MulTeC: A construção de um corpus multimodal em teletandem

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Lopes, Queila Barbosa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/181353
Resumo: O teletandem (TTD), contexto de aprendizagem de línguas telecolaborativo e autônomo (TELLES, 2006), desenvolvido na Unesp há mais de 12 anos, vem promovendo oportunidade de aprendizagem de línguas estrangeiras embasada na autonomia, separação de línguas e reciprocidade, princípios basilares da aprendizagem in tandem, como discutido por Brammerts (1996). Tal contexto de aprendizagem se tornou possível pela utilização das redes telemáticas que viabilizam a aprendizagem de línguas entre aprendizes que residem em países geograficamente distantes. No TTD, os aprendizes realizam sessões orais de teletandem (SOTs) e participam de sessões de mediação. Segundo Aranha e Leone (2016; 2017) essas são macrotarefas a partir das quais ocorrem as microtarefas: produção de diários de aprendizagem, troca de textos entre os participantes, respostas aos questionários inicial e final e uso da ferramenta chat durante a SOT. Esse contexto propicia a geração de uma quantidade significativa de dados multimodais (áudio, vídeo, texto escrito) que podem ser utilizados para pesquisas diversas. O intuito desta pesquisa é a construção de um corpus com os dados produzidos por 112 pares no período de 2012 a 2015. Para a composição do corpus, foram utilizados os dados coletados e armazenados conforme descrito por Aranha, Luvizari-Murad e Moreno (2015) e para a elaboração do corpus utilizei os seguintes procedimentos: a) levantamento das características de cada grupo de teletandem; b) criação de código para identificação dos parceiros; c) criação de códigos para a nomeação dos dados; d) padronização da anonimização dos dados; e) conversão dos dados para formatos compatíveis com diferentes sistemas operacionais; e f) renomeação dos dados a partir de Chanier e Wigham (2016). O MulTeC (Multimodal Teletandem Corpus) é composto por um total de 91 questionários iniciais, 41 questionários finais, 666 diários de aprendizagem, 355 chats, 921 textos produzidos na troca de texto por brasileiros e corrigidos por estadunidenses e 581 horas de gravações em vídeos, com transcrições em andamento. Após a finalização do corpus, percebeu-se a necessidade de ampliação de dados a serem coletados, incluindo a coleta da reunião tutorial e das sessões de mediação em mídia de vídeo ou áudio.
id UNSP_e9cd06406eb74ff12bcad3e4876b7734
oai_identifier_str oai:repositorio.unesp.br:11449/181353
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling MulTeC: A construção de um corpus multimodal em teletandemMulTeC: building a teletandem multimodal corpusTeletandemCorpusTarefasTasksO teletandem (TTD), contexto de aprendizagem de línguas telecolaborativo e autônomo (TELLES, 2006), desenvolvido na Unesp há mais de 12 anos, vem promovendo oportunidade de aprendizagem de línguas estrangeiras embasada na autonomia, separação de línguas e reciprocidade, princípios basilares da aprendizagem in tandem, como discutido por Brammerts (1996). Tal contexto de aprendizagem se tornou possível pela utilização das redes telemáticas que viabilizam a aprendizagem de línguas entre aprendizes que residem em países geograficamente distantes. No TTD, os aprendizes realizam sessões orais de teletandem (SOTs) e participam de sessões de mediação. Segundo Aranha e Leone (2016; 2017) essas são macrotarefas a partir das quais ocorrem as microtarefas: produção de diários de aprendizagem, troca de textos entre os participantes, respostas aos questionários inicial e final e uso da ferramenta chat durante a SOT. Esse contexto propicia a geração de uma quantidade significativa de dados multimodais (áudio, vídeo, texto escrito) que podem ser utilizados para pesquisas diversas. O intuito desta pesquisa é a construção de um corpus com os dados produzidos por 112 pares no período de 2012 a 2015. Para a composição do corpus, foram utilizados os dados coletados e armazenados conforme descrito por Aranha, Luvizari-Murad e Moreno (2015) e para a elaboração do corpus utilizei os seguintes procedimentos: a) levantamento das características de cada grupo de teletandem; b) criação de código para identificação dos parceiros; c) criação de códigos para a nomeação dos dados; d) padronização da anonimização dos dados; e) conversão dos dados para formatos compatíveis com diferentes sistemas operacionais; e f) renomeação dos dados a partir de Chanier e Wigham (2016). O MulTeC (Multimodal Teletandem Corpus) é composto por um total de 91 questionários iniciais, 41 questionários finais, 666 diários de aprendizagem, 355 chats, 921 textos produzidos na troca de texto por brasileiros e corrigidos por estadunidenses e 581 horas de gravações em vídeos, com transcrições em andamento. Após a finalização do corpus, percebeu-se a necessidade de ampliação de dados a serem coletados, incluindo a coleta da reunião tutorial e das sessões de mediação em mídia de vídeo ou áudio.Teletandem (TTD), a telecollaborative and autonomous language learning context (TELLES, 2006), which has been carried out at Unesp for more than 12 years, has been promoting language learning based on autonomy, separation of languages and reciprocity, basic principles of tandem learning, as discussed by Brammerts (1996). Such learning context has become viable using telematic networks that enable language learning between learners residing in geographically distant countries. In teletandem, learners hold teletandem oral sessions (TOSs) and participate in mediation sessions. According to Aranha and Leone (2016, 2017) these are macrotasks from which microtasks occur: production of learning diaries, text exchange among TTD participants, responses to the initial and final questionnaires, and use of the chat tool during teletandem oral sessions. The production of these tasks generates a significant amount of data that can be used for various researches. The purpose of this research is constructing a multimodal corpus in teletandem with the data produced by the participants in the period from 2012 to 2015. The data which constitute the corpus were produced by 112 pairs, in a partnership with an American university in the period of 2012 to 2015, whose collection was described by Aranha, Luvizari-Murad and Moreno (2015). The elaboration of the corpus from the collection and storage described in Aranha, Luvizari-Murad and Moreno (2015) adopted the following procedures: a) survey of the characteristics of each teletandem group; b) creation of code to identify the partners; c) creation of codes for data naming; d) standardization of data anonymization; e) converting the data to compatible formats with different operating systems; and f) renaming the data according to what is proposed by Chanier and Wigham (2016). After the organization of the corpus, MulTeC (Multimodal Teletandem Corpus) has a total of 91 initial questionnaires, 41 final questionnaires, 666 learning diaries, 355 chats, 921 texts produced in the text exchange between the partners and 581 hours of TOSs recordings, with transcriptions ongoing. After the completion of the corpus, it was perceived the need to broaden the collection of the data, including tutorial meeting and mediation sessions in audio or video media collection.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Estadual Paulista (Unesp)Aranha, Solange [UNESP]Universidade Estadual Paulista (Unesp)Lopes, Queila Barbosa2019-04-03T18:16:46Z2019-04-03T18:16:46Z2019-03-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfapplication/pdfhttp://hdl.handle.net/11449/18135300091459633004153069P5porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2024-11-05T17:38:09Zoai:repositorio.unesp.br:11449/181353Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462024-11-05T17:38:09Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv MulTeC: A construção de um corpus multimodal em teletandem
MulTeC: building a teletandem multimodal corpus
title MulTeC: A construção de um corpus multimodal em teletandem
spellingShingle MulTeC: A construção de um corpus multimodal em teletandem
Lopes, Queila Barbosa
Teletandem
Corpus
Tarefas
Tasks
title_short MulTeC: A construção de um corpus multimodal em teletandem
title_full MulTeC: A construção de um corpus multimodal em teletandem
title_fullStr MulTeC: A construção de um corpus multimodal em teletandem
title_full_unstemmed MulTeC: A construção de um corpus multimodal em teletandem
title_sort MulTeC: A construção de um corpus multimodal em teletandem
author Lopes, Queila Barbosa
author_facet Lopes, Queila Barbosa
author_role author
dc.contributor.none.fl_str_mv Aranha, Solange [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Lopes, Queila Barbosa
dc.subject.por.fl_str_mv Teletandem
Corpus
Tarefas
Tasks
topic Teletandem
Corpus
Tarefas
Tasks
description O teletandem (TTD), contexto de aprendizagem de línguas telecolaborativo e autônomo (TELLES, 2006), desenvolvido na Unesp há mais de 12 anos, vem promovendo oportunidade de aprendizagem de línguas estrangeiras embasada na autonomia, separação de línguas e reciprocidade, princípios basilares da aprendizagem in tandem, como discutido por Brammerts (1996). Tal contexto de aprendizagem se tornou possível pela utilização das redes telemáticas que viabilizam a aprendizagem de línguas entre aprendizes que residem em países geograficamente distantes. No TTD, os aprendizes realizam sessões orais de teletandem (SOTs) e participam de sessões de mediação. Segundo Aranha e Leone (2016; 2017) essas são macrotarefas a partir das quais ocorrem as microtarefas: produção de diários de aprendizagem, troca de textos entre os participantes, respostas aos questionários inicial e final e uso da ferramenta chat durante a SOT. Esse contexto propicia a geração de uma quantidade significativa de dados multimodais (áudio, vídeo, texto escrito) que podem ser utilizados para pesquisas diversas. O intuito desta pesquisa é a construção de um corpus com os dados produzidos por 112 pares no período de 2012 a 2015. Para a composição do corpus, foram utilizados os dados coletados e armazenados conforme descrito por Aranha, Luvizari-Murad e Moreno (2015) e para a elaboração do corpus utilizei os seguintes procedimentos: a) levantamento das características de cada grupo de teletandem; b) criação de código para identificação dos parceiros; c) criação de códigos para a nomeação dos dados; d) padronização da anonimização dos dados; e) conversão dos dados para formatos compatíveis com diferentes sistemas operacionais; e f) renomeação dos dados a partir de Chanier e Wigham (2016). O MulTeC (Multimodal Teletandem Corpus) é composto por um total de 91 questionários iniciais, 41 questionários finais, 666 diários de aprendizagem, 355 chats, 921 textos produzidos na troca de texto por brasileiros e corrigidos por estadunidenses e 581 horas de gravações em vídeos, com transcrições em andamento. Após a finalização do corpus, percebeu-se a necessidade de ampliação de dados a serem coletados, incluindo a coleta da reunião tutorial e das sessões de mediação em mídia de vídeo ou áudio.
publishDate 2019
dc.date.none.fl_str_mv 2019-04-03T18:16:46Z
2019-04-03T18:16:46Z
2019-03-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/181353
000914596
33004153069P5
url http://hdl.handle.net/11449/181353
identifier_str_mv 000914596
33004153069P5
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954443499372544