A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Lameira, Vivian Meurer
Orientador(a): Bocorny, Ana Eliza Pereira
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/250303
Resumo: Estruturas Lexicais (Lexical Frames) são sequências descontínuas de palavras que formam uma estrutura (frame) em torno de lacunas variáveis (slots) – por exemplo, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Tais unidades representam blocos formulaicos muito importantes na construção do discurso acadêmico (GRAY; BIBER, 2013). Diversas pesquisas já foram realizadas sobre linguagem formulaica em contextos acadêmicos (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Poucos estudos, no entanto, tiveram como foco a análise funcional das ELs em resumos de diferentes áreas de especialidade, a partir de um modelo que combine princípios de duas grandes áreas: os Estudos sobre Gêneros do Discurso e a Linguística de Corpus. Nessa direção, este estudo investiga o uso e a distribuição das ELs utilizadas na realização linguística das funções retóricas expressas nas seções de resumos de três áreas do conhecimento: (1) Ciências da Computação e da Informação, (2) Física e (3) Medicina e Ciências da Saúde. Em especial, busca-se a identificação e a análise funcional dos referidos blocos formulaicos extraídos dos corpora, em uma abordagem dirigida por corpus (data-driven approach). Para tanto, foram compilados três corpora de resumos escritos em inglês, das áreas-alvo, publicados em periódicos revisados por pares. Cada corpus, com 1 milhão de palavras, foi compilado com a ferramenta AntCorGen (ANTHONY, 2019) e analisado por meio das ferramentas Sketch Engine (KILGARRIFF et al., 2004) e AntConc 4.0.10 (ANTHONY, 2022). Um total de 717 ELs foram extraídas dos três corpora estudados. Destas, 159 são da área das Ciências da Computação e da Informação; 154, da área da Física; e 404, da área da Medicina e das Ciências da Saúde. Quanto ao padrão retórico, foi possível constatar que as seções que são convencionais nos resumos estruturados das áreas-alvo são as mesmas elencadas por Swales e Feak (2009). A observação da amostra de 150 ELs, no que tange às funções retóricas que realizam nos resumos acadêmicos, indicou a existência de duas grandes categorias de unidades multipalavras descontínuas: (i) as ELs transparentes e (ii) as ELs opacas. As ELs transparentes representam as unidades que têm a sua função retórica mais facilmente identificável a partir da observação: (i) dos elementos fixos que constituem a sua estrutura; (ii) das palavras que preenchem as lacunas variáveis; e (iii) dos contextos de ocorrência. Quanto a sua tipologia, as ELs transparentes podem ser divididas em 2 tipos, as ELs transparentes retóricas (ELTR) e as ELs transparentes terminológicas (ELTT). As ELTRs realizam linguisticamente as funções retóricas expressas nos gêneros, particularmente as funções relativas à apresentação dos objetivos do trabalho, estando, por essa razão, mais vinculadas a um movimento ou a uma seção retórica. Tais estruturas apresentam, em sua composição, palavras lexicais que indicam função retórica (por exemplo, aim, purpose, results). As ELTTs mais vinculadas às áreas de especialidade realizam a função de referir termos, procedimentos e conceitos consagrados nas áreas especializadas. Quanto à frequência de ocorrência nos corpora, as ELTTs são menos frequentes do que as ELTRs, sendo necessários pontos de corte mais baixos para que possamos identificá-las. Essas estruturas apresentam, em sua composição, palavras lexicais que indicam vinculação a uma área de especialidade (por exemplo, risk, hazard patients). Sugere-se que os dados obtidos neste estudo sejam usados para subsidiar o ensino de Inglês para Fins Acadêmicos (IFA).
id URGS_7ecbbef9ec53cddc61772462d5f4898f
oai_identifier_str oai:www.lume.ufrgs.br:10183/250303
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Lameira, Vivian MeurerBocorny, Ana Eliza Pereira2022-10-26T04:47:11Z2022http://hdl.handle.net/10183/250303001152085Estruturas Lexicais (Lexical Frames) são sequências descontínuas de palavras que formam uma estrutura (frame) em torno de lacunas variáveis (slots) – por exemplo, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Tais unidades representam blocos formulaicos muito importantes na construção do discurso acadêmico (GRAY; BIBER, 2013). Diversas pesquisas já foram realizadas sobre linguagem formulaica em contextos acadêmicos (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Poucos estudos, no entanto, tiveram como foco a análise funcional das ELs em resumos de diferentes áreas de especialidade, a partir de um modelo que combine princípios de duas grandes áreas: os Estudos sobre Gêneros do Discurso e a Linguística de Corpus. Nessa direção, este estudo investiga o uso e a distribuição das ELs utilizadas na realização linguística das funções retóricas expressas nas seções de resumos de três áreas do conhecimento: (1) Ciências da Computação e da Informação, (2) Física e (3) Medicina e Ciências da Saúde. Em especial, busca-se a identificação e a análise funcional dos referidos blocos formulaicos extraídos dos corpora, em uma abordagem dirigida por corpus (data-driven approach). Para tanto, foram compilados três corpora de resumos escritos em inglês, das áreas-alvo, publicados em periódicos revisados por pares. Cada corpus, com 1 milhão de palavras, foi compilado com a ferramenta AntCorGen (ANTHONY, 2019) e analisado por meio das ferramentas Sketch Engine (KILGARRIFF et al., 2004) e AntConc 4.0.10 (ANTHONY, 2022). Um total de 717 ELs foram extraídas dos três corpora estudados. Destas, 159 são da área das Ciências da Computação e da Informação; 154, da área da Física; e 404, da área da Medicina e das Ciências da Saúde. Quanto ao padrão retórico, foi possível constatar que as seções que são convencionais nos resumos estruturados das áreas-alvo são as mesmas elencadas por Swales e Feak (2009). A observação da amostra de 150 ELs, no que tange às funções retóricas que realizam nos resumos acadêmicos, indicou a existência de duas grandes categorias de unidades multipalavras descontínuas: (i) as ELs transparentes e (ii) as ELs opacas. As ELs transparentes representam as unidades que têm a sua função retórica mais facilmente identificável a partir da observação: (i) dos elementos fixos que constituem a sua estrutura; (ii) das palavras que preenchem as lacunas variáveis; e (iii) dos contextos de ocorrência. Quanto a sua tipologia, as ELs transparentes podem ser divididas em 2 tipos, as ELs transparentes retóricas (ELTR) e as ELs transparentes terminológicas (ELTT). As ELTRs realizam linguisticamente as funções retóricas expressas nos gêneros, particularmente as funções relativas à apresentação dos objetivos do trabalho, estando, por essa razão, mais vinculadas a um movimento ou a uma seção retórica. Tais estruturas apresentam, em sua composição, palavras lexicais que indicam função retórica (por exemplo, aim, purpose, results). As ELTTs mais vinculadas às áreas de especialidade realizam a função de referir termos, procedimentos e conceitos consagrados nas áreas especializadas. Quanto à frequência de ocorrência nos corpora, as ELTTs são menos frequentes do que as ELTRs, sendo necessários pontos de corte mais baixos para que possamos identificá-las. Essas estruturas apresentam, em sua composição, palavras lexicais que indicam vinculação a uma área de especialidade (por exemplo, risk, hazard patients). Sugere-se que os dados obtidos neste estudo sejam usados para subsidiar o ensino de Inglês para Fins Acadêmicos (IFA).Lexical Frames are discontinuous sequences of words that form a structure (frame) around variable gaps (slots) – for example, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Lexical Frames (LFs) have great pedagogical value for the production of written academic genres in different areas of expertise. Several studies have already been carried out on formulaic language in academic contexts (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Few studies, however, have focused on the functional analysis of LFs in abstracts from different specialized areas, based on a model that combines principles from two major areas: Studies on Discourse Genres and Corpus Linguistics. In this direction, this study investigates the use and distribution of the LFs used in the linguistic realization of the rhetorical functions expressed in the sections of abstracts of three areas of knowledge: (1) Computer and Information Sciences, (2) Physics and (3) Medicine and Health Sciences. In particular, the study seeks to identify and functionally analyze the aforementioned formulaic blocks extracted from the corpora, in a data-driven approach. To this end, three corpora of abstracts, written in English, from the target areas, published in peer-reviewed journals, were compiled. Each corpus, with 1 million words, was compiled with AntCorGen (ANTHONY, 2019) and analyzed using Sketch Engine (Kilgarriff et al., 2004) and AntConc 4.0.10 (ANTHONY, 2022). A total of 717 LFs were extracted from the three corpora studied. Of these, 159 are in the area of Computer and Information Sciences; 154, in the area of Physics; and 404, in the area of Medicine and Health Sciences. As for the rhetorical pattern, it was possible to verify that the sections that are conventional in the structured abstracts of the target areas are the same listed by Swales and Feak (2009). The observation of the sample of 150 LFs, regarding the rhetorical functions they perform in the abstracts, indicated the existence of two major categories of discontinuous multiword units: (i) the transparent LFs and (ii) the opaque LFs. The transparent LFs represent the units that have their rhetorical function more easily identifiable from the observation: (i) of the fixed elements that constitute their structure; (ii) the words that fill in the variable slots; and (iii) the contexts of occurrence. Regarding their typology, the transparent LFs can be divided into 2 types, the rhetorically transparent LFs (RTLF) and the terminologically transparent LFs (TTLF). The RTLFs linguistically perform the rhetorical functions expressed in the genres, especially the functions related to the presentation of the objectives of the work and, for this reason, they are more linked to a rhetorical move or section. They have, in their composition, lexical words that indicate rhetorical function (for example, aim, purpose, results). The TTLFs, more linked to the specialized areas, perform the function of referring to terms, procedures and concepts established in the specialized domains. As for the frequency of occurrence in the corpora, TTLFs are less frequent than RTLFs, requiring lower cut-off points so that they can be extracted from the corpus. They have, in their composition, lexical words that indicate a link to a specialized area (for example, risk, hazard patients). It is suggested that the data obtained in this study be used to support the teaching of English for Academic Purposes (EAP).application/pdfporLingüística de corpusGêneros do discursoRetóricaEscrita acadêmicaLingüística de corpusCorpus LinguisticsStudies on Discourse GenresAnalysis of rhetorical movementsLexical structuresAcademic writingCorpus-driven pedagogical resourcesA análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2022mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001152085.pdf.txt001152085.pdf.txtExtracted Texttext/plain295226http://www.lume.ufrgs.br/bitstream/10183/250303/2/001152085.pdf.txtbfcd53a2a1783280dd21fe8df653bc59MD52ORIGINAL001152085.pdfTexto completoapplication/pdf4333653http://www.lume.ufrgs.br/bitstream/10183/250303/1/001152085.pdfe610c30e1c89ae54d45638a26051f780MD5110183/2503032022-10-27 04:50:13.296175oai:www.lume.ufrgs.br:10183/250303Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-10-27T07:50:13Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
title A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
spellingShingle A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
Lameira, Vivian Meurer
Lingüística de corpus
Gêneros do discurso
Retórica
Escrita acadêmica
Lingüística de corpus
Corpus Linguistics
Studies on Discourse Genres
Analysis of rhetorical movements
Lexical structures
Academic writing
Corpus-driven pedagogical resources
title_short A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
title_full A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
title_fullStr A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
title_full_unstemmed A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
title_sort A análise funcional de estruturas lexicais (lexical frames): dados linguísticos extraídos de corpora para subsidiar o ensino de IFA
author Lameira, Vivian Meurer
author_facet Lameira, Vivian Meurer
author_role author
dc.contributor.author.fl_str_mv Lameira, Vivian Meurer
dc.contributor.advisor1.fl_str_mv Bocorny, Ana Eliza Pereira
contributor_str_mv Bocorny, Ana Eliza Pereira
dc.subject.por.fl_str_mv Lingüística de corpus
Gêneros do discurso
Retórica
Escrita acadêmica
Lingüística de corpus
topic Lingüística de corpus
Gêneros do discurso
Retórica
Escrita acadêmica
Lingüística de corpus
Corpus Linguistics
Studies on Discourse Genres
Analysis of rhetorical movements
Lexical structures
Academic writing
Corpus-driven pedagogical resources
dc.subject.eng.fl_str_mv Corpus Linguistics
Studies on Discourse Genres
Analysis of rhetorical movements
Lexical structures
Academic writing
Corpus-driven pedagogical resources
description Estruturas Lexicais (Lexical Frames) são sequências descontínuas de palavras que formam uma estrutura (frame) em torno de lacunas variáveis (slots) – por exemplo, the (aim, purpose, objective) of the (GRAY; BIBER, 2013). Tais unidades representam blocos formulaicos muito importantes na construção do discurso acadêmico (GRAY; BIBER, 2013). Diversas pesquisas já foram realizadas sobre linguagem formulaica em contextos acadêmicos (BIBER et al., 1999; HYLAND, 2008; CORTES, 2004; CORTES, 2013). Poucos estudos, no entanto, tiveram como foco a análise funcional das ELs em resumos de diferentes áreas de especialidade, a partir de um modelo que combine princípios de duas grandes áreas: os Estudos sobre Gêneros do Discurso e a Linguística de Corpus. Nessa direção, este estudo investiga o uso e a distribuição das ELs utilizadas na realização linguística das funções retóricas expressas nas seções de resumos de três áreas do conhecimento: (1) Ciências da Computação e da Informação, (2) Física e (3) Medicina e Ciências da Saúde. Em especial, busca-se a identificação e a análise funcional dos referidos blocos formulaicos extraídos dos corpora, em uma abordagem dirigida por corpus (data-driven approach). Para tanto, foram compilados três corpora de resumos escritos em inglês, das áreas-alvo, publicados em periódicos revisados por pares. Cada corpus, com 1 milhão de palavras, foi compilado com a ferramenta AntCorGen (ANTHONY, 2019) e analisado por meio das ferramentas Sketch Engine (KILGARRIFF et al., 2004) e AntConc 4.0.10 (ANTHONY, 2022). Um total de 717 ELs foram extraídas dos três corpora estudados. Destas, 159 são da área das Ciências da Computação e da Informação; 154, da área da Física; e 404, da área da Medicina e das Ciências da Saúde. Quanto ao padrão retórico, foi possível constatar que as seções que são convencionais nos resumos estruturados das áreas-alvo são as mesmas elencadas por Swales e Feak (2009). A observação da amostra de 150 ELs, no que tange às funções retóricas que realizam nos resumos acadêmicos, indicou a existência de duas grandes categorias de unidades multipalavras descontínuas: (i) as ELs transparentes e (ii) as ELs opacas. As ELs transparentes representam as unidades que têm a sua função retórica mais facilmente identificável a partir da observação: (i) dos elementos fixos que constituem a sua estrutura; (ii) das palavras que preenchem as lacunas variáveis; e (iii) dos contextos de ocorrência. Quanto a sua tipologia, as ELs transparentes podem ser divididas em 2 tipos, as ELs transparentes retóricas (ELTR) e as ELs transparentes terminológicas (ELTT). As ELTRs realizam linguisticamente as funções retóricas expressas nos gêneros, particularmente as funções relativas à apresentação dos objetivos do trabalho, estando, por essa razão, mais vinculadas a um movimento ou a uma seção retórica. Tais estruturas apresentam, em sua composição, palavras lexicais que indicam função retórica (por exemplo, aim, purpose, results). As ELTTs mais vinculadas às áreas de especialidade realizam a função de referir termos, procedimentos e conceitos consagrados nas áreas especializadas. Quanto à frequência de ocorrência nos corpora, as ELTTs são menos frequentes do que as ELTRs, sendo necessários pontos de corte mais baixos para que possamos identificá-las. Essas estruturas apresentam, em sua composição, palavras lexicais que indicam vinculação a uma área de especialidade (por exemplo, risk, hazard patients). Sugere-se que os dados obtidos neste estudo sejam usados para subsidiar o ensino de Inglês para Fins Acadêmicos (IFA).
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-10-26T04:47:11Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/250303
dc.identifier.nrb.pt_BR.fl_str_mv 001152085
url http://hdl.handle.net/10183/250303
identifier_str_mv 001152085
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/250303/2/001152085.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/250303/1/001152085.pdf
bitstream.checksum.fl_str_mv bfcd53a2a1783280dd21fe8df653bc59
e610c30e1c89ae54d45638a26051f780
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1797065195702452224