Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Leite, Janaína da Silva
Orientador(a): Takahata, André Kazuo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do ABC
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia da Informação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124681&midiaext=80949
Resumo: Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
id UFBC_c8ad5975a9c8fdca749d3ca5c4ede381
oai_identifier_str oai:BDTD:124681
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisFundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro2022-08-19Takahata, André KazuoLeite, Janaína da SilvaUniversidade Federal do ABCPrograma de Pós-Graduação em Engenharia da InformaçãoUFABCporCOVID-19CORPUS DE TEXTOS BIOMÉDICOSCOMPLEXIDADE TEXTUALSIMPLIFICAÇÃO TEXTUALCORPUS OF BIOMEDICAL TEXTSCOMPLEX WORD IDENTICATIONLEXICAL SIMPLIFICATIONPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorEsta dissertação propõe-se a apresentar a fundamentação teórica e o processo metodológico que nortearam a elaboração do corpus COVID-19 UFABC. O corpus aqui proposto compõe-se de textos de linguagem especializada do domínio da saúde em língua portuguesa publicados entre os meses de março de 2020 a setembro de 2020, período inicial da pandemia. À época indicada, o conhecimento a respeito do coronavírus era inicialmente restrito à comunidade acadêmica especializada e, em consequência disso, a difusão de conhecimento acerca do COVID-19 e dos seus protocolos de prevenção, como o isolamento social, desempenhou papel de protagonismo no enfrentamento da pandemia. Dessa forma, os textos reunidos nesse corpus comportam termos oriundos de domínios especializados, contendo expressões complexas que podem trazer ao leitor leigo ou pouco familiarizado com o jargão médico alguma dificuldade de compreensão. Essa dissertação apresenta esforços de um primeiro estudo para elaboração de recursos de corpora compatíveis com pesquisas sobre tarefas de simplificação lexical e identificação de palavras complexas no contexto de combate à COVID-19. A metodologia baseou-se na extração, compilação, armazenamento e categorização de textos da base de dados científicos Pubmed, resultando em um corpus de 254 textos. A aplicação de técnicas de categorização mostrou que o maior grupo, de cerca de 30% dos textos, situa-se nas áreas de Saúde Coletiva e Epidemiologia, em detrimento de outras especialidades médicas e áreas mais exploratórias de pesquisa que tratam, por exemplo, de virologia ou genômica. Este resultado pode indicar padrões de um recorte do comportamento da comunidade científica no período inicial da pandemia, em especial no que concerne às publicações em língua portuguesa.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124681&midiaext=80949application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:03:54Zoai:BDTD:124681Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2023-08-10T16:18:13Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.pt.fl_str_mv Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
title Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
spellingShingle Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
Leite, Janaína da Silva
title_short Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
title_full Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
title_fullStr Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
title_full_unstemmed Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
title_sort Fundamentação e elaboração de corpus de linguagem especializada para o domínio da saúde sobre a COVID-19 em português brasileiro
author Leite, Janaína da Silva
author_facet Leite, Janaína da Silva
author_role author
dc.contributor.advisor1.fl_str_mv Takahata, André Kazuo
dc.contributor.author.fl_str_mv Leite, Janaína da Silva
contributor_str_mv Takahata, André Kazuo
description Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
publishDate 2022
dc.date.issued.fl_str_mv 2022-08-19
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124681&midiaext=80949
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124681&midiaext=80949
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do ABC
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia da Informação
dc.publisher.initials.fl_str_mv UFABC
publisher.none.fl_str_mv Universidade Federal do ABC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1854475889969987584