Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Wilton, Pablo Ernesto Vigneaux
Orientador(a): Rover, Aires José
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://repositorio.ufsc.br/handle/123456789/262982
Resumo: Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2024.
id UFSC_fc475a68e746d5f8507da064be7439de
oai_identifier_str oai:repositorio.ufsc.br:123456789/262982
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Universidade Federal de Santa CatarinaWilton, Pablo Ernesto VigneauxRover, Aires JoséSantos, Neri dos2025-01-30T23:22:26Z2025-01-30T23:22:26Z2024389881https://repositorio.ufsc.br/handle/123456789/262982Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2024.O crescimento constante das publicações científicas apresenta desafios significativos na extração e organização do conhecimento gerado. Este trabalho aborda esses desafios no contexto de diabetes mellitus, explorando técnicas de Processamento de Linguagem Natural (NLP) para mineração de dados. A construção de um Grafo de Conhecimento (KG) a partir de abstracts de artigos científicos é investigada para representar as entidades nomeadas e seus relacionamentos. Este trabalho tem como objetivo estudar a extração de entidades nomeadas e seus relacionamentos a partir de abstracts de artigos científicos sobre diabetes mellitus. Utilizando técnicas e modelos de NLP, visa-se a construção de um Grafo de Conhecimento para facilitar a extração e organização do conhecimento, assim como facilitar a aplicação de técnicas que, por meio de inferências, gerem novos conhecimentos na área biomédica. Para a seleção de artigos, utilizou-se a plataforma PubMed, resultando em um total inicial de 518.432 registros, posteriormente filtrados para 361.688 registros. Abstracts foram utilizados para a análise. Inicialmente, foi realizada uma Análise Exploratória de Dados (EDA) para entender e preparar os dados. Em seguida, técnicas de NLP, como o reconhecimento de entidades nomeadas (NER) e a extração de relacionamentos entre entidades (ERE), foram aplicadas para identificar e extrair entidades e seus relacionamentos. Este processo permitiu a construção de triplas que compõem o Grafo de Conhecimento. A abordagem foi inspirada pelo Design Science Research Methodology (DSRM), que oferece uma estrutura sistemática para a criação e avaliação de artefatos na pesquisa científica. Os resultados demonstraram que o uso de modelos de Machine Learning e Deep Learning é eficaz na identificação de entidades relevantes em textos acadêmicos, permitindo a construção de um Grafo de Conhecimento robusto. O grafo resultante forneceu uma estrutura rica para análise e visualização das relações entre entidades biomédicas. No entanto, a pesquisa também identificou desafios significativos, como a necessidade de maior poder computacional e melhorias nas técnicas de pré-processamento e extração de relações.Abstract: The constant growth of scientific publications presents significant challenges in the extraction and organization of the generated knowledge. This work addresses these challenges in the context of diabetes mellitus by exploring Natural Language Processing (NLP) techniques for data mining. The construction of a Knowledge Graph (KG) from scientific article abstracts is investigated to map named entities and their relationships. The objective of this work is to study the extraction of named entities and their relationships from scientific article abstracts on diabetes mellitus. By using NLP techniques and models, the aim is to construct a Knowledge Graph to facilitate the extraction and organization of knowledge, as well as to enable the application of techniques that, through inferences, generate new knowledge in the biomedical field. For the selection of articles, the PubMed platform was used, resulting in an initial total of 518,432 records, which were subsequently filtered to 361,688 records. Abstracts were used for the analysis. Initially, Exploratory Data Analysis (EDA) was performed to understand and prepare the data. Next, NLP techniques such as Named Entity Recognition (NER) and Entity Relation Extraction (ERE) were applied to identify and extract entities and their relationships. This process allowed the construction of triples that make up the Knowledge Graph. The approach was inspired by the Design Science Research Methodology (DSRM), which provides a systematic framework for creating and evaluating artifacts in scientific research. The results demonstrated that the use of Machine Learning and Deep Learning models is effective in identifying relevant entities in academic texts, enabling the construction of a robust Knowledge Graph. The resulting graph provided a rich structure for analyzing and visualizing the relationships between biomedical entities. However, the research also identified significant challenges, such as the need for greater computational power and improvements in preprocessing and relation extraction techniques.200 p.| il., gráfs.porGestão do conhecimentoEngenharia e gestão do conhecimentoMineração de dados de textoProcessamento de linguagem natural (Computação)Diabetes MellitusUm método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitusinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALPEGC0840-D.pdfPEGC0840-D.pdfapplication/pdf6532670https://repositorio.ufsc.br/bitstream/123456789/262982/-1/PEGC0840-D.pdf0b5b566451bfd1b2a8dcf47ac9ac57ccMD5-1123456789/2629822025-01-30 20:22:27.033oai:repositorio.ufsc.br:123456789/262982Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestsandra.sobrera@ufsc.bropendoar:23732025-01-30T23:22:27Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
title Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
spellingShingle Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
Wilton, Pablo Ernesto Vigneaux
Gestão do conhecimento
Engenharia e gestão do conhecimento
Mineração de dados de texto
Processamento de linguagem natural (Computação)
Diabetes Mellitus
title_short Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
title_full Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
title_fullStr Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
title_full_unstemmed Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
title_sort Um método voltado à representação de conhecimento a partir de textos acadêmicos sobre diabetes mellitus
author Wilton, Pablo Ernesto Vigneaux
author_facet Wilton, Pablo Ernesto Vigneaux
author_role author
dc.contributor.none.fl_str_mv Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Wilton, Pablo Ernesto Vigneaux
dc.contributor.advisor1.fl_str_mv Rover, Aires José
dc.contributor.advisor-co1.fl_str_mv Santos, Neri dos
contributor_str_mv Rover, Aires José
Santos, Neri dos
dc.subject.classification.none.fl_str_mv Gestão do conhecimento
Engenharia e gestão do conhecimento
Mineração de dados de texto
Processamento de linguagem natural (Computação)
Diabetes Mellitus
topic Gestão do conhecimento
Engenharia e gestão do conhecimento
Mineração de dados de texto
Processamento de linguagem natural (Computação)
Diabetes Mellitus
description Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento, Florianópolis, 2024.
publishDate 2024
dc.date.issued.fl_str_mv 2024
dc.date.accessioned.fl_str_mv 2025-01-30T23:22:26Z
dc.date.available.fl_str_mv 2025-01-30T23:22:26Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/262982
dc.identifier.other.none.fl_str_mv 389881
identifier_str_mv 389881
url https://repositorio.ufsc.br/handle/123456789/262982
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 200 p.| il., gráfs.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/262982/-1/PEGC0840-D.pdf
bitstream.checksum.fl_str_mv 0b5b566451bfd1b2a8dcf47ac9ac57cc
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv sandra.sobrera@ufsc.br
_version_ 1851759100613885952