Uso de redes neurais artificiais para extração de dados de prontuários médicos

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Rocha, Naila Camila da [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/214404
Resumo: Diversos estudos recentes têm utilizado inteligência artificial na extração e tratamento de dados secundários na área da saúde, obtidos em prontuários eletrônicos hospitalares. No entanto, alguns estudos são inviáveis devido a informações incompletas ou inseridas apenas em campos narrativos. O objetivo deste trabalho é desenvolver uma rede neural que utilize os dados desses campos para obter informações estruturadas referentes aos sintomas, diagnósticos, medicamentos, condições, exames e tratamentos. A rede neural proposta facilitará a descoberta de relações entre doenças e sintomas, prevalências e incidências, a identificação de condições clínicas, a evolução de enfermidades e os efeitos das medicações prescritas. O algoritmo utiliza métodos de processamento de linguagem natural para extração de textos e redes neurais convolucionais para reconhecimento de padrões. Foram simulados diferentes valores e funções para a determinação dos hiperparâmetros e otimizadores mais adequados para o modelo de Reconhecimento de Entidades Nomeadas (NER) desenvolvido através da biblioteca spaCy em Python. Para uma análise exploratória dos dados extraídos e demonstração da aplicabilidade do modelo foram executadas técnicas da estatística multivariada de análise de agrupamento, obtendo quatro grupos que melhor representam os perfis dos pacientes e os medicamentos por eles utilizados. Os resultados obtidos foram significativos considerando a complexidade do modelo, com um F-Score de 63,9% e Precision de 72,7%. A classe Condição do Paciente chegou a atingir 90,3% de Precision, seguido por Medicação com 87,5%. No desenvolvimento do presente trabalho, foram utilizados dados de 30.000 prontuários de pacientes do Hospital das Clínicas da Faculdade de Medicina de Botucatu/SP - Brasil (HCFMB), gerando um corpus com 1.200 textos clínicos. A utilização de NER em dados clínicos se mostrou uma ferramenta capaz de extrair informações que não existem em campos estruturados de prontuários médicos. Além disso, análises de agrupamento utilizando esses dados revelam comportamentos e características até então desconhecidas, relacionadas com as Entidades extraídas.
id UNSP_1dd4c26b621702a8f234010b176d44fe
oai_identifier_str oai:repositorio.unesp.br:11449/214404
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Uso de redes neurais artificiais para extração de dados de prontuários médicosMedical records data extraction using artificial neural networksReconhecimento de entidades nomeadasAnálise de agrupamentoProntuários médicosRedes neuraisDistância de gowerDiversos estudos recentes têm utilizado inteligência artificial na extração e tratamento de dados secundários na área da saúde, obtidos em prontuários eletrônicos hospitalares. No entanto, alguns estudos são inviáveis devido a informações incompletas ou inseridas apenas em campos narrativos. O objetivo deste trabalho é desenvolver uma rede neural que utilize os dados desses campos para obter informações estruturadas referentes aos sintomas, diagnósticos, medicamentos, condições, exames e tratamentos. A rede neural proposta facilitará a descoberta de relações entre doenças e sintomas, prevalências e incidências, a identificação de condições clínicas, a evolução de enfermidades e os efeitos das medicações prescritas. O algoritmo utiliza métodos de processamento de linguagem natural para extração de textos e redes neurais convolucionais para reconhecimento de padrões. Foram simulados diferentes valores e funções para a determinação dos hiperparâmetros e otimizadores mais adequados para o modelo de Reconhecimento de Entidades Nomeadas (NER) desenvolvido através da biblioteca spaCy em Python. Para uma análise exploratória dos dados extraídos e demonstração da aplicabilidade do modelo foram executadas técnicas da estatística multivariada de análise de agrupamento, obtendo quatro grupos que melhor representam os perfis dos pacientes e os medicamentos por eles utilizados. Os resultados obtidos foram significativos considerando a complexidade do modelo, com um F-Score de 63,9% e Precision de 72,7%. A classe Condição do Paciente chegou a atingir 90,3% de Precision, seguido por Medicação com 87,5%. No desenvolvimento do presente trabalho, foram utilizados dados de 30.000 prontuários de pacientes do Hospital das Clínicas da Faculdade de Medicina de Botucatu/SP - Brasil (HCFMB), gerando um corpus com 1.200 textos clínicos. A utilização de NER em dados clínicos se mostrou uma ferramenta capaz de extrair informações que não existem em campos estruturados de prontuários médicos. Além disso, análises de agrupamento utilizando esses dados revelam comportamentos e características até então desconhecidas, relacionadas com as Entidades extraídas.Universidade Estadual Paulista (Unesp)Silveira, Liciana Vaz de Arruda [UNESP]Corrente, José Eduardo [UNESP]Universidade Estadual Paulista (Unesp)Rocha, Naila Camila da [UNESP]2021-09-14T18:03:10Z2021-09-14T18:03:10Z2021-07-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfapplication/pdfhttp://hdl.handle.net/11449/21440433004064083P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-10-23T14:26:36Zoai:repositorio.unesp.br:11449/214404Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-10-23T14:26:36Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Uso de redes neurais artificiais para extração de dados de prontuários médicos
Medical records data extraction using artificial neural networks
title Uso de redes neurais artificiais para extração de dados de prontuários médicos
spellingShingle Uso de redes neurais artificiais para extração de dados de prontuários médicos
Rocha, Naila Camila da [UNESP]
Reconhecimento de entidades nomeadas
Análise de agrupamento
Prontuários médicos
Redes neurais
Distância de gower
title_short Uso de redes neurais artificiais para extração de dados de prontuários médicos
title_full Uso de redes neurais artificiais para extração de dados de prontuários médicos
title_fullStr Uso de redes neurais artificiais para extração de dados de prontuários médicos
title_full_unstemmed Uso de redes neurais artificiais para extração de dados de prontuários médicos
title_sort Uso de redes neurais artificiais para extração de dados de prontuários médicos
author Rocha, Naila Camila da [UNESP]
author_facet Rocha, Naila Camila da [UNESP]
author_role author
dc.contributor.none.fl_str_mv Silveira, Liciana Vaz de Arruda [UNESP]
Corrente, José Eduardo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Rocha, Naila Camila da [UNESP]
dc.subject.por.fl_str_mv Reconhecimento de entidades nomeadas
Análise de agrupamento
Prontuários médicos
Redes neurais
Distância de gower
topic Reconhecimento de entidades nomeadas
Análise de agrupamento
Prontuários médicos
Redes neurais
Distância de gower
description Diversos estudos recentes têm utilizado inteligência artificial na extração e tratamento de dados secundários na área da saúde, obtidos em prontuários eletrônicos hospitalares. No entanto, alguns estudos são inviáveis devido a informações incompletas ou inseridas apenas em campos narrativos. O objetivo deste trabalho é desenvolver uma rede neural que utilize os dados desses campos para obter informações estruturadas referentes aos sintomas, diagnósticos, medicamentos, condições, exames e tratamentos. A rede neural proposta facilitará a descoberta de relações entre doenças e sintomas, prevalências e incidências, a identificação de condições clínicas, a evolução de enfermidades e os efeitos das medicações prescritas. O algoritmo utiliza métodos de processamento de linguagem natural para extração de textos e redes neurais convolucionais para reconhecimento de padrões. Foram simulados diferentes valores e funções para a determinação dos hiperparâmetros e otimizadores mais adequados para o modelo de Reconhecimento de Entidades Nomeadas (NER) desenvolvido através da biblioteca spaCy em Python. Para uma análise exploratória dos dados extraídos e demonstração da aplicabilidade do modelo foram executadas técnicas da estatística multivariada de análise de agrupamento, obtendo quatro grupos que melhor representam os perfis dos pacientes e os medicamentos por eles utilizados. Os resultados obtidos foram significativos considerando a complexidade do modelo, com um F-Score de 63,9% e Precision de 72,7%. A classe Condição do Paciente chegou a atingir 90,3% de Precision, seguido por Medicação com 87,5%. No desenvolvimento do presente trabalho, foram utilizados dados de 30.000 prontuários de pacientes do Hospital das Clínicas da Faculdade de Medicina de Botucatu/SP - Brasil (HCFMB), gerando um corpus com 1.200 textos clínicos. A utilização de NER em dados clínicos se mostrou uma ferramenta capaz de extrair informações que não existem em campos estruturados de prontuários médicos. Além disso, análises de agrupamento utilizando esses dados revelam comportamentos e características até então desconhecidas, relacionadas com as Entidades extraídas.
publishDate 2021
dc.date.none.fl_str_mv 2021-09-14T18:03:10Z
2021-09-14T18:03:10Z
2021-07-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/214404
33004064083P2
url http://hdl.handle.net/11449/214404
identifier_str_mv 33004064083P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954382159773696