Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Solha, Erik Zarko Macêdo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/589380
Resumo: A pandemia de COVID-19 causou interrupções significativas na vida cotidiana e teve consequências sociais, políticas e financeiras que persistirão por anos. Diversas iniciativas com uso intensivo de tecnologia foram rapidamente desenvolvidas nesse cenário. No entanto, são escassas as tecnologias que aprimoram a vigilância epidemiológica em contextos com baixa capacidade de testagem e recursos de saúde limitados. Portanto, este estudo tem como objetivo abordar essa lacuna, desenvolvendo um modelo de ciência de dados que utiliza registros de atendimentos de saúde gerados rotineiramente para detectar possíveis novos surtos de forma precoce e em tempo real. Definiu-se um indicador epidemiológico que serve como proxy para casos suspeitos de COVID-19 usando os registros de saúde de pacientes das Unidades de Pronto Atendimento (UPAs) e técnicas de mineração de texto. O conjunto de dados aberto compreende 2.760.862 registros médicos de nove UPAs, onde cada registro contém informações sobre a idade do paciente, sintomas relatados e a hora e data de admissão. Também foi utilizado um conjunto de dados onde 1.026.804 casos de COVID-19 foram oficialmente confirmados. Os registros variam de janeiro de 2020 a maio de 2022. A correlação cruzada amostral entre duas séries temporais estocásticas finitas foi utilizada para avaliar os modelos. Para pacientes com idade = 18 anos, encontramos atraso temporal t = 72 dias e correlação cruzada ?ˆi,j ~ 0, 82, t = 25 dias e ?ˆi,j ~ 0, 93, e t = 17 dias e ?ˆi,j ~ 0, 88 para a primeira, segunda e terceira ondas, respectivamente. Em suma, mostrou-se que o modelo desenvolvido pode auxiliar na detecção precoce de sinais de possíveis novos surtos de COVID-19, semanas antes dos sistemas tradicionais de vigilância, antecipando assim a implementação de ações preventivas e de controle em saúde pública com uma maior probabilidade de sucesso. Palavras-chave: COVID-19. Vigilância em Saúde Pública. Ciência de Dados. Mineração de Texto. Correlação Cruzada.
id UFOR_57911c871d5a0b04cbec150fe2561d76
oai_identifier_str oai::589380
network_acronym_str UFOR
network_name_str Biblioteca Digital de Teses e Dissertações da UNIFOR
repository_id_str
spelling Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúdeCovid-19 (Pandemia)Prontuário eletrônicoMineração de dadosA pandemia de COVID-19 causou interrupções significativas na vida cotidiana e teve consequências sociais, políticas e financeiras que persistirão por anos. Diversas iniciativas com uso intensivo de tecnologia foram rapidamente desenvolvidas nesse cenário. No entanto, são escassas as tecnologias que aprimoram a vigilância epidemiológica em contextos com baixa capacidade de testagem e recursos de saúde limitados. Portanto, este estudo tem como objetivo abordar essa lacuna, desenvolvendo um modelo de ciência de dados que utiliza registros de atendimentos de saúde gerados rotineiramente para detectar possíveis novos surtos de forma precoce e em tempo real. Definiu-se um indicador epidemiológico que serve como proxy para casos suspeitos de COVID-19 usando os registros de saúde de pacientes das Unidades de Pronto Atendimento (UPAs) e técnicas de mineração de texto. O conjunto de dados aberto compreende 2.760.862 registros médicos de nove UPAs, onde cada registro contém informações sobre a idade do paciente, sintomas relatados e a hora e data de admissão. Também foi utilizado um conjunto de dados onde 1.026.804 casos de COVID-19 foram oficialmente confirmados. Os registros variam de janeiro de 2020 a maio de 2022. A correlação cruzada amostral entre duas séries temporais estocásticas finitas foi utilizada para avaliar os modelos. Para pacientes com idade = 18 anos, encontramos atraso temporal t = 72 dias e correlação cruzada ?ˆi,j ~ 0, 82, t = 25 dias e ?ˆi,j ~ 0, 93, e t = 17 dias e ?ˆi,j ~ 0, 88 para a primeira, segunda e terceira ondas, respectivamente. Em suma, mostrou-se que o modelo desenvolvido pode auxiliar na detecção precoce de sinais de possíveis novos surtos de COVID-19, semanas antes dos sistemas tradicionais de vigilância, antecipando assim a implementação de ações preventivas e de controle em saúde pública com uma maior probabilidade de sucesso. Palavras-chave: COVID-19. Vigilância em Saúde Pública. Ciência de Dados. Mineração de Texto. Correlação Cruzada.The COVID-19 pandemic has caused significant disruptions to everyday life and has had social, political, and financial consequences that will persist for years. Several initiatives with intensive use of technology were quickly developed in this scenario. However, technologies that enhance epidemiological surveillance in contexts with low testing capacity and healthcare resources are scarce. Therefore, this study aims to address this gap by developing a data science model that uses routinely generated healthcare encounter records to detect possible new outbreaks early in real-time. We defined an epidemiological indicator that is a proxy for suspected cases of COVID-19 using the health records of Emergency Care Unit (ECU) patients and text mining techniques. The open-field dataset comprises 2,760,862 medical records from nine ECUs, where each record has information about the patient’s age, reported symptoms, and the time and date of admission. We also used a dataset where 1,026,804 cases of COVID-19 were officially confirmed. The records range from January 2020 to May 2022. Sample cross-correlation between two finite stochastic time series was used to evaluate the models. For patients with age = 18 years, we find time-lag t = 72 days and cross-correlation ?ˆi,j ~ 0, 82, t = 25 days and ?ˆi,j ~ 0, 93, and t = 17 days and ?ˆi,j ~ 0, 88 for the first, second, and third waves, respectively. In conclusion, the developed model can aid in the early detection of signs of possible new COVID-19 outbreaks, weeks before traditional surveillance systems, thereby anticipating in initiating preventive and control actions in public health with a higher likelihood of success. Keywords: COVID-19. Public Health Surveillance. Data Science. Text Mining. Crosscorrelation.A Dissertação foi enviada com autorização e certificação via CI 54932/24 em 26/08/2024.Oliveira, Erneson Alves deRocha, Hermano Alexandre LimaPires, Rilder de SousaUniversidade de Fortaleza. Programa de Pós-Graduação em Informática AplicadaSolha, Erik Zarko Macêdo2024info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf45f.https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/589380https://uol.unifor.br/auth-sophia/exibicao/37089porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess2024-10-29T20:20:45Zoai::589380Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br||bib@unifor.bropendoar:2024-10-29T20:20:45Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false
dc.title.none.fl_str_mv Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
title Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
spellingShingle Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
Solha, Erik Zarko Macêdo
Covid-19 (Pandemia)
Prontuário eletrônico
Mineração de dados
title_short Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
title_full Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
title_fullStr Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
title_full_unstemmed Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
title_sort Vigilância de surtos de COVID-19 através de mineração de texto aplicada aos registros eletrônicos de saúde
author Solha, Erik Zarko Macêdo
author_facet Solha, Erik Zarko Macêdo
author_role author
dc.contributor.none.fl_str_mv Oliveira, Erneson Alves de
Rocha, Hermano Alexandre Lima
Pires, Rilder de Sousa
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
dc.contributor.author.fl_str_mv Solha, Erik Zarko Macêdo
dc.subject.por.fl_str_mv Covid-19 (Pandemia)
Prontuário eletrônico
Mineração de dados
topic Covid-19 (Pandemia)
Prontuário eletrônico
Mineração de dados
description A pandemia de COVID-19 causou interrupções significativas na vida cotidiana e teve consequências sociais, políticas e financeiras que persistirão por anos. Diversas iniciativas com uso intensivo de tecnologia foram rapidamente desenvolvidas nesse cenário. No entanto, são escassas as tecnologias que aprimoram a vigilância epidemiológica em contextos com baixa capacidade de testagem e recursos de saúde limitados. Portanto, este estudo tem como objetivo abordar essa lacuna, desenvolvendo um modelo de ciência de dados que utiliza registros de atendimentos de saúde gerados rotineiramente para detectar possíveis novos surtos de forma precoce e em tempo real. Definiu-se um indicador epidemiológico que serve como proxy para casos suspeitos de COVID-19 usando os registros de saúde de pacientes das Unidades de Pronto Atendimento (UPAs) e técnicas de mineração de texto. O conjunto de dados aberto compreende 2.760.862 registros médicos de nove UPAs, onde cada registro contém informações sobre a idade do paciente, sintomas relatados e a hora e data de admissão. Também foi utilizado um conjunto de dados onde 1.026.804 casos de COVID-19 foram oficialmente confirmados. Os registros variam de janeiro de 2020 a maio de 2022. A correlação cruzada amostral entre duas séries temporais estocásticas finitas foi utilizada para avaliar os modelos. Para pacientes com idade = 18 anos, encontramos atraso temporal t = 72 dias e correlação cruzada ?ˆi,j ~ 0, 82, t = 25 dias e ?ˆi,j ~ 0, 93, e t = 17 dias e ?ˆi,j ~ 0, 88 para a primeira, segunda e terceira ondas, respectivamente. Em suma, mostrou-se que o modelo desenvolvido pode auxiliar na detecção precoce de sinais de possíveis novos surtos de COVID-19, semanas antes dos sistemas tradicionais de vigilância, antecipando assim a implementação de ações preventivas e de controle em saúde pública com uma maior probabilidade de sucesso. Palavras-chave: COVID-19. Vigilância em Saúde Pública. Ciência de Dados. Mineração de Texto. Correlação Cruzada.
publishDate 2024
dc.date.none.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/589380
url https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/589380
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://uol.unifor.br/auth-sophia/exibicao/37089
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
45f.
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR
instname:Universidade de Fortaleza (UNIFOR)
instacron:UNIFOR
instname_str Universidade de Fortaleza (UNIFOR)
instacron_str UNIFOR
institution UNIFOR
reponame_str Biblioteca Digital de Teses e Dissertações da UNIFOR
collection Biblioteca Digital de Teses e Dissertações da UNIFOR
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)
repository.mail.fl_str_mv bib@unifor.br||bib@unifor.br
_version_ 1846365345440333824