Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Montezano, Bruno Braga
Orientador(a): Passos, Ives Cavalcante
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/266476
Resumo: O transtorno bipolar (tb) é uma doença psiquiátrica crônica associada à altas taxas de morbidade e mortalidade. Estudos anteriores demonstram redução significativa da expectativa de vida, além de risco aumentado para doença cardiovascular e morte por suicídio. Apesar de ser um transtorno com início precoce, existe um atraso de até 10 anos entre o início de sintomas e o diagnóstico adequado. Como consequência do crescimento da psiquiatria de precisão, pesquisas têm explorado o uso de técnicas de aprendizado de máquina para predizer tb, com foco em diagnóstico diferencial. No entanto, grande parte destes estudos são baseados em amostras clínicas pequenas, com curtos períodos de acompanhamento. A presente dissertação visa construir um modelo de classificação binária capaz de prever casos incidentes de tb em um intervalo de cinco anos através de características sociodemográficas e clínicas em uma amostra de adultos jovens, a partir de um grande estudo de coorte populacional. Avaliamos 1.091 sujeitos sem tb com 18 a 24 anos de idade no baseline a partir de uma amostra comunitária de jovens adultos da cidade de Pelotas (rs). O diagnóstico de tb no follow-up foi construído com base na Mini International Neuropsychiatric Interview 5.0. Cento e noventa preditores demográficos, sociais, clínicos e ambientais foram incluídos no pipeline de pré-processamento e modelagem. Utilizamos o algoritmo xgboost, estado-da-arte para dados tabulares, com validação cruzada 5-fold repetida por cinco vezes junto à seleção de variáveis e métodos de sobreamostragem para criar um modelo que pudesse prever quais sujeitos desenvolveriam tb cinco anos mais tarde. Quarenta e nove indivíduos (4,49%) receberam um diagnóstico de tb cinco anos depois. O melhor modelo selecionado com base no processo de validação cruzada apresentou um desempenho aceitável com um valor de auc de teste de 0,786 (ic 95%: 0,686, 0,887). O modelo final incluiu dez preditores, sendo eles: sentimento de fracasso, tristeza, episódio depressivo atual na primeira avaliação, problemas de estresse auto-relatado, autoconfiança, uso de cocaína ao longo da vida, status socioeconômico, frequência sexual, relacionamento com parceiro fixo e taquilalia. Um teste de permutação com 10.000 permutações demonstrou performance de auc significativamente melhor do modelo construído comparado a classificadores aleatórios ( < 0, 001). Os resultados do estudo trazem insights relevantes no que tange à compreensão do tb como um fenômeno latente, em especial, considerando que a depressão maior é comumente a primeira manifestação da doença, em linha com sintomas depressivos sendo os principais preditores no modelo apresentado. Visando uma melhor caracterização do tb, sugerimos que estudos futuros concentrem-se em fazer um acompanhamento sistemático que leve em conta estas características durante outras etapas do desenvolvimento, bem como investir em estudos que utilizem populações de risco específicas. Além disso, a inclusão de dados digitais de saúde, informações biológicas e neuropsicológicas pode ajudar no aprimoramento de novos modelos preditivos.
id URGS_1a9bf9ff8798c0787ddac57889b50893
oai_identifier_str oai:www.lume.ufrgs.br:10183/266476
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Montezano, Bruno BragaPassos, Ives CavalcanteJansen, Karen2023-11-02T03:25:55Z2023http://hdl.handle.net/10183/266476001185742O transtorno bipolar (tb) é uma doença psiquiátrica crônica associada à altas taxas de morbidade e mortalidade. Estudos anteriores demonstram redução significativa da expectativa de vida, além de risco aumentado para doença cardiovascular e morte por suicídio. Apesar de ser um transtorno com início precoce, existe um atraso de até 10 anos entre o início de sintomas e o diagnóstico adequado. Como consequência do crescimento da psiquiatria de precisão, pesquisas têm explorado o uso de técnicas de aprendizado de máquina para predizer tb, com foco em diagnóstico diferencial. No entanto, grande parte destes estudos são baseados em amostras clínicas pequenas, com curtos períodos de acompanhamento. A presente dissertação visa construir um modelo de classificação binária capaz de prever casos incidentes de tb em um intervalo de cinco anos através de características sociodemográficas e clínicas em uma amostra de adultos jovens, a partir de um grande estudo de coorte populacional. Avaliamos 1.091 sujeitos sem tb com 18 a 24 anos de idade no baseline a partir de uma amostra comunitária de jovens adultos da cidade de Pelotas (rs). O diagnóstico de tb no follow-up foi construído com base na Mini International Neuropsychiatric Interview 5.0. Cento e noventa preditores demográficos, sociais, clínicos e ambientais foram incluídos no pipeline de pré-processamento e modelagem. Utilizamos o algoritmo xgboost, estado-da-arte para dados tabulares, com validação cruzada 5-fold repetida por cinco vezes junto à seleção de variáveis e métodos de sobreamostragem para criar um modelo que pudesse prever quais sujeitos desenvolveriam tb cinco anos mais tarde. Quarenta e nove indivíduos (4,49%) receberam um diagnóstico de tb cinco anos depois. O melhor modelo selecionado com base no processo de validação cruzada apresentou um desempenho aceitável com um valor de auc de teste de 0,786 (ic 95%: 0,686, 0,887). O modelo final incluiu dez preditores, sendo eles: sentimento de fracasso, tristeza, episódio depressivo atual na primeira avaliação, problemas de estresse auto-relatado, autoconfiança, uso de cocaína ao longo da vida, status socioeconômico, frequência sexual, relacionamento com parceiro fixo e taquilalia. Um teste de permutação com 10.000 permutações demonstrou performance de auc significativamente melhor do modelo construído comparado a classificadores aleatórios ( < 0, 001). Os resultados do estudo trazem insights relevantes no que tange à compreensão do tb como um fenômeno latente, em especial, considerando que a depressão maior é comumente a primeira manifestação da doença, em linha com sintomas depressivos sendo os principais preditores no modelo apresentado. Visando uma melhor caracterização do tb, sugerimos que estudos futuros concentrem-se em fazer um acompanhamento sistemático que leve em conta estas características durante outras etapas do desenvolvimento, bem como investir em estudos que utilizem populações de risco específicas. Além disso, a inclusão de dados digitais de saúde, informações biológicas e neuropsicológicas pode ajudar no aprimoramento de novos modelos preditivos.Bipolar disorder (bd) is a chronic psychiatric illness associated with high rates of morbidity and mortality. Previous studies demonstrate a significant reduction in life expectancy, as well as an increased risk for cardiovascular disease and death by suicide. Despite being an early-onset disorder, there is a delay of up to 10 years between symptom onset and adequate diagnosis. As a consequence of the growth of precision psychiatry, research has explored the use of machine learning techniques to predict bd, with a focus on differential diagnosis. However, a large portion of these studies are based on small clinical samples with short follow-up periods. The present thesis aims to build a binary classification model capable of predicting incident cases of bd within a 5-year interval through sociodemographic and clinical characteristics in a sample of young adults from a large population cohort study.We evaluated 1,091 individuals without bd aged 18–24 at baseline from a community sample of young adults in the city of Pelotas (rs). The diagnosis of bd in the follow-up was based on the Mini International Neuropsychiatric Interview 5.0. One hundred and ninety demographic, social, clinical, and environmental predictors were included in the preprocessing and modeling pipeline.We used the state-of-the-art xgboost algorithm for tabular data, with 5-fold cross-validation repeated five times, along with variable selection and oversampling methods, to create a model that could predict which subjects would develop bd five years later. Forty-nine individuals (4.49%) received a bd diagnosis five years later. The best model based on the cross-validation procedure showed acceptable performance with a test auc value of 0.786 (95% ci: 0.686, 0.887). The final model included ten predictors, namely, feeling like a failure, sadness, current depressive episode at baseline, selfreported stress problems, self-confidence, lifetime cocaine use, socioeconomic status, sexual frequency, relationship with a fixed partner, and tachylalia. A permutation test with 10,000 permutations demonstrated significantly better auc performance of the built model compared to random classifiers ( < 0.001). The study results provide relevant insights regarding the understanding of bd as a latent phenomenon, particularly considering that major depression is commonly the first manifestation of the disease, in line with depressive symptoms being the main predictors in the presented model. In order to better characterize bd, we suggest that future studies focus on systematic follow-up that takes these characteristics into account during other stages of development, aswell as investing in studies that use specific at-risk populations. Additionally, the inclusion of digital health data, biological and neuropsychological information can help improve new predictive models.application/pdfporTranstorno bipolarAprendizado de máquinaAdulto jovemIncidênciaMedicina de precisãoBipolar disorderMachine learningxgboostIncidencePrecision medicinePredição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulFaculdade de MedicinaPrograma de Pós-Graduação em Psiquiatria e Ciências do ComportamentoPorto Alegre, BR-RS2023mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001185742.pdf.txt001185742.pdf.txtExtracted Texttext/plain252074http://www.lume.ufrgs.br/bitstream/10183/266476/2/001185742.pdf.txt9a377a1a351deb052ffd71fd8b045b18MD52ORIGINAL001185742.pdfTexto completoapplication/pdf2952077http://www.lume.ufrgs.br/bitstream/10183/266476/1/001185742.pdf8dc20de4d82d040ea7947063cfb93aedMD5110183/2664762023-11-03 03:25:30.451934oai:www.lume.ufrgs.br:10183/266476Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-11-03T06:25:30Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
title Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
spellingShingle Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
Montezano, Bruno Braga
Transtorno bipolar
Aprendizado de máquina
Adulto jovem
Incidência
Medicina de precisão
Bipolar disorder
Machine learning
xgboost
Incidence
Precision medicine
title_short Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
title_full Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
title_fullStr Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
title_full_unstemmed Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
title_sort Predição de transtorno bipolar e desfechos funcionais em adultos jovens : um acompanhamento de cinco anos
author Montezano, Bruno Braga
author_facet Montezano, Bruno Braga
author_role author
dc.contributor.author.fl_str_mv Montezano, Bruno Braga
dc.contributor.advisor1.fl_str_mv Passos, Ives Cavalcante
dc.contributor.advisor-co1.fl_str_mv Jansen, Karen
contributor_str_mv Passos, Ives Cavalcante
Jansen, Karen
dc.subject.por.fl_str_mv Transtorno bipolar
Aprendizado de máquina
Adulto jovem
Incidência
Medicina de precisão
topic Transtorno bipolar
Aprendizado de máquina
Adulto jovem
Incidência
Medicina de precisão
Bipolar disorder
Machine learning
xgboost
Incidence
Precision medicine
dc.subject.eng.fl_str_mv Bipolar disorder
Machine learning
xgboost
Incidence
Precision medicine
description O transtorno bipolar (tb) é uma doença psiquiátrica crônica associada à altas taxas de morbidade e mortalidade. Estudos anteriores demonstram redução significativa da expectativa de vida, além de risco aumentado para doença cardiovascular e morte por suicídio. Apesar de ser um transtorno com início precoce, existe um atraso de até 10 anos entre o início de sintomas e o diagnóstico adequado. Como consequência do crescimento da psiquiatria de precisão, pesquisas têm explorado o uso de técnicas de aprendizado de máquina para predizer tb, com foco em diagnóstico diferencial. No entanto, grande parte destes estudos são baseados em amostras clínicas pequenas, com curtos períodos de acompanhamento. A presente dissertação visa construir um modelo de classificação binária capaz de prever casos incidentes de tb em um intervalo de cinco anos através de características sociodemográficas e clínicas em uma amostra de adultos jovens, a partir de um grande estudo de coorte populacional. Avaliamos 1.091 sujeitos sem tb com 18 a 24 anos de idade no baseline a partir de uma amostra comunitária de jovens adultos da cidade de Pelotas (rs). O diagnóstico de tb no follow-up foi construído com base na Mini International Neuropsychiatric Interview 5.0. Cento e noventa preditores demográficos, sociais, clínicos e ambientais foram incluídos no pipeline de pré-processamento e modelagem. Utilizamos o algoritmo xgboost, estado-da-arte para dados tabulares, com validação cruzada 5-fold repetida por cinco vezes junto à seleção de variáveis e métodos de sobreamostragem para criar um modelo que pudesse prever quais sujeitos desenvolveriam tb cinco anos mais tarde. Quarenta e nove indivíduos (4,49%) receberam um diagnóstico de tb cinco anos depois. O melhor modelo selecionado com base no processo de validação cruzada apresentou um desempenho aceitável com um valor de auc de teste de 0,786 (ic 95%: 0,686, 0,887). O modelo final incluiu dez preditores, sendo eles: sentimento de fracasso, tristeza, episódio depressivo atual na primeira avaliação, problemas de estresse auto-relatado, autoconfiança, uso de cocaína ao longo da vida, status socioeconômico, frequência sexual, relacionamento com parceiro fixo e taquilalia. Um teste de permutação com 10.000 permutações demonstrou performance de auc significativamente melhor do modelo construído comparado a classificadores aleatórios ( < 0, 001). Os resultados do estudo trazem insights relevantes no que tange à compreensão do tb como um fenômeno latente, em especial, considerando que a depressão maior é comumente a primeira manifestação da doença, em linha com sintomas depressivos sendo os principais preditores no modelo apresentado. Visando uma melhor caracterização do tb, sugerimos que estudos futuros concentrem-se em fazer um acompanhamento sistemático que leve em conta estas características durante outras etapas do desenvolvimento, bem como investir em estudos que utilizem populações de risco específicas. Além disso, a inclusão de dados digitais de saúde, informações biológicas e neuropsicológicas pode ajudar no aprimoramento de novos modelos preditivos.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-11-02T03:25:55Z
dc.date.issued.fl_str_mv 2023
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/266476
dc.identifier.nrb.pt_BR.fl_str_mv 001185742
url http://hdl.handle.net/10183/266476
identifier_str_mv 001185742
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/266476/2/001185742.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/266476/1/001185742.pdf
bitstream.checksum.fl_str_mv 9a377a1a351deb052ffd71fd8b045b18
8dc20de4d82d040ea7947063cfb93aed
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316167920189440