Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Machado, Cristiane dos Santos
Orientador(a): Passos, Ives Cavalcante
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/211237
Resumo: O suicídio é uma das principais causas de morte no mundo e um evento trágico, mas altamente prevenível. Entretanto, ainda há pouca consciência de uma estratificação objetiva para o risco de suicídio. A presente dissertação tem como objetivo desenvolver modelos para prever tentativas de suicídio na população americana em geral (Objetivo 1) e em participantes com episódios depressivos maiores ao longo da vida (Objetivo 2), usando técnicas de machine learning associadas a variáveis sociodemográficas, de eventos estressantes da vida e variáveis clínicas. Para alcançar esse objetivo e abordar as limitações de trabalhos anteriores, utilizamos o National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). O NESARC é uma coorte publicamente disponível, mediante solicitação, com 43.093 participantes e com um período de seguimento de três anos. Ele foi realizado em duas ondas. Entrevistas presenciais foram realizadas com 43.093 indivíduos na Onda 1, com uma taxa de 81% de resposta. A onda 2 envolveu reavaliações presenciais com todos os participantes da onda 1, refletindo 34.653 entrevistas concluídas. As variáveis preditoras foram avaliadas na Onda 1, enquanto que o desfecho (participantes que tentaram suicídio versus participantes que não tentaram suicídio entre a Onda 1 e a Onda 2) foi avaliado na Onda 2. Nós utilizamos o elastic net regularization como nossa análise primária, mas também o random forest e o artificial neural networks. O modelo construído com o elastic net regularization distinguiu indivíduos que tentaram suicídio daqueles que não tentaram com uma área sob a curva ROC (AUC) de 0,89, acurácia balanceada de 81,86%, especificidade de 89,22% e sensibilidade de 74,51% para a população geral. Para os participantes com episódios depressivos maiores ao longo da vida, a AUC foi de 0,89, a acurácia balanceada de 81,64%, a especificidade de 85,86% e a sensibilidade de 77,42%. As variáveis mais importantes com o elastic net foram transtorno de personalidade borderline, transtorno de estresse pós-traumático e descendência asiática para o modelo com todos os participantes; e tentativa prévia de suicídio, transtorno de personalidade borderline e ter ficado uma noite no hospital por causa da depressão no modelo com indivíduos com episódios depressivos maiores ao longo da vida. Random forest e artificial neural networks tiveram desempenho semelhantes em comparação ao elastic net. Dessa forma, através desse trabalho, concluímos que o risco de tentativa de suicídio pode ser estimado com alta precisão, em nível individual, em uma amostra representativa da população americana, por meio da incorporação de variáveis sociodemográficas, de fatores estressantes da vida e de variáveis clínicas. Estudos futuros que integrem dados de diferentes níveis biológicos, como dados genéticos e de saúde digital, podem ajudar a construir modelos mais precisos.
id URGS_4bec9db030ff1dbccd953012b214e2e1
oai_identifier_str oai:www.lume.ufrgs.br:10183/211237
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Machado, Cristiane dos SantosPassos, Ives Cavalcante2020-07-02T03:36:02Z2020http://hdl.handle.net/10183/211237001114854O suicídio é uma das principais causas de morte no mundo e um evento trágico, mas altamente prevenível. Entretanto, ainda há pouca consciência de uma estratificação objetiva para o risco de suicídio. A presente dissertação tem como objetivo desenvolver modelos para prever tentativas de suicídio na população americana em geral (Objetivo 1) e em participantes com episódios depressivos maiores ao longo da vida (Objetivo 2), usando técnicas de machine learning associadas a variáveis sociodemográficas, de eventos estressantes da vida e variáveis clínicas. Para alcançar esse objetivo e abordar as limitações de trabalhos anteriores, utilizamos o National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). O NESARC é uma coorte publicamente disponível, mediante solicitação, com 43.093 participantes e com um período de seguimento de três anos. Ele foi realizado em duas ondas. Entrevistas presenciais foram realizadas com 43.093 indivíduos na Onda 1, com uma taxa de 81% de resposta. A onda 2 envolveu reavaliações presenciais com todos os participantes da onda 1, refletindo 34.653 entrevistas concluídas. As variáveis preditoras foram avaliadas na Onda 1, enquanto que o desfecho (participantes que tentaram suicídio versus participantes que não tentaram suicídio entre a Onda 1 e a Onda 2) foi avaliado na Onda 2. Nós utilizamos o elastic net regularization como nossa análise primária, mas também o random forest e o artificial neural networks. O modelo construído com o elastic net regularization distinguiu indivíduos que tentaram suicídio daqueles que não tentaram com uma área sob a curva ROC (AUC) de 0,89, acurácia balanceada de 81,86%, especificidade de 89,22% e sensibilidade de 74,51% para a população geral. Para os participantes com episódios depressivos maiores ao longo da vida, a AUC foi de 0,89, a acurácia balanceada de 81,64%, a especificidade de 85,86% e a sensibilidade de 77,42%. As variáveis mais importantes com o elastic net foram transtorno de personalidade borderline, transtorno de estresse pós-traumático e descendência asiática para o modelo com todos os participantes; e tentativa prévia de suicídio, transtorno de personalidade borderline e ter ficado uma noite no hospital por causa da depressão no modelo com indivíduos com episódios depressivos maiores ao longo da vida. Random forest e artificial neural networks tiveram desempenho semelhantes em comparação ao elastic net. Dessa forma, através desse trabalho, concluímos que o risco de tentativa de suicídio pode ser estimado com alta precisão, em nível individual, em uma amostra representativa da população americana, por meio da incorporação de variáveis sociodemográficas, de fatores estressantes da vida e de variáveis clínicas. Estudos futuros que integrem dados de diferentes níveis biológicos, como dados genéticos e de saúde digital, podem ajudar a construir modelos mais precisos.Suicide is a major cause of death worldwide and a tragic but highly preventable event. However, there is still little awareness of objective suicide risk stratification. The present dissertation aims to develop models to predict suicide attempts in the general population (Aim 1) and in participants with lifetime major depressive episodes (Aim 2) by using machine learning techniques coupled with sociodemographic, stressful life events, and clinical data. To achieve this and to address the limitations of prior works, we used the National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). NESARC is representative cohort publicly available by request with 43,093 participants a 3-year follow-up period. It was conducted in two waves. Face-to-face interviews were conducted with 43,093 respondents in Wave 1, yielding an overall response rate of 81%. Wave 2 of the NESARC involved face-to-face reinterviews with all Wave 1 participants, reflecting 34,653 completed interviews. Predictor variables were assessed in Wave 1, while the outcome (participants who attempted suicide versus participants who did not between Wave 1 and Wave 2) was assessed in Wave 2. We used elastic net regularization as our primary analysis, plus random forest, and artificial neural networks. The model built with elastic net regularization distinguished individuals who had attempted suicide from those who had not with an area under the ROC curve (AUC) of 0.89, balanced accuracy 81.86%, specificity 89.22%, and sensitivity 74.51% for the general population. For participants with lifetime major depressive episodes, AUC was 0.89, balanced accuracy 81.64%, specificity 85.86%, and sensitivity 77.42%. The most important variables for the model with elastic net were borderline personality disorder, posttraumatic stress disorder, and being of Asian descent for the model in all participants; and previous suicide attempt, borderline personality disorder, and stay overnight in hospital because of depression for the model in participants with lifetime major depressive episodes. Random forest and artificial neural networks had similar performance compared to elastic net. In conclusion, risk for suicide attempt can be estimated with high accuracy at an individual subject level by incorporating sociodemographic, stressful life events and clinical variables in a US national representative sample. Future studies integrating data from different biological levels, such as genetics and digital health data, could potentially help to build more accurate models.application/pdfporPrognósticoFatores de riscoTentativa de suicídioAprendizado de máquinaSuicide attemptMachine learningPredictionNESARCPredição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulFaculdade de MedicinaPrograma de Pós-Graduação em Psiquiatria e Ciências do ComportamentoPorto Alegre, BR-RS2020mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001114854.pdf.txt001114854.pdf.txtExtracted Texttext/plain114868http://www.lume.ufrgs.br/bitstream/10183/211237/2/001114854.pdf.txta31e131a74492c14c831691c9db5117eMD52ORIGINAL001114854.pdfTexto completoapplication/pdf1645244http://www.lume.ufrgs.br/bitstream/10183/211237/1/001114854.pdf45e7d4ddff70ebadd07ed9a334db0f65MD5110183/2112372023-05-26 03:29:09.591938oai:www.lume.ufrgs.br:10183/211237Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532023-05-26T06:29:09Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
title Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
spellingShingle Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
Machado, Cristiane dos Santos
Prognóstico
Fatores de risco
Tentativa de suicídio
Aprendizado de máquina
Suicide attempt
Machine learning
Prediction
NESARC
title_short Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
title_full Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
title_fullStr Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
title_full_unstemmed Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
title_sort Predição de tentativas de suicídio em uma amostra representativa da população americana através do uso de machine learning
author Machado, Cristiane dos Santos
author_facet Machado, Cristiane dos Santos
author_role author
dc.contributor.author.fl_str_mv Machado, Cristiane dos Santos
dc.contributor.advisor1.fl_str_mv Passos, Ives Cavalcante
contributor_str_mv Passos, Ives Cavalcante
dc.subject.por.fl_str_mv Prognóstico
Fatores de risco
Tentativa de suicídio
Aprendizado de máquina
topic Prognóstico
Fatores de risco
Tentativa de suicídio
Aprendizado de máquina
Suicide attempt
Machine learning
Prediction
NESARC
dc.subject.eng.fl_str_mv Suicide attempt
Machine learning
Prediction
NESARC
description O suicídio é uma das principais causas de morte no mundo e um evento trágico, mas altamente prevenível. Entretanto, ainda há pouca consciência de uma estratificação objetiva para o risco de suicídio. A presente dissertação tem como objetivo desenvolver modelos para prever tentativas de suicídio na população americana em geral (Objetivo 1) e em participantes com episódios depressivos maiores ao longo da vida (Objetivo 2), usando técnicas de machine learning associadas a variáveis sociodemográficas, de eventos estressantes da vida e variáveis clínicas. Para alcançar esse objetivo e abordar as limitações de trabalhos anteriores, utilizamos o National Epidemiologic Survey on Alcohol and Related Conditions (NESARC). O NESARC é uma coorte publicamente disponível, mediante solicitação, com 43.093 participantes e com um período de seguimento de três anos. Ele foi realizado em duas ondas. Entrevistas presenciais foram realizadas com 43.093 indivíduos na Onda 1, com uma taxa de 81% de resposta. A onda 2 envolveu reavaliações presenciais com todos os participantes da onda 1, refletindo 34.653 entrevistas concluídas. As variáveis preditoras foram avaliadas na Onda 1, enquanto que o desfecho (participantes que tentaram suicídio versus participantes que não tentaram suicídio entre a Onda 1 e a Onda 2) foi avaliado na Onda 2. Nós utilizamos o elastic net regularization como nossa análise primária, mas também o random forest e o artificial neural networks. O modelo construído com o elastic net regularization distinguiu indivíduos que tentaram suicídio daqueles que não tentaram com uma área sob a curva ROC (AUC) de 0,89, acurácia balanceada de 81,86%, especificidade de 89,22% e sensibilidade de 74,51% para a população geral. Para os participantes com episódios depressivos maiores ao longo da vida, a AUC foi de 0,89, a acurácia balanceada de 81,64%, a especificidade de 85,86% e a sensibilidade de 77,42%. As variáveis mais importantes com o elastic net foram transtorno de personalidade borderline, transtorno de estresse pós-traumático e descendência asiática para o modelo com todos os participantes; e tentativa prévia de suicídio, transtorno de personalidade borderline e ter ficado uma noite no hospital por causa da depressão no modelo com indivíduos com episódios depressivos maiores ao longo da vida. Random forest e artificial neural networks tiveram desempenho semelhantes em comparação ao elastic net. Dessa forma, através desse trabalho, concluímos que o risco de tentativa de suicídio pode ser estimado com alta precisão, em nível individual, em uma amostra representativa da população americana, por meio da incorporação de variáveis sociodemográficas, de fatores estressantes da vida e de variáveis clínicas. Estudos futuros que integrem dados de diferentes níveis biológicos, como dados genéticos e de saúde digital, podem ajudar a construir modelos mais precisos.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-07-02T03:36:02Z
dc.date.issued.fl_str_mv 2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/211237
dc.identifier.nrb.pt_BR.fl_str_mv 001114854
url http://hdl.handle.net/10183/211237
identifier_str_mv 001114854
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/211237/2/001114854.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/211237/1/001114854.pdf
bitstream.checksum.fl_str_mv a31e131a74492c14c831691c9db5117e
45e7d4ddff70ebadd07ed9a334db0f65
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316094984388608