Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Nagamatu, Bruno Issamo Tagava
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/
Resumo: Transtornos de saúde mental, como depressão e ansiedade, são uma preocupação crescente na sociedade moderna. No Processamento de Linguagem Natural (PLN), textos provenientes de redes sociais têm sido amplamente utilizados para a detecção de transtornos de saúde mental por meio de métodos de aprendizado de máquina, que analisam todos os dados de autoria do usuário disponíveis. A série de desafios eRisk propõe uma abordagem alternativa, focada na detecção precoce de risco, ou seja, identificar um transtorno utilizando o menor volume possível de dados em uma sequência cronológica de postagens, como em uma timeline de rede social. Neste contexto, o presente estudo enfoca o problema a detecção precoce de transtornos de saúde mental nos moldes da série de desafios eRisk (originalmente voltado ao domínio de fóruns de discussão sobre saúde mental no idioma inglês) em uma rede social de propósito geral em português. De forma mais específica, propõe a adaptação de uma estratégia vencedora em diversas edições deste shared task para o caso da detecção precoce de depressão e transtorno de ansiedade no domínio do Twitter/X brasileiro, usando para este fim uma abordagem inédita baseada em LLMs com uso de engenharia de prompts. Estes modelos têm demonstrado potencial significativo em capturar nuances textuais complexas e, portanto, serão explorados como abordagem para a resolução do problema. Adicionalmente, métodos aprendizado de máquina e representação textual tradicionais, bem como modelo de língua pré-treinado BERT, serão utilizados como baselines para comparação. Também relacionado à rede social de propósito geral investigou-se a influência da proximidade das mensagens do momento do diagnóstico na ordem cronológica da timeline do Twitter/X na tarefa de detecção precoce de transtornos de saúde mental por meio da comparação entre da aplicação de LLMs tanto às mensagens mais recentes quanto a timeline completa.
id USP_923ab0bb27bb191d00ec24f6c354febd
oai_identifier_str oai:teses.usp.br:tde-26112024-115052
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociaisDetection of early risk of mental health disorders from publications on social networksAnsiedadeAnxietyDepressãoDepressionDetecção precoceEarly risk predictionMental healthRedes sociaisSaúde mentalSocial mediaTranstornos de saúde mental, como depressão e ansiedade, são uma preocupação crescente na sociedade moderna. No Processamento de Linguagem Natural (PLN), textos provenientes de redes sociais têm sido amplamente utilizados para a detecção de transtornos de saúde mental por meio de métodos de aprendizado de máquina, que analisam todos os dados de autoria do usuário disponíveis. A série de desafios eRisk propõe uma abordagem alternativa, focada na detecção precoce de risco, ou seja, identificar um transtorno utilizando o menor volume possível de dados em uma sequência cronológica de postagens, como em uma timeline de rede social. Neste contexto, o presente estudo enfoca o problema a detecção precoce de transtornos de saúde mental nos moldes da série de desafios eRisk (originalmente voltado ao domínio de fóruns de discussão sobre saúde mental no idioma inglês) em uma rede social de propósito geral em português. De forma mais específica, propõe a adaptação de uma estratégia vencedora em diversas edições deste shared task para o caso da detecção precoce de depressão e transtorno de ansiedade no domínio do Twitter/X brasileiro, usando para este fim uma abordagem inédita baseada em LLMs com uso de engenharia de prompts. Estes modelos têm demonstrado potencial significativo em capturar nuances textuais complexas e, portanto, serão explorados como abordagem para a resolução do problema. Adicionalmente, métodos aprendizado de máquina e representação textual tradicionais, bem como modelo de língua pré-treinado BERT, serão utilizados como baselines para comparação. Também relacionado à rede social de propósito geral investigou-se a influência da proximidade das mensagens do momento do diagnóstico na ordem cronológica da timeline do Twitter/X na tarefa de detecção precoce de transtornos de saúde mental por meio da comparação entre da aplicação de LLMs tanto às mensagens mais recentes quanto a timeline completa.Mental health disorders, such as depression and anxiety, are a growing concern in modern society. In Natural Language Processing (NLP), texts from social media have been widely used for detection of mental health disorders through machine learning methods, which analyze all available user-generated data. The eRisk challenge series proposes an alternative approach, focused on early risk detection, i.e., identifying a disorder using the smallest possible volume of data in a chronological sequence of posts, like in a social media timeline. In this context, the present study focuses on the problem of early detection of mental health disorders following the framework of the eRisk challenge series (originally devoted to online mental health discussion domain in the English language) in a general-purpose Portuguese social media. More specifically, a strategy that has won a number of shared tasks was adapted to the case of early detection of depression and anxiety disorders in the Brazilian Twitter/X, using for this purpose a novel approach based on LLMs with prompt engineering. These models have shown significant potential in capturing complex textual nuances and will therefore be explored as an approach to solving the problem. Additionally, traditional machine learning and textual representation methods, as well as the pre-trained BERT language model, will be used as baselines for comparison. Also related to the general-purpose social network, the study investigated the influence of the proximity of messages to the time of diagnosis in the chronological order of the Twitter/X timeline in the task of early detection of mental health disorders by comparing the application of LLMs to both the most recent messages and the complete timeline.Biblioteca Digitais de Teses e Dissertações da USPParaboni, IvandreNagamatu, Bruno Issamo Tagava2024-10-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-08-19T20:02:02Zoai:teses.usp.br:tde-26112024-115052Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-19T20:02:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
Detection of early risk of mental health disorders from publications on social networks
title Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
spellingShingle Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
Nagamatu, Bruno Issamo Tagava
Ansiedade
Anxiety
Depressão
Depression
Detecção precoce
Early risk prediction
Mental health
Redes sociais
Saúde mental
Social media
title_short Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
title_full Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
title_fullStr Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
title_full_unstemmed Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
title_sort Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
author Nagamatu, Bruno Issamo Tagava
author_facet Nagamatu, Bruno Issamo Tagava
author_role author
dc.contributor.none.fl_str_mv Paraboni, Ivandre
dc.contributor.author.fl_str_mv Nagamatu, Bruno Issamo Tagava
dc.subject.por.fl_str_mv Ansiedade
Anxiety
Depressão
Depression
Detecção precoce
Early risk prediction
Mental health
Redes sociais
Saúde mental
Social media
topic Ansiedade
Anxiety
Depressão
Depression
Detecção precoce
Early risk prediction
Mental health
Redes sociais
Saúde mental
Social media
description Transtornos de saúde mental, como depressão e ansiedade, são uma preocupação crescente na sociedade moderna. No Processamento de Linguagem Natural (PLN), textos provenientes de redes sociais têm sido amplamente utilizados para a detecção de transtornos de saúde mental por meio de métodos de aprendizado de máquina, que analisam todos os dados de autoria do usuário disponíveis. A série de desafios eRisk propõe uma abordagem alternativa, focada na detecção precoce de risco, ou seja, identificar um transtorno utilizando o menor volume possível de dados em uma sequência cronológica de postagens, como em uma timeline de rede social. Neste contexto, o presente estudo enfoca o problema a detecção precoce de transtornos de saúde mental nos moldes da série de desafios eRisk (originalmente voltado ao domínio de fóruns de discussão sobre saúde mental no idioma inglês) em uma rede social de propósito geral em português. De forma mais específica, propõe a adaptação de uma estratégia vencedora em diversas edições deste shared task para o caso da detecção precoce de depressão e transtorno de ansiedade no domínio do Twitter/X brasileiro, usando para este fim uma abordagem inédita baseada em LLMs com uso de engenharia de prompts. Estes modelos têm demonstrado potencial significativo em capturar nuances textuais complexas e, portanto, serão explorados como abordagem para a resolução do problema. Adicionalmente, métodos aprendizado de máquina e representação textual tradicionais, bem como modelo de língua pré-treinado BERT, serão utilizados como baselines para comparação. Também relacionado à rede social de propósito geral investigou-se a influência da proximidade das mensagens do momento do diagnóstico na ordem cronológica da timeline do Twitter/X na tarefa de detecção precoce de transtornos de saúde mental por meio da comparação entre da aplicação de LLMs tanto às mensagens mais recentes quanto a timeline completa.
publishDate 2024
dc.date.none.fl_str_mv 2024-10-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/
url https://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370491141652480