Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/ |
Resumo: | Transtornos de saúde mental, como depressão e ansiedade, são uma preocupação crescente na sociedade moderna. No Processamento de Linguagem Natural (PLN), textos provenientes de redes sociais têm sido amplamente utilizados para a detecção de transtornos de saúde mental por meio de métodos de aprendizado de máquina, que analisam todos os dados de autoria do usuário disponíveis. A série de desafios eRisk propõe uma abordagem alternativa, focada na detecção precoce de risco, ou seja, identificar um transtorno utilizando o menor volume possível de dados em uma sequência cronológica de postagens, como em uma timeline de rede social. Neste contexto, o presente estudo enfoca o problema a detecção precoce de transtornos de saúde mental nos moldes da série de desafios eRisk (originalmente voltado ao domínio de fóruns de discussão sobre saúde mental no idioma inglês) em uma rede social de propósito geral em português. De forma mais específica, propõe a adaptação de uma estratégia vencedora em diversas edições deste shared task para o caso da detecção precoce de depressão e transtorno de ansiedade no domínio do Twitter/X brasileiro, usando para este fim uma abordagem inédita baseada em LLMs com uso de engenharia de prompts. Estes modelos têm demonstrado potencial significativo em capturar nuances textuais complexas e, portanto, serão explorados como abordagem para a resolução do problema. Adicionalmente, métodos aprendizado de máquina e representação textual tradicionais, bem como modelo de língua pré-treinado BERT, serão utilizados como baselines para comparação. Também relacionado à rede social de propósito geral investigou-se a influência da proximidade das mensagens do momento do diagnóstico na ordem cronológica da timeline do Twitter/X na tarefa de detecção precoce de transtornos de saúde mental por meio da comparação entre da aplicação de LLMs tanto às mensagens mais recentes quanto a timeline completa. |
| id |
USP_923ab0bb27bb191d00ec24f6c354febd |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-26112024-115052 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociaisDetection of early risk of mental health disorders from publications on social networksAnsiedadeAnxietyDepressãoDepressionDetecção precoceEarly risk predictionMental healthRedes sociaisSaúde mentalSocial mediaTranstornos de saúde mental, como depressão e ansiedade, são uma preocupação crescente na sociedade moderna. No Processamento de Linguagem Natural (PLN), textos provenientes de redes sociais têm sido amplamente utilizados para a detecção de transtornos de saúde mental por meio de métodos de aprendizado de máquina, que analisam todos os dados de autoria do usuário disponíveis. A série de desafios eRisk propõe uma abordagem alternativa, focada na detecção precoce de risco, ou seja, identificar um transtorno utilizando o menor volume possível de dados em uma sequência cronológica de postagens, como em uma timeline de rede social. Neste contexto, o presente estudo enfoca o problema a detecção precoce de transtornos de saúde mental nos moldes da série de desafios eRisk (originalmente voltado ao domínio de fóruns de discussão sobre saúde mental no idioma inglês) em uma rede social de propósito geral em português. De forma mais específica, propõe a adaptação de uma estratégia vencedora em diversas edições deste shared task para o caso da detecção precoce de depressão e transtorno de ansiedade no domínio do Twitter/X brasileiro, usando para este fim uma abordagem inédita baseada em LLMs com uso de engenharia de prompts. Estes modelos têm demonstrado potencial significativo em capturar nuances textuais complexas e, portanto, serão explorados como abordagem para a resolução do problema. Adicionalmente, métodos aprendizado de máquina e representação textual tradicionais, bem como modelo de língua pré-treinado BERT, serão utilizados como baselines para comparação. Também relacionado à rede social de propósito geral investigou-se a influência da proximidade das mensagens do momento do diagnóstico na ordem cronológica da timeline do Twitter/X na tarefa de detecção precoce de transtornos de saúde mental por meio da comparação entre da aplicação de LLMs tanto às mensagens mais recentes quanto a timeline completa.Mental health disorders, such as depression and anxiety, are a growing concern in modern society. In Natural Language Processing (NLP), texts from social media have been widely used for detection of mental health disorders through machine learning methods, which analyze all available user-generated data. The eRisk challenge series proposes an alternative approach, focused on early risk detection, i.e., identifying a disorder using the smallest possible volume of data in a chronological sequence of posts, like in a social media timeline. In this context, the present study focuses on the problem of early detection of mental health disorders following the framework of the eRisk challenge series (originally devoted to online mental health discussion domain in the English language) in a general-purpose Portuguese social media. More specifically, a strategy that has won a number of shared tasks was adapted to the case of early detection of depression and anxiety disorders in the Brazilian Twitter/X, using for this purpose a novel approach based on LLMs with prompt engineering. These models have shown significant potential in capturing complex textual nuances and will therefore be explored as an approach to solving the problem. Additionally, traditional machine learning and textual representation methods, as well as the pre-trained BERT language model, will be used as baselines for comparison. Also related to the general-purpose social network, the study investigated the influence of the proximity of messages to the time of diagnosis in the chronological order of the Twitter/X timeline in the task of early detection of mental health disorders by comparing the application of LLMs to both the most recent messages and the complete timeline.Biblioteca Digitais de Teses e Dissertações da USPParaboni, IvandreNagamatu, Bruno Issamo Tagava2024-10-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-08-19T20:02:02Zoai:teses.usp.br:tde-26112024-115052Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-19T20:02:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais Detection of early risk of mental health disorders from publications on social networks |
| title |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais |
| spellingShingle |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais Nagamatu, Bruno Issamo Tagava Ansiedade Anxiety Depressão Depression Detecção precoce Early risk prediction Mental health Redes sociais Saúde mental Social media |
| title_short |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais |
| title_full |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais |
| title_fullStr |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais |
| title_full_unstemmed |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais |
| title_sort |
Detecção precoce de transtornos de saúde mental a partir de publicações em redes sociais |
| author |
Nagamatu, Bruno Issamo Tagava |
| author_facet |
Nagamatu, Bruno Issamo Tagava |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Paraboni, Ivandre |
| dc.contributor.author.fl_str_mv |
Nagamatu, Bruno Issamo Tagava |
| dc.subject.por.fl_str_mv |
Ansiedade Anxiety Depressão Depression Detecção precoce Early risk prediction Mental health Redes sociais Saúde mental Social media |
| topic |
Ansiedade Anxiety Depressão Depression Detecção precoce Early risk prediction Mental health Redes sociais Saúde mental Social media |
| description |
Transtornos de saúde mental, como depressão e ansiedade, são uma preocupação crescente na sociedade moderna. No Processamento de Linguagem Natural (PLN), textos provenientes de redes sociais têm sido amplamente utilizados para a detecção de transtornos de saúde mental por meio de métodos de aprendizado de máquina, que analisam todos os dados de autoria do usuário disponíveis. A série de desafios eRisk propõe uma abordagem alternativa, focada na detecção precoce de risco, ou seja, identificar um transtorno utilizando o menor volume possível de dados em uma sequência cronológica de postagens, como em uma timeline de rede social. Neste contexto, o presente estudo enfoca o problema a detecção precoce de transtornos de saúde mental nos moldes da série de desafios eRisk (originalmente voltado ao domínio de fóruns de discussão sobre saúde mental no idioma inglês) em uma rede social de propósito geral em português. De forma mais específica, propõe a adaptação de uma estratégia vencedora em diversas edições deste shared task para o caso da detecção precoce de depressão e transtorno de ansiedade no domínio do Twitter/X brasileiro, usando para este fim uma abordagem inédita baseada em LLMs com uso de engenharia de prompts. Estes modelos têm demonstrado potencial significativo em capturar nuances textuais complexas e, portanto, serão explorados como abordagem para a resolução do problema. Adicionalmente, métodos aprendizado de máquina e representação textual tradicionais, bem como modelo de língua pré-treinado BERT, serão utilizados como baselines para comparação. Também relacionado à rede social de propósito geral investigou-se a influência da proximidade das mensagens do momento do diagnóstico na ordem cronológica da timeline do Twitter/X na tarefa de detecção precoce de transtornos de saúde mental por meio da comparação entre da aplicação de LLMs tanto às mensagens mais recentes quanto a timeline completa. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-10-30 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/ |
| url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-26112024-115052/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370491141652480 |