Exportação concluída — 

AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Luna, Alana da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/
Resumo: Com o avanço de tecnologias multimídia, as interfaces conversacionais humano-computador se tornam cada vez mais importantes e se apresentam como uma área muito próspera para pesquisa. Representações vocais, expressões faciais e corporais podem ser usadas para extração de diversas informações. No contexto das representações vocais, a complexidade da comunicação humana envolve uma ampla diversidade de expressões que variam de acordo com regras gramaticais, idiomas, sotaques, gírias, disfluências e outros eventos da fala. Em particular, a detecção de disfluências, ou seja, interrupções no fluxo normal da fala representadas por pausas, repetições e prolongamentos sonoros, é de interesse não apenas pela melhoria de sistemas de reconhecimento de fala, mas também pela possível identificação de aspectos emocionais em áudios. O objetivo do presente estudo foi desenvolver e validar um método para identificar disfluências em textos transcritos de áudios de psicoterapia em Português Brasileiro, com a finalidade de prever o nível da aliança terapêutica. Um estudo de caso foi conduzido aplicando esse método a sessões de psicoterapia gravadas no contexto do programa COMVC-19, que ofereceu apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. A pesquisa abrangeu uma revisão da literatura referente a disfluências, bem como a análise de bases de dados disponíveis, ferramentas de transcrição e métodos computacionais empregados. Os procedimentos e abordagens utilizados na pesquisa incluíram o desenvolvimento de estratégias para identificar disfluências, a extração de características desses eventos e a criação de modelos de regressão com o propósito de prever o nível de aliança terapêutica. Os resultados indicaram uma relação entre disfluências nos textos das sessões de psicoterapia e a percepção do nível de aliança terapêutica, embora não seja o único fator relevante, já que elementos como a comunicação não verbal e características individuais dos participantes também desempenham papéis significativos. Este estudo tem o potencial de contribuir para áreas interessadas na compreensão do comportamento humano por meio das emoções, como a Computação Afetiva, e pode ser aplicado em diversas outras áreas que se beneficiariam da análise de textos transcritos de áudios.
id USP_6aa23d1806b9a00cebf8aca030456def
oai_identifier_str oai:teses.usp.br:tde-07032024-182823
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêuticaAllianceScan: an approach for identifying disfluencies in Brazilian Portuguese applied to transcribed texts from psychotherapy sessions to predict therapeutic allianceAprendizado de máquinaMachine learningProcessamento de sinaisRegressãoRegressionSignal processingCom o avanço de tecnologias multimídia, as interfaces conversacionais humano-computador se tornam cada vez mais importantes e se apresentam como uma área muito próspera para pesquisa. Representações vocais, expressões faciais e corporais podem ser usadas para extração de diversas informações. No contexto das representações vocais, a complexidade da comunicação humana envolve uma ampla diversidade de expressões que variam de acordo com regras gramaticais, idiomas, sotaques, gírias, disfluências e outros eventos da fala. Em particular, a detecção de disfluências, ou seja, interrupções no fluxo normal da fala representadas por pausas, repetições e prolongamentos sonoros, é de interesse não apenas pela melhoria de sistemas de reconhecimento de fala, mas também pela possível identificação de aspectos emocionais em áudios. O objetivo do presente estudo foi desenvolver e validar um método para identificar disfluências em textos transcritos de áudios de psicoterapia em Português Brasileiro, com a finalidade de prever o nível da aliança terapêutica. Um estudo de caso foi conduzido aplicando esse método a sessões de psicoterapia gravadas no contexto do programa COMVC-19, que ofereceu apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. A pesquisa abrangeu uma revisão da literatura referente a disfluências, bem como a análise de bases de dados disponíveis, ferramentas de transcrição e métodos computacionais empregados. Os procedimentos e abordagens utilizados na pesquisa incluíram o desenvolvimento de estratégias para identificar disfluências, a extração de características desses eventos e a criação de modelos de regressão com o propósito de prever o nível de aliança terapêutica. Os resultados indicaram uma relação entre disfluências nos textos das sessões de psicoterapia e a percepção do nível de aliança terapêutica, embora não seja o único fator relevante, já que elementos como a comunicação não verbal e características individuais dos participantes também desempenham papéis significativos. Este estudo tem o potencial de contribuir para áreas interessadas na compreensão do comportamento humano por meio das emoções, como a Computação Afetiva, e pode ser aplicado em diversas outras áreas que se beneficiariam da análise de textos transcritos de áudios.With the advancement of multimedia technologies, human-computer conversational interfaces are becoming increasingly important and are emerging as a very prosperous area for research. Vocal representations, facial expressions, and body language can be used for extracting various information. In the context of vocal representations, the complexity of human communication involves a wide diversity of expressions that vary according to grammatical rules, languages, accents, slang, disfluencies, and other speech events. In particular, the detection of disfluencies, i.e., interruptions in the normal flow of speech represented by pauses, repetitions, and sound prolongations, is of interest not only for improving speech recognition systems but also for the potential identification of emotional aspects in audio. The aim of this study was to develop and validate a method to identify disfluencies in transcribed texts from Brazilian Portuguese psychotherapy audio recordings, with the purpose of predicting the level of therapeutic alliance. A case study was conducted by applying this method to psychotherapy sessions recorded in the context of the COMVC-19 program, which provided psychological support to healthcare professionals during the COVID-19 pandemic. The research encompassed a review of the literature related to disfluencies, as well as the analysis of available databases, transcription tools, and computational methods employed. The procedures and approaches used in the research included the development of strategies to identify disfluencies, the extraction of features from these events, and the creation of regression models with the purpose of predicting the level of the therapeutic alliance. The results indicated a relationship between disfluencies in the texts of psychotherapy sessions and the perception of the level of the therapeutic alliance, although it is not the only relevant factor, as elements such as non-verbal communication and individual participant characteristics also play significant roles. This study has the potential to contribute to fields interested in understanding human behavior through emotions, such as Affective Computing, and can be applied in various other areas that would benefit from the analysis of transcribed audio texts.Biblioteca Digitais de Teses e Dissertações da USPLima, Ariane MachadoMarques, Fátima de Lourdes dos Santos NunesLuna, Alana da Silva2024-01-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-07032024-182823Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
AllianceScan: an approach for identifying disfluencies in Brazilian Portuguese applied to transcribed texts from psychotherapy sessions to predict therapeutic alliance
title AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
spellingShingle AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
Luna, Alana da Silva
Aprendizado de máquina
Machine learning
Processamento de sinais
Regressão
Regression
Signal processing
title_short AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
title_full AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
title_fullStr AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
title_full_unstemmed AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
title_sort AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
author Luna, Alana da Silva
author_facet Luna, Alana da Silva
author_role author
dc.contributor.none.fl_str_mv Lima, Ariane Machado
Marques, Fátima de Lourdes dos Santos Nunes
dc.contributor.author.fl_str_mv Luna, Alana da Silva
dc.subject.por.fl_str_mv Aprendizado de máquina
Machine learning
Processamento de sinais
Regressão
Regression
Signal processing
topic Aprendizado de máquina
Machine learning
Processamento de sinais
Regressão
Regression
Signal processing
description Com o avanço de tecnologias multimídia, as interfaces conversacionais humano-computador se tornam cada vez mais importantes e se apresentam como uma área muito próspera para pesquisa. Representações vocais, expressões faciais e corporais podem ser usadas para extração de diversas informações. No contexto das representações vocais, a complexidade da comunicação humana envolve uma ampla diversidade de expressões que variam de acordo com regras gramaticais, idiomas, sotaques, gírias, disfluências e outros eventos da fala. Em particular, a detecção de disfluências, ou seja, interrupções no fluxo normal da fala representadas por pausas, repetições e prolongamentos sonoros, é de interesse não apenas pela melhoria de sistemas de reconhecimento de fala, mas também pela possível identificação de aspectos emocionais em áudios. O objetivo do presente estudo foi desenvolver e validar um método para identificar disfluências em textos transcritos de áudios de psicoterapia em Português Brasileiro, com a finalidade de prever o nível da aliança terapêutica. Um estudo de caso foi conduzido aplicando esse método a sessões de psicoterapia gravadas no contexto do programa COMVC-19, que ofereceu apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. A pesquisa abrangeu uma revisão da literatura referente a disfluências, bem como a análise de bases de dados disponíveis, ferramentas de transcrição e métodos computacionais empregados. Os procedimentos e abordagens utilizados na pesquisa incluíram o desenvolvimento de estratégias para identificar disfluências, a extração de características desses eventos e a criação de modelos de regressão com o propósito de prever o nível de aliança terapêutica. Os resultados indicaram uma relação entre disfluências nos textos das sessões de psicoterapia e a percepção do nível de aliança terapêutica, embora não seja o único fator relevante, já que elementos como a comunicação não verbal e características individuais dos participantes também desempenham papéis significativos. Este estudo tem o potencial de contribuir para áreas interessadas na compreensão do comportamento humano por meio das emoções, como a Computação Afetiva, e pode ser aplicado em diversas outras áreas que se beneficiariam da análise de textos transcritos de áudios.
publishDate 2024
dc.date.none.fl_str_mv 2024-01-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/
url https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279177541910528