AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/ |
Resumo: | Com o avanço de tecnologias multimídia, as interfaces conversacionais humano-computador se tornam cada vez mais importantes e se apresentam como uma área muito próspera para pesquisa. Representações vocais, expressões faciais e corporais podem ser usadas para extração de diversas informações. No contexto das representações vocais, a complexidade da comunicação humana envolve uma ampla diversidade de expressões que variam de acordo com regras gramaticais, idiomas, sotaques, gírias, disfluências e outros eventos da fala. Em particular, a detecção de disfluências, ou seja, interrupções no fluxo normal da fala representadas por pausas, repetições e prolongamentos sonoros, é de interesse não apenas pela melhoria de sistemas de reconhecimento de fala, mas também pela possível identificação de aspectos emocionais em áudios. O objetivo do presente estudo foi desenvolver e validar um método para identificar disfluências em textos transcritos de áudios de psicoterapia em Português Brasileiro, com a finalidade de prever o nível da aliança terapêutica. Um estudo de caso foi conduzido aplicando esse método a sessões de psicoterapia gravadas no contexto do programa COMVC-19, que ofereceu apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. A pesquisa abrangeu uma revisão da literatura referente a disfluências, bem como a análise de bases de dados disponíveis, ferramentas de transcrição e métodos computacionais empregados. Os procedimentos e abordagens utilizados na pesquisa incluíram o desenvolvimento de estratégias para identificar disfluências, a extração de características desses eventos e a criação de modelos de regressão com o propósito de prever o nível de aliança terapêutica. Os resultados indicaram uma relação entre disfluências nos textos das sessões de psicoterapia e a percepção do nível de aliança terapêutica, embora não seja o único fator relevante, já que elementos como a comunicação não verbal e características individuais dos participantes também desempenham papéis significativos. Este estudo tem o potencial de contribuir para áreas interessadas na compreensão do comportamento humano por meio das emoções, como a Computação Afetiva, e pode ser aplicado em diversas outras áreas que se beneficiariam da análise de textos transcritos de áudios. |
| id |
USP_6aa23d1806b9a00cebf8aca030456def |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-07032024-182823 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêuticaAllianceScan: an approach for identifying disfluencies in Brazilian Portuguese applied to transcribed texts from psychotherapy sessions to predict therapeutic allianceAprendizado de máquinaMachine learningProcessamento de sinaisRegressãoRegressionSignal processingCom o avanço de tecnologias multimídia, as interfaces conversacionais humano-computador se tornam cada vez mais importantes e se apresentam como uma área muito próspera para pesquisa. Representações vocais, expressões faciais e corporais podem ser usadas para extração de diversas informações. No contexto das representações vocais, a complexidade da comunicação humana envolve uma ampla diversidade de expressões que variam de acordo com regras gramaticais, idiomas, sotaques, gírias, disfluências e outros eventos da fala. Em particular, a detecção de disfluências, ou seja, interrupções no fluxo normal da fala representadas por pausas, repetições e prolongamentos sonoros, é de interesse não apenas pela melhoria de sistemas de reconhecimento de fala, mas também pela possível identificação de aspectos emocionais em áudios. O objetivo do presente estudo foi desenvolver e validar um método para identificar disfluências em textos transcritos de áudios de psicoterapia em Português Brasileiro, com a finalidade de prever o nível da aliança terapêutica. Um estudo de caso foi conduzido aplicando esse método a sessões de psicoterapia gravadas no contexto do programa COMVC-19, que ofereceu apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. A pesquisa abrangeu uma revisão da literatura referente a disfluências, bem como a análise de bases de dados disponíveis, ferramentas de transcrição e métodos computacionais empregados. Os procedimentos e abordagens utilizados na pesquisa incluíram o desenvolvimento de estratégias para identificar disfluências, a extração de características desses eventos e a criação de modelos de regressão com o propósito de prever o nível de aliança terapêutica. Os resultados indicaram uma relação entre disfluências nos textos das sessões de psicoterapia e a percepção do nível de aliança terapêutica, embora não seja o único fator relevante, já que elementos como a comunicação não verbal e características individuais dos participantes também desempenham papéis significativos. Este estudo tem o potencial de contribuir para áreas interessadas na compreensão do comportamento humano por meio das emoções, como a Computação Afetiva, e pode ser aplicado em diversas outras áreas que se beneficiariam da análise de textos transcritos de áudios.With the advancement of multimedia technologies, human-computer conversational interfaces are becoming increasingly important and are emerging as a very prosperous area for research. Vocal representations, facial expressions, and body language can be used for extracting various information. In the context of vocal representations, the complexity of human communication involves a wide diversity of expressions that vary according to grammatical rules, languages, accents, slang, disfluencies, and other speech events. In particular, the detection of disfluencies, i.e., interruptions in the normal flow of speech represented by pauses, repetitions, and sound prolongations, is of interest not only for improving speech recognition systems but also for the potential identification of emotional aspects in audio. The aim of this study was to develop and validate a method to identify disfluencies in transcribed texts from Brazilian Portuguese psychotherapy audio recordings, with the purpose of predicting the level of therapeutic alliance. A case study was conducted by applying this method to psychotherapy sessions recorded in the context of the COMVC-19 program, which provided psychological support to healthcare professionals during the COVID-19 pandemic. The research encompassed a review of the literature related to disfluencies, as well as the analysis of available databases, transcription tools, and computational methods employed. The procedures and approaches used in the research included the development of strategies to identify disfluencies, the extraction of features from these events, and the creation of regression models with the purpose of predicting the level of the therapeutic alliance. The results indicated a relationship between disfluencies in the texts of psychotherapy sessions and the perception of the level of the therapeutic alliance, although it is not the only relevant factor, as elements such as non-verbal communication and individual participant characteristics also play significant roles. This study has the potential to contribute to fields interested in understanding human behavior through emotions, such as Affective Computing, and can be applied in various other areas that would benefit from the analysis of transcribed audio texts.Biblioteca Digitais de Teses e Dissertações da USPLima, Ariane MachadoMarques, Fátima de Lourdes dos Santos NunesLuna, Alana da Silva2024-01-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-07032024-182823Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica AllianceScan: an approach for identifying disfluencies in Brazilian Portuguese applied to transcribed texts from psychotherapy sessions to predict therapeutic alliance |
| title |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica |
| spellingShingle |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica Luna, Alana da Silva Aprendizado de máquina Machine learning Processamento de sinais Regressão Regression Signal processing |
| title_short |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica |
| title_full |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica |
| title_fullStr |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica |
| title_full_unstemmed |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica |
| title_sort |
AllianceScan: uma abordagem para identificação de disfluências em português brasileiro aplicada em textos transcritos de áudios de psicoterapia para predizer aliança terapêutica |
| author |
Luna, Alana da Silva |
| author_facet |
Luna, Alana da Silva |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Lima, Ariane Machado Marques, Fátima de Lourdes dos Santos Nunes |
| dc.contributor.author.fl_str_mv |
Luna, Alana da Silva |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina Machine learning Processamento de sinais Regressão Regression Signal processing |
| topic |
Aprendizado de máquina Machine learning Processamento de sinais Regressão Regression Signal processing |
| description |
Com o avanço de tecnologias multimídia, as interfaces conversacionais humano-computador se tornam cada vez mais importantes e se apresentam como uma área muito próspera para pesquisa. Representações vocais, expressões faciais e corporais podem ser usadas para extração de diversas informações. No contexto das representações vocais, a complexidade da comunicação humana envolve uma ampla diversidade de expressões que variam de acordo com regras gramaticais, idiomas, sotaques, gírias, disfluências e outros eventos da fala. Em particular, a detecção de disfluências, ou seja, interrupções no fluxo normal da fala representadas por pausas, repetições e prolongamentos sonoros, é de interesse não apenas pela melhoria de sistemas de reconhecimento de fala, mas também pela possível identificação de aspectos emocionais em áudios. O objetivo do presente estudo foi desenvolver e validar um método para identificar disfluências em textos transcritos de áudios de psicoterapia em Português Brasileiro, com a finalidade de prever o nível da aliança terapêutica. Um estudo de caso foi conduzido aplicando esse método a sessões de psicoterapia gravadas no contexto do programa COMVC-19, que ofereceu apoio psicológico a profissionais de saúde durante a pandemia de COVID-19. A pesquisa abrangeu uma revisão da literatura referente a disfluências, bem como a análise de bases de dados disponíveis, ferramentas de transcrição e métodos computacionais empregados. Os procedimentos e abordagens utilizados na pesquisa incluíram o desenvolvimento de estratégias para identificar disfluências, a extração de características desses eventos e a criação de modelos de regressão com o propósito de prever o nível de aliança terapêutica. Os resultados indicaram uma relação entre disfluências nos textos das sessões de psicoterapia e a percepção do nível de aliança terapêutica, embora não seja o único fator relevante, já que elementos como a comunicação não verbal e características individuais dos participantes também desempenham papéis significativos. Este estudo tem o potencial de contribuir para áreas interessadas na compreensão do comportamento humano por meio das emoções, como a Computação Afetiva, e pode ser aplicado em diversas outras áreas que se beneficiariam da análise de textos transcritos de áudios. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-01-29 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/ |
| url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-07032024-182823/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1818279177541910528 |