Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Andrade Sobrinho, Fernando Araujo de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/18/18153/tde-05012017-141759/
Resumo: Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas.
id USP_0282a1a0f6f3bdcdb257f520e2629c6e
oai_identifier_str oai:teses.usp.br:tde-05012017-141759
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de vozDetection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signalAcoustic analysis of voiceAnálise acústica de vozDinâmica não linearNonlinear dynamicPhase space reconstructionPoincaré sectionReconstrução do espaço de faseSeção de PoincaréDiversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas.Several studies have been performed to detect pathologies of the larynx. These pathologies cause changes in the frequency, amplitude, and waveform of the voice signal. They can be studied by means of conventional analysis parameters such as jitter and shimmer, or from nonlinear dynamics concepts. These techniques are noninvasive and can help the speech therapist to better diagnose the pathologies in the vocal folds. The acoustic analysis techniques are based on the voice waveform in the time and frequency domains, while the non-linear analysis techniques are based on the attractor reconstructed from the speech signal.The aim of this thesis is to differentiate normal and pathological voices using a nonlinear analysis technique named Poincaré section. We analyzed 48 human voice signals divided into 3 groups (16 normal, 16 nodule and 16 Reinke\'s edema). Then, we analyzed 3 stretches of 500ms in the intervals 0.5s-1.0s, 2.0s-2.5s e 4.0-4.5s, denominated first criteria, and a stretch of 500ms in a higher variation in pitch, denominated second criteria. The attractor was then reconstructed in three dimensions, the average attractor was determined, and at each point of the average attractor, a Poincaré section was extracted. From each Poincaré section, the dispersion of the points of the attractor was calculated in the plane by means of the statistical average and standard deviation related to the medium point of the section. The validation of the tool developed for this thesis was achieved by inserting jitter gradually in a sinusoidal wave, where there was a proportional variation of average\'s dispersion was observed. The results obtained for this set of voices showed that the average and standard deviation of dispersion of the points in the Poincaré section differentiate the groups of voices, but not the pathological groups. The Statistical tests of Anova and Tukey were used to analyze the 3 groups and all group pairings, two by two, with a statistical significance of 5%. The best interval to classify normal voices from pathological voices by means of the first criteria was between 0.5s-1.0s, given the fact that in this interval, all normal voices were correctly classified. However, 6 pathological voices were classified as normal voices, with 2 voices border lining the frontier between normal voices from pathological voices. The second criteria classified all normal voices correctly, with only one pathological voice incorrectly classified. In conclusion, the second criteria tool proposed by this thesis was proven superior to differentiate normal voices from pathological ones.Biblioteca Digitais de Teses e Dissertações da USPAlberto, Luís Fernando CostaAndrade Sobrinho, Fernando Araujo de2016-09-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/18/18153/tde-05012017-141759/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2018-07-17T16:34:08Zoai:teses.usp.br:tde-05012017-141759Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212018-07-17T16:34:08Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
Detection of pathologies in vocal fold by means of Poincaré section of the tridimensional phase space of a voice signal
title Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
spellingShingle Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
Andrade Sobrinho, Fernando Araujo de
Acoustic analysis of voice
Análise acústica de voz
Dinâmica não linear
Nonlinear dynamic
Phase space reconstruction
Poincaré section
Reconstrução do espaço de fase
Seção de Poincaré
title_short Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
title_full Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
title_fullStr Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
title_full_unstemmed Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
title_sort Detecção de patologias em pregas vocais utilizando a seção Poincaré do espaço de fase tridimensional de um sinal de voz
author Andrade Sobrinho, Fernando Araujo de
author_facet Andrade Sobrinho, Fernando Araujo de
author_role author
dc.contributor.none.fl_str_mv Alberto, Luís Fernando Costa
dc.contributor.author.fl_str_mv Andrade Sobrinho, Fernando Araujo de
dc.subject.por.fl_str_mv Acoustic analysis of voice
Análise acústica de voz
Dinâmica não linear
Nonlinear dynamic
Phase space reconstruction
Poincaré section
Reconstrução do espaço de fase
Seção de Poincaré
topic Acoustic analysis of voice
Análise acústica de voz
Dinâmica não linear
Nonlinear dynamic
Phase space reconstruction
Poincaré section
Reconstrução do espaço de fase
Seção de Poincaré
description Diversos estudos foram realizados para detecção de patologias na laringe. Essas patologias causam alteração na frequência, amplitude e formato de onda do sinal de voz e podem ser estudadas através dos parâmetros convencionais de análise como jitter e shimmer, ou sob o enfoque da dinâmica não linear. Essas técnicas são não invasivas e servem de apoio ao especialista da área de fonoaudiologia para o diagnóstico de patologias nas pregas vocais. As técnicas de análise acústica baseiam-se no formato de onda vocal no domínio do tempo e domínio da frequência, enquanto que a técnica de análise não linear utilizada nesse trabalho baseia-se no atrator reconstruído do sinal de voz. O objetivo dessa tese é diferenciar vozes normais e patológicas e entre patologias usando a técnica de análise não linear conhecida como Seção de Poincaré. Foram analisados 48 sinais de vozes humanas, divididos em 3 grupos (16 normais, 16 com nódulo e 16 com edema de Reinke). Em seguida foram selecionados 3 trechos de 500 ms nos intervalos 0.5s-1.0s, 2.0s-2.5s e 4.0s-4.5s chamado de primeiro critério e um trecho 500ms no trecho de maior variação de pitch, chamado de segundo critério. Em seguida, o atrator foi reconstruído em 3 dimensões, determinado o atrator médio, e de cada ponto do atrator médio foi extraída a seção de Poincaré. De cada seção de Poincaré foi calculada a dispersão dos pontos do atrator no plano através da média e desvio padrão das dispersão dos pontos da seção de Poincaré em relação ao ponto médio da seção. A validação da ferramenta desenvolvida para essa tese foi realizada utilizando um sinal senoidal inserindo jitter gradativamente, onde verificou-se uma variação proporcional da média da dispersão. Os resultados obtidos mostraram que não foi possível diferenciar patologias mas foi possível classificar vozes normais das patológicas. O melhor intervalo para classificar as vozes normais das patológicas utilizando o primeiro critério foi entre 0.5s-1.0s pois nesse intervalo todas as vozes normais foram classificadas corretamente. No entanto, 6 vozes patológicas foram classificadas como normais com 2 vozes patológicas na fronteira que separa as vozes normais das patológicas. O segundo critério classificou todas as vozes normais corretamente e apenas uma voz patológica foi classificada como patológica. Concluiu-se que a ferramenta proposta utilizando o segundo critério mostrou-se superior em relação ao primeiro critério para diferenciar vozes normais das patológicas.
publishDate 2016
dc.date.none.fl_str_mv 2016-09-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/18/18153/tde-05012017-141759/
url http://www.teses.usp.br/teses/disponiveis/18/18153/tde-05012017-141759/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865490898467422208