Classificação automática de desordens vocais usando a variância wavelet
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Cornelio Procopio Brasil Programa de Pós-Graduação em Engenharia Elétrica UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/30196 |
Resumo: | Vocal disorders may be present when the voice fails to fulfill its basic role of verbal and emotional transmission. These disturbances can be perceived by the variation of perceptual parameters of the voice, such as quality, pitch, and loudness. Changes in voice parameters can be measured and classified automatically through acoustic analysis. The present work proposes an algorithm for automatic classification of voice disorders, using wavelet variance in signals of vowel "a" with neutral pitch to form a feature vector. The pathology under analysis is nodules and Reinke's edema. These pathologies affect the vocal folds and alter acoustic parameters of voice signals. Classification is performed using a supervised learning technique called support vector machine. The experiments are performed as a binary classification between the groups Edema/Healthy, Nodule/Healthy, Edema/Nodule and Pathological/Healthy, being the pathological class formed by the pathologies nodule and Reinke's edema. In order to compare the results, the extraction of features of the voice signals is carried out with two other methods, the mel spectrogram and the mel frequency cepstral coefficients. The results obtained in the tests are promising and indicate that the features extracted from the signals using wavelet variance discriminate the classes and can replace the mel spectrogram and MFCC techniques. |
| id |
UTFPR-12_8b42936be41056c3a8e3b0ff2823b27a |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/30196 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Classificação automática de desordens vocais usando a variância waveletAutomatic classification of vocal disorders using wavelet varianceWavelets (Matemática)Reconhecimento automático da vozClassificaçãoWavelets (Mathematics)Automatic speech recognitionClassificationCNPQ::ENGENHARIAS::ENGENHARIA ELETRICAEngenharia ElétricaVocal disorders may be present when the voice fails to fulfill its basic role of verbal and emotional transmission. These disturbances can be perceived by the variation of perceptual parameters of the voice, such as quality, pitch, and loudness. Changes in voice parameters can be measured and classified automatically through acoustic analysis. The present work proposes an algorithm for automatic classification of voice disorders, using wavelet variance in signals of vowel "a" with neutral pitch to form a feature vector. The pathology under analysis is nodules and Reinke's edema. These pathologies affect the vocal folds and alter acoustic parameters of voice signals. Classification is performed using a supervised learning technique called support vector machine. The experiments are performed as a binary classification between the groups Edema/Healthy, Nodule/Healthy, Edema/Nodule and Pathological/Healthy, being the pathological class formed by the pathologies nodule and Reinke's edema. In order to compare the results, the extraction of features of the voice signals is carried out with two other methods, the mel spectrogram and the mel frequency cepstral coefficients. The results obtained in the tests are promising and indicate that the features extracted from the signals using wavelet variance discriminate the classes and can replace the mel spectrogram and MFCC techniques.Distúrbios vocais podem existir quando a voz não consegue cumprir seu papel básico de transmissão verbal e emocional. Esses distúrbios podem ser percebidos pela variação de parâmetros perceptuais da voz, tais como qualidade, tom e volume. As alterações dos parâmetros da voz podem ser medidas e classificadas de forma automática por meio da análise acústica. O presente trabalho propõe um algoritmo de classificação automática de distúrbios vocais, utilizando a variância wavelet em sinais de vogal "a" com tom neutro para formar um vetor de características. As patologias em análise são o nódulo e edema de Reinke. Essas patologias afetam as pregas vocais e alteram parâmetros acústicos dos sinais de voz. A classificação é realizada utilizando a técnica de aprendizagem supervisionada support vector machine. Os experimentos são realizados como uma classificação binária, entre os grupos Edema/Saudável, Nódulo/Saudável, Edema/Nódulo e Patológico/Saudável, sendo a classe patológica formada pelas patologias nódulo e edema de Reinke. Com o objetivo de comparar os resultados obtidos, realiza-se a extração de atributos dos sinais de voz com outros dois métodos, o mel espectrograma e os coeficientes cepstrais de frequência mel. Os resultados obtidos nos testes são promissores e indicam que as características extraídas dos sinais através da variância wavelet discriminam as classes e podem substituir as técnicas mel espectrograma e MFCC.Universidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em Engenharia ElétricaUTFPRScalassara, Paulo Rogeriohttp://lattes.cnpq.br/5016119298122922Agulhari, Cristiano Marcoshttp://lattes.cnpq.br/4935395556663775Scalassara, Paulo Rogeriohttp://lattes.cnpq.br/5016119298122922Guido, Rodrigo Capobiancohttp://lattes.cnpq.br/6542086226808067Endo, Wagnerhttp://lattes.cnpq.br/5229173673499346Santos, Rafael Alberto dos2022-11-29T14:15:01Z2022-11-29T14:15:01Z2022-07-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSANTOS, Rafael Alberto dos. Classificação automática de desordens vocais usando a variância wavelet. 2022. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.http://repositorio.utfpr.edu.br/jspui/handle/1/30196porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2022-11-30T06:07:41Zoai:repositorio.utfpr.edu.br:1/30196Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2022-11-30T06:07:41Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Classificação automática de desordens vocais usando a variância wavelet Automatic classification of vocal disorders using wavelet variance |
| title |
Classificação automática de desordens vocais usando a variância wavelet |
| spellingShingle |
Classificação automática de desordens vocais usando a variância wavelet Santos, Rafael Alberto dos Wavelets (Matemática) Reconhecimento automático da voz Classificação Wavelets (Mathematics) Automatic speech recognition Classification CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Engenharia Elétrica |
| title_short |
Classificação automática de desordens vocais usando a variância wavelet |
| title_full |
Classificação automática de desordens vocais usando a variância wavelet |
| title_fullStr |
Classificação automática de desordens vocais usando a variância wavelet |
| title_full_unstemmed |
Classificação automática de desordens vocais usando a variância wavelet |
| title_sort |
Classificação automática de desordens vocais usando a variância wavelet |
| author |
Santos, Rafael Alberto dos |
| author_facet |
Santos, Rafael Alberto dos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Scalassara, Paulo Rogerio http://lattes.cnpq.br/5016119298122922 Agulhari, Cristiano Marcos http://lattes.cnpq.br/4935395556663775 Scalassara, Paulo Rogerio http://lattes.cnpq.br/5016119298122922 Guido, Rodrigo Capobianco http://lattes.cnpq.br/6542086226808067 Endo, Wagner http://lattes.cnpq.br/5229173673499346 |
| dc.contributor.author.fl_str_mv |
Santos, Rafael Alberto dos |
| dc.subject.por.fl_str_mv |
Wavelets (Matemática) Reconhecimento automático da voz Classificação Wavelets (Mathematics) Automatic speech recognition Classification CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Engenharia Elétrica |
| topic |
Wavelets (Matemática) Reconhecimento automático da voz Classificação Wavelets (Mathematics) Automatic speech recognition Classification CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Engenharia Elétrica |
| description |
Vocal disorders may be present when the voice fails to fulfill its basic role of verbal and emotional transmission. These disturbances can be perceived by the variation of perceptual parameters of the voice, such as quality, pitch, and loudness. Changes in voice parameters can be measured and classified automatically through acoustic analysis. The present work proposes an algorithm for automatic classification of voice disorders, using wavelet variance in signals of vowel "a" with neutral pitch to form a feature vector. The pathology under analysis is nodules and Reinke's edema. These pathologies affect the vocal folds and alter acoustic parameters of voice signals. Classification is performed using a supervised learning technique called support vector machine. The experiments are performed as a binary classification between the groups Edema/Healthy, Nodule/Healthy, Edema/Nodule and Pathological/Healthy, being the pathological class formed by the pathologies nodule and Reinke's edema. In order to compare the results, the extraction of features of the voice signals is carried out with two other methods, the mel spectrogram and the mel frequency cepstral coefficients. The results obtained in the tests are promising and indicate that the features extracted from the signals using wavelet variance discriminate the classes and can replace the mel spectrogram and MFCC techniques. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-11-29T14:15:01Z 2022-11-29T14:15:01Z 2022-07-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
SANTOS, Rafael Alberto dos. Classificação automática de desordens vocais usando a variância wavelet. 2022. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022. http://repositorio.utfpr.edu.br/jspui/handle/1/30196 |
| identifier_str_mv |
SANTOS, Rafael Alberto dos. Classificação automática de desordens vocais usando a variância wavelet. 2022. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/30196 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Engenharia Elétrica UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Cornelio Procopio Brasil Programa de Pós-Graduação em Engenharia Elétrica UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498293293907968 |