Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
| Ano de defesa: | 2004 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://hdl.handle.net/10183/6465 |
Resumo: | Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível. |
| id |
URGS_bb528456e0e9743e8b1a32b4990da53f |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/6465 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Crovato, César David ParedesSchuck Junior, Adalberto2007-06-06T18:56:54Z2004http://hdl.handle.net/10183/6465000530304Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.application/pdfporRedes neurais artificiaisProcessamento de sinais de vozTransformadas waveletVozClassificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia ElétricaPorto Alegre, BR-RS2004mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000530304.pdf000530304.pdfTexto completoapplication/pdf4308100http://www.lume.ufrgs.br/bitstream/10183/6465/1/000530304.pdf34823200331eee30e105790879122ce8MD51TEXT000530304.pdf.txt000530304.pdf.txtExtracted Texttext/plain245495http://www.lume.ufrgs.br/bitstream/10183/6465/2/000530304.pdf.txt15f51f057bb8dc3c2ec6e3e84945268cMD52THUMBNAIL000530304.pdf.jpg000530304.pdf.jpgGenerated Thumbnailimage/jpeg978http://www.lume.ufrgs.br/bitstream/10183/6465/3/000530304.pdf.jpgf479edc5bf8f62ed559c48125b5a87bbMD5310183/64652022-10-06 04:55:27.78836oai:www.lume.ufrgs.br:10183/6465Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-10-06T07:55:27Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| title |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| spellingShingle |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais Crovato, César David Paredes Redes neurais artificiais Processamento de sinais de voz Transformadas wavelet Voz |
| title_short |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| title_full |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| title_fullStr |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| title_full_unstemmed |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| title_sort |
Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais |
| author |
Crovato, César David Paredes |
| author_facet |
Crovato, César David Paredes |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Crovato, César David Paredes |
| dc.contributor.advisor1.fl_str_mv |
Schuck Junior, Adalberto |
| contributor_str_mv |
Schuck Junior, Adalberto |
| dc.subject.por.fl_str_mv |
Redes neurais artificiais Processamento de sinais de voz Transformadas wavelet Voz |
| topic |
Redes neurais artificiais Processamento de sinais de voz Transformadas wavelet Voz |
| description |
Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível. |
| publishDate |
2004 |
| dc.date.issued.fl_str_mv |
2004 |
| dc.date.accessioned.fl_str_mv |
2007-06-06T18:56:54Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/6465 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
000530304 |
| url |
http://hdl.handle.net/10183/6465 |
| identifier_str_mv |
000530304 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/6465/1/000530304.pdf http://www.lume.ufrgs.br/bitstream/10183/6465/2/000530304.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/6465/3/000530304.pdf.jpg |
| bitstream.checksum.fl_str_mv |
34823200331eee30e105790879122ce8 15f51f057bb8dc3c2ec6e3e84945268c f479edc5bf8f62ed559c48125b5a87bb |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831315813459558400 |