Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais

Detalhes bibliográficos
Ano de defesa: 2004
Autor(a) principal: Crovato, César David Paredes
Orientador(a): Schuck Junior, Adalberto
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Voz
Link de acesso: http://hdl.handle.net/10183/6465
Resumo: Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.
id URGS_bb528456e0e9743e8b1a32b4990da53f
oai_identifier_str oai:www.lume.ufrgs.br:10183/6465
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Crovato, César David ParedesSchuck Junior, Adalberto2007-06-06T18:56:54Z2004http://hdl.handle.net/10183/6465000530304Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.application/pdfporRedes neurais artificiaisProcessamento de sinais de vozTransformadas waveletVozClassificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulEscola de EngenhariaPrograma de Pós-Graduação em Engenharia ElétricaPorto Alegre, BR-RS2004mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000530304.pdf000530304.pdfTexto completoapplication/pdf4308100http://www.lume.ufrgs.br/bitstream/10183/6465/1/000530304.pdf34823200331eee30e105790879122ce8MD51TEXT000530304.pdf.txt000530304.pdf.txtExtracted Texttext/plain245495http://www.lume.ufrgs.br/bitstream/10183/6465/2/000530304.pdf.txt15f51f057bb8dc3c2ec6e3e84945268cMD52THUMBNAIL000530304.pdf.jpg000530304.pdf.jpgGenerated Thumbnailimage/jpeg978http://www.lume.ufrgs.br/bitstream/10183/6465/3/000530304.pdf.jpgf479edc5bf8f62ed559c48125b5a87bbMD5310183/64652022-10-06 04:55:27.78836oai:www.lume.ufrgs.br:10183/6465Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532022-10-06T07:55:27Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
title Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
spellingShingle Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
Crovato, César David Paredes
Redes neurais artificiais
Processamento de sinais de voz
Transformadas wavelet
Voz
title_short Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
title_full Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
title_fullStr Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
title_full_unstemmed Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
title_sort Classificação de sinais de voz utilizando a transformada Wavelet Packet e redes neurais artificiais
author Crovato, César David Paredes
author_facet Crovato, César David Paredes
author_role author
dc.contributor.author.fl_str_mv Crovato, César David Paredes
dc.contributor.advisor1.fl_str_mv Schuck Junior, Adalberto
contributor_str_mv Schuck Junior, Adalberto
dc.subject.por.fl_str_mv Redes neurais artificiais
Processamento de sinais de voz
Transformadas wavelet
Voz
topic Redes neurais artificiais
Processamento de sinais de voz
Transformadas wavelet
Voz
description Este trabalho apresenta um sistema de classificação de voz disfônica utilizando a Transformada Wavelet Packet (WPT) e o algoritmo Best Basis (BBA) como redutor de dimensionalidade e seis Redes Neurais Artificiais (ANN) atuando como um conjunto de sistemas denominados “especialistas”. O banco de vozes utilizado está separado em seis grupos de acordo com as similaridades patológicas (onde o 6o grupo é o dos pacientes com voz normal). O conjunto de seis ANN foi treinado, com cada rede especializando-se em um determinado grupo. A base de decomposição utilizada na WPT foi a Symlet 5 e a função custo utilizada na Best Basis Tree (BBT) gerada com o BBA, foi a entropia de Shannon. Cada ANN é alimentada pelos valores de entropia dos nós da BBT. O sistema apresentou uma taxa de sucesso de 87,5%, 95,31%, 87,5%, 100%, 96,87% e 89,06% para os grupos 1 ao 6 respectivamente, utilizando o método de Validação Cruzada Múltipla (MCV). O poder de generalização foi medido utilizando o método de MCV com a variação Leave-One-Out (LOO), obtendo erros em média de 38.52%, apontando a necessidade de aumentar o banco de vozes disponível.
publishDate 2004
dc.date.issued.fl_str_mv 2004
dc.date.accessioned.fl_str_mv 2007-06-06T18:56:54Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/6465
dc.identifier.nrb.pt_BR.fl_str_mv 000530304
url http://hdl.handle.net/10183/6465
identifier_str_mv 000530304
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/6465/1/000530304.pdf
http://www.lume.ufrgs.br/bitstream/10183/6465/2/000530304.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/6465/3/000530304.pdf.jpg
bitstream.checksum.fl_str_mv 34823200331eee30e105790879122ce8
15f51f057bb8dc3c2ec6e3e84945268c
f479edc5bf8f62ed559c48125b5a87bb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831315813459558400