Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor

Detalhes bibliográficos
Ano de defesa: 2000
Autor(a) principal: Pegoraro, Tarciano Facco
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1588807
Resumo: Orientadores: Nestor Jorge Becerra Yoma, João Marcos Travassos Romano
id UNICAMP-30_f4bec1cfd131a70af1da2de4238e7afd
oai_identifier_str oai::192423
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutorReconhecimento automático da vozSistemas de reconhecimento de padrõesProcessamento de sinais - Técnicas digitaisOrientadores: Nestor Jorge Becerra Yoma, João Marcos Travassos RomanoDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: A voz é uma característica biométrica e, além das informações fonético-lingüísticas detectadas e classificadas pelos sistemas de reconhecimento de voz, também carrega informações que podem ser empregadas em tarefas de reconhecimento de locutor. Entretanto, sistemas de reconhecimento de voz e locutor sofrem uma sensível queda em seu desempenho na presença de ruído, tanto aditivo quanto convolucional. Esta dissertação mostra os estágios da implementação de um Sistema de Verificação de Locutor (SVL) e testes com algoritmos de robustez a ruído geralmente empregados em Sistemas de Reconhecimento de Voz. É realizado um breve estudo sobre a influência do ruído sobre a tecnologia de verificação de locutor e sobre as técnicas de robustez. Para os experimentos com o SVL são utilizadas três técnicas convencionais (subtração espectral (SS), a normalização da média cepstral (CMN), Log-RASTA) e um método de modelamento de duração de estados (MDE) com restrições temporais, recentemente proposto. Como verificado em reconhecimento de voz, todas estas técnicas também forneceram um bom desempenho para o SVL em questão. O ruído convolucional é quase que totalmente cancelado por CMN ou Log-RASTA, e o ruído aditivo tem sua influência bastante reduzida principalmente com o emprego conjunto de SS e MDE com truncamento simples. Com a presença de ambos os ruídos, SS, Log-RASTA e MDE com truncamento simples conjuntamente reduziram em até 87% a taxa de erros iguais. Verifica-se também que a presença de CMN e principalmente Log-RASTA reduz significativamente a variabilidade do limiar de decisão. A pesar dos resultados aqui apresentados mostrarem um importante avanço, a robustez de sistemas de reconhecimento de voz e de locutor a ruídos interferentes ainda são um problema complexo, e é o principal empecilho enfrentado em aplicações práticas reaisAbstract: The speech carries linguistic information that can be classified by speech recognition systems, and also information related to the speaker's characteristics, which is employed by speaker recognition methods. However, speech and speaker recognition tasks have the performance strongly degraded by noise environments, and this dissertation presents the results of experiments with a speaker verification system combined with noise robust algorithms usually used in speech recognition. Three conventional techniques were tested (spectral subtraction (SS), cepstral mean subtraction (CMN) and RAST A filtering) and a method for state duration modeling with temporal restrictions (MDE) that has recently been proposed. Firstly, an introduction to acoustic pattern matching algorithms is presented, and the speaker verification system employed in this dissertation is briefly described. Secondly, noise robust techniques are analyzed and discussed. Finally, these techniques are tested in the speaker verification system to cancel both additive and convolution noise, and the combinations of the noise robust methods are evaluated and compared. This dissertation shows that the techniques here addressed can give a high improvement in a speaker verification system, although the noise robustness of speech and speaker recognition systems is still a complex topic and the main problem to be addressed to make successful real applications of this technologyMestradoMestre em Engenharia Elétrica[s.n.]Becerra Yoma, Nestor JorgeRomano, João Marcos Travassos, 1960-Lee, Luan LingPortugheis, JaimeYoma, Nestor Jorge BecerraMiranda, MariaUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASPegoraro, Tarciano Facco2000info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf101p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1588807PEGORARO, Tarciano Facco. Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor. 2000. 101p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588807. Acesso em: 27 fev. 2025.https://repositorio.unicamp.br/acervo/detalhe/192423porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-02-18T03:10:30Zoai::192423Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-02-18T03:10:30Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
title Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
spellingShingle Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
Pegoraro, Tarciano Facco
Reconhecimento automático da voz
Sistemas de reconhecimento de padrões
Processamento de sinais - Técnicas digitais
title_short Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
title_full Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
title_fullStr Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
title_full_unstemmed Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
title_sort Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor
author Pegoraro, Tarciano Facco
author_facet Pegoraro, Tarciano Facco
author_role author
dc.contributor.none.fl_str_mv Becerra Yoma, Nestor Jorge
Romano, João Marcos Travassos, 1960-
Lee, Luan Ling
Portugheis, Jaime
Yoma, Nestor Jorge Becerra
Miranda, Maria
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Pegoraro, Tarciano Facco
dc.subject.por.fl_str_mv Reconhecimento automático da voz
Sistemas de reconhecimento de padrões
Processamento de sinais - Técnicas digitais
topic Reconhecimento automático da voz
Sistemas de reconhecimento de padrões
Processamento de sinais - Técnicas digitais
description Orientadores: Nestor Jorge Becerra Yoma, João Marcos Travassos Romano
publishDate 2000
dc.date.none.fl_str_mv 2000
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv (Broch.)
https://hdl.handle.net/20.500.12733/1588807
PEGORARO, Tarciano Facco. Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor. 2000. 101p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588807. Acesso em: 27 fev. 2025.
identifier_str_mv (Broch.)
PEGORARO, Tarciano Facco. Algoritmos robustos de reconhecimento de voz aplicados a verificação de locutor. 2000. 101p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588807. Acesso em: 27 fev. 2025.
url https://hdl.handle.net/20.500.12733/1588807
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/192423
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
101p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1829137405449338880