Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.

Detalhes bibliográficos
Ano de defesa: 2001
Autor(a) principal: Sória, Roberto Amilton Bernardes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/
Resumo: Este trabalho avalia o reconhecimento do locutor utilizando diferentes tipos de redes neurais artificiais e um pré-processamento baseado nas correlações dos coeficientes mel-cepstrais. Primeiramente são mostradas as bases para o aprendizado das redes neurais e em seguida a importante teoria das redes é exposta. As redes utilizadas neste trabalho são de dois tipos diferentes. O Multi-Layer Perceptron (MLP), a LearnMatrix (LM) e a Radial Basis Function (RBF) são redes supervisionadas, enquanto a Self-Organizing Feature Finder (SOFF) é não supervisionada. Estas redes são comparadas na tarefa de reconhecimento do locutor. O pré-processamento do sinal de voz que utiliza as correlações dos coeficientes mel-cepstrais, chamados de MFC3, é mostrado e avaliado. A viabilidade da utilização destes coeficientes é reconhecida e os resultados obtidos apontam para o MLP junto com os MFC3 como sendo uma combinação que permite obter taxas elevadas na tarefa de reconhecimento do locutor. No entanto, os resultados mostrados para a rede binária LearnMatrix a definem como sendo uma ferramenta poderosa na avaliação prévia do sinal de voz.
id USP_7ea72e1af8a56b77a3d59d3b0a31bf1c
oai_identifier_str oai:teses.usp.br:tde-16092024-101602
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.Untitled in englishNeural networksRedes neuraisEste trabalho avalia o reconhecimento do locutor utilizando diferentes tipos de redes neurais artificiais e um pré-processamento baseado nas correlações dos coeficientes mel-cepstrais. Primeiramente são mostradas as bases para o aprendizado das redes neurais e em seguida a importante teoria das redes é exposta. As redes utilizadas neste trabalho são de dois tipos diferentes. O Multi-Layer Perceptron (MLP), a LearnMatrix (LM) e a Radial Basis Function (RBF) são redes supervisionadas, enquanto a Self-Organizing Feature Finder (SOFF) é não supervisionada. Estas redes são comparadas na tarefa de reconhecimento do locutor. O pré-processamento do sinal de voz que utiliza as correlações dos coeficientes mel-cepstrais, chamados de MFC3, é mostrado e avaliado. A viabilidade da utilização destes coeficientes é reconhecida e os resultados obtidos apontam para o MLP junto com os MFC3 como sendo uma combinação que permite obter taxas elevadas na tarefa de reconhecimento do locutor. No entanto, os resultados mostrados para a rede binária LearnMatrix a definem como sendo uma ferramenta poderosa na avaliação prévia do sinal de voz.This work evaluates different types of artificial neural networks in a speaker recognition task and a front-end based on mel-frequency cepstral coefficients correlations. After the artificial neural networks fundamentals are presented, each neural network is explained. The networks that are used in this work are from two types. The Multi-Layer Perceptron (MLP), the LearnMatrix (LM) and the Radial Basis Function (RBF) are supervised networks while the Self-Organizing Feature Finder (SOFF) is self-organizing. These networks are compared in a speaker recognition task. The front-end processing using the mel-frequency cepstral coefficients correlations, called MFC3, is presented and evaluated. The use of these coefficients has been found promising and the results show that the combination of the MLP and the MFC3 allow achieving high recognition rates. However, the results shown for the LearnMatrix network make us believe that this network may be a powerful tool for a previous speech data evaluation. The ability of dimensionality reduction of the SOFF paradigm is also discussed.Biblioteca Digitais de Teses e Dissertações da USPCabral Junior, Euvaldo FerreiraSória, Roberto Amilton Bernardes2001-06-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-09-16T13:20:02Zoai:teses.usp.br:tde-16092024-101602Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-09-16T13:20:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
Untitled in english
title Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
spellingShingle Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
Sória, Roberto Amilton Bernardes
Neural networks
Redes neurais
title_short Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
title_full Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
title_fullStr Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
title_full_unstemmed Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
title_sort Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
author Sória, Roberto Amilton Bernardes
author_facet Sória, Roberto Amilton Bernardes
author_role author
dc.contributor.none.fl_str_mv Cabral Junior, Euvaldo Ferreira
dc.contributor.author.fl_str_mv Sória, Roberto Amilton Bernardes
dc.subject.por.fl_str_mv Neural networks
Redes neurais
topic Neural networks
Redes neurais
description Este trabalho avalia o reconhecimento do locutor utilizando diferentes tipos de redes neurais artificiais e um pré-processamento baseado nas correlações dos coeficientes mel-cepstrais. Primeiramente são mostradas as bases para o aprendizado das redes neurais e em seguida a importante teoria das redes é exposta. As redes utilizadas neste trabalho são de dois tipos diferentes. O Multi-Layer Perceptron (MLP), a LearnMatrix (LM) e a Radial Basis Function (RBF) são redes supervisionadas, enquanto a Self-Organizing Feature Finder (SOFF) é não supervisionada. Estas redes são comparadas na tarefa de reconhecimento do locutor. O pré-processamento do sinal de voz que utiliza as correlações dos coeficientes mel-cepstrais, chamados de MFC3, é mostrado e avaliado. A viabilidade da utilização destes coeficientes é reconhecida e os resultados obtidos apontam para o MLP junto com os MFC3 como sendo uma combinação que permite obter taxas elevadas na tarefa de reconhecimento do locutor. No entanto, os resultados mostrados para a rede binária LearnMatrix a definem como sendo uma ferramenta poderosa na avaliação prévia do sinal de voz.
publishDate 2001
dc.date.none.fl_str_mv 2001-06-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/
url https://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279200500482048