Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.
| Ano de defesa: | 2001 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/ |
Resumo: | Este trabalho avalia o reconhecimento do locutor utilizando diferentes tipos de redes neurais artificiais e um pré-processamento baseado nas correlações dos coeficientes mel-cepstrais. Primeiramente são mostradas as bases para o aprendizado das redes neurais e em seguida a importante teoria das redes é exposta. As redes utilizadas neste trabalho são de dois tipos diferentes. O Multi-Layer Perceptron (MLP), a LearnMatrix (LM) e a Radial Basis Function (RBF) são redes supervisionadas, enquanto a Self-Organizing Feature Finder (SOFF) é não supervisionada. Estas redes são comparadas na tarefa de reconhecimento do locutor. O pré-processamento do sinal de voz que utiliza as correlações dos coeficientes mel-cepstrais, chamados de MFC3, é mostrado e avaliado. A viabilidade da utilização destes coeficientes é reconhecida e os resultados obtidos apontam para o MLP junto com os MFC3 como sendo uma combinação que permite obter taxas elevadas na tarefa de reconhecimento do locutor. No entanto, os resultados mostrados para a rede binária LearnMatrix a definem como sendo uma ferramenta poderosa na avaliação prévia do sinal de voz. |
| id |
USP_7ea72e1af8a56b77a3d59d3b0a31bf1c |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-16092024-101602 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais.Untitled in englishNeural networksRedes neuraisEste trabalho avalia o reconhecimento do locutor utilizando diferentes tipos de redes neurais artificiais e um pré-processamento baseado nas correlações dos coeficientes mel-cepstrais. Primeiramente são mostradas as bases para o aprendizado das redes neurais e em seguida a importante teoria das redes é exposta. As redes utilizadas neste trabalho são de dois tipos diferentes. O Multi-Layer Perceptron (MLP), a LearnMatrix (LM) e a Radial Basis Function (RBF) são redes supervisionadas, enquanto a Self-Organizing Feature Finder (SOFF) é não supervisionada. Estas redes são comparadas na tarefa de reconhecimento do locutor. O pré-processamento do sinal de voz que utiliza as correlações dos coeficientes mel-cepstrais, chamados de MFC3, é mostrado e avaliado. A viabilidade da utilização destes coeficientes é reconhecida e os resultados obtidos apontam para o MLP junto com os MFC3 como sendo uma combinação que permite obter taxas elevadas na tarefa de reconhecimento do locutor. No entanto, os resultados mostrados para a rede binária LearnMatrix a definem como sendo uma ferramenta poderosa na avaliação prévia do sinal de voz.This work evaluates different types of artificial neural networks in a speaker recognition task and a front-end based on mel-frequency cepstral coefficients correlations. After the artificial neural networks fundamentals are presented, each neural network is explained. The networks that are used in this work are from two types. The Multi-Layer Perceptron (MLP), the LearnMatrix (LM) and the Radial Basis Function (RBF) are supervised networks while the Self-Organizing Feature Finder (SOFF) is self-organizing. These networks are compared in a speaker recognition task. The front-end processing using the mel-frequency cepstral coefficients correlations, called MFC3, is presented and evaluated. The use of these coefficients has been found promising and the results show that the combination of the MLP and the MFC3 allow achieving high recognition rates. However, the results shown for the LearnMatrix network make us believe that this network may be a powerful tool for a previous speech data evaluation. The ability of dimensionality reduction of the SOFF paradigm is also discussed.Biblioteca Digitais de Teses e Dissertações da USPCabral Junior, Euvaldo FerreiraSória, Roberto Amilton Bernardes2001-06-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-09-16T13:20:02Zoai:teses.usp.br:tde-16092024-101602Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-09-16T13:20:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. Untitled in english |
| title |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. |
| spellingShingle |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. Sória, Roberto Amilton Bernardes Neural networks Redes neurais |
| title_short |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. |
| title_full |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. |
| title_fullStr |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. |
| title_full_unstemmed |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. |
| title_sort |
Reconhecimento automático do locutor usando pré-processamento em sons nasalizados com diversos classificadores neurais. |
| author |
Sória, Roberto Amilton Bernardes |
| author_facet |
Sória, Roberto Amilton Bernardes |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Cabral Junior, Euvaldo Ferreira |
| dc.contributor.author.fl_str_mv |
Sória, Roberto Amilton Bernardes |
| dc.subject.por.fl_str_mv |
Neural networks Redes neurais |
| topic |
Neural networks Redes neurais |
| description |
Este trabalho avalia o reconhecimento do locutor utilizando diferentes tipos de redes neurais artificiais e um pré-processamento baseado nas correlações dos coeficientes mel-cepstrais. Primeiramente são mostradas as bases para o aprendizado das redes neurais e em seguida a importante teoria das redes é exposta. As redes utilizadas neste trabalho são de dois tipos diferentes. O Multi-Layer Perceptron (MLP), a LearnMatrix (LM) e a Radial Basis Function (RBF) são redes supervisionadas, enquanto a Self-Organizing Feature Finder (SOFF) é não supervisionada. Estas redes são comparadas na tarefa de reconhecimento do locutor. O pré-processamento do sinal de voz que utiliza as correlações dos coeficientes mel-cepstrais, chamados de MFC3, é mostrado e avaliado. A viabilidade da utilização destes coeficientes é reconhecida e os resultados obtidos apontam para o MLP junto com os MFC3 como sendo uma combinação que permite obter taxas elevadas na tarefa de reconhecimento do locutor. No entanto, os resultados mostrados para a rede binária LearnMatrix a definem como sendo uma ferramenta poderosa na avaliação prévia do sinal de voz. |
| publishDate |
2001 |
| dc.date.none.fl_str_mv |
2001-06-08 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-16092024-101602/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1818279200500482048 |