Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente
Ano de defesa: | 2016 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Sergipe
|
Programa de Pós-Graduação: |
Pós-Graduação em Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://ri.ufs.br/handle/riufs/3363 |
Resumo: | One of the biggest challenges in speech recognition today is its use on a daily basis, in which distortion and noise in the environment are present and hinder this task. In the last thirty years, hundreds of methods for noise-robust recognition were proposed, each with its own advantages and disadvantages. In this thesis, the use of Convolutional Neural Networks (CNN) as acoustic models in automatic speech recognition systems (ASR) is proposed as an alternative to the classical recognition methods based on Hidden Markov Models (HMM) without any noise-robust method applied. Experiments were performed with a audio set modified by additive and natural noises, and showed that the presented method reduces the Equal Error Rate (EER) and improves the acuracy of speech recognition in noisy environments when compared to traditional models of classifiation, indicating the robustness of the approach. |
id |
UFS-2_3eda4c1391202494d5227dc82adb1a0d |
---|---|
oai_identifier_str |
oai:ufs.br:riufs/3363 |
network_acronym_str |
UFS-2 |
network_name_str |
Repositório Institucional da UFS |
repository_id_str |
|
spelling |
Santos, Rafael MenêsesMatos, Leonardo NogueiraMacedo, Hendrik Teixeirahttp://lattes.cnpq.br/17450814187972732017-09-26T11:34:29Z2017-09-26T11:34:29Z2016-05-30SANTOS, Rafael Menêses. Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente. 2016. 40 f. Dissertação (Pós-Graduação em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2016.https://ri.ufs.br/handle/riufs/3363One of the biggest challenges in speech recognition today is its use on a daily basis, in which distortion and noise in the environment are present and hinder this task. In the last thirty years, hundreds of methods for noise-robust recognition were proposed, each with its own advantages and disadvantages. In this thesis, the use of Convolutional Neural Networks (CNN) as acoustic models in automatic speech recognition systems (ASR) is proposed as an alternative to the classical recognition methods based on Hidden Markov Models (HMM) without any noise-robust method applied. Experiments were performed with a audio set modified by additive and natural noises, and showed that the presented method reduces the Equal Error Rate (EER) and improves the acuracy of speech recognition in noisy environments when compared to traditional models of classifiation, indicating the robustness of the approach.Um dos maiores desafios no reconhecimento de fala atualmente é usá-lo no contexto diário, no qual distorções no sinal da fala e ruídos no ambiente estão presentes e re- duzem a qualidade do reconhecimento. Nos últimos trinta anos, centenas de métodos para reconhecimento robusto ao ruído foram propostos, cada um com suas vantagens e desvantagens. Este trabalho propõe o uso de uma rede neural convolucional no papel de modelo acústico em sistemas de reconhecimento automático de fala,como uma alter- nativa ao métodos clássicos de reconhecimento baseado em modelos ocultos de Markov (HMM, do inglês, Hidden Markov Models) sem a aplicação de um método robusto ao ruído. Experimentos foram realizados com áudios modi ficados com ruídos aditivos e reais, e mostraram que o método proposto reduz o Equal Error Rate (EER) e aumenta a acurácia da classificação de comando de voz quando comparado a modelos tradicionais de classificação, evidenciando a robustez da abordagem apresentada.application/pdfporUniversidade Federal de SergipePós-Graduação em Ciência da ComputaçãoUFSBrasilComputaçãoRedes neurais (Computação)Reconhecimento automático da vozProcessos de MarkovConvolucionaisHMMReconhecimento de falaSpeech recognitionConvolutional neural networksCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambienteinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSTEXTRAFAEL_MENESES_SANTOS.pdf.txtRAFAEL_MENESES_SANTOS.pdf.txtExtracted texttext/plain59361https://ri.ufs.br/jspui/bitstream/riufs/3363/2/RAFAEL_MENESES_SANTOS.pdf.txt358fbbd2203a95e61e2d86961e2f0f96MD52THUMBNAILRAFAEL_MENESES_SANTOS.pdf.jpgRAFAEL_MENESES_SANTOS.pdf.jpgGenerated Thumbnailimage/jpeg1175https://ri.ufs.br/jspui/bitstream/riufs/3363/3/RAFAEL_MENESES_SANTOS.pdf.jpg640dfa15b79a101574fc59c18a9ce4f2MD53ORIGINALRAFAEL_MENESES_SANTOS.pdfapplication/pdf2189611https://ri.ufs.br/jspui/bitstream/riufs/3363/1/RAFAEL_MENESES_SANTOS.pdf0f0b24f0e304c633783f5e0847924350MD51riufs/33632017-11-24 21:35:09.862oai:ufs.br:riufs/3363Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2017-11-25T00:35:09Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false |
dc.title.por.fl_str_mv |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
title |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
spellingShingle |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente Santos, Rafael Menêses Computação Redes neurais (Computação) Reconhecimento automático da voz Processos de Markov Convolucionais HMM Reconhecimento de fala Speech recognition Convolutional neural networks CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
title_full |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
title_fullStr |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
title_full_unstemmed |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
title_sort |
Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente |
author |
Santos, Rafael Menêses |
author_facet |
Santos, Rafael Menêses |
author_role |
author |
dc.contributor.author.fl_str_mv |
Santos, Rafael Menêses |
dc.contributor.advisor1.fl_str_mv |
Matos, Leonardo Nogueira |
dc.contributor.advisor-co1.fl_str_mv |
Macedo, Hendrik Teixeira |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/1745081418797273 |
contributor_str_mv |
Matos, Leonardo Nogueira Macedo, Hendrik Teixeira |
dc.subject.por.fl_str_mv |
Computação Redes neurais (Computação) Reconhecimento automático da voz Processos de Markov Convolucionais HMM Reconhecimento de fala |
topic |
Computação Redes neurais (Computação) Reconhecimento automático da voz Processos de Markov Convolucionais HMM Reconhecimento de fala Speech recognition Convolutional neural networks CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Speech recognition Convolutional neural networks |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
One of the biggest challenges in speech recognition today is its use on a daily basis, in which distortion and noise in the environment are present and hinder this task. In the last thirty years, hundreds of methods for noise-robust recognition were proposed, each with its own advantages and disadvantages. In this thesis, the use of Convolutional Neural Networks (CNN) as acoustic models in automatic speech recognition systems (ASR) is proposed as an alternative to the classical recognition methods based on Hidden Markov Models (HMM) without any noise-robust method applied. Experiments were performed with a audio set modified by additive and natural noises, and showed that the presented method reduces the Equal Error Rate (EER) and improves the acuracy of speech recognition in noisy environments when compared to traditional models of classifiation, indicating the robustness of the approach. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-05-30 |
dc.date.accessioned.fl_str_mv |
2017-09-26T11:34:29Z |
dc.date.available.fl_str_mv |
2017-09-26T11:34:29Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
SANTOS, Rafael Menêses. Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente. 2016. 40 f. Dissertação (Pós-Graduação em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2016. |
dc.identifier.uri.fl_str_mv |
https://ri.ufs.br/handle/riufs/3363 |
identifier_str_mv |
SANTOS, Rafael Menêses. Uma abordagem híbrida CNN-HMM para reconhecimento de fala tolerante a ruídos de ambiente. 2016. 40 f. Dissertação (Pós-Graduação em Ciência da Computação) - Universidade Federal de Sergipe, São Cristóvão, SE, 2016. |
url |
https://ri.ufs.br/handle/riufs/3363 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Sergipe |
dc.publisher.program.fl_str_mv |
Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFS |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Sergipe |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe (UFS) instacron:UFS |
instname_str |
Universidade Federal de Sergipe (UFS) |
instacron_str |
UFS |
institution |
UFS |
reponame_str |
Repositório Institucional da UFS |
collection |
Repositório Institucional da UFS |
bitstream.url.fl_str_mv |
https://ri.ufs.br/jspui/bitstream/riufs/3363/2/RAFAEL_MENESES_SANTOS.pdf.txt https://ri.ufs.br/jspui/bitstream/riufs/3363/3/RAFAEL_MENESES_SANTOS.pdf.jpg https://ri.ufs.br/jspui/bitstream/riufs/3363/1/RAFAEL_MENESES_SANTOS.pdf |
bitstream.checksum.fl_str_mv |
358fbbd2203a95e61e2d86961e2f0f96 640dfa15b79a101574fc59c18a9ce4f2 0f0b24f0e304c633783f5e0847924350 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS) |
repository.mail.fl_str_mv |
repositorio@academico.ufs.br |
_version_ |
1802111126211657728 |