Avaliação de diferentes tecnicas para reconhecimento da fala
Ano de defesa: | 1997 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
[s.n.]
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://hdl.handle.net/20.500.12733/1585715 |
Resumo: | Orientador: Fabio Violaro |
id |
UNICAMP-30_8501971df8c1345ac0486c51f181a965 |
---|---|
oai_identifier_str |
oai::126667 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Avaliação de diferentes tecnicas para reconhecimento da falaReconhecimento automático da vozReconhecimento de padrõesReconhecimento de palavrasRedes neurais (Computação)Processos de MarkovReconhecimento automatico da falaOrientador: Fabio ViolaroTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: Neste trabalho são avaliadas as seguintes técnicas empregadas em reconhecimento de fala: Modelos Ocultos de Markov (Discreto, Semicontínuo e Contínuo), redes " Multilayer Perceptron " e Sistemas Híbridos. Para essa avaliação, foram implementados vários reconhece dores de palavras isoladas independentes do locutor, sendo usada a mesma base de dados para todos os reconhecedores. O objetivo dessa avaliação é identificar as vantagens e desvantagens de cada técnica de modo a facilitar a escolha da técnica mais apropriada para cada aplicação de reconhecimento de fala considerando diversos aspectos como taxa de acerto, tempo de reconhecimento, tempo de treinamento, quantidade de parâmetros, tipo de algoritmo e outros. Reconhecedores implementados empregando as técnicas descritas também foram utilizados para avaliar algoritmos para detecção de início/fim de palavras, vários tipos de medidas de distorção usados em quantização vetorial e diferentes parâmetros utilizados para representar o sinal de fala. Entre esses parâmetros mostrou-se que existe uma superioridade dos parâmetros calculados usando uma escala não linear de freqüências, independentemente da técnica empregada nos reconhecedores. Discute-se também o uso da subtração da média espectral e diferenciação, as quais melhoram o desempenho dos reconhecedores. Combinando diferentes parâmetros conseguiu-se obter uma taxa de acertos de 99.47% para um reconhecedor de palavras isoladas independente do locutor e um vocabulário de 50 palavrasAbstract: This work presents an evaluation of speaker independent isolated word recognizers using Hidden Markov Models (Discrete, Continuous and Semicontinuous), Artificial Neural Networks (Multilayer Perceptron) and Hybrid Systems. All the recognizers were evaluated considering the same database. The goal of these comparisons is to identify the advantages and disadvantages of each technique used in speech recognition, considering the following features: training and recognition time, recognition accuracy, complexity of algorithms and others. It is also reported the result of a comparison among different algorithms used in word endpoints detection. Moreover, several distance measures employed in vector quantization were evaluated with regard to recognition performance. In addition, different kinds of parameters used to represent the speech signal such as LPC coefficients, Mel Frequency Cepstrum coefficients, PLP coefficients were considered in the evaluation of recognizers and it was discussed the efects of cepstral mean subtraction in order to improve the recognition accuracy. The best recognizer performance of 99.47% was obtained combining different featuresDoutoradoDoutor em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASMartins, José Antônio1997info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf161f. : il.(Broch.)https://hdl.handle.net/20.500.12733/1585715MARTINS, José Antônio. Avaliação de diferentes tecnicas para reconhecimento da fala. 1997. 161f. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1585715. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/126667porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2014-04-18T10:57:17Zoai::126667Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2014-04-18T10:57:17Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Avaliação de diferentes tecnicas para reconhecimento da fala |
title |
Avaliação de diferentes tecnicas para reconhecimento da fala |
spellingShingle |
Avaliação de diferentes tecnicas para reconhecimento da fala Martins, José Antônio Reconhecimento automático da voz Reconhecimento de padrões Reconhecimento de palavras Redes neurais (Computação) Processos de Markov Reconhecimento automatico da fala |
title_short |
Avaliação de diferentes tecnicas para reconhecimento da fala |
title_full |
Avaliação de diferentes tecnicas para reconhecimento da fala |
title_fullStr |
Avaliação de diferentes tecnicas para reconhecimento da fala |
title_full_unstemmed |
Avaliação de diferentes tecnicas para reconhecimento da fala |
title_sort |
Avaliação de diferentes tecnicas para reconhecimento da fala |
author |
Martins, José Antônio |
author_facet |
Martins, José Antônio |
author_role |
author |
dc.contributor.none.fl_str_mv |
Violaro, Fábio, 1950- Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Martins, José Antônio |
dc.subject.por.fl_str_mv |
Reconhecimento automático da voz Reconhecimento de padrões Reconhecimento de palavras Redes neurais (Computação) Processos de Markov Reconhecimento automatico da fala |
topic |
Reconhecimento automático da voz Reconhecimento de padrões Reconhecimento de palavras Redes neurais (Computação) Processos de Markov Reconhecimento automatico da fala |
description |
Orientador: Fabio Violaro |
publishDate |
1997 |
dc.date.none.fl_str_mv |
1997 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
(Broch.) https://hdl.handle.net/20.500.12733/1585715 MARTINS, José Antônio. Avaliação de diferentes tecnicas para reconhecimento da fala. 1997. 161f. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1585715. Acesso em: 2 set. 2024. |
identifier_str_mv |
(Broch.) MARTINS, José Antônio. Avaliação de diferentes tecnicas para reconhecimento da fala. 1997. 161f. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1585715. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1585715 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/126667 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 161f. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189689223020544 |