Avaliação de diferentes tecnicas para reconhecimento da fala

Detalhes bibliográficos
Ano de defesa: 1997
Autor(a) principal: Martins, José Antônio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1585715
Resumo: Orientador: Fabio Violaro
id UNICAMP-30_8501971df8c1345ac0486c51f181a965
oai_identifier_str oai::126667
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Avaliação de diferentes tecnicas para reconhecimento da falaReconhecimento automático da vozReconhecimento de padrõesReconhecimento de palavrasRedes neurais (Computação)Processos de MarkovReconhecimento automatico da falaOrientador: Fabio ViolaroTese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: Neste trabalho são avaliadas as seguintes técnicas empregadas em reconhecimento de fala: Modelos Ocultos de Markov (Discreto, Semicontínuo e Contínuo), redes " Multilayer Perceptron " e Sistemas Híbridos. Para essa avaliação, foram implementados vários reconhece dores de palavras isoladas independentes do locutor, sendo usada a mesma base de dados para todos os reconhecedores. O objetivo dessa avaliação é identificar as vantagens e desvantagens de cada técnica de modo a facilitar a escolha da técnica mais apropriada para cada aplicação de reconhecimento de fala considerando diversos aspectos como taxa de acerto, tempo de reconhecimento, tempo de treinamento, quantidade de parâmetros, tipo de algoritmo e outros. Reconhecedores implementados empregando as técnicas descritas também foram utilizados para avaliar algoritmos para detecção de início/fim de palavras, vários tipos de medidas de distorção usados em quantização vetorial e diferentes parâmetros utilizados para representar o sinal de fala. Entre esses parâmetros mostrou-se que existe uma superioridade dos parâmetros calculados usando uma escala não linear de freqüências, independentemente da técnica empregada nos reconhecedores. Discute-se também o uso da subtração da média espectral e diferenciação, as quais melhoram o desempenho dos reconhecedores. Combinando diferentes parâmetros conseguiu-se obter uma taxa de acertos de 99.47% para um reconhecedor de palavras isoladas independente do locutor e um vocabulário de 50 palavrasAbstract: This work presents an evaluation of speaker independent isolated word recognizers using Hidden Markov Models (Discrete, Continuous and Semicontinuous), Artificial Neural Networks (Multilayer Perceptron) and Hybrid Systems. All the recognizers were evaluated considering the same database. The goal of these comparisons is to identify the advantages and disadvantages of each technique used in speech recognition, considering the following features: training and recognition time, recognition accuracy, complexity of algorithms and others. It is also reported the result of a comparison among different algorithms used in word endpoints detection. Moreover, several distance measures employed in vector quantization were evaluated with regard to recognition performance. In addition, different kinds of parameters used to represent the speech signal such as LPC coefficients, Mel Frequency Cepstrum coefficients, PLP coefficients were considered in the evaluation of recognizers and it was discussed the efects of cepstral mean subtraction in order to improve the recognition accuracy. The best recognizer performance of 99.47% was obtained combining different featuresDoutoradoDoutor em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASMartins, José Antônio1997info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdf161f. : il.(Broch.)https://hdl.handle.net/20.500.12733/1585715MARTINS, José Antônio. Avaliação de diferentes tecnicas para reconhecimento da fala. 1997. 161f. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1585715. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/126667porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2014-04-18T10:57:17Zoai::126667Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2014-04-18T10:57:17Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Avaliação de diferentes tecnicas para reconhecimento da fala
title Avaliação de diferentes tecnicas para reconhecimento da fala
spellingShingle Avaliação de diferentes tecnicas para reconhecimento da fala
Martins, José Antônio
Reconhecimento automático da voz
Reconhecimento de padrões
Reconhecimento de palavras
Redes neurais (Computação)
Processos de Markov
Reconhecimento automatico da fala
title_short Avaliação de diferentes tecnicas para reconhecimento da fala
title_full Avaliação de diferentes tecnicas para reconhecimento da fala
title_fullStr Avaliação de diferentes tecnicas para reconhecimento da fala
title_full_unstemmed Avaliação de diferentes tecnicas para reconhecimento da fala
title_sort Avaliação de diferentes tecnicas para reconhecimento da fala
author Martins, José Antônio
author_facet Martins, José Antônio
author_role author
dc.contributor.none.fl_str_mv Violaro, Fábio, 1950-
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Martins, José Antônio
dc.subject.por.fl_str_mv Reconhecimento automático da voz
Reconhecimento de padrões
Reconhecimento de palavras
Redes neurais (Computação)
Processos de Markov
Reconhecimento automatico da fala
topic Reconhecimento automático da voz
Reconhecimento de padrões
Reconhecimento de palavras
Redes neurais (Computação)
Processos de Markov
Reconhecimento automatico da fala
description Orientador: Fabio Violaro
publishDate 1997
dc.date.none.fl_str_mv 1997
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv (Broch.)
https://hdl.handle.net/20.500.12733/1585715
MARTINS, José Antônio. Avaliação de diferentes tecnicas para reconhecimento da fala. 1997. 161f. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1585715. Acesso em: 2 set. 2024.
identifier_str_mv (Broch.)
MARTINS, José Antônio. Avaliação de diferentes tecnicas para reconhecimento da fala. 1997. 161f. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1585715. Acesso em: 2 set. 2024.
url https://hdl.handle.net/20.500.12733/1585715
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/126667
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
161f. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189689223020544