Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.

Detalhes bibliográficos
Ano de defesa: 1993
Autor(a) principal: Minami, Mario
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/
Resumo: Neste trabalho, serão apresentados o desenvolvimento e a implementação de um sistema de reconhecimento de voz, independente do falante, usando quantização vetorial (VQ) e modelos ocultos de Markov (Hidden Markov Models - HMM), para palavras da língua portuguesa, pronunciadas isoladamente. O vocabulário de treinamento foi de 50 palavras, sendo 40 da interface gráfica Microsoft Windows 3.1 (em português) e mais os 10 dígitos. O treinamento do estágio de VQ foi executado com um algoritmo LBG, com busca exaustiva e incremento de bit, e o treinamento dos HMM\'s foi feito com o algoritmo de Baum-Welch (estimador por máxima verossimilhança). No reconhecimento, o estágio de VQ realiza busca completa no livro de códigos de 128 níveis e, na seqüência, um modelo HMM por palavra é fornecido ao decodificador de Viterbi, que encontra o melhor modelo. O índice de reconhecimento no banco de dados de treinamento foi de 100%, para 9 falantes. Pelas estimativas realizadas, a implementação em tempo real do sistema proposto, em plataformas tipo IBM PC de alto desempenho, é viável.
id USP_9ca443eb7c8ab1372a0e86160bc40037
oai_identifier_str oai:teses.usp.br:tde-22072025-113244
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.Untitled in englishReconhecimento de vozVoice recognitionNeste trabalho, serão apresentados o desenvolvimento e a implementação de um sistema de reconhecimento de voz, independente do falante, usando quantização vetorial (VQ) e modelos ocultos de Markov (Hidden Markov Models - HMM), para palavras da língua portuguesa, pronunciadas isoladamente. O vocabulário de treinamento foi de 50 palavras, sendo 40 da interface gráfica Microsoft Windows 3.1 (em português) e mais os 10 dígitos. O treinamento do estágio de VQ foi executado com um algoritmo LBG, com busca exaustiva e incremento de bit, e o treinamento dos HMM\'s foi feito com o algoritmo de Baum-Welch (estimador por máxima verossimilhança). No reconhecimento, o estágio de VQ realiza busca completa no livro de códigos de 128 níveis e, na seqüência, um modelo HMM por palavra é fornecido ao decodificador de Viterbi, que encontra o melhor modelo. O índice de reconhecimento no banco de dados de treinamento foi de 100%, para 9 falantes. Pelas estimativas realizadas, a implementação em tempo real do sistema proposto, em plataformas tipo IBM PC de alto desempenho, é viável.In this work the development and implementation of speaker independent speech recogniton system, using Vector Quantization (VQ) and Hidden Markov Models (HMM), for isolating one word utterance of Portuguese language. The training vocabulary was 50 words including 40 of graphics interface Microsoft Windows 3.] (in Portuguese) plus the 10 digits. The training of VQ phase was executed by LBG algorithm, with exhaustive search and bit increment, and the training of HMM was done with the Baum-Welch algorithm (maximum likelihood estimator). In the recognition the VQ phase scans fully the 128-level Codebook, and a HMM for word is supplied to Viterbi decoder, which finds the best model. The recognition index in the training Data Base was 100% for 9 speakers. According to our estimates the system real-time implementation, at a high performance IBM PC-like host, is feasible.Biblioteca Digitais de Teses e Dissertações da USPAlens, NormondsMinami, Mario1993-09-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-07-22T14:39:02Zoai:teses.usp.br:tde-22072025-113244Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-07-22T14:39:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
Untitled in english
title Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
spellingShingle Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
Minami, Mario
Reconhecimento de voz
Voice recognition
title_short Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
title_full Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
title_fullStr Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
title_full_unstemmed Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
title_sort Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
author Minami, Mario
author_facet Minami, Mario
author_role author
dc.contributor.none.fl_str_mv Alens, Normonds
dc.contributor.author.fl_str_mv Minami, Mario
dc.subject.por.fl_str_mv Reconhecimento de voz
Voice recognition
topic Reconhecimento de voz
Voice recognition
description Neste trabalho, serão apresentados o desenvolvimento e a implementação de um sistema de reconhecimento de voz, independente do falante, usando quantização vetorial (VQ) e modelos ocultos de Markov (Hidden Markov Models - HMM), para palavras da língua portuguesa, pronunciadas isoladamente. O vocabulário de treinamento foi de 50 palavras, sendo 40 da interface gráfica Microsoft Windows 3.1 (em português) e mais os 10 dígitos. O treinamento do estágio de VQ foi executado com um algoritmo LBG, com busca exaustiva e incremento de bit, e o treinamento dos HMM\'s foi feito com o algoritmo de Baum-Welch (estimador por máxima verossimilhança). No reconhecimento, o estágio de VQ realiza busca completa no livro de códigos de 128 níveis e, na seqüência, um modelo HMM por palavra é fornecido ao decodificador de Viterbi, que encontra o melhor modelo. O índice de reconhecimento no banco de dados de treinamento foi de 100%, para 9 falantes. Pelas estimativas realizadas, a implementação em tempo real do sistema proposto, em plataformas tipo IBM PC de alto desempenho, é viável.
publishDate 1993
dc.date.none.fl_str_mv 1993-09-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/
url https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1844786343625883648