Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.
| Ano de defesa: | 1993 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/ |
Resumo: | Neste trabalho, serão apresentados o desenvolvimento e a implementação de um sistema de reconhecimento de voz, independente do falante, usando quantização vetorial (VQ) e modelos ocultos de Markov (Hidden Markov Models - HMM), para palavras da língua portuguesa, pronunciadas isoladamente. O vocabulário de treinamento foi de 50 palavras, sendo 40 da interface gráfica Microsoft Windows 3.1 (em português) e mais os 10 dígitos. O treinamento do estágio de VQ foi executado com um algoritmo LBG, com busca exaustiva e incremento de bit, e o treinamento dos HMM\'s foi feito com o algoritmo de Baum-Welch (estimador por máxima verossimilhança). No reconhecimento, o estágio de VQ realiza busca completa no livro de códigos de 128 níveis e, na seqüência, um modelo HMM por palavra é fornecido ao decodificador de Viterbi, que encontra o melhor modelo. O índice de reconhecimento no banco de dados de treinamento foi de 100%, para 9 falantes. Pelas estimativas realizadas, a implementação em tempo real do sistema proposto, em plataformas tipo IBM PC de alto desempenho, é viável. |
| id |
USP_9ca443eb7c8ab1372a0e86160bc40037 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-22072025-113244 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto.Untitled in englishReconhecimento de vozVoice recognitionNeste trabalho, serão apresentados o desenvolvimento e a implementação de um sistema de reconhecimento de voz, independente do falante, usando quantização vetorial (VQ) e modelos ocultos de Markov (Hidden Markov Models - HMM), para palavras da língua portuguesa, pronunciadas isoladamente. O vocabulário de treinamento foi de 50 palavras, sendo 40 da interface gráfica Microsoft Windows 3.1 (em português) e mais os 10 dígitos. O treinamento do estágio de VQ foi executado com um algoritmo LBG, com busca exaustiva e incremento de bit, e o treinamento dos HMM\'s foi feito com o algoritmo de Baum-Welch (estimador por máxima verossimilhança). No reconhecimento, o estágio de VQ realiza busca completa no livro de códigos de 128 níveis e, na seqüência, um modelo HMM por palavra é fornecido ao decodificador de Viterbi, que encontra o melhor modelo. O índice de reconhecimento no banco de dados de treinamento foi de 100%, para 9 falantes. Pelas estimativas realizadas, a implementação em tempo real do sistema proposto, em plataformas tipo IBM PC de alto desempenho, é viável.In this work the development and implementation of speaker independent speech recogniton system, using Vector Quantization (VQ) and Hidden Markov Models (HMM), for isolating one word utterance of Portuguese language. The training vocabulary was 50 words including 40 of graphics interface Microsoft Windows 3.] (in Portuguese) plus the 10 digits. The training of VQ phase was executed by LBG algorithm, with exhaustive search and bit increment, and the training of HMM was done with the Baum-Welch algorithm (maximum likelihood estimator). In the recognition the VQ phase scans fully the 128-level Codebook, and a HMM for word is supplied to Viterbi decoder, which finds the best model. The recognition index in the training Data Base was 100% for 9 speakers. According to our estimates the system real-time implementation, at a high performance IBM PC-like host, is feasible.Biblioteca Digitais de Teses e Dissertações da USPAlens, NormondsMinami, Mario1993-09-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-07-22T14:39:02Zoai:teses.usp.br:tde-22072025-113244Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-07-22T14:39:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. Untitled in english |
| title |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. |
| spellingShingle |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. Minami, Mario Reconhecimento de voz Voice recognition |
| title_short |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. |
| title_full |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. |
| title_fullStr |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. |
| title_full_unstemmed |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. |
| title_sort |
Reconhecer de palavras isoladas, independente do falente, usando HMM discreto. |
| author |
Minami, Mario |
| author_facet |
Minami, Mario |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Alens, Normonds |
| dc.contributor.author.fl_str_mv |
Minami, Mario |
| dc.subject.por.fl_str_mv |
Reconhecimento de voz Voice recognition |
| topic |
Reconhecimento de voz Voice recognition |
| description |
Neste trabalho, serão apresentados o desenvolvimento e a implementação de um sistema de reconhecimento de voz, independente do falante, usando quantização vetorial (VQ) e modelos ocultos de Markov (Hidden Markov Models - HMM), para palavras da língua portuguesa, pronunciadas isoladamente. O vocabulário de treinamento foi de 50 palavras, sendo 40 da interface gráfica Microsoft Windows 3.1 (em português) e mais os 10 dígitos. O treinamento do estágio de VQ foi executado com um algoritmo LBG, com busca exaustiva e incremento de bit, e o treinamento dos HMM\'s foi feito com o algoritmo de Baum-Welch (estimador por máxima verossimilhança). No reconhecimento, o estágio de VQ realiza busca completa no livro de códigos de 128 níveis e, na seqüência, um modelo HMM por palavra é fornecido ao decodificador de Viterbi, que encontra o melhor modelo. O índice de reconhecimento no banco de dados de treinamento foi de 100%, para 9 falantes. Pelas estimativas realizadas, a implementação em tempo real do sistema proposto, em plataformas tipo IBM PC de alto desempenho, é viável. |
| publishDate |
1993 |
| dc.date.none.fl_str_mv |
1993-09-02 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22072025-113244/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1844786343625883648 |