Reconhecimento de voz, linguagem contínua, usando modelos de Markov.
| Ano de defesa: | 1993 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-03062025-081812/ |
Resumo: | Este trabalho estuda e descreve um reconhecedor de voz, de linguagem contínua, usando modelos de Markov (HMM) no processo de comparação de padrões. A realização deste trabalho utiliza análise LPC e quantização vetorial, para tratamento do sinal de voz, bem como o emprego de uma síntaxe, atendendo a um ambiente de aplicação, para efetuar a análise da sentença de voz proferida. O codebook do quantizador vetorial, e treinado via algoritmo LBG, e os parâmetros dos modelos de Markov, são estimados, conforme abordagem por máxima verossimilhança, e calculado pelo algoritmo de reestimação de Baum-Welch. O sistema é orientado a comandos, e o ambiente de aplicação escolhido e o de operações bancárias. Outras possíveis aplicações para este tipo de sistema podem ser consideradas, tais como interface homem-máquina amigável, auxílio a deficientes físicos, e outras aplicações onde um sistema de reconhecimento de voz, possa ser empregado. Os resultados obtidos do sistema foram satisfatórios, com o desempenho medido segundo testes com palavras isoladas, testes com linguagem contínua e testes de independência do locutor. Os resultados bem como os aspectos teóricos e práticos de implementação, são apresentados e discutidos no decorrer deste texto. |
| id |
USP_b11df1aa57179a471186fc194915e7bd |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-03062025-081812 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov.Untitled in englishPattern recognitionProcessamento de sinaisReconhecimento de padrõesReconhecimento de vozSignal processingSpeech recognitionEste trabalho estuda e descreve um reconhecedor de voz, de linguagem contínua, usando modelos de Markov (HMM) no processo de comparação de padrões. A realização deste trabalho utiliza análise LPC e quantização vetorial, para tratamento do sinal de voz, bem como o emprego de uma síntaxe, atendendo a um ambiente de aplicação, para efetuar a análise da sentença de voz proferida. O codebook do quantizador vetorial, e treinado via algoritmo LBG, e os parâmetros dos modelos de Markov, são estimados, conforme abordagem por máxima verossimilhança, e calculado pelo algoritmo de reestimação de Baum-Welch. O sistema é orientado a comandos, e o ambiente de aplicação escolhido e o de operações bancárias. Outras possíveis aplicações para este tipo de sistema podem ser consideradas, tais como interface homem-máquina amigável, auxílio a deficientes físicos, e outras aplicações onde um sistema de reconhecimento de voz, possa ser empregado. Os resultados obtidos do sistema foram satisfatórios, com o desempenho medido segundo testes com palavras isoladas, testes com linguagem contínua e testes de independência do locutor. Os resultados bem como os aspectos teóricos e práticos de implementação, são apresentados e discutidos no decorrer deste texto.This work studies and describes a Continuous Speech Recognition System, using Hidden Markov Models (HMM), In the pattern matching process. The processing system uses LPC analysis, and Vector Quantization, for dealing with Speech Signals, and syntax structure following specific application environment in the analysis of speech sentences. The vector quantization codebook is trained with well-know LBG Algorithm, and the Hidden Markov Parameters are estimated, pursuant to maximum likelihood approach, and processed by Baum-Welch Reestimation Algorithm. The features include command-oriented system, and application environment involving banking tasks. Among possible applications could be considered man-machine user-friendly interface, aiding handicapped people, and others task where Speech Recognition Systems could be employed. The results evaluated has been fair, with performance measured with isolated word recognition test, continuous speech recognition test, and speaker independence test. Results tests and theoretical and practical topics are presented and discussed through this text.Biblioteca Digitais de Teses e Dissertações da USPAlens, NormondsFagundes, Rubem Dutra Ribeiro1993-08-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-03062025-081812/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-06-03T11:25:02Zoai:teses.usp.br:tde-03062025-081812Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-06-03T11:25:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. Untitled in english |
| title |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. |
| spellingShingle |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. Fagundes, Rubem Dutra Ribeiro Pattern recognition Processamento de sinais Reconhecimento de padrões Reconhecimento de voz Signal processing Speech recognition |
| title_short |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. |
| title_full |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. |
| title_fullStr |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. |
| title_full_unstemmed |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. |
| title_sort |
Reconhecimento de voz, linguagem contínua, usando modelos de Markov. |
| author |
Fagundes, Rubem Dutra Ribeiro |
| author_facet |
Fagundes, Rubem Dutra Ribeiro |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Alens, Normonds |
| dc.contributor.author.fl_str_mv |
Fagundes, Rubem Dutra Ribeiro |
| dc.subject.por.fl_str_mv |
Pattern recognition Processamento de sinais Reconhecimento de padrões Reconhecimento de voz Signal processing Speech recognition |
| topic |
Pattern recognition Processamento de sinais Reconhecimento de padrões Reconhecimento de voz Signal processing Speech recognition |
| description |
Este trabalho estuda e descreve um reconhecedor de voz, de linguagem contínua, usando modelos de Markov (HMM) no processo de comparação de padrões. A realização deste trabalho utiliza análise LPC e quantização vetorial, para tratamento do sinal de voz, bem como o emprego de uma síntaxe, atendendo a um ambiente de aplicação, para efetuar a análise da sentença de voz proferida. O codebook do quantizador vetorial, e treinado via algoritmo LBG, e os parâmetros dos modelos de Markov, são estimados, conforme abordagem por máxima verossimilhança, e calculado pelo algoritmo de reestimação de Baum-Welch. O sistema é orientado a comandos, e o ambiente de aplicação escolhido e o de operações bancárias. Outras possíveis aplicações para este tipo de sistema podem ser consideradas, tais como interface homem-máquina amigável, auxílio a deficientes físicos, e outras aplicações onde um sistema de reconhecimento de voz, possa ser empregado. Os resultados obtidos do sistema foram satisfatórios, com o desempenho medido segundo testes com palavras isoladas, testes com linguagem contínua e testes de independência do locutor. Os resultados bem como os aspectos teóricos e práticos de implementação, são apresentados e discutidos no decorrer deste texto. |
| publishDate |
1993 |
| dc.date.none.fl_str_mv |
1993-08-05 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-03062025-081812/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-03062025-081812/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1844786326214279168 |