Reconhecimento de palavras por modelos ocultos de Markov.
Ano de defesa: | 1996 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/ |
Resumo: | O uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM. |
id |
USP_2abd920d6d3186e396fb4c5fb6af0700 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-22082024-101705 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
|
spelling |
Reconhecimento de palavras por modelos ocultos de Markov.Untitled in englishReconhecimento de vozVoice recognitionO uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM.The use of hidden Markov models (HMM) in autyomatic speech recognition has been object of extensive research. These models use two inter-related statistics processes, one modeling the variability of the utterances rythms while the other describes the diversity of speech accoustical phenomena. The later would also be able to manage the features of different individual voices. This work studies the use of hidden Markov models through a recognition system for a restricted vocabular. The system uses the linear coeficiente prediction analysis and vector quantization to represent the voice signal by sequences of symbols to estimate model parameters. The results achieved with a single speaker support the representation capability of these models. However, system performance drops significantly whrn applied to different speakers. Some alternatives are proposed to improve the system in this way, without achievieng better results. The solutions for speaker-independent tasks points to adaptative methods preserving HMM versatility.Biblioteca Digitais de Teses e Dissertações da USPCampos, Geraldo Lino deScavone, André Pasquale Rocco1996-05-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-08-22T13:45:03Zoai:teses.usp.br:tde-22082024-101705Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-08-22T13:45:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Reconhecimento de palavras por modelos ocultos de Markov. Untitled in english |
title |
Reconhecimento de palavras por modelos ocultos de Markov. |
spellingShingle |
Reconhecimento de palavras por modelos ocultos de Markov. Scavone, André Pasquale Rocco Reconhecimento de voz Voice recognition |
title_short |
Reconhecimento de palavras por modelos ocultos de Markov. |
title_full |
Reconhecimento de palavras por modelos ocultos de Markov. |
title_fullStr |
Reconhecimento de palavras por modelos ocultos de Markov. |
title_full_unstemmed |
Reconhecimento de palavras por modelos ocultos de Markov. |
title_sort |
Reconhecimento de palavras por modelos ocultos de Markov. |
author |
Scavone, André Pasquale Rocco |
author_facet |
Scavone, André Pasquale Rocco |
author_role |
author |
dc.contributor.none.fl_str_mv |
Campos, Geraldo Lino de |
dc.contributor.author.fl_str_mv |
Scavone, André Pasquale Rocco |
dc.subject.por.fl_str_mv |
Reconhecimento de voz Voice recognition |
topic |
Reconhecimento de voz Voice recognition |
description |
O uso de modelos ocultos de Markov (HMM) na tarefa de reconhecimento de voz tem sido objeto de extensa pesquisa. Esses modelos utilizam dois processos estatísticos inter-relacionados: enquanto um modelo a variabilidade dos ritmos de emissao, o outro representa a diversidade dos fenômenos acústicos da fala. Este segundo processo permitiria também absorver as características de diferentes vozes. Este trabalho estuda o uso dos modelos ocultos de Markov através da implementação de um sistema de reconhecimento de vocabulário restrito. O sistema utiliza a análise por coeficientes de predição linear e quantização vetorial para representar o sinal de voz por uma sequência de símbolos que estima os parâmetros dos modelos. Os resultados obtidos com um locutor confirmam a capacidade de representação desses modelos. No entanto, o desempenho do sistema se reduz consideravelmente quando aplicado a diversos locutores. Algumas alternativas são propostas no sentido de melhorar o desempenho do sistema, sem atingir grande exito. As soluções para a independência do locutor apontam para métodos adaptativos que preservem a versatilidade dos HMM. |
publishDate |
1996 |
dc.date.none.fl_str_mv |
1996-05-31 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/ |
url |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-22082024-101705/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809092045558513664 |