Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
Ano de defesa: | 1999 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
[s.n.]
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://hdl.handle.net/20.500.12733/1588258 |
Resumo: | Orientador: Fabio Violaro |
id |
UNICAMP-30_1edc471348e9ce0e31fd064cea117157 |
---|---|
oai_identifier_str |
oai::183837 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectadosReconhecimento automático da vozRedes neurais (Computação)Processos de MarkovProcessamento de palavrasAlgoritmosReconhecimento automatico da falaOrientador: Fabio ViolaroDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: Os Modelos Ocultos de Markov constituem, atualmente, a principal abordagem para o problema de Reconhecimento de Fala, pois proporcionam bom desempenho e alto grau de flexibilidade. Infelizmente, este modelo acústico não é ideal e alguns problemas afetam sua robustez e desempenho em condições adversas. A inconsistência do modelamento temporal implícito nos HMM's é um exemplo de um sério problema sem soluções bem definidas. De fato, o Modelo de Duração de Estados com distribuição exponencial é incompatível com o comportamento estatístico das unidades lingüísticas reais. A hipótese de independência entre observações representa outra limitação dos HMM's, já que não se verifica nos experimentos práticos. De fato, existe forte dependência contextual no caso de quadros pertencentes a regiões de transição entre unidades acústicas de uma elocução. Alguns modelos e algoritmos têm sido propostos para tentar transpor estes obstáculos, tais como Modelos Segmentais e Duração Explícita de Estados. Nesta tese, uma estratégia alternativa é proposta para atenuar estes problemas, sem acréscimos significativos no custo computacional. A informação relativa às transições entre fones, ao longo de uma elocução, é obtida através de métodos de segmentação automática. Realiza-se uma ponderação no algoritmo de Viterbi, a fim de penalizar os modelos que gerarem segmentações inconsistentes. Bons resultados são obtidos, para várias condições relacionadas a uma aplicação de Dígitos Conectados. O objetivo atual é aplicar esta técnica para o caso de vocabulários extensosAbstract: Hidden Markov Model is actually the main approach to Speech Recognition problem, because of the good performance and high degree of flexibility that can be achieved. Unfortunately, this acoustical modeling is not optimum and some problems still affect it's robustness and performance in a more realistic condition. The weakness of the temporal modeling embedded in HMM is an example of a serious problem without well defined solutions. In fact, the implicit state duration model with exponential distribution may not describe the real linguistic units distributions. The hypothesis of independence between observations is other difficult problem to solve and it is incompatible with practical experiments because there is strong correlation between frames in the same acoustic segment. Some models and algorithms have been proposed to overcome or, at lest, attenuate those problems, such as Stochastic Segment Models and Explicit State Duration. This thesis presents an alternative approach to alleviate these problems, with relatively low computational cost. The information on phoneme boundaries in time is obtained through an Automatic segmentation algorithm and it is used in a Weighted Viterbi Algorithm in order to penalize the, models that generates inconsistent segmentations. Good results were achieved for various conditions related to connected digits application. The actual objective is to expand it to continuous speech recognitionMestradoMestre em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Meloni, Luís Geraldo PedrosoAlcaim, AbrahamUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASFigueiredo, Fabricio Lira19991999-12-17T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf150p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1588258FIGUEIREDO, Fabricio Lira. Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados. 1999. 150p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588258. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/183837porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-08-15T10:50:11Zoai::183837Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-08-15T10:50:11Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
title |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
spellingShingle |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados Figueiredo, Fabricio Lira Reconhecimento automático da voz Redes neurais (Computação) Processos de Markov Processamento de palavras Algoritmos Reconhecimento automatico da fala |
title_short |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
title_full |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
title_fullStr |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
title_full_unstemmed |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
title_sort |
Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados |
author |
Figueiredo, Fabricio Lira |
author_facet |
Figueiredo, Fabricio Lira |
author_role |
author |
dc.contributor.none.fl_str_mv |
Violaro, Fábio, 1950- Meloni, Luís Geraldo Pedroso Alcaim, Abraham Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação Programa de Pós-Graduação em Engenharia Elétrica UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Figueiredo, Fabricio Lira |
dc.subject.por.fl_str_mv |
Reconhecimento automático da voz Redes neurais (Computação) Processos de Markov Processamento de palavras Algoritmos Reconhecimento automatico da fala |
topic |
Reconhecimento automático da voz Redes neurais (Computação) Processos de Markov Processamento de palavras Algoritmos Reconhecimento automatico da fala |
description |
Orientador: Fabio Violaro |
publishDate |
1999 |
dc.date.none.fl_str_mv |
1999 1999-12-17T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
(Broch.) https://hdl.handle.net/20.500.12733/1588258 FIGUEIREDO, Fabricio Lira. Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados. 1999. 150p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588258. Acesso em: 2 set. 2024. |
identifier_str_mv |
(Broch.) FIGUEIREDO, Fabricio Lira. Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados. 1999. 150p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588258. Acesso em: 2 set. 2024. |
url |
https://hdl.handle.net/20.500.12733/1588258 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/183837 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 150p. : il. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1809189704341389312 |