Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados

Detalhes bibliográficos
Ano de defesa: 1999
Autor(a) principal: Figueiredo, Fabricio Lira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1588258
Resumo: Orientador: Fabio Violaro
id UNICAMP-30_1edc471348e9ce0e31fd064cea117157
oai_identifier_str oai::183837
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectadosReconhecimento automático da vozRedes neurais (Computação)Processos de MarkovProcessamento de palavrasAlgoritmosReconhecimento automatico da falaOrientador: Fabio ViolaroDissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de ComputaçãoResumo: Os Modelos Ocultos de Markov constituem, atualmente, a principal abordagem para o problema de Reconhecimento de Fala, pois proporcionam bom desempenho e alto grau de flexibilidade. Infelizmente, este modelo acústico não é ideal e alguns problemas afetam sua robustez e desempenho em condições adversas. A inconsistência do modelamento temporal implícito nos HMM's é um exemplo de um sério problema sem soluções bem definidas. De fato, o Modelo de Duração de Estados com distribuição exponencial é incompatível com o comportamento estatístico das unidades lingüísticas reais. A hipótese de independência entre observações representa outra limitação dos HMM's, já que não se verifica nos experimentos práticos. De fato, existe forte dependência contextual no caso de quadros pertencentes a regiões de transição entre unidades acústicas de uma elocução. Alguns modelos e algoritmos têm sido propostos para tentar transpor estes obstáculos, tais como Modelos Segmentais e Duração Explícita de Estados. Nesta tese, uma estratégia alternativa é proposta para atenuar estes problemas, sem acréscimos significativos no custo computacional. A informação relativa às transições entre fones, ao longo de uma elocução, é obtida através de métodos de segmentação automática. Realiza-se uma ponderação no algoritmo de Viterbi, a fim de penalizar os modelos que gerarem segmentações inconsistentes. Bons resultados são obtidos, para várias condições relacionadas a uma aplicação de Dígitos Conectados. O objetivo atual é aplicar esta técnica para o caso de vocabulários extensosAbstract: Hidden Markov Model is actually the main approach to Speech Recognition problem, because of the good performance and high degree of flexibility that can be achieved. Unfortunately, this acoustical modeling is not optimum and some problems still affect it's robustness and performance in a more realistic condition. The weakness of the temporal modeling embedded in HMM is an example of a serious problem without well defined solutions. In fact, the implicit state duration model with exponential distribution may not describe the real linguistic units distributions. The hypothesis of independence between observations is other difficult problem to solve and it is incompatible with practical experiments because there is strong correlation between frames in the same acoustic segment. Some models and algorithms have been proposed to overcome or, at lest, attenuate those problems, such as Stochastic Segment Models and Explicit State Duration. This thesis presents an alternative approach to alleviate these problems, with relatively low computational cost. The information on phoneme boundaries in time is obtained through an Automatic segmentation algorithm and it is used in a Weighted Viterbi Algorithm in order to penalize the, models that generates inconsistent segmentations. Good results were achieved for various conditions related to connected digits application. The actual objective is to expand it to continuous speech recognitionMestradoMestre em Engenharia Elétrica[s.n.]Violaro, Fábio, 1950-Meloni, Luís Geraldo PedrosoAlcaim, AbrahamUniversidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de ComputaçãoPrograma de Pós-Graduação em Engenharia ElétricaUNIVERSIDADE ESTADUAL DE CAMPINASFigueiredo, Fabricio Lira19991999-12-17T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf150p. : il.(Broch.)https://hdl.handle.net/20.500.12733/1588258FIGUEIREDO, Fabricio Lira. Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados. 1999. 150p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588258. Acesso em: 2 set. 2024.https://repositorio.unicamp.br/acervo/detalhe/183837porreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2017-08-15T10:50:11Zoai::183837Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2017-08-15T10:50:11Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
title Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
spellingShingle Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
Figueiredo, Fabricio Lira
Reconhecimento automático da voz
Redes neurais (Computação)
Processos de Markov
Processamento de palavras
Algoritmos
Reconhecimento automatico da fala
title_short Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
title_full Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
title_fullStr Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
title_full_unstemmed Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
title_sort Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados
author Figueiredo, Fabricio Lira
author_facet Figueiredo, Fabricio Lira
author_role author
dc.contributor.none.fl_str_mv Violaro, Fábio, 1950-
Meloni, Luís Geraldo Pedroso
Alcaim, Abraham
Universidade Estadual de Campinas (UNICAMP). Faculdade de Engenharia Elétrica e de Computação
Programa de Pós-Graduação em Engenharia Elétrica
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Figueiredo, Fabricio Lira
dc.subject.por.fl_str_mv Reconhecimento automático da voz
Redes neurais (Computação)
Processos de Markov
Processamento de palavras
Algoritmos
Reconhecimento automatico da fala
topic Reconhecimento automático da voz
Redes neurais (Computação)
Processos de Markov
Processamento de palavras
Algoritmos
Reconhecimento automatico da fala
description Orientador: Fabio Violaro
publishDate 1999
dc.date.none.fl_str_mv 1999
1999-12-17T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv (Broch.)
https://hdl.handle.net/20.500.12733/1588258
FIGUEIREDO, Fabricio Lira. Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados. 1999. 150p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588258. Acesso em: 2 set. 2024.
identifier_str_mv (Broch.)
FIGUEIREDO, Fabricio Lira. Segmentação automatica e treinamento discriminativo aplicados a um sistema de reconhecimento de digitos conectados. 1999. 150p. Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Eletrica e de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1588258. Acesso em: 2 set. 2024.
url https://hdl.handle.net/20.500.12733/1588258
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/183837
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
150p. : il.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1809189704341389312