Transformada wavelet de malvar aplicada ao processamento de sinais de voz.

Detalhes bibliográficos
Ano de defesa: 1998
Autor(a) principal: Kanno, Yoshinori
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3142/tde-05112024-162013/
Resumo: Este trabalho faz uma breve apresentação da Transformada Wavelet de Malvar e propõe um método de aplicá-la ao Processamento de Sinais de Voz. Através deste estudo pretende-se confirmar que a Transformada Wavelet, em comparação à clássica Transformada Fourier de Curto Prazo (STFT), possibilita evidenciar especialmente os trechos transitórios dentro do espectro de freqüências de voz. Primeiramente fazemos um estudo analítico da resposta em freqüência obtida a partir das funções básicas de Malvar verificando seu comportamento como um banco de filtros. A partir destas funções é que se obtém-se os Coeficientes Wavelets de Malvar para um dado sinal. Em seguida apresentamos um método de obtenção de segmentação não-uniforme de sinais de voz minimizando-se o valor da entropia, a qual é calculada a partir dos Coeficientes de Wavelets de Malvar. Por fim, propomos uma aplicação em reconhecimento automático de voz com um reconhecedor HMM Contínuo (Hidden Markov Models) adotando-se o método da segmentação não-uniforme. Espera-se assim analisar o efeito resultante da aplicação da cálculo dos HMM sobre trechos de largura diferenciada obtidos a partir do valor da entropia, que é variável ao longo do sinal de voz. Para tal estudo foi utilizado um banco de dados de voz de dígitos adquiridos em ambiente natural (pouco ruidoso). Ao final comentamos e analisamos os resultados obtidos. Além disso propormos alguns possíveis trabalhos que poderão se seguir a partir dos estudos realizados neste trabalho.
id USP_0a3d03d34052c4c7d68f490bee90820e
oai_identifier_str oai:teses.usp.br:tde-05112024-162013
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Transformada wavelet de malvar aplicada ao processamento de sinais de voz.Untitled in englishProcessamento de sinaisProcessamento de vozSignal processingSpeech processingEste trabalho faz uma breve apresentação da Transformada Wavelet de Malvar e propõe um método de aplicá-la ao Processamento de Sinais de Voz. Através deste estudo pretende-se confirmar que a Transformada Wavelet, em comparação à clássica Transformada Fourier de Curto Prazo (STFT), possibilita evidenciar especialmente os trechos transitórios dentro do espectro de freqüências de voz. Primeiramente fazemos um estudo analítico da resposta em freqüência obtida a partir das funções básicas de Malvar verificando seu comportamento como um banco de filtros. A partir destas funções é que se obtém-se os Coeficientes Wavelets de Malvar para um dado sinal. Em seguida apresentamos um método de obtenção de segmentação não-uniforme de sinais de voz minimizando-se o valor da entropia, a qual é calculada a partir dos Coeficientes de Wavelets de Malvar. Por fim, propomos uma aplicação em reconhecimento automático de voz com um reconhecedor HMM Contínuo (Hidden Markov Models) adotando-se o método da segmentação não-uniforme. Espera-se assim analisar o efeito resultante da aplicação da cálculo dos HMM sobre trechos de largura diferenciada obtidos a partir do valor da entropia, que é variável ao longo do sinal de voz. Para tal estudo foi utilizado um banco de dados de voz de dígitos adquiridos em ambiente natural (pouco ruidoso). Ao final comentamos e analisamos os resultados obtidos. Além disso propormos alguns possíveis trabalhos que poderão se seguir a partir dos estudos realizados neste trabalho.This work presents a brief theory on Malvar Wavelets Transform (MWT) and proposes an application method to it in speech processing. With this preview we intend to confirm that the Wavelet Transform can play an important role in emphasizing transition periods within speech spectrum that are not focused in the STFT (Short-Time Fourier Transform) analysis. We firstly make an analysis on the frequency response of Malvar basis functions verifying its behavior as a filter bank. We calculate the Malvar Wavelets Coeficients of a given signal using these functions. Then we present a nonuniform segmentation method for speech data minimizing a value called entropy computed from the Malvar Wavelets Coeficients. Finally we propose an application using a Continuous HMM (Hidden Markov Models) automatic recognizer adopting the nonuniform segmentation method. We intend thus to verify the effects of applying HMM on variable length segments determined from the entropy measure which varies along the speech signal. In order to meet this purpose we worked on a digit speech data bank recorded in natural environment (Presence of weak noise only). We conclude this work with some comments and result analysis. We also propose further research from this work.Biblioteca Digitais de Teses e Dissertações da USPSanches, IvandroKanno, Yoshinori1998-05-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3142/tde-05112024-162013/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-11-05T18:25:02Zoai:teses.usp.br:tde-05112024-162013Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-11-05T18:25:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
Untitled in english
title Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
spellingShingle Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
Kanno, Yoshinori
Processamento de sinais
Processamento de voz
Signal processing
Speech processing
title_short Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
title_full Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
title_fullStr Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
title_full_unstemmed Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
title_sort Transformada wavelet de malvar aplicada ao processamento de sinais de voz.
author Kanno, Yoshinori
author_facet Kanno, Yoshinori
author_role author
dc.contributor.none.fl_str_mv Sanches, Ivandro
dc.contributor.author.fl_str_mv Kanno, Yoshinori
dc.subject.por.fl_str_mv Processamento de sinais
Processamento de voz
Signal processing
Speech processing
topic Processamento de sinais
Processamento de voz
Signal processing
Speech processing
description Este trabalho faz uma breve apresentação da Transformada Wavelet de Malvar e propõe um método de aplicá-la ao Processamento de Sinais de Voz. Através deste estudo pretende-se confirmar que a Transformada Wavelet, em comparação à clássica Transformada Fourier de Curto Prazo (STFT), possibilita evidenciar especialmente os trechos transitórios dentro do espectro de freqüências de voz. Primeiramente fazemos um estudo analítico da resposta em freqüência obtida a partir das funções básicas de Malvar verificando seu comportamento como um banco de filtros. A partir destas funções é que se obtém-se os Coeficientes Wavelets de Malvar para um dado sinal. Em seguida apresentamos um método de obtenção de segmentação não-uniforme de sinais de voz minimizando-se o valor da entropia, a qual é calculada a partir dos Coeficientes de Wavelets de Malvar. Por fim, propomos uma aplicação em reconhecimento automático de voz com um reconhecedor HMM Contínuo (Hidden Markov Models) adotando-se o método da segmentação não-uniforme. Espera-se assim analisar o efeito resultante da aplicação da cálculo dos HMM sobre trechos de largura diferenciada obtidos a partir do valor da entropia, que é variável ao longo do sinal de voz. Para tal estudo foi utilizado um banco de dados de voz de dígitos adquiridos em ambiente natural (pouco ruidoso). Ao final comentamos e analisamos os resultados obtidos. Além disso propormos alguns possíveis trabalhos que poderão se seguir a partir dos estudos realizados neste trabalho.
publishDate 1998
dc.date.none.fl_str_mv 1998-05-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3142/tde-05112024-162013/
url https://www.teses.usp.br/teses/disponiveis/3/3142/tde-05112024-162013/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279173324537856