Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio

Detalhes bibliográficos
Ano de defesa: 2012
Autor(a) principal: Claser, R.
Orientador(a): Sanches, Ivandro
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Centro Universitário da FEI, São Bernardo do Campo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.fei.edu.br/handle/FEI/429
Resumo: As transformadas de Fourier e Wavelet são as representações/transformações mais comumentes utilizadas para se referir a um dado sinal, por serem rápidas e fáceis de se manipular. Porém, em casos em que a representação é construída a partir da seleção de elementos de conjuntos redundantes chamados de dicionários, o uso de técnicas alternativas que permite uma maior esparsidade (dispersão) se faz necessário. Dessa forma, o objetivo deste trabalho visa buscar dicionários adequados de forma a solucionar o problema de se classificar trechos de sinal entre voz e silêncio utilizando dicionários redundantes e representação esparsa de sinais. Para esse fim, constrói-se um dicionário redundante de funções básicas (átomos) e analisa-se o sinal de voz via Matching Pursuit. Dessa análise, fase de treinamento, obtém-se a distribuição de probabilidade discreta a priori de ocorrência do conjunto de átomos para cada classe de interesse, permitindo a discriminação a posteriori entre as classes. Surpreendentemente, a técnica mencionada anteriormente não se baseia na variação de níveis de energia ao longo do sinal, mas nas características fundamentais que determinam a essência de cada uma dessas duas classes de sinais, nominalmente voz e silêncio. Entretanto, devido a ineficiência apresentada pela mesma, precisou-se utilizar os pesos dos átomos, os quais contém informação de energia, de forma a melhorar e refinar a classificação desempenhada pelo algoritmo.
id FEI_0047ef019109ff87c8dccd7c27981add
oai_identifier_str oai:repositorio.fei.edu.br:FEI/429
network_acronym_str FEI
network_name_str Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository_id_str
spelling Claser, R.Sanches, Ivandro2019-03-20T14:00:52Z2019-03-20T14:00:52Z2012CLASER, R. <b> Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio. </b> 2012. 48 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=297>. Acesso em: 1 abr. 2013.https://repositorio.fei.edu.br/handle/FEI/429As transformadas de Fourier e Wavelet são as representações/transformações mais comumentes utilizadas para se referir a um dado sinal, por serem rápidas e fáceis de se manipular. Porém, em casos em que a representação é construída a partir da seleção de elementos de conjuntos redundantes chamados de dicionários, o uso de técnicas alternativas que permite uma maior esparsidade (dispersão) se faz necessário. Dessa forma, o objetivo deste trabalho visa buscar dicionários adequados de forma a solucionar o problema de se classificar trechos de sinal entre voz e silêncio utilizando dicionários redundantes e representação esparsa de sinais. Para esse fim, constrói-se um dicionário redundante de funções básicas (átomos) e analisa-se o sinal de voz via Matching Pursuit. Dessa análise, fase de treinamento, obtém-se a distribuição de probabilidade discreta a priori de ocorrência do conjunto de átomos para cada classe de interesse, permitindo a discriminação a posteriori entre as classes. Surpreendentemente, a técnica mencionada anteriormente não se baseia na variação de níveis de energia ao longo do sinal, mas nas características fundamentais que determinam a essência de cada uma dessas duas classes de sinais, nominalmente voz e silêncio. Entretanto, devido a ineficiência apresentada pela mesma, precisou-se utilizar os pesos dos átomos, os quais contém informação de energia, de forma a melhorar e refinar a classificação desempenhada pelo algoritmo.The Fourier and Wavelet transforms are the representations/transformations more commonly used to refer to a given sign, because they are fast and easily to manipulate. However, in cases where the representation is builded by the selection of a set of redundant elements called "dictionaries", the use of alternative techniques which allows a greater "sparcity" (dispertion) it s necessary. Thus, the objective of this study aims to seek appropriate dictionaries in order to solve the problem of classifying passages of signal between voice and silence using redundantes dictionaries and sparse signals representation. To this end, construct a redundant dictionary of basic functions (atoms) and analyzes the speech signal via Matching Pursuit. From this analysis, the training phase, one obtains the discrete probability distribution a priori of occurrence of a collection of atoms for each class of interest, subsequently allowing discrimination between classes. Surprisingly, the aforementioned technique does not rely on the variation of energy level throughout the signal, but the fundamental characteristics which determine the essence of each of these two classes of signals, namely voice and silence. However, due to inefficiency presented by itself, had to be used weights of atoms, which contains energy information, in order to improve and refine the classification performed by the algorithm.porpt_BRCentro Universitário da FEI, São Bernardo do CampoInteligência artificialReconhecimento automático da vozSíntese da vozEstudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncioinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccessORIGINALfulltext.pdffulltext.pdfapplication/pdf2899695https://repositorio-novo.fei.edu.br/bitstreams/6e98779d-c73c-4d97-892e-41e55a7fe1f1/download6ab636ca8110d23467fb9caed215e2dcMD51trueAnonymousREADTEXTfulltext.pdf.txtfulltext.pdf.txtExtracted texttext/plain76187https://repositorio-novo.fei.edu.br/bitstreams/87e44d9d-f9d3-4f62-8d76-980163e2b28f/download105b03caf593b07128ae3c63f3aa5affMD54falseAnonymousREADTHUMBNAILfulltext.pdf.jpgfulltext.pdf.jpgGenerated Thumbnailimage/jpeg2333https://repositorio-novo.fei.edu.br/bitstreams/10763f54-6940-4829-b4b9-6c9058ffd7e6/download40de8d47c87603f42189a36c14471ed4MD55falseAnonymousREADFEI/4292023-03-14 13:12:16.038open.accessoai:repositorio.fei.edu.br:FEI/429https://repositorio-novo.fei.edu.brBiblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2023-03-14T13:12:16Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.pt_BR.fl_str_mv Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
title Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
spellingShingle Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
Claser, R.
Inteligência artificial
Reconhecimento automático da voz
Síntese da voz
title_short Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
title_full Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
title_fullStr Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
title_full_unstemmed Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
title_sort Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
author Claser, R.
author_facet Claser, R.
author_role author
dc.contributor.author.fl_str_mv Claser, R.
dc.contributor.advisor1.fl_str_mv Sanches, Ivandro
contributor_str_mv Sanches, Ivandro
dc.subject.por.fl_str_mv Inteligência artificial
Reconhecimento automático da voz
Síntese da voz
topic Inteligência artificial
Reconhecimento automático da voz
Síntese da voz
description As transformadas de Fourier e Wavelet são as representações/transformações mais comumentes utilizadas para se referir a um dado sinal, por serem rápidas e fáceis de se manipular. Porém, em casos em que a representação é construída a partir da seleção de elementos de conjuntos redundantes chamados de dicionários, o uso de técnicas alternativas que permite uma maior esparsidade (dispersão) se faz necessário. Dessa forma, o objetivo deste trabalho visa buscar dicionários adequados de forma a solucionar o problema de se classificar trechos de sinal entre voz e silêncio utilizando dicionários redundantes e representação esparsa de sinais. Para esse fim, constrói-se um dicionário redundante de funções básicas (átomos) e analisa-se o sinal de voz via Matching Pursuit. Dessa análise, fase de treinamento, obtém-se a distribuição de probabilidade discreta a priori de ocorrência do conjunto de átomos para cada classe de interesse, permitindo a discriminação a posteriori entre as classes. Surpreendentemente, a técnica mencionada anteriormente não se baseia na variação de níveis de energia ao longo do sinal, mas nas características fundamentais que determinam a essência de cada uma dessas duas classes de sinais, nominalmente voz e silêncio. Entretanto, devido a ineficiência apresentada pela mesma, precisou-se utilizar os pesos dos átomos, os quais contém informação de energia, de forma a melhorar e refinar a classificação desempenhada pelo algoritmo.
publishDate 2012
dc.date.issued.fl_str_mv 2012
dc.date.accessioned.fl_str_mv 2019-03-20T14:00:52Z
dc.date.available.fl_str_mv 2019-03-20T14:00:52Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CLASER, R. <b> Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio. </b> 2012. 48 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=297>. Acesso em: 1 abr. 2013.
dc.identifier.uri.fl_str_mv https://repositorio.fei.edu.br/handle/FEI/429
identifier_str_mv CLASER, R. <b> Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio. </b> 2012. 48 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=297>. Acesso em: 1 abr. 2013.
url https://repositorio.fei.edu.br/handle/FEI/429
dc.language.iso.fl_str_mv por
pt_BR
language por
language_invalid_str_mv pt_BR
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Centro Universitário da FEI, São Bernardo do Campo
publisher.none.fl_str_mv Centro Universitário da FEI, São Bernardo do Campo
dc.source.none.fl_str_mv reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
collection Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
bitstream.url.fl_str_mv https://repositorio-novo.fei.edu.br/bitstreams/6e98779d-c73c-4d97-892e-41e55a7fe1f1/download
https://repositorio-novo.fei.edu.br/bitstreams/87e44d9d-f9d3-4f62-8d76-980163e2b28f/download
https://repositorio-novo.fei.edu.br/bitstreams/10763f54-6940-4829-b4b9-6c9058ffd7e6/download
bitstream.checksum.fl_str_mv 6ab636ca8110d23467fb9caed215e2dc
105b03caf593b07128ae3c63f3aa5aff
40de8d47c87603f42189a36c14471ed4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1856221269893054464