Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio
Ano de defesa: | 2012 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Centro Universitário da FEI, São Bernardo do Campo
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.fei.edu.br/handle/FEI/429 |
Resumo: | As transformadas de Fourier e Wavelet são as representações/transformações mais comumentes utilizadas para se referir a um dado sinal, por serem rápidas e fáceis de se manipular. Porém, em casos em que a representação é construída a partir da seleção de elementos de conjuntos redundantes chamados de dicionários, o uso de técnicas alternativas que permite uma maior esparsidade (dispersão) se faz necessário. Dessa forma, o objetivo deste trabalho visa buscar dicionários adequados de forma a solucionar o problema de se classificar trechos de sinal entre voz e silêncio utilizando dicionários redundantes e representação esparsa de sinais. Para esse fim, constrói-se um dicionário redundante de funções básicas (átomos) e analisa-se o sinal de voz via Matching Pursuit. Dessa análise, fase de treinamento, obtém-se a distribuição de probabilidade discreta a priori de ocorrência do conjunto de átomos para cada classe de interesse, permitindo a discriminação a posteriori entre as classes. Surpreendentemente, a técnica mencionada anteriormente não se baseia na variação de níveis de energia ao longo do sinal, mas nas características fundamentais que determinam a essência de cada uma dessas duas classes de sinais, nominalmente voz e silêncio. Entretanto, devido a ineficiência apresentada pela mesma, precisou-se utilizar os pesos dos átomos, os quais contém informação de energia, de forma a melhorar e refinar a classificação desempenhada pelo algoritmo. |
id |
FEI_0047ef019109ff87c8dccd7c27981add |
---|---|
oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/429 |
network_acronym_str |
FEI |
network_name_str |
Biblioteca Digital de Teses e Dissertações da FEI |
repository_id_str |
|
spelling |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncioInteligência artificialReconhecimento automático da vozSíntese da vozAs transformadas de Fourier e Wavelet são as representações/transformações mais comumentes utilizadas para se referir a um dado sinal, por serem rápidas e fáceis de se manipular. Porém, em casos em que a representação é construída a partir da seleção de elementos de conjuntos redundantes chamados de dicionários, o uso de técnicas alternativas que permite uma maior esparsidade (dispersão) se faz necessário. Dessa forma, o objetivo deste trabalho visa buscar dicionários adequados de forma a solucionar o problema de se classificar trechos de sinal entre voz e silêncio utilizando dicionários redundantes e representação esparsa de sinais. Para esse fim, constrói-se um dicionário redundante de funções básicas (átomos) e analisa-se o sinal de voz via Matching Pursuit. Dessa análise, fase de treinamento, obtém-se a distribuição de probabilidade discreta a priori de ocorrência do conjunto de átomos para cada classe de interesse, permitindo a discriminação a posteriori entre as classes. Surpreendentemente, a técnica mencionada anteriormente não se baseia na variação de níveis de energia ao longo do sinal, mas nas características fundamentais que determinam a essência de cada uma dessas duas classes de sinais, nominalmente voz e silêncio. Entretanto, devido a ineficiência apresentada pela mesma, precisou-se utilizar os pesos dos átomos, os quais contém informação de energia, de forma a melhorar e refinar a classificação desempenhada pelo algoritmo.The Fourier and Wavelet transforms are the representations/transformations more commonly used to refer to a given sign, because they are fast and easily to manipulate. However, in cases where the representation is builded by the selection of a set of redundant elements called "dictionaries", the use of alternative techniques which allows a greater "sparcity" (dispertion) it s necessary. Thus, the objective of this study aims to seek appropriate dictionaries in order to solve the problem of classifying passages of signal between voice and silence using redundantes dictionaries and sparse signals representation. To this end, construct a redundant dictionary of basic functions (atoms) and analyzes the speech signal via Matching Pursuit. From this analysis, the training phase, one obtains the discrete probability distribution a priori of occurrence of a collection of atoms for each class of interest, subsequently allowing discrimination between classes. Surprisingly, the aforementioned technique does not rely on the variation of energy level throughout the signal, but the fundamental characteristics which determine the essence of each of these two classes of signals, namely voice and silence. However, due to inefficiency presented by itself, had to be used weights of atoms, which contains energy information, in order to improve and refine the classification performed by the algorithm.Centro Universitário da FEI, São Bernardo do CampoSanches, IvandroClaser, R.2019-03-20T14:00:52Z2019-03-20T14:00:52Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfCLASER, R. <b> Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio. </b> 2012. 48 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=297>. Acesso em: 1 abr. 2013.https://repositorio.fei.edu.br/handle/FEI/429porpt_BRreponame:Biblioteca Digital de Teses e Dissertações da FEIinstname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccess2023-03-14T13:12:16Zoai:repositorio.fei.edu.br:FEI/429Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttp://sofia.fei.edu.br/pergamum/oai/oai2.phpcfernandes@fei.edu.bropendoar:https://repositorio.fei.edu.br/oai/request2023-03-14T13:12:16Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
dc.title.none.fl_str_mv |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
title |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
spellingShingle |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio Claser, R. Inteligência artificial Reconhecimento automático da voz Síntese da voz |
title_short |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
title_full |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
title_fullStr |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
title_full_unstemmed |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
title_sort |
Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio |
author |
Claser, R. |
author_facet |
Claser, R. |
author_role |
author |
dc.contributor.none.fl_str_mv |
Sanches, Ivandro |
dc.contributor.author.fl_str_mv |
Claser, R. |
dc.subject.por.fl_str_mv |
Inteligência artificial Reconhecimento automático da voz Síntese da voz |
topic |
Inteligência artificial Reconhecimento automático da voz Síntese da voz |
description |
As transformadas de Fourier e Wavelet são as representações/transformações mais comumentes utilizadas para se referir a um dado sinal, por serem rápidas e fáceis de se manipular. Porém, em casos em que a representação é construída a partir da seleção de elementos de conjuntos redundantes chamados de dicionários, o uso de técnicas alternativas que permite uma maior esparsidade (dispersão) se faz necessário. Dessa forma, o objetivo deste trabalho visa buscar dicionários adequados de forma a solucionar o problema de se classificar trechos de sinal entre voz e silêncio utilizando dicionários redundantes e representação esparsa de sinais. Para esse fim, constrói-se um dicionário redundante de funções básicas (átomos) e analisa-se o sinal de voz via Matching Pursuit. Dessa análise, fase de treinamento, obtém-se a distribuição de probabilidade discreta a priori de ocorrência do conjunto de átomos para cada classe de interesse, permitindo a discriminação a posteriori entre as classes. Surpreendentemente, a técnica mencionada anteriormente não se baseia na variação de níveis de energia ao longo do sinal, mas nas características fundamentais que determinam a essência de cada uma dessas duas classes de sinais, nominalmente voz e silêncio. Entretanto, devido a ineficiência apresentada pela mesma, precisou-se utilizar os pesos dos átomos, os quais contém informação de energia, de forma a melhorar e refinar a classificação desempenhada pelo algoritmo. |
publishDate |
2012 |
dc.date.none.fl_str_mv |
2012 2019-03-20T14:00:52Z 2019-03-20T14:00:52Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
CLASER, R. <b> Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio. </b> 2012. 48 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=297>. Acesso em: 1 abr. 2013. https://repositorio.fei.edu.br/handle/FEI/429 |
identifier_str_mv |
CLASER, R. <b> Estudo e aplicação da técnica de matching pursuit na classificação entre sinais de voz e silêncio. </b> 2012. 48 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário da FEI, São Bernardo do Campo, 2012 Disponível em: <http://sofia.fei.edu.br/tede/tde_busca/arquivo.php?codArquivo=297>. Acesso em: 1 abr. 2013. |
url |
https://repositorio.fei.edu.br/handle/FEI/429 |
dc.language.iso.fl_str_mv |
por pt_BR |
language |
por |
language_invalid_str_mv |
pt_BR |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Centro Universitário da FEI, São Bernardo do Campo |
publisher.none.fl_str_mv |
Centro Universitário da FEI, São Bernardo do Campo |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da FEI instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
instacron_str |
FEI |
institution |
FEI |
reponame_str |
Biblioteca Digital de Teses e Dissertações da FEI |
collection |
Biblioteca Digital de Teses e Dissertações da FEI |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da FEI - Centro Universitário da Fundação Educacional Inaciana (FEI) |
repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
_version_ |
1809225360325214208 |