Detecção de refrão usando correlação sobre a envoltória do som

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: RODRIGUES, Renato Celso Santos
Orientador(a): RAMALHO, Geber Lisboa
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/21122
Resumo: Em aplicações de Preview de serviços de streaming de música, onde uma rápida impressão de um álbum desconhecido é proporcionada pela navegação de suas músicas, a inclusão do refrão no trecho de trinta segundos fornecido para cada música torna a aplicação muito mais precisa e eficaz. O refrão pode também funcionar como uma “miniatura” representativa da música, melhorando o desempenho e a precisão das consultas, se realizadas somente procurando pelos refrãos em vez de se procurar por músicas inteiras. Diante da importância de obter o trecho mais representativo de uma canção, o objetivo de um sistema de detecção de refrão é identificar este segmento ou, mais precisamente, os seus instantes inicial e final. Métodos do Estado da Arte buscam extrair features associadas a notas musicais e timbre como vetores Chroma e MFCC, e a partir destas identificar as repetições entre os segmentos da música, inclusive o refrão. Este tipo de abordagem torna o método pouco robusto no processamento de músicas onde notas musicais e variedade de timbres não são tão presentes, como em estilos musicais mais percussivos. Este trabalho propõe uma mudança de paradigma para a detecção de refrão, baseada na exploração do domínio do tempo em lugar do domínio da frequência, com o objetivo de obter um método mais competitivo no processamento de músicas percussivas. O método proposto elimina a etapa de segmentação, substitui as features harmônicas e timbrais pela envoltória do sinal e utiliza a função de correlação entre as envoltórias das partes da música como métrica de similaridade, tornando o método menos dependente de notas musicais e timbres. Os testes mediram o grau de degeneração das taxas de acertos do método proposto e de uma versão modificada usando vetores de Chroma sobre uma base harmônica e uma base percussiva. Os resultados indicam que a abordagem proposta sofre uma degeneração duas vezes menor que a versão modificada, comprovando a hipótese de que um método de detecção de refrão que explore o domínio do tempo é mais competitivo, ao processar músicas percussivas, que um método limitado à exploração do domínio da frequência.
id UFPE_9e316247f955a41ae167d150c978b66a
oai_identifier_str oai:repositorio.ufpe.br:123456789/21122
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling RODRIGUES, Renato Celso Santoshttp://lattes.cnpq.br/7636069505826759http://lattes.cnpq.br/9783292465422902RAMALHO, Geber LisboaCABRAL, Giordano Ribeiro Eulálio2017-08-31T18:49:43Z2017-08-31T18:49:43Z2016-09-14https://repositorio.ufpe.br/handle/123456789/21122Em aplicações de Preview de serviços de streaming de música, onde uma rápida impressão de um álbum desconhecido é proporcionada pela navegação de suas músicas, a inclusão do refrão no trecho de trinta segundos fornecido para cada música torna a aplicação muito mais precisa e eficaz. O refrão pode também funcionar como uma “miniatura” representativa da música, melhorando o desempenho e a precisão das consultas, se realizadas somente procurando pelos refrãos em vez de se procurar por músicas inteiras. Diante da importância de obter o trecho mais representativo de uma canção, o objetivo de um sistema de detecção de refrão é identificar este segmento ou, mais precisamente, os seus instantes inicial e final. Métodos do Estado da Arte buscam extrair features associadas a notas musicais e timbre como vetores Chroma e MFCC, e a partir destas identificar as repetições entre os segmentos da música, inclusive o refrão. Este tipo de abordagem torna o método pouco robusto no processamento de músicas onde notas musicais e variedade de timbres não são tão presentes, como em estilos musicais mais percussivos. Este trabalho propõe uma mudança de paradigma para a detecção de refrão, baseada na exploração do domínio do tempo em lugar do domínio da frequência, com o objetivo de obter um método mais competitivo no processamento de músicas percussivas. O método proposto elimina a etapa de segmentação, substitui as features harmônicas e timbrais pela envoltória do sinal e utiliza a função de correlação entre as envoltórias das partes da música como métrica de similaridade, tornando o método menos dependente de notas musicais e timbres. Os testes mediram o grau de degeneração das taxas de acertos do método proposto e de uma versão modificada usando vetores de Chroma sobre uma base harmônica e uma base percussiva. Os resultados indicam que a abordagem proposta sofre uma degeneração duas vezes menor que a versão modificada, comprovando a hipótese de que um método de detecção de refrão que explore o domínio do tempo é mais competitivo, ao processar músicas percussivas, que um método limitado à exploração do domínio da frequência.In Preview applications of music streaming services, where a fast printing from an unknown album is provided by the navigation of your songs, including the chorus in thirty seconds excerpt provided for each song makes the application much more accurate and effective. The chorus can also function as a “miniature” representative of music, enhancing the performance and accuracy of search, if carried out only by looking choruses instead of searching for entire songs. Given the importance of getting the most representative excerpt of a song, the goal of a chorus detection system is to identify this segment, or more precisely, its beginning and its end. State of the art methods seek to extract features associated with musical notes and timbre, like Chroma and MFCC vectors and identify from these repetitions between segments of music, including the chorus. This approach type makes method little robust in music where musical notes and variety of timbres are not as present, as in percussive music for example. This paper proposes a paradigm shift for the chorus detection, based on the exploitation of the time domain instead of the frequency domain, in order to obtain a more competitive method in the processing of percussive music. The proposed method eliminates the segmentation, replaces the harmonic and timbral features with the envelope of the signal, and uses the correlation function between the envelope of the music segments as a metric of similarity, to make it less dependent on musical notes and timbre. The tests measured the degree of degeneration of hit rates of the proposed method and of a modified version using Chroma vectors on a harmonic basis and a percussive basis. The results indicate that the proposed approach have a degeneration two times lower than the modified version, proving the hypothesis that a chorus detection method that exploits the time domain is more competitive when processing percussive songs than a method limited to the frequency domain exploitation.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessDetecção de Refrão. Recuperação de Informação de Música. Computação Musical.Chorus Detection. Music Information Retrieval. Music Computing.Detecção de refrão usando correlação sobre a envoltória do sominfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDissertação Renato.pdf.jpgDissertação Renato.pdf.jpgGenerated Thumbnailimage/jpeg1295https://repositorio.ufpe.br/bitstream/123456789/21122/5/Disserta%c3%a7%c3%a3o%20Renato.pdf.jpgcf9dff22d32e90ddd678da6f6d728c33MD55ORIGINALDissertação Renato.pdfDissertação Renato.pdfapplication/pdf2458758https://repositorio.ufpe.br/bitstream/123456789/21122/1/Disserta%c3%a7%c3%a3o%20Renato.pdfb08fb4f41c821e5fd07c0022ea5dcaacMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/21122/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/21122/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDissertação Renato.pdf.txtDissertação Renato.pdf.txtExtracted texttext/plain182383https://repositorio.ufpe.br/bitstream/123456789/21122/4/Disserta%c3%a7%c3%a3o%20Renato.pdf.txtfe5ca380b54030157a000f23af0e46bbMD54123456789/211222019-10-25 22:00:38.475oai:repositorio.ufpe.br:123456789/21122TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-26T01:00:38Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Detecção de refrão usando correlação sobre a envoltória do som
title Detecção de refrão usando correlação sobre a envoltória do som
spellingShingle Detecção de refrão usando correlação sobre a envoltória do som
RODRIGUES, Renato Celso Santos
Detecção de Refrão. Recuperação de Informação de Música. Computação Musical.
Chorus Detection. Music Information Retrieval. Music Computing.
title_short Detecção de refrão usando correlação sobre a envoltória do som
title_full Detecção de refrão usando correlação sobre a envoltória do som
title_fullStr Detecção de refrão usando correlação sobre a envoltória do som
title_full_unstemmed Detecção de refrão usando correlação sobre a envoltória do som
title_sort Detecção de refrão usando correlação sobre a envoltória do som
author RODRIGUES, Renato Celso Santos
author_facet RODRIGUES, Renato Celso Santos
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/7636069505826759
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9783292465422902
dc.contributor.author.fl_str_mv RODRIGUES, Renato Celso Santos
dc.contributor.advisor1.fl_str_mv RAMALHO, Geber Lisboa
dc.contributor.advisor-co1.fl_str_mv CABRAL, Giordano Ribeiro Eulálio
contributor_str_mv RAMALHO, Geber Lisboa
CABRAL, Giordano Ribeiro Eulálio
dc.subject.por.fl_str_mv Detecção de Refrão. Recuperação de Informação de Música. Computação Musical.
Chorus Detection. Music Information Retrieval. Music Computing.
topic Detecção de Refrão. Recuperação de Informação de Música. Computação Musical.
Chorus Detection. Music Information Retrieval. Music Computing.
description Em aplicações de Preview de serviços de streaming de música, onde uma rápida impressão de um álbum desconhecido é proporcionada pela navegação de suas músicas, a inclusão do refrão no trecho de trinta segundos fornecido para cada música torna a aplicação muito mais precisa e eficaz. O refrão pode também funcionar como uma “miniatura” representativa da música, melhorando o desempenho e a precisão das consultas, se realizadas somente procurando pelos refrãos em vez de se procurar por músicas inteiras. Diante da importância de obter o trecho mais representativo de uma canção, o objetivo de um sistema de detecção de refrão é identificar este segmento ou, mais precisamente, os seus instantes inicial e final. Métodos do Estado da Arte buscam extrair features associadas a notas musicais e timbre como vetores Chroma e MFCC, e a partir destas identificar as repetições entre os segmentos da música, inclusive o refrão. Este tipo de abordagem torna o método pouco robusto no processamento de músicas onde notas musicais e variedade de timbres não são tão presentes, como em estilos musicais mais percussivos. Este trabalho propõe uma mudança de paradigma para a detecção de refrão, baseada na exploração do domínio do tempo em lugar do domínio da frequência, com o objetivo de obter um método mais competitivo no processamento de músicas percussivas. O método proposto elimina a etapa de segmentação, substitui as features harmônicas e timbrais pela envoltória do sinal e utiliza a função de correlação entre as envoltórias das partes da música como métrica de similaridade, tornando o método menos dependente de notas musicais e timbres. Os testes mediram o grau de degeneração das taxas de acertos do método proposto e de uma versão modificada usando vetores de Chroma sobre uma base harmônica e uma base percussiva. Os resultados indicam que a abordagem proposta sofre uma degeneração duas vezes menor que a versão modificada, comprovando a hipótese de que um método de detecção de refrão que explore o domínio do tempo é mais competitivo, ao processar músicas percussivas, que um método limitado à exploração do domínio da frequência.
publishDate 2016
dc.date.issued.fl_str_mv 2016-09-14
dc.date.accessioned.fl_str_mv 2017-08-31T18:49:43Z
dc.date.available.fl_str_mv 2017-08-31T18:49:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/21122
url https://repositorio.ufpe.br/handle/123456789/21122
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/21122/5/Disserta%c3%a7%c3%a3o%20Renato.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/21122/1/Disserta%c3%a7%c3%a3o%20Renato.pdf
https://repositorio.ufpe.br/bitstream/123456789/21122/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/21122/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/21122/4/Disserta%c3%a7%c3%a3o%20Renato.pdf.txt
bitstream.checksum.fl_str_mv cf9dff22d32e90ddd678da6f6d728c33
b08fb4f41c821e5fd07c0022ea5dcaac
e39d27027a6cc9cb039ad269a5db8e34
4b8a02c7f2818eaf00dcf2260dd5eb08
fe5ca380b54030157a000f23af0e46bb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1797782359334977536