Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Costa, Yandre Maldonado e Gomes da
Orientador(a): Oliveira, Luiz Eduardo Soares de, 1971-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/34886
Resumo: Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira
id UFPR_cdd09eee2de0d8b849324ddff4658d03
oai_identifier_str oai:acervodigital.ufpr.br:1884/34886
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Koerich, Alessandro LameirasUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaOliveira, Luiz Eduardo Soares de, 1971-Costa, Yandre Maldonado e Gomes da2024-11-04T19:57:30Z2024-11-04T19:57:30Z2013https://hdl.handle.net/1884/34886Orientador: Prof. Dr. Luiz Eduardo Soares de OliveiraCoorientador: Prof. Dr. Alessandro Lameiras KoerichTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 15/08/2013Inclui referênciasResumo: Com a rápida expansão da Internet um imenso volume de dados tem se tornado disponível on-line. Entretanto, essa informação não segue um padrão de apresentação e não está disponível de maneira estruturada. Devido a isso, tarefas como busca, recuperação, indexação e sumarização automática dessas informações se tornaram problemas importantes, cujas soluções coadunam no sentido de facilitar o acesso a estes conteúdos. Há algum tempo, a maior parte das informações sobre dados multimídia é organizada e classificada com base em informações textuais. A música digital é um dos mais importantes tipos de dados distribuídos na Internet. Existem muitos estudos a respeito da análise de conteúdo de áudio usando diferentes características e métodos. Um componente fundamental para um sistema de recuperação de informações de áudio baseado em conteúdo é um modulo de classificação automática de gêneros musicais. Os gêneros musicais são rótulos categóricos criados por especialistas humanos e por amadores para determinar ou designar estilos de música. Em alguns trabalhos verificou-se que o gênero musical é um importante atributo para os usuários na organização e recuperação de arquivos de música. Este trabalho propõe o uso de características inovadoras para a representação do conteúdo das músicas, obtidas a partir de imagens de espectrograma geradas a partir do sinal do áudio, para aplicação em tarefas de reconhecimento de gêneros musicais. As imagens de espectrograma apresentam a textura como principal atributo visual. Assim, as características propostas foram obtidas utilizando-se alguns descritores de textura propostos na literatura de processamento de imagens, em particular os descritores Local Binary Pattern e Local Phase Quantization, pois ambos se destacaram por apresentar um bom desempenho. Também foram investigados os impactos proporcionados pelo uso de uma estratégia de preservação de informações locais, através do zoneamento das imagens. O zoneamento propiciou a criação de múltiplos classificadores, um para cada zona, e os melhores resultados foram obtidos com a fusão das saídas destes classificadores. A maioria dos experimentos foi realizada sobre a base LMD com o uso de \artist lter". O método também foi experimentado sobre a base ISMIR 2004. Os melhores resultados obtidos são comparáveis aos melhores resultados já apresentados na literatura utilizando outras abordagens. Considerando os experimentos com a base LMD e com o uso de \artist _lter", os resultados obtidos são superiores ao melhor resultado descrito na literatura até então. Finalmente, seleção dinâmica de classificadores e seleção de características foram avaliadas e mostraram resultados promissores.Abstract: With the rapid expansion of the internet, a huge amount of data from different sources has become available online. In most cases, this information is not organized according to some predefined pattern. Thus, tasks related to automatic search, retrieval, indexing and summarization has become important questions, whose solutions could support the access to this content. For some time, textual annotation is used to organize and classify multimedia data. Digital music is among the most common types of data distributed through the internet. There are a number of studies concerning to audio content analysis using different features and methods. Automatic music genre recognition is a crucial task for a content based music information retrieval system. Musical genres are categorical labels created by humans to characterize pieces of music. A musical genre is characterized by the common characteristics shared by its members. These characteristics typically are related to the instrumentation, rhythmic structure, and harmonic content of the music. In some studies it was found that genre is an important attribute which helps users in organizing and retrieving music _les. In this work we propose an alternative approach for music genre classification which converts the audio signal into a spectrogram (short-time Fourier representation) and then extract features from this visual representation. Texture is the main visual content in a spectrogram image. Thus, the features to be explored here were taken among some well known texture descriptors presented in the image processing literature, in particular Local Binary Pattern and Local Phase Quantization. Both have shown good performance in works related to different application domains recently presented in the literature. In addition, the effects of local information preserving, by zoning the images, were investigated. The rationale behind the zoning and combining scheme is that music signals may include similar instruments and similar rhythmic patterns which leads to similar areas in the spectrogram images. By zoning the images we can extract local information and try to highlight the specificities of each music genre. A positive side effect obtained with zoning strategy is that one can create a specific classifier to deal with the features extracted from each specific zone. Thus, we can naturally obtain several classifiers. Not by chance, the best obtained results happened by combining these classifiers outputs. Most of the experiments was developed ont the LMD dataset using the artist _lter restriction. Some experiments with the ISMIR 2004 dataset were performed as well. With this dataset, the best obtained results are comparable to the best obtained results described in the literature. Regarding to the LMD dataset, the best obtained result is the best ever obtained using artist _lter. Finally, dynamic ensemble of classifiers selection (using KNORA) and feature selection (using genetic algorithm) were tested and presented promising results.106f. : il., tabs.application/pdfDisponível em formato digitalMusica - Analise, apreciaçãoSistemas de reconhecimento de padrõesCiência da computaçãoReconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadoresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - YANDRE MALDONADO E GOMES DA COSTA.pdfapplication/pdf7710769https://acervodigital.ufpr.br/bitstream/1884/34886/1/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdfaba90d96de09a4fb8b2fadc977770043MD51open accessTEXTR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.txtExtracted Texttext/plain290686https://acervodigital.ufpr.br/bitstream/1884/34886/2/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.txtcf333afbca59585b4ca6f5c099997221MD52open accessTHUMBNAILR - T - YANDRE MALDONADO E GOMES DA COSTA.pdf.jpgGenerated Thumbnailimage/jpeg1276https://acervodigital.ufpr.br/bitstream/1884/34886/3/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.jpg580c916b2218980180dddd0b204d61a5MD53open access1884/348862024-11-04 16:57:31.125open accessoai:acervodigital.ufpr.br:1884/34886Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-04T19:57:31Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
spellingShingle Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
Costa, Yandre Maldonado e Gomes da
Musica - Analise, apreciação
Sistemas de reconhecimento de padrões
Ciência da computação
title_short Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_full Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_fullStr Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_full_unstemmed Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
title_sort Reconhecimento de gêneros musicais utilizando espectrogramas com combinação de classificadores
author Costa, Yandre Maldonado e Gomes da
author_facet Costa, Yandre Maldonado e Gomes da
author_role author
dc.contributor.other.pt_BR.fl_str_mv Koerich, Alessandro Lameiras
Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.advisor1.fl_str_mv Oliveira, Luiz Eduardo Soares de, 1971-
dc.contributor.author.fl_str_mv Costa, Yandre Maldonado e Gomes da
contributor_str_mv Oliveira, Luiz Eduardo Soares de, 1971-
dc.subject.por.fl_str_mv Musica - Analise, apreciação
Sistemas de reconhecimento de padrões
Ciência da computação
topic Musica - Analise, apreciação
Sistemas de reconhecimento de padrões
Ciência da computação
description Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira
publishDate 2013
dc.date.issued.fl_str_mv 2013
dc.date.accessioned.fl_str_mv 2024-11-04T19:57:30Z
dc.date.available.fl_str_mv 2024-11-04T19:57:30Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/34886
url https://hdl.handle.net/1884/34886
dc.language.iso.fl_str_mv por
language por
dc.relation.pt_BR.fl_str_mv Disponível em formato digital
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 106f. : il., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/34886/1/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf
https://acervodigital.ufpr.br/bitstream/1884/34886/2/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.txt
https://acervodigital.ufpr.br/bitstream/1884/34886/3/R%20-%20T%20-%20YANDRE%20MALDONADO%20E%20GOMES%20DA%20COSTA.pdf.jpg
bitstream.checksum.fl_str_mv aba90d96de09a4fb8b2fadc977770043
cf333afbca59585b4ca6f5c099997221
580c916b2218980180dddd0b204d61a5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526234637991936