Music similarity models applied to cover song identification and classification
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27092021-104421/ |
Resumo: | The spread of digital music allowed the appearance of datasets with millions of music files. The processing of this huge number of audio files is carried out with techniques of Music Information Retrieval (MIR) that work directly with the audio content. The MIR task of most interest in this project is the modelling of Music Similarity. Our proposed approach follows this pipeline: extract audio features, aggregate local features into global features, and compute the similarities of every pair of songs from the dataset being processed. According to this approach, a triple {extractor_i, aggregator_j, distance_k} defines a music similarity model, and our main goal is to investigate the ability of similarity models to distinguish audio files from different classes. The music similarity models are also used to address specific problems such as Cover Song Identification (CSI), which is an MIR application related to Music Similarity, and the closely-related Cover Song Classification (CSC) problem. MIR-related techniques, such as Dataset Modifications and Matrix Fusion, are explored in the context of improving the results of music similarity models. This work presents several contributions, among which a comprehensive benchmark of music similarity models; the definition of new similarity matrices within CSC as a solution approach to the CSI problem; the exploration of different types of dataset modifications and an investigation of their effect on music similarity metrics; and the fusion of similarity matrices computed from secondary datasets obtained via source separation. The experiments presented produced encouraging results, indicating that the methods proposed in this thesis point towards novel approaches to Music Similarity that are worth further investigation and development. |
| id |
USP_64b64a6252bf00ee7cd6b7e5042db0a1 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-27092021-104421 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Music similarity models applied to cover song identification and classificationModelos de similaridade musical aplicados à identificação e classificação de coversClassificação de coversComputação musicalComputer musicCover song classificationCover song identificationIdentificação de coversMusic information retrievalMusic similarityRecuperação de informação musicalSimilaridade musicalThe spread of digital music allowed the appearance of datasets with millions of music files. The processing of this huge number of audio files is carried out with techniques of Music Information Retrieval (MIR) that work directly with the audio content. The MIR task of most interest in this project is the modelling of Music Similarity. Our proposed approach follows this pipeline: extract audio features, aggregate local features into global features, and compute the similarities of every pair of songs from the dataset being processed. According to this approach, a triple {extractor_i, aggregator_j, distance_k} defines a music similarity model, and our main goal is to investigate the ability of similarity models to distinguish audio files from different classes. The music similarity models are also used to address specific problems such as Cover Song Identification (CSI), which is an MIR application related to Music Similarity, and the closely-related Cover Song Classification (CSC) problem. MIR-related techniques, such as Dataset Modifications and Matrix Fusion, are explored in the context of improving the results of music similarity models. This work presents several contributions, among which a comprehensive benchmark of music similarity models; the definition of new similarity matrices within CSC as a solution approach to the CSI problem; the exploration of different types of dataset modifications and an investigation of their effect on music similarity metrics; and the fusion of similarity matrices computed from secondary datasets obtained via source separation. The experiments presented produced encouraging results, indicating that the methods proposed in this thesis point towards novel approaches to Music Similarity that are worth further investigation and development.A difusão da música digital permitiu o surgimento de conjuntos de dados com milhões de arquivos de áudio. O processamento deste enorme número de arquivos é realizado com técnicas de Recuperação de Informação Musical que analisam diretamente o conteúdo do áudio. A tarefa de maior interesse neste projeto é a modelagem de Similaridade Musical. Nossa proposta segue os seguintes passos: extrair descritores de áudio, agregar descritores locais em descritores globais e calcular as distâncias entre todos os pares de músicas dos conjuntos de dados sendo processados. De acordo com essa abordagem, uma tripla {extrator_i, agregador_j, distância_k} define um modelo de similaridade musical, e nosso principal objetivo é investigar a capacidade dos modelos de similaridade de distinguir arquivos de áudio de classes diferentes. Os modelos de similaridade musical também são usados para resolver problemas específicos, como Identificação de Covers, que é uma aplicação de Similaridade Musical, e Classificação de Covers, que é um problema relacionado com o de Identificação. Outras técnicas de Recuperação de Informação Musical, como Modificação de Conjuntos de Dados e Fusão de Matrizes, são exploradas no contexto de melhorar os resultados de modelos de similaridade musical. Este trabalho apresenta várias contribuições, entre as quais o benchmark de modelos de similaridade musical; a definição de novas matrizes de similaridade no contexto de Classificação de Covers como abordagem de solução para a Identificação de Covers; a exploração de diferentes tipos de modificação de conjuntos de dados e uma investigação de seus efeitos nas métricas de similaridade musical; e a fusão de matrizes de similaridade calculadas a partir de conjuntos de dados secundários obtidos por meio de separação de fontes. Os experimentos apresentados produziram resultados encorajadores, indicando que os métodos propostos nesta tese apontam na direção de abordagens inovadoras que merecem investigação e desenvolvimento adicionais.Biblioteca Digitais de Teses e Dissertações da USPQueiroz, Marcelo Gomes deBodo, Roberto Piassi Passos2021-07-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-27092021-104421/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-09-28T01:40:03Zoai:teses.usp.br:tde-27092021-104421Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-09-28T01:40:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Music similarity models applied to cover song identification and classification Modelos de similaridade musical aplicados à identificação e classificação de covers |
| title |
Music similarity models applied to cover song identification and classification |
| spellingShingle |
Music similarity models applied to cover song identification and classification Bodo, Roberto Piassi Passos Classificação de covers Computação musical Computer music Cover song classification Cover song identification Identificação de covers Music information retrieval Music similarity Recuperação de informação musical Similaridade musical |
| title_short |
Music similarity models applied to cover song identification and classification |
| title_full |
Music similarity models applied to cover song identification and classification |
| title_fullStr |
Music similarity models applied to cover song identification and classification |
| title_full_unstemmed |
Music similarity models applied to cover song identification and classification |
| title_sort |
Music similarity models applied to cover song identification and classification |
| author |
Bodo, Roberto Piassi Passos |
| author_facet |
Bodo, Roberto Piassi Passos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Queiroz, Marcelo Gomes de |
| dc.contributor.author.fl_str_mv |
Bodo, Roberto Piassi Passos |
| dc.subject.por.fl_str_mv |
Classificação de covers Computação musical Computer music Cover song classification Cover song identification Identificação de covers Music information retrieval Music similarity Recuperação de informação musical Similaridade musical |
| topic |
Classificação de covers Computação musical Computer music Cover song classification Cover song identification Identificação de covers Music information retrieval Music similarity Recuperação de informação musical Similaridade musical |
| description |
The spread of digital music allowed the appearance of datasets with millions of music files. The processing of this huge number of audio files is carried out with techniques of Music Information Retrieval (MIR) that work directly with the audio content. The MIR task of most interest in this project is the modelling of Music Similarity. Our proposed approach follows this pipeline: extract audio features, aggregate local features into global features, and compute the similarities of every pair of songs from the dataset being processed. According to this approach, a triple {extractor_i, aggregator_j, distance_k} defines a music similarity model, and our main goal is to investigate the ability of similarity models to distinguish audio files from different classes. The music similarity models are also used to address specific problems such as Cover Song Identification (CSI), which is an MIR application related to Music Similarity, and the closely-related Cover Song Classification (CSC) problem. MIR-related techniques, such as Dataset Modifications and Matrix Fusion, are explored in the context of improving the results of music similarity models. This work presents several contributions, among which a comprehensive benchmark of music similarity models; the definition of new similarity matrices within CSC as a solution approach to the CSI problem; the exploration of different types of dataset modifications and an investigation of their effect on music similarity metrics; and the fusion of similarity matrices computed from secondary datasets obtained via source separation. The experiments presented produced encouraging results, indicating that the methods proposed in this thesis point towards novel approaches to Music Similarity that are worth further investigation and development. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-07-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27092021-104421/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27092021-104421/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258556180463616 |