Inverted index techniques in music information retrieval: three application scenarios

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Tofani, Arthur Piza Mosterio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/
Resumo: The rapid advancement of digital technology has resulted in the widespread use of search engines and recommender systems across several industries. In music streaming platforms, these systems are transforming the way we discover and experience music. However, the growing number of users and items available in catalogues represents a significant challenge for these platforms. The Information Retrieval (IR) research field has a long-standing history of scale-related issues, initially driven by text search needs. Over time, this area has evolved to address a wide range of retrieval requirements, offering a range of techniques that can be employed for solving problems in many contexts. Indexing and searching are two complementary activities that form the foundation of IR systems. These systems are usually supported by the inverted index, a central data structure that enables the efficient indexing and retrieval of relevant information. Designing IR systems for non-textual scenarios is not a trivial task. For instance, the accurate scoring and ranking of the retrieved results requires representing the problem as a collection of indexable units. In the field of Music Information Retrieval (MIR), numerous tasks rely on non-textual representations (such as digital audio and music data), presenting distinct challenges for efficient retrieval. This study explores the application of IR techniques for music retrieval through the investigation and assessment of three distinct music tasks where scaling is an important requirement: audio identification, version identification, and music recommendation. The study aims to develop a better understanding of the challenges involved in designing effective IR systems for music purposes, with a particular focus on understanding the effectiveness of typical IR scoring techniques in these tasks. The findings of this study suggest that typical text-based scoring techniques behave as competitive baselines for relevance-based ranking, enabling researchers to focus on representation aspects. Also, the study highlights the importance of evaluating the number of results returned by retrieval systems along with the performance. Also, the study highlights the impact of the number of retrieved items in scalability and efficiency.
id USP_54f5d6b4c9d57710f5adc80ace0966e8
oai_identifier_str oai:teses.usp.br:tde-07102024-212635
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Inverted index techniques in music information retrieval: three application scenariosTécnicas de índice invertido em recuperação de informação musical: três cenários de aplicaçãoAudio identificationContent-based retrievalIdentificação de áudioIdentificação de versãoIndexaçãoIndexingInformation retrievalMusic information retrievalOrdenação por relevânciaRecommender systemsRecuperação de informaçãoRecuperação de informação musicalScoring techniquesSistemas de recomendaçãoVersion identificationThe rapid advancement of digital technology has resulted in the widespread use of search engines and recommender systems across several industries. In music streaming platforms, these systems are transforming the way we discover and experience music. However, the growing number of users and items available in catalogues represents a significant challenge for these platforms. The Information Retrieval (IR) research field has a long-standing history of scale-related issues, initially driven by text search needs. Over time, this area has evolved to address a wide range of retrieval requirements, offering a range of techniques that can be employed for solving problems in many contexts. Indexing and searching are two complementary activities that form the foundation of IR systems. These systems are usually supported by the inverted index, a central data structure that enables the efficient indexing and retrieval of relevant information. Designing IR systems for non-textual scenarios is not a trivial task. For instance, the accurate scoring and ranking of the retrieved results requires representing the problem as a collection of indexable units. In the field of Music Information Retrieval (MIR), numerous tasks rely on non-textual representations (such as digital audio and music data), presenting distinct challenges for efficient retrieval. This study explores the application of IR techniques for music retrieval through the investigation and assessment of three distinct music tasks where scaling is an important requirement: audio identification, version identification, and music recommendation. The study aims to develop a better understanding of the challenges involved in designing effective IR systems for music purposes, with a particular focus on understanding the effectiveness of typical IR scoring techniques in these tasks. The findings of this study suggest that typical text-based scoring techniques behave as competitive baselines for relevance-based ranking, enabling researchers to focus on representation aspects. Also, the study highlights the importance of evaluating the number of results returned by retrieval systems along with the performance. Also, the study highlights the impact of the number of retrieved items in scalability and efficiency.O rápido avanço da tecnologia digital resultou no amplo uso de mecanismos de busca e sistemas de recomendação na indústria de modo geral. Em plataformas de streaming de música, esses sistemas estão transformando a maneira como descobrimos e ouvimos música. No entanto, o crescente número de usuários e itens disponíveis nos catálogos representa um desafio significativo para essas plataformas. O campo de pesquisa de Recuperação de Informação (IR) tem uma longa história de abordagem de questões relacionadas à escalabilidade, inicialmente impulsionado pelas necessidades de busca em texto. Ao longo do tempo, essa área tem abrangido várias outras necessidades, provendo um amplo repertório de técnicas que podem ser utilizadas para resolver problemas em diferentes contextos. Sistemas de recuperação de informação baseiam-se em duas atividades distintas, embora complementares: indexação e busca. Esses sistemas geralmente utilizam o índice invertido, uma estrutura de dados com papel de importância na eficiência dos processos de indexação e busca de informação. O uso de sistemas de IR para além das aplicações em texto não é uma tarefa trivial, especialmente em termos de como representar o problema através de uma coleção de unidades indexáveis, bem como na ordenação dos resultados recuperados por relevância. No campo de Recuperação de Informação Musical (MIR), diversas tarefas que requerem execução em escala industrial não utilizam representações textuais, mas dados digitais de áudio e música, introduzindo desafios únicos na modelagem destes sistemas. O presente estudo explora a aplicação de técnicas de IR para aplicações musicais através da investigação em três tarefas distintas de música das quais escalabilidade é um requerimento importante: identificação de áudio, identificação de versão e recomendação de música. O estudo tem como objetivo desenvolver uma melhor compreensão dos desafios envolvidos no desenvolvimento de sistemas de IR para fins musicais não textuais, com especial interesse na compreensão da eficácia de técnicas convencionais de ordenação de resultados por relevância nos casos estudados. Os resultados deste estudo sugerem que as técnicas de pontuação baseadas em texto típicas apresentam resultados competitivos como bases para classificação de resultados por relevância, permitindo que pesquisadores se concentrem nos aspectos de representação do problema. Além disso, o estudo destaca a importância de avaliar o número de resultados retornados pelos sistemas de recuperação, juntamente como desempenho.Biblioteca Digitais de Teses e Dissertações da USPQueiroz, Marcelo Gomes deTofani, Arthur Piza Mosterio2023-08-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-11-04T20:33:02Zoai:teses.usp.br:tde-07102024-212635Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-11-04T20:33:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Inverted index techniques in music information retrieval: three application scenarios
Técnicas de índice invertido em recuperação de informação musical: três cenários de aplicação
title Inverted index techniques in music information retrieval: three application scenarios
spellingShingle Inverted index techniques in music information retrieval: three application scenarios
Tofani, Arthur Piza Mosterio
Audio identification
Content-based retrieval
Identificação de áudio
Identificação de versão
Indexação
Indexing
Information retrieval
Music information retrieval
Ordenação por relevância
Recommender systems
Recuperação de informação
Recuperação de informação musical
Scoring techniques
Sistemas de recomendação
Version identification
title_short Inverted index techniques in music information retrieval: three application scenarios
title_full Inverted index techniques in music information retrieval: three application scenarios
title_fullStr Inverted index techniques in music information retrieval: three application scenarios
title_full_unstemmed Inverted index techniques in music information retrieval: three application scenarios
title_sort Inverted index techniques in music information retrieval: three application scenarios
author Tofani, Arthur Piza Mosterio
author_facet Tofani, Arthur Piza Mosterio
author_role author
dc.contributor.none.fl_str_mv Queiroz, Marcelo Gomes de
dc.contributor.author.fl_str_mv Tofani, Arthur Piza Mosterio
dc.subject.por.fl_str_mv Audio identification
Content-based retrieval
Identificação de áudio
Identificação de versão
Indexação
Indexing
Information retrieval
Music information retrieval
Ordenação por relevância
Recommender systems
Recuperação de informação
Recuperação de informação musical
Scoring techniques
Sistemas de recomendação
Version identification
topic Audio identification
Content-based retrieval
Identificação de áudio
Identificação de versão
Indexação
Indexing
Information retrieval
Music information retrieval
Ordenação por relevância
Recommender systems
Recuperação de informação
Recuperação de informação musical
Scoring techniques
Sistemas de recomendação
Version identification
description The rapid advancement of digital technology has resulted in the widespread use of search engines and recommender systems across several industries. In music streaming platforms, these systems are transforming the way we discover and experience music. However, the growing number of users and items available in catalogues represents a significant challenge for these platforms. The Information Retrieval (IR) research field has a long-standing history of scale-related issues, initially driven by text search needs. Over time, this area has evolved to address a wide range of retrieval requirements, offering a range of techniques that can be employed for solving problems in many contexts. Indexing and searching are two complementary activities that form the foundation of IR systems. These systems are usually supported by the inverted index, a central data structure that enables the efficient indexing and retrieval of relevant information. Designing IR systems for non-textual scenarios is not a trivial task. For instance, the accurate scoring and ranking of the retrieved results requires representing the problem as a collection of indexable units. In the field of Music Information Retrieval (MIR), numerous tasks rely on non-textual representations (such as digital audio and music data), presenting distinct challenges for efficient retrieval. This study explores the application of IR techniques for music retrieval through the investigation and assessment of three distinct music tasks where scaling is an important requirement: audio identification, version identification, and music recommendation. The study aims to develop a better understanding of the challenges involved in designing effective IR systems for music purposes, with a particular focus on understanding the effectiveness of typical IR scoring techniques in these tasks. The findings of this study suggest that typical text-based scoring techniques behave as competitive baselines for relevance-based ranking, enabling researchers to focus on representation aspects. Also, the study highlights the importance of evaluating the number of results returned by retrieval systems along with the performance. Also, the study highlights the impact of the number of retrieved items in scalability and efficiency.
publishDate 2023
dc.date.none.fl_str_mv 2023-08-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279178643963904