Inverted index techniques in music information retrieval: three application scenarios
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/ |
Resumo: | The rapid advancement of digital technology has resulted in the widespread use of search engines and recommender systems across several industries. In music streaming platforms, these systems are transforming the way we discover and experience music. However, the growing number of users and items available in catalogues represents a significant challenge for these platforms. The Information Retrieval (IR) research field has a long-standing history of scale-related issues, initially driven by text search needs. Over time, this area has evolved to address a wide range of retrieval requirements, offering a range of techniques that can be employed for solving problems in many contexts. Indexing and searching are two complementary activities that form the foundation of IR systems. These systems are usually supported by the inverted index, a central data structure that enables the efficient indexing and retrieval of relevant information. Designing IR systems for non-textual scenarios is not a trivial task. For instance, the accurate scoring and ranking of the retrieved results requires representing the problem as a collection of indexable units. In the field of Music Information Retrieval (MIR), numerous tasks rely on non-textual representations (such as digital audio and music data), presenting distinct challenges for efficient retrieval. This study explores the application of IR techniques for music retrieval through the investigation and assessment of three distinct music tasks where scaling is an important requirement: audio identification, version identification, and music recommendation. The study aims to develop a better understanding of the challenges involved in designing effective IR systems for music purposes, with a particular focus on understanding the effectiveness of typical IR scoring techniques in these tasks. The findings of this study suggest that typical text-based scoring techniques behave as competitive baselines for relevance-based ranking, enabling researchers to focus on representation aspects. Also, the study highlights the importance of evaluating the number of results returned by retrieval systems along with the performance. Also, the study highlights the impact of the number of retrieved items in scalability and efficiency. |
| id |
USP_54f5d6b4c9d57710f5adc80ace0966e8 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-07102024-212635 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Inverted index techniques in music information retrieval: three application scenariosTécnicas de índice invertido em recuperação de informação musical: três cenários de aplicaçãoAudio identificationContent-based retrievalIdentificação de áudioIdentificação de versãoIndexaçãoIndexingInformation retrievalMusic information retrievalOrdenação por relevânciaRecommender systemsRecuperação de informaçãoRecuperação de informação musicalScoring techniquesSistemas de recomendaçãoVersion identificationThe rapid advancement of digital technology has resulted in the widespread use of search engines and recommender systems across several industries. In music streaming platforms, these systems are transforming the way we discover and experience music. However, the growing number of users and items available in catalogues represents a significant challenge for these platforms. The Information Retrieval (IR) research field has a long-standing history of scale-related issues, initially driven by text search needs. Over time, this area has evolved to address a wide range of retrieval requirements, offering a range of techniques that can be employed for solving problems in many contexts. Indexing and searching are two complementary activities that form the foundation of IR systems. These systems are usually supported by the inverted index, a central data structure that enables the efficient indexing and retrieval of relevant information. Designing IR systems for non-textual scenarios is not a trivial task. For instance, the accurate scoring and ranking of the retrieved results requires representing the problem as a collection of indexable units. In the field of Music Information Retrieval (MIR), numerous tasks rely on non-textual representations (such as digital audio and music data), presenting distinct challenges for efficient retrieval. This study explores the application of IR techniques for music retrieval through the investigation and assessment of three distinct music tasks where scaling is an important requirement: audio identification, version identification, and music recommendation. The study aims to develop a better understanding of the challenges involved in designing effective IR systems for music purposes, with a particular focus on understanding the effectiveness of typical IR scoring techniques in these tasks. The findings of this study suggest that typical text-based scoring techniques behave as competitive baselines for relevance-based ranking, enabling researchers to focus on representation aspects. Also, the study highlights the importance of evaluating the number of results returned by retrieval systems along with the performance. Also, the study highlights the impact of the number of retrieved items in scalability and efficiency.O rápido avanço da tecnologia digital resultou no amplo uso de mecanismos de busca e sistemas de recomendação na indústria de modo geral. Em plataformas de streaming de música, esses sistemas estão transformando a maneira como descobrimos e ouvimos música. No entanto, o crescente número de usuários e itens disponíveis nos catálogos representa um desafio significativo para essas plataformas. O campo de pesquisa de Recuperação de Informação (IR) tem uma longa história de abordagem de questões relacionadas à escalabilidade, inicialmente impulsionado pelas necessidades de busca em texto. Ao longo do tempo, essa área tem abrangido várias outras necessidades, provendo um amplo repertório de técnicas que podem ser utilizadas para resolver problemas em diferentes contextos. Sistemas de recuperação de informação baseiam-se em duas atividades distintas, embora complementares: indexação e busca. Esses sistemas geralmente utilizam o índice invertido, uma estrutura de dados com papel de importância na eficiência dos processos de indexação e busca de informação. O uso de sistemas de IR para além das aplicações em texto não é uma tarefa trivial, especialmente em termos de como representar o problema através de uma coleção de unidades indexáveis, bem como na ordenação dos resultados recuperados por relevância. No campo de Recuperação de Informação Musical (MIR), diversas tarefas que requerem execução em escala industrial não utilizam representações textuais, mas dados digitais de áudio e música, introduzindo desafios únicos na modelagem destes sistemas. O presente estudo explora a aplicação de técnicas de IR para aplicações musicais através da investigação em três tarefas distintas de música das quais escalabilidade é um requerimento importante: identificação de áudio, identificação de versão e recomendação de música. O estudo tem como objetivo desenvolver uma melhor compreensão dos desafios envolvidos no desenvolvimento de sistemas de IR para fins musicais não textuais, com especial interesse na compreensão da eficácia de técnicas convencionais de ordenação de resultados por relevância nos casos estudados. Os resultados deste estudo sugerem que as técnicas de pontuação baseadas em texto típicas apresentam resultados competitivos como bases para classificação de resultados por relevância, permitindo que pesquisadores se concentrem nos aspectos de representação do problema. Além disso, o estudo destaca a importância de avaliar o número de resultados retornados pelos sistemas de recuperação, juntamente como desempenho.Biblioteca Digitais de Teses e Dissertações da USPQueiroz, Marcelo Gomes deTofani, Arthur Piza Mosterio2023-08-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-11-04T20:33:02Zoai:teses.usp.br:tde-07102024-212635Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-11-04T20:33:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Inverted index techniques in music information retrieval: three application scenarios Técnicas de índice invertido em recuperação de informação musical: três cenários de aplicação |
| title |
Inverted index techniques in music information retrieval: three application scenarios |
| spellingShingle |
Inverted index techniques in music information retrieval: three application scenarios Tofani, Arthur Piza Mosterio Audio identification Content-based retrieval Identificação de áudio Identificação de versão Indexação Indexing Information retrieval Music information retrieval Ordenação por relevância Recommender systems Recuperação de informação Recuperação de informação musical Scoring techniques Sistemas de recomendação Version identification |
| title_short |
Inverted index techniques in music information retrieval: three application scenarios |
| title_full |
Inverted index techniques in music information retrieval: three application scenarios |
| title_fullStr |
Inverted index techniques in music information retrieval: three application scenarios |
| title_full_unstemmed |
Inverted index techniques in music information retrieval: three application scenarios |
| title_sort |
Inverted index techniques in music information retrieval: three application scenarios |
| author |
Tofani, Arthur Piza Mosterio |
| author_facet |
Tofani, Arthur Piza Mosterio |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Queiroz, Marcelo Gomes de |
| dc.contributor.author.fl_str_mv |
Tofani, Arthur Piza Mosterio |
| dc.subject.por.fl_str_mv |
Audio identification Content-based retrieval Identificação de áudio Identificação de versão Indexação Indexing Information retrieval Music information retrieval Ordenação por relevância Recommender systems Recuperação de informação Recuperação de informação musical Scoring techniques Sistemas de recomendação Version identification |
| topic |
Audio identification Content-based retrieval Identificação de áudio Identificação de versão Indexação Indexing Information retrieval Music information retrieval Ordenação por relevância Recommender systems Recuperação de informação Recuperação de informação musical Scoring techniques Sistemas de recomendação Version identification |
| description |
The rapid advancement of digital technology has resulted in the widespread use of search engines and recommender systems across several industries. In music streaming platforms, these systems are transforming the way we discover and experience music. However, the growing number of users and items available in catalogues represents a significant challenge for these platforms. The Information Retrieval (IR) research field has a long-standing history of scale-related issues, initially driven by text search needs. Over time, this area has evolved to address a wide range of retrieval requirements, offering a range of techniques that can be employed for solving problems in many contexts. Indexing and searching are two complementary activities that form the foundation of IR systems. These systems are usually supported by the inverted index, a central data structure that enables the efficient indexing and retrieval of relevant information. Designing IR systems for non-textual scenarios is not a trivial task. For instance, the accurate scoring and ranking of the retrieved results requires representing the problem as a collection of indexable units. In the field of Music Information Retrieval (MIR), numerous tasks rely on non-textual representations (such as digital audio and music data), presenting distinct challenges for efficient retrieval. This study explores the application of IR techniques for music retrieval through the investigation and assessment of three distinct music tasks where scaling is an important requirement: audio identification, version identification, and music recommendation. The study aims to develop a better understanding of the challenges involved in designing effective IR systems for music purposes, with a particular focus on understanding the effectiveness of typical IR scoring techniques in these tasks. The findings of this study suggest that typical text-based scoring techniques behave as competitive baselines for relevance-based ranking, enabling researchers to focus on representation aspects. Also, the study highlights the importance of evaluating the number of results returned by retrieval systems along with the performance. Also, the study highlights the impact of the number of retrieved items in scalability and efficiency. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-08-01 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-07102024-212635/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1818279178643963904 |