Towards scalable and evolving graph-based collaborative filtering for data stream recommendation

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Schmitt, Murilo Falleiros Lemos
Orientador(a): Spinosa, Eduardo Jaques, 1974-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/90084
Resumo: Orientador: Eduardo Jaques Spinosa
id UFPR_4f4227bbc2c92c3d1fe111fd884514d7
oai_identifier_str oai:acervodigital.ufpr.br:1884/90084
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaSpinosa, Eduardo Jaques, 1974-Schmitt, Murilo Falleiros Lemos2024-10-08T18:59:48Z2024-10-08T18:59:48Z2024https://hdl.handle.net/1884/90084Orientador: Eduardo Jaques SpinosaTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 22/02/2024Inclui referênciasÁrea de concentração: Ciência da ComputaçãoResumo: Sistemas de recomendação são projetados para recomendar itens para usuários com base em seus interesses, a fim de aumentar seu engajamento ao interagir com sistemas online. O aumento significativo no volume de dados gerados por usuários em alta frequência resulta na necessidade de projetar sistemas de recomendação escaláveis e capazes de aprender dinamicamente, com base somente em dados recém gerados, ao menos tão rápido quanto à sua chegada, e que também sejam capazes de recomendar itens com base em informações atuais, com recursos de processamento e memória restritos. No entanto, algoritmos de recomendação bem sucedidos, que tradicionalmente dependem de re-treinamento esporádico a partir de dados previamente armazenados, não são projetados para adaptar-se de tal maneira, gerando problemas de escalabilidade e adaptabilidade. Uma alternativa é projetar sistemas de recomendação como uma tarefa de mineração de fluxos contínuos de dados, usando aprendizado incremental. Tal abordagem permite processar feedback de usuários continuamente e atualizar modelos de recomendação com base apenas em novos dados recebidos, sem a necessidade de armazenar estes dados, que podem então ser descartados após seu processamento. Embora sistemas de recomendação baseados em fluxos contínuos de dados estejam recentemente tornando-se um tópico ativo de pesquisa, ainda são pouco frequentes na literatura, e diversos problemas associados à sua aplicação, tais como esparsidade, precisão, escalabilidade e desvio de conceito, seguem em aberto. Neste contexto, a principal contribuição desta pesquisa é um modelo baseado em fluxo contínuo de dados, IGSI ˆ ???? , que consiste em um grafo de interações sequenciais com esquecimento para recomendação em fluxo contínuo de dados com feedback implícito. IGSI ˆ ???? incorpora feedback em um grafo, cujos vértices representam itens, de maneira incremental, com a suposição de que o comportamento dos usuários pode ser extraído dessas sequências de interações com o passar do tempo, capturando interesses de curto prazo e de longo prazo. Nossa proposta é robusta à esparsidade, possui alta capacidade incremental e flexibilidade no processo de recomendação. A abordagem recomenda itens para usuários com base em simulações de passeios aleatórios curtos, o que permite a geração de recomendações escaláveis. Nosso trabalho também contribui com um mecanismo de esquecimento, local neighborhood decay, projetado especificamente para explorar as vantagens de IGSI ˆ ???? , e que pode ser generalizada para abordagens relacionadas. Tal mecanismo reutiliza as amostras de passeios aleatórios geradas originalmente para recomendação para capturar informações estruturais do grafo, e inferir a relevância dos itens. Arestas obsoletas são então eliminadas com base nessas informações e em fatores de popularidade. Avaliamos nossa proposta utilizando várias métricas e comparamos os resultados com vários algoritmos incrementais em fluxos de dados simulados. Os resultados demonstram a eficácia de nossa proposta, que em geral supera outros algoritmos em taxa de acerto, com tempos de atualização e recomendação muito competitivos. Além disso, os resultados demonstram que nossa técnica de esquecimento é capaz de aumentar escalabilidade, taxa de acerto e diversidade.Abstract: Recommender systems are designed to recommend items to users based on their interests, enhancing their engagement and satisfaction when interacting with online systems. The explosion of user-generated data at fast rates in online services leads to the need for designing scalable recommender systems that are able to learn on-the-fly. Such design requires learning from newly generated data on a single pass, at least as fast as data arrives, while also allowing the recommendation of relevant items based on up-to-date information with restricted time and processing requirements. However, successful recommendation algorithms, which traditionally rely on batch processing, are not designed to adapt to continuous flow of data, raising scalability and adaptability issues. An alternative approach is to view the recommendation problem under a data stream framework and design Stream-Based Recommender Systems, using incremental learning. This design allows continuous processing of user feedback and the update of models solely with incoming data, without requiring storage of observations, which can be discarded after processing. Although stream-based approaches are recently becoming an active topic of research, recommendation under the lens of data streams is still infrequent, and several issues still pertain, such as sparsity, accuracy, scalability and concept drift. Thus, the main contribution of this research is a stream-based model, IGSI ˆ ???? , that consists in an evolving graph of sequential interactions with forgetting for data stream recommendation with implicit feedback. IGSI ˆ ???? incorporates feedback into an item-graph in incremental manner with the assumption that user behavior can be extracted from such sequence of interactions as time passes, capturing short-term and long-term interests. By focusing on a graph-based approach, our proposal is robust to sparsity, has natural incremental capability and flexibility on the recommendation procedure. It recommends items to users based on simulations of short random walks, which allows the generation of scalable recommendations. This work also contributes with a forgetting mechanism, local neighborhood decay, specifically designed to explore the advantages of IGSI ˆ ???? , that can be generalized to related approaches. This mechanism reuses the random walk samples originally generated for recommendation to capture structural information from the graph and infer the relevance of items. Obsolete connections are then faded based on this information and popularity factors. We evaluated our proposal under several metrics and compared the results with other related incremental algorithms on simulated data stream settings. The results suggest the effectiveness of our proposal, which generally outperforms competing algorithms in accuracy, with very competitive update and recommendation times. Also, the results suggest that our proposed forgetting technique is able to increase scalability, accuracy and diversity.1 recurso online : PDF.application/pdfSistemas de recomendação (Filtragem de informações)Fluxo de dados (Computação)Aprendizado do computadorCiência da ComputaçãoTowards scalable and evolving graph-based collaborative filtering for data stream recommendationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisengreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - MURILO FALLEIROS LEMOS SCHMITT.pdfapplication/pdf37905473https://acervodigital.ufpr.br/bitstream/1884/90084/1/R%20-%20T%20-%20MURILO%20FALLEIROS%20LEMOS%20SCHMITT.pdfdfe82544dad87a4ac87b041abe991439MD51open access1884/900842024-10-08 15:59:48.994open accessoai:acervodigital.ufpr.br:1884/90084Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-10-08T18:59:48Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
title Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
spellingShingle Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
Schmitt, Murilo Falleiros Lemos
Sistemas de recomendação (Filtragem de informações)
Fluxo de dados (Computação)
Aprendizado do computador
Ciência da Computação
title_short Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
title_full Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
title_fullStr Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
title_full_unstemmed Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
title_sort Towards scalable and evolving graph-based collaborative filtering for data stream recommendation
author Schmitt, Murilo Falleiros Lemos
author_facet Schmitt, Murilo Falleiros Lemos
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.advisor1.fl_str_mv Spinosa, Eduardo Jaques, 1974-
dc.contributor.author.fl_str_mv Schmitt, Murilo Falleiros Lemos
contributor_str_mv Spinosa, Eduardo Jaques, 1974-
dc.subject.por.fl_str_mv Sistemas de recomendação (Filtragem de informações)
Fluxo de dados (Computação)
Aprendizado do computador
Ciência da Computação
topic Sistemas de recomendação (Filtragem de informações)
Fluxo de dados (Computação)
Aprendizado do computador
Ciência da Computação
description Orientador: Eduardo Jaques Spinosa
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-10-08T18:59:48Z
dc.date.available.fl_str_mv 2024-10-08T18:59:48Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/90084
url https://hdl.handle.net/1884/90084
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/90084/1/R%20-%20T%20-%20MURILO%20FALLEIROS%20LEMOS%20SCHMITT.pdf
bitstream.checksum.fl_str_mv dfe82544dad87a4ac87b041abe991439
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526315115151360