Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Sacenti, Juarez Angelo Piazza
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufsc.br/handle/123456789/231015
Resumo: Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2021.
id UFSC_f597314805d468ae57bfeefc97a7e0ef
oai_identifier_str oai:repositorio.ufsc.br:123456789/231015
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str
spelling Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendaçãoComputaçãoSistemas de recomendação (filtragem de informações)Ontologias (Sistema de recuperação da informação)Representação do conhecimento (Teoria da informação)Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2021.Um problema clássico que frequentemente compromete a qualidade de Sistemas de Recomendação (SRs) é a esparsidade de dados sobre as interações dos usuários com os itens a serem recomendados. A representação de conhecimento acerca dos usuários e dos itens (p.ex., no domínio do filmes, atores, diretores e gêneros), também chamado de informações laterais, por meio de ontologias e Grafos de Conhecimento (GCs) se mostrou eficaz para contornar esse problema. No entanto, o crescimento das informações laterais em termos de volume e complexidade dá origem a muitos desafios, incluindo a demanda por algoritmos de alto custo para lidar com grandes quantidades de dados. Enquanto isso, embora a Sumarização de Grafo (SG) tenha se tornado popular para dar suporte às tarefas de visualização e consulta de GC, seu uso ainda é relativamente inexplorado no domínio de SRs. Esta tese investiga os impactos da representação e sumarização do conhecimento em SRs, tanto a nível de eficácia como de eficiência. A eficácia neste contexto está relacionada à qualidade das recomendações geradas, e eficiência, por sua vez, está relacionada ao custo computacional. Mais especificamente, esta tese investiga duas abordagens para mitigar o problema do alto custo de treinamento de modelos de recomendação baseados em informações laterais. A primeira abordagem converte a representação das informações laterais baseada em ontologia numa matriz de preferência, eliminando a necessidade do uso de algoritmos de alto custo computacional baseados em inferências em ontologias ou na estrutura de rede de informação. Esta abordagem é aplicável a SRs baseados em filtragem híbrida clássica para considerar as informações laterais no processo de recomendação. Para definir melhor esta técnica de conversão, esta tese propõe um arcabouço conceitual, chamado de ORBS, que permite especificar a representação ontológica descrevendo os diferentes aspectos (características) dos itens e as hierarquias de entidades que ordenam e descrevem estes aspectos. Neste arcabouço, o conhecimento é representado usando ontologias de diferentes níveis de abstração, diferenciando conceitos relacionados à tarefa de recomendação, ao domínio do item e à aplicação. A segunda abordagem foca os SRs baseados em GCs (SRGCs), onde é proposto a sumarização do GC utilizando uma técnica que combina embeddings com clusterização de nodos para reduzir o volume das informações laterais. Esta técnica adota duas estratégias de sumarização: a única-visão, que sumariza o GC como um todo, e a multi-visão, que separa o GC em múltiplas visões, sumariza cada visão e, então, unifica-as em um único sumário de GC. Estas visões são subgrafos do GC contendo entidades relacionadas a um determinado aspecto de item. Os experimentos desta tese analisaram as duas abordagens propostas usando os dados do MovieLens 1M e informações laterais de Movie Ontology, IMDb e DBpedia. Os resultados demonstram que a especificação de múltiplos aspectos e hierarquias têm o potencial de melhorar a eficácia de SRs. Além disso, experimentos subsequentes avaliam o impacto das duas estratégias da técnica de sumarização de GC na eficiência e eficácia de quatro SRGCs. Os resultados mostram que a sumarização proposta pode melhorar a eficiência do SRs sem mudar significativamente a eficácia.Abstract: A classic problem that often compromises the quality of Recommender Systems (RSs) is the sparsity of data about user interactions with the items to be recommended. The representation of knowledge about users and items (e.g., in film domain, actors, directors, and genres), also called lateral information, through ontologies and Knowledge Graphs (KGs), has proven effective to circumvent this problem. However, the growth of lateral information in terms of volume and complexity gives rise to many challenges, including the demand for costly algorithms to handle large amounts of data. Meanwhile, although Graph Summary (GS) has become popular to support KG visualization and query tasks, its use is still relatively unexplored in the recommendation domain. This thesis investigates the impacts of knowledge representation and summarization in recommendation systems, both in terms of effectiveness and efficiency. The effectiveness in this context is related to the quality of the generated recommendations, and efficiency, in turn, is the computational cost. Specifically, this thesis investigates two approaches to mitigate the high cost of training recommendation models based on lateral information. The first approach converts the representation of ontology-based RSs into a preference matrix, removing the need of using high computational cost algorithms based on ontology inference or the structure of information network. This approach is applicable to RSs based on classical hybrid filtering to consider the lateral information not the recommendation process. To better define this mapping technique, this thesis proposes a conceptual framework, called ORBS, which allows specifying the ontological representation describing the different aspects (characteristics) of items and the hierarchies of entities that order and describe these aspects. In this framework, knowledge is represented using ontologies of different levels of abstraction, differentiating concepts related to the recommendation task, item domain and application. The second approach focuses on KG-based RSs, where the KG summarization is proposed using a technique that combines embeddings with node clustering to reduce the volume of lateral information. This method takes two strategies: single-view, which summarizes the KG as a whole, and multi-view, which separates the KG into multiple views, summarizes each view, and then unifies them into a single KG summary. In this context, views are subgraphs of the KG containing entities related to a particular item aspect. The experiments in this thesis analyzed the two proposed approaches using data from MovieLens 1M and side information from Movie Ontology, IMDb and DBpedia. The results demonstrate that specifying multiple aspects and hierarchies has the potential to improve the effectiveness of RSs. Furthermore, subsequent experiments assess the impact of the two KG summarization technique strategies on the efficiency and effectiveness of four KG-based RSs. The results show that the proposed summarization can improve the efficiency of RSs without significantly changing the effectiveness.Willrich, RobertoFileto, RenatoUniversidade Federal de Santa CatarinaSacenti, Juarez Angelo Piazza2022-02-14T13:31:28Z2022-02-14T13:31:28Z2021info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis152 p.| il., gráfs., tabs.application/pdf373998https://repositorio.ufsc.br/handle/123456789/231015porreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccess2022-02-14T13:31:28Zoai:repositorio.ufsc.br:123456789/231015Repositório InstitucionalPUBhttp://150.162.242.35/oai/requestopendoar:23732022-02-14T13:31:28Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.none.fl_str_mv Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
title Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
spellingShingle Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
Sacenti, Juarez Angelo Piazza
Computação
Sistemas de recomendação (filtragem de informações)
Ontologias (Sistema de recuperação da informação)
Representação do conhecimento (Teoria da informação)
title_short Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
title_full Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
title_fullStr Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
title_full_unstemmed Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
title_sort Impactos da representação e da sumarização de grafos de conhecimentos em sistemas de recomendação
author Sacenti, Juarez Angelo Piazza
author_facet Sacenti, Juarez Angelo Piazza
author_role author
dc.contributor.none.fl_str_mv Willrich, Roberto
Fileto, Renato
Universidade Federal de Santa Catarina
dc.contributor.author.fl_str_mv Sacenti, Juarez Angelo Piazza
dc.subject.por.fl_str_mv Computação
Sistemas de recomendação (filtragem de informações)
Ontologias (Sistema de recuperação da informação)
Representação do conhecimento (Teoria da informação)
topic Computação
Sistemas de recomendação (filtragem de informações)
Ontologias (Sistema de recuperação da informação)
Representação do conhecimento (Teoria da informação)
description Tese (doutorado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós-Graduação em Ciência da Computação, Florianópolis, 2021.
publishDate 2021
dc.date.none.fl_str_mv 2021
2022-02-14T13:31:28Z
2022-02-14T13:31:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv 373998
https://repositorio.ufsc.br/handle/123456789/231015
identifier_str_mv 373998
url https://repositorio.ufsc.br/handle/123456789/231015
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 152 p.| il., gráfs., tabs.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1785187871904235520