Online probabilistic theory revision from examples : a proPPR approach

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Guimarães, Victor Augusto Lopes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11422/13080
Resumo: Handling relational data streams has become a crucial task, given the availability of pervasive sensors and Internet-produced content, such as social networks and knowledge graphs. In a relational environment, this is a particularly challenging task, since one cannot assure that the streams of examples are independent along the iterations. Thus, most relational machine learning methods are still designed to learn only from closed batches of data, not considering the models acquired in previous iterations of incoming examples. In this work, we propose OSLR, an online relational learning algorithm that can handle continuous, open-ended streams of relational examples as they arrive. We employ techniques from theory revision to take advantage of the already acquired knowledge as a starting point, find where it should be modified to cope with the new examples, and automatically update it. We rely on the Hoeding’s bound statistical theory to decide if the model must in fact be updated accordingly to the new examples. Our system is built upon ProPPR statistical relational language to describe the induced models, aiming at contemplating the uncertainty inherent to real data. Experimental results in entity co-reference and social networks datasets show the potential of the proposed approach compared to other relational learners
id UFRJ_47e7fcd490a330b323ba696ccc01a3fb
oai_identifier_str oai:pantheon.ufrj.br:11422/13080
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Online probabilistic theory revision from examples : a proPPR approachRevisão incremental de teoria probabilística a partir de exemplos: uma abordagem com proPPRonline learningstatistical relational learningtheory revision from examplesinductive logic programmingmining data streamsCNPQ::ENGENHARIASHandling relational data streams has become a crucial task, given the availability of pervasive sensors and Internet-produced content, such as social networks and knowledge graphs. In a relational environment, this is a particularly challenging task, since one cannot assure that the streams of examples are independent along the iterations. Thus, most relational machine learning methods are still designed to learn only from closed batches of data, not considering the models acquired in previous iterations of incoming examples. In this work, we propose OSLR, an online relational learning algorithm that can handle continuous, open-ended streams of relational examples as they arrive. We employ techniques from theory revision to take advantage of the already acquired knowledge as a starting point, find where it should be modified to cope with the new examples, and automatically update it. We rely on the Hoeding’s bound statistical theory to decide if the model must in fact be updated accordingly to the new examples. Our system is built upon ProPPR statistical relational language to describe the induced models, aiming at contemplating the uncertainty inherent to real data. Experimental results in entity co-reference and social networks datasets show the potential of the proposed approach compared to other relational learnersA manipulação de fluxos de dados relacionais estruturados se tornou uma tarefa crucial, dada a disponibilidade de conteúdo produzido por sensores e pela Internet, como redes sociais e grafos de conhecimento. Esta tarefa é ainda mais desafiadora em um ambiente relacional do que em ambientes que lidam com exemplos i.i.d., dado que não podemos garantir que os exemplos são independentes. Além disso, a maioria dos métodos de aprendizado relacional ainda são projetados para aprender apenas a partir de conjuntos fechados de dados, não considerando modelos aprendidos em iterações anteriores de exemplos. Neste trabalho, nós propomos OSLR, um algoritmo de aprendizado relacional incremental que é capaz de lidar com fluxos de dados contínuos de exemplos, a medida em que eles chegam. Nós aplicamos técnica de revisão de teoria para aproveitar o conhecimento preliminar como ponto de partida, buscando onde o mesmo deve ser modificado para considerar novos exemplos e aplicando automaticamente essas modificações. Nós nos baseamos na teoria estatística do limitante de Hoeding para decidir se o modelo, de fato, deve ser atualizado, de acordo com novos exemplos. Nosso sistema foi construído sobre a linguagem estatística relacional ProPPR, para descrever os modelos induzidos, visando considerar a incerteza inerente de dados reais. Resultados experimentais em bases de co-autoria e redes sociais mostram o potencial da abordagem proposta comparada com outros métodos de aprendizado relacional.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJZaverucha, Gersonhttp://lattes.cnpq.br/5117568495536090http://lattes.cnpq.br/3532148462112499Carvalho, Aline Marins PaesCV: http://lattes.cnpq.br/0506389215528790Barbosa, Valmir CarneiroCozman, Fabio GagliardiGuimarães, Victor Augusto Lopes2020-09-22T22:17:16Z2023-12-21T03:02:18Z2018-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/13080enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:02:18Zoai:pantheon.ufrj.br:11422/13080Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:02:18Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.none.fl_str_mv Online probabilistic theory revision from examples : a proPPR approach
Revisão incremental de teoria probabilística a partir de exemplos: uma abordagem com proPPR
title Online probabilistic theory revision from examples : a proPPR approach
spellingShingle Online probabilistic theory revision from examples : a proPPR approach
Guimarães, Victor Augusto Lopes
online learning
statistical relational learning
theory revision from examples
inductive logic programming
mining data streams
CNPQ::ENGENHARIAS
title_short Online probabilistic theory revision from examples : a proPPR approach
title_full Online probabilistic theory revision from examples : a proPPR approach
title_fullStr Online probabilistic theory revision from examples : a proPPR approach
title_full_unstemmed Online probabilistic theory revision from examples : a proPPR approach
title_sort Online probabilistic theory revision from examples : a proPPR approach
author Guimarães, Victor Augusto Lopes
author_facet Guimarães, Victor Augusto Lopes
author_role author
dc.contributor.none.fl_str_mv Zaverucha, Gerson
http://lattes.cnpq.br/5117568495536090
http://lattes.cnpq.br/3532148462112499
Carvalho, Aline Marins Paes
CV: http://lattes.cnpq.br/0506389215528790
Barbosa, Valmir Carneiro
Cozman, Fabio Gagliardi
dc.contributor.author.fl_str_mv Guimarães, Victor Augusto Lopes
dc.subject.por.fl_str_mv online learning
statistical relational learning
theory revision from examples
inductive logic programming
mining data streams
CNPQ::ENGENHARIAS
topic online learning
statistical relational learning
theory revision from examples
inductive logic programming
mining data streams
CNPQ::ENGENHARIAS
description Handling relational data streams has become a crucial task, given the availability of pervasive sensors and Internet-produced content, such as social networks and knowledge graphs. In a relational environment, this is a particularly challenging task, since one cannot assure that the streams of examples are independent along the iterations. Thus, most relational machine learning methods are still designed to learn only from closed batches of data, not considering the models acquired in previous iterations of incoming examples. In this work, we propose OSLR, an online relational learning algorithm that can handle continuous, open-ended streams of relational examples as they arrive. We employ techniques from theory revision to take advantage of the already acquired knowledge as a starting point, find where it should be modified to cope with the new examples, and automatically update it. We rely on the Hoeding’s bound statistical theory to decide if the model must in fact be updated accordingly to the new examples. Our system is built upon ProPPR statistical relational language to describe the induced models, aiming at contemplating the uncertainty inherent to real data. Experimental results in entity co-reference and social networks datasets show the potential of the proposed approach compared to other relational learners
publishDate 2018
dc.date.none.fl_str_mv 2018-03
2020-09-22T22:17:16Z
2023-12-21T03:02:18Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/13080
url http://hdl.handle.net/11422/13080
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv pantheon@sibi.ufrj.br
_version_ 1831773707322785792