Word embeddings-based transfer learning for boosted relational dependency networks

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Almeida, Thais Luca Marques de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11422/26618
Resumo: Machine learning algorithms have proven to be a great asset in different applications. However, traditional machine learning methods assume data is independent identically distributed (i.i.d.) and despises the relational structure of the data, which contains crucial information about how objects participate in relationships and events. Statistical machine learning models are a concise representation of probabilistic dependencies among the attributes of an object. Statistical Relational Learning (SRL) extends statistical learning to represent and learn from data with several objects and their relations. SRL models do not suppose data to be i.i.d. but, as traditional machine learning models, also assume training and testing data are sampled from the same distribution. Transfer learning has emerged as an essential technique to handle scenarios where such an assumption does not hold, as it relies on leveraging the knowledge acquired in one or more learning tasks as a starting point to solve a new task. When employing transfer learning to SRL, the primary challenge is to transfer the learned structure, mapping the vocabulary from a source domain to a different target domain. In this dissertation, we propose \mbox{TransBoostler}, which uses pre-trained word embeddings to guide the mapping as the name of a predicate usually has a semantic connotation that can be mapped to a vector space model. After transferring, TransBoostler employs theory revision to adapt the mapped model to the target data. In the experimental results, TransBoostler has successfully transferred trees from a source to a different target domain. It performs equal or better than previous works and requires less training time for most of the investigated scenarios.
id UFRJ_5d146d72f0e92154a438dad9eedd0849
oai_identifier_str oai:pantheon.ufrj.br:11422/26618
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Word embeddings-based transfer learning for boosted relational dependency networksAprendizado de máquinaTransferência de aprendizadoAprendizado estatístico relacionalRepresentação vetorial de palavrasRedes de dependência probabilísticasMachine learningTransfer learningRelational learningRelational dependency networksSemantic mappingCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOMachine learning algorithms have proven to be a great asset in different applications. However, traditional machine learning methods assume data is independent identically distributed (i.i.d.) and despises the relational structure of the data, which contains crucial information about how objects participate in relationships and events. Statistical machine learning models are a concise representation of probabilistic dependencies among the attributes of an object. Statistical Relational Learning (SRL) extends statistical learning to represent and learn from data with several objects and their relations. SRL models do not suppose data to be i.i.d. but, as traditional machine learning models, also assume training and testing data are sampled from the same distribution. Transfer learning has emerged as an essential technique to handle scenarios where such an assumption does not hold, as it relies on leveraging the knowledge acquired in one or more learning tasks as a starting point to solve a new task. When employing transfer learning to SRL, the primary challenge is to transfer the learned structure, mapping the vocabulary from a source domain to a different target domain. In this dissertation, we propose \mbox{TransBoostler}, which uses pre-trained word embeddings to guide the mapping as the name of a predicate usually has a semantic connotation that can be mapped to a vector space model. After transferring, TransBoostler employs theory revision to adapt the mapped model to the target data. In the experimental results, TransBoostler has successfully transferred trees from a source to a different target domain. It performs equal or better than previous works and requires less training time for most of the investigated scenarios.Resumo Algoritmos de aprendizado de máquina têm obtido sucesso nas mais diversas áreas de aplicação. Porém, os métodos tradicionais assumem dados independentes e identicamente distribuídos (i.i.d.), desprezando a estrutura relacional dos dados, que contém informações cruciais sobre como objetos participam de relações e eventos. Dentre os algoritmos de aprendizado de máquina, os modelos de aprendizado estatístico consistem em uma representação concisa das dependências probabilísticas entre atributos de um objeto. O aprendizado estatístico relacional estende aprendizado estatístico para representar e aprender a partir de dados contendo diferentes objetos e como estes se relacionam. Apesar de não seguirem a suposição i.i.d., também assumem que dados de treinamento e teste seguem a mesma distribuição. Para lidar com cenários em que os dados têm diferentes distribuições, surgiu a transferência de aprendizado, que consiste em usar o conhecimento adquirido em uma ou mais tarefas já resolvidas como um ponto de partida para resolver uma nova tarefa. Para aplicar transferência de aprendizado em aprendizado estatístico relacional, o primeiro desafio é como transferir a estrutura, mapeando o vocabulário de um domínio de origem para um domínio de destino. Nesta dissertação, propomos o TransBoostler, que utiliza vetores de palavras pré-treinados para mapear vocabulários, uma vez que os nomes dos predicados normalmente tem uma conotação semântica que pode ser mapeada para um modelo de espaço vetorial. Após a transferência, aplica-se revisão de teoria para adaptar o modelo mapeado aos novos dados de treinamento. Durante os experimentos, o TransBoostler realizou com êxito a tarefa de transferir árvores entre domínios com desempenho igual ou superior a trabalhos anteriores, e com redução no tempo de treinamento para a maioria dos cenários investigados.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia de Sistemas e ComputaçãoUFRJZaverucha, Gersonhttp://lattes.cnpq.br/5117568495536090http://lattes.cnpq.br/1787527911799919Carvalho, Aline Marins Paeshttp://lattes.cnpq.br/0506389215528790Figueiredo, Daniel Rattonhttp://lattes.cnpq.br/3621433615334969Cozman, Fabio Gagliardihttp://lattes.cnpq.br/2763982530162198Almeida, Thais Luca Marques de2025-08-11T15:29:51Z2025-08-13T03:00:09Z2021-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisALMEIDA, Thais Luca Marques de. Word embeddings-based transfer learning for boosted relational dependency networks. 2021. 75 f. Dissertação (Mestrado) - Programa de Pós-Graduação em Engenharia de Sistemas e Computação, COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2021.http://hdl.handle.net/11422/26618enginfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2025-08-13T03:00:09Zoai:pantheon.ufrj.br:11422/26618Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2025-08-13T03:00:09Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.none.fl_str_mv Word embeddings-based transfer learning for boosted relational dependency networks
title Word embeddings-based transfer learning for boosted relational dependency networks
spellingShingle Word embeddings-based transfer learning for boosted relational dependency networks
Almeida, Thais Luca Marques de
Aprendizado de máquina
Transferência de aprendizado
Aprendizado estatístico relacional
Representação vetorial de palavras
Redes de dependência probabilísticas
Machine learning
Transfer learning
Relational learning
Relational dependency networks
Semantic mapping
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Word embeddings-based transfer learning for boosted relational dependency networks
title_full Word embeddings-based transfer learning for boosted relational dependency networks
title_fullStr Word embeddings-based transfer learning for boosted relational dependency networks
title_full_unstemmed Word embeddings-based transfer learning for boosted relational dependency networks
title_sort Word embeddings-based transfer learning for boosted relational dependency networks
author Almeida, Thais Luca Marques de
author_facet Almeida, Thais Luca Marques de
author_role author
dc.contributor.none.fl_str_mv Zaverucha, Gerson
http://lattes.cnpq.br/5117568495536090
http://lattes.cnpq.br/1787527911799919
Carvalho, Aline Marins Paes
http://lattes.cnpq.br/0506389215528790
Figueiredo, Daniel Ratton
http://lattes.cnpq.br/3621433615334969
Cozman, Fabio Gagliardi
http://lattes.cnpq.br/2763982530162198
dc.contributor.author.fl_str_mv Almeida, Thais Luca Marques de
dc.subject.por.fl_str_mv Aprendizado de máquina
Transferência de aprendizado
Aprendizado estatístico relacional
Representação vetorial de palavras
Redes de dependência probabilísticas
Machine learning
Transfer learning
Relational learning
Relational dependency networks
Semantic mapping
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
topic Aprendizado de máquina
Transferência de aprendizado
Aprendizado estatístico relacional
Representação vetorial de palavras
Redes de dependência probabilísticas
Machine learning
Transfer learning
Relational learning
Relational dependency networks
Semantic mapping
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description Machine learning algorithms have proven to be a great asset in different applications. However, traditional machine learning methods assume data is independent identically distributed (i.i.d.) and despises the relational structure of the data, which contains crucial information about how objects participate in relationships and events. Statistical machine learning models are a concise representation of probabilistic dependencies among the attributes of an object. Statistical Relational Learning (SRL) extends statistical learning to represent and learn from data with several objects and their relations. SRL models do not suppose data to be i.i.d. but, as traditional machine learning models, also assume training and testing data are sampled from the same distribution. Transfer learning has emerged as an essential technique to handle scenarios where such an assumption does not hold, as it relies on leveraging the knowledge acquired in one or more learning tasks as a starting point to solve a new task. When employing transfer learning to SRL, the primary challenge is to transfer the learned structure, mapping the vocabulary from a source domain to a different target domain. In this dissertation, we propose \mbox{TransBoostler}, which uses pre-trained word embeddings to guide the mapping as the name of a predicate usually has a semantic connotation that can be mapped to a vector space model. After transferring, TransBoostler employs theory revision to adapt the mapped model to the target data. In the experimental results, TransBoostler has successfully transferred trees from a source to a different target domain. It performs equal or better than previous works and requires less training time for most of the investigated scenarios.
publishDate 2021
dc.date.none.fl_str_mv 2021-12
2025-08-11T15:29:51Z
2025-08-13T03:00:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALMEIDA, Thais Luca Marques de. Word embeddings-based transfer learning for boosted relational dependency networks. 2021. 75 f. Dissertação (Mestrado) - Programa de Pós-Graduação em Engenharia de Sistemas e Computação, COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2021.
http://hdl.handle.net/11422/26618
identifier_str_mv ALMEIDA, Thais Luca Marques de. Word embeddings-based transfer learning for boosted relational dependency networks. 2021. 75 f. Dissertação (Mestrado) - Programa de Pós-Graduação em Engenharia de Sistemas e Computação, COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2021.
url http://hdl.handle.net/11422/26618
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv pantheon@sibi.ufrj.br
_version_ 1861279129910902784