A Study on Machine Learning Techniques for the Schema Matching Networks Problem

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Rodrigues, Diego de Azevedo
Outros Autores: http://lattes.cnpq.br/1094681264347962
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.ufam.edu.br/handle/tede/6801
Resumo: Casamento de Esquemas é a tarefa de encontrar correpondências entre elementos de diferentes esquemas de bancos de dados. É um problema desafiador, uma vez que o mesmo conceito geralmente é representado de maneiras distintas nos esquemas.Tradicionalmente, a tarefa envolve um par de esquemas a serem mapeados. Entretanto, houve um crescimento na necessidade de mapear vários esquemas ao mesmo tempo, tarefa conhecida como Casamento de Esquemas em Rede, onde o objetivo é identificar elementos de vários esquemas que correspondem ao mesmo conceito. Este trabalho propõe uma famı́lia de métodos para o problema do casamento de esquemas em rede baseados em aprendizagem de máquina, que provou ser uma alternativa viável para o problema do casamento tradicional em diversos domı́nios. Para superar obstáculo de obter bastantes instâncias de treino, também é proposta uma técnica de bootstrapping para gerar treino automático. Além disso, o trabalho considera restrições de integridade que ajudam a nortear o processo de casamento em rede. Este trabalho também propõe uma estratégia para receber avaliações do usuário, com o propósito de melhorar o resultado final. Experimentos mostram que o método proposto supera outros métodos comparados alcançando valor F1 até 0.83 e sem utilizar muitas avaliações do usuário.
id UFAM_36c8c7b7162d4d2535ee2602509e8424
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/6801
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling A Study on Machine Learning Techniques for the Schema Matching Networks ProblemUm Estudo de Técnicas de Aprendizagem de Máquina para o Problema de Casamento de Esquemas em RedeCasamento de Esquemas em RedeReconciliação de Esquemas em RedeIntegração de DadosAprendizagem de MáquinaBanco de DadosSchema Matching NetworksSchema Reconciliation NetworksData IntegrationMachine LearningDatabasesCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO: METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO: BANCO DE DADOSCasamento de Esquemas é a tarefa de encontrar correpondências entre elementos de diferentes esquemas de bancos de dados. É um problema desafiador, uma vez que o mesmo conceito geralmente é representado de maneiras distintas nos esquemas.Tradicionalmente, a tarefa envolve um par de esquemas a serem mapeados. Entretanto, houve um crescimento na necessidade de mapear vários esquemas ao mesmo tempo, tarefa conhecida como Casamento de Esquemas em Rede, onde o objetivo é identificar elementos de vários esquemas que correspondem ao mesmo conceito. Este trabalho propõe uma famı́lia de métodos para o problema do casamento de esquemas em rede baseados em aprendizagem de máquina, que provou ser uma alternativa viável para o problema do casamento tradicional em diversos domı́nios. Para superar obstáculo de obter bastantes instâncias de treino, também é proposta uma técnica de bootstrapping para gerar treino automático. Além disso, o trabalho considera restrições de integridade que ajudam a nortear o processo de casamento em rede. Este trabalho também propõe uma estratégia para receber avaliações do usuário, com o propósito de melhorar o resultado final. Experimentos mostram que o método proposto supera outros métodos comparados alcançando valor F1 até 0.83 e sem utilizar muitas avaliações do usuário.Schema Matching is the problem of finding semantic correspondences between elements from different schemas. This is a challenging problem, since the same concept is often represented by disparate elements in the schemas. The traditional instances of this problem involved a pair of schemas to be matched. However, recently there has been a increasing interest in matching several related schemas at once, a problem known as Schema Matching Networks, where the goal is to identify elements from several schemas that correspond to a single concept. We propose a family of methods for schema matching networks based on machine learning, which proved to be a competitive alternative for the traditional matching problem in several domains. To overcome the issue of requiring a large amount of training data, we also propose a bootstrapping procedure to automatically generate training data. In addition, we leverage constraints that arise in network scenarios to improve the quality of this data. We also propose a strategy for receiving user feedback to assert some of the matchings generated, and, relying on this feedback, improving the quality of the final result. Our experiments show that our methods can outperform baselines reaching F1-score up to 0.83.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaSilva, Altigran Soares dahttp://lattes.cnpq.br/3405503472010994Cavalcanti, João Marcos BastosMacêdo, José Antônio Fernandes deSalgado, Ana Carolina BrandãoRodrigues, Diego de Azevedohttp://lattes.cnpq.br/10946812643479622018-12-10T19:02:56Z2018-10-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfRODRIGUES, Diego de Azevedo. A Study on Machine Learning Techniques for the Schema Matching Networks Problem. 2018. 109 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2018.https://tede.ufam.edu.br/handle/tede/6801enghttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2018-12-11T05:03:33Zoai:https://tede.ufam.edu.br/handle/:tede/6801Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922018-12-11T05:03:33Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv A Study on Machine Learning Techniques for the Schema Matching Networks Problem
Um Estudo de Técnicas de Aprendizagem de Máquina para o Problema de Casamento de Esquemas em Rede
title A Study on Machine Learning Techniques for the Schema Matching Networks Problem
spellingShingle A Study on Machine Learning Techniques for the Schema Matching Networks Problem
Rodrigues, Diego de Azevedo
Casamento de Esquemas em Rede
Reconciliação de Esquemas em Rede
Integração de Dados
Aprendizagem de Máquina
Banco de Dados
Schema Matching Networks
Schema Reconciliation Networks
Data Integration
Machine Learning
Databases
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO: METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO: BANCO DE DADOS
title_short A Study on Machine Learning Techniques for the Schema Matching Networks Problem
title_full A Study on Machine Learning Techniques for the Schema Matching Networks Problem
title_fullStr A Study on Machine Learning Techniques for the Schema Matching Networks Problem
title_full_unstemmed A Study on Machine Learning Techniques for the Schema Matching Networks Problem
title_sort A Study on Machine Learning Techniques for the Schema Matching Networks Problem
author Rodrigues, Diego de Azevedo
author_facet Rodrigues, Diego de Azevedo
http://lattes.cnpq.br/1094681264347962
author_role author
author2 http://lattes.cnpq.br/1094681264347962
author2_role author
dc.contributor.none.fl_str_mv Silva, Altigran Soares da
http://lattes.cnpq.br/3405503472010994
Cavalcanti, João Marcos Bastos
Macêdo, José Antônio Fernandes de
Salgado, Ana Carolina Brandão
dc.contributor.author.fl_str_mv Rodrigues, Diego de Azevedo
http://lattes.cnpq.br/1094681264347962
dc.subject.por.fl_str_mv Casamento de Esquemas em Rede
Reconciliação de Esquemas em Rede
Integração de Dados
Aprendizagem de Máquina
Banco de Dados
Schema Matching Networks
Schema Reconciliation Networks
Data Integration
Machine Learning
Databases
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO: METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO: BANCO DE DADOS
topic Casamento de Esquemas em Rede
Reconciliação de Esquemas em Rede
Integração de Dados
Aprendizagem de Máquina
Banco de Dados
Schema Matching Networks
Schema Reconciliation Networks
Data Integration
Machine Learning
Databases
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO: METODOLOGIA E TÉCNICAS DA COMPUTAÇÃO: BANCO DE DADOS
description Casamento de Esquemas é a tarefa de encontrar correpondências entre elementos de diferentes esquemas de bancos de dados. É um problema desafiador, uma vez que o mesmo conceito geralmente é representado de maneiras distintas nos esquemas.Tradicionalmente, a tarefa envolve um par de esquemas a serem mapeados. Entretanto, houve um crescimento na necessidade de mapear vários esquemas ao mesmo tempo, tarefa conhecida como Casamento de Esquemas em Rede, onde o objetivo é identificar elementos de vários esquemas que correspondem ao mesmo conceito. Este trabalho propõe uma famı́lia de métodos para o problema do casamento de esquemas em rede baseados em aprendizagem de máquina, que provou ser uma alternativa viável para o problema do casamento tradicional em diversos domı́nios. Para superar obstáculo de obter bastantes instâncias de treino, também é proposta uma técnica de bootstrapping para gerar treino automático. Além disso, o trabalho considera restrições de integridade que ajudam a nortear o processo de casamento em rede. Este trabalho também propõe uma estratégia para receber avaliações do usuário, com o propósito de melhorar o resultado final. Experimentos mostram que o método proposto supera outros métodos comparados alcançando valor F1 até 0.83 e sem utilizar muitas avaliações do usuário.
publishDate 2018
dc.date.none.fl_str_mv 2018-12-10T19:02:56Z
2018-10-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv RODRIGUES, Diego de Azevedo. A Study on Machine Learning Techniques for the Schema Matching Networks Problem. 2018. 109 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2018.
https://tede.ufam.edu.br/handle/tede/6801
identifier_str_mv RODRIGUES, Diego de Azevedo. A Study on Machine Learning Techniques for the Schema Matching Networks Problem. 2018. 109 f. Tese (Doutorado em Informática) - Universidade Federal do Amazonas, Manaus, 2018.
url https://tede.ufam.edu.br/handle/tede/6801
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1797040498515378176