Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética
| Ano de defesa: | 2010 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/26968 |
Resumo: | Bibliotecas digitais tornaram-se uma importante fonte de informação para comunidades científicas. Entretanto, por coletar dados de diferentes fontes, surge o problema de informações ambíguas ou duplicadas de nomes de autores. Métodos tradicionais de desambiguação de nomes utilizam informação sintática de atributos. Todavia, recentemente o uso de redes de relacionamentos, que traz informação semântica, tem sido estudado em desambiguação de dados. Em desambiguação de nomes de autores, relações de co-autoria podem ser usadas para criar uma rede social, que pode ser utilizada para melhorar métodos de desambiguação de nomes de autores. Esta dissertação apresenta um estudo do impacto de adicionar análise de redes sociais a métodos de desambiguação de nomes de autores baseados em informação sintática de atributos. Nós apresentamos uma abordagem de aprendizagem de máquina baseada em Programação Genética e a utilizamos para avaliar o impacto de adicionar análise de redes sociais a desambiguação de nomes de autores. Através de experimentos usando subconjuntos de bibliotecas digitais reais, nós demonstramos que o uso de análise de redes sociais melhora de forma significativa a qualidade dos resultados. Adicionalmente, nós demonstramos que as funções de casamento criadas por nossa abordagem baseada em Programação Genética são capazes de competir com métodos do estado da arte. |
| id |
URGS_84976932e1fb086f77c6d35ef8ded0d9 |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/26968 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Levin, Felipe HoppeHeuser, Carlos Alberto2010-12-16T04:19:20Z2010http://hdl.handle.net/10183/26968000762203Bibliotecas digitais tornaram-se uma importante fonte de informação para comunidades científicas. Entretanto, por coletar dados de diferentes fontes, surge o problema de informações ambíguas ou duplicadas de nomes de autores. Métodos tradicionais de desambiguação de nomes utilizam informação sintática de atributos. Todavia, recentemente o uso de redes de relacionamentos, que traz informação semântica, tem sido estudado em desambiguação de dados. Em desambiguação de nomes de autores, relações de co-autoria podem ser usadas para criar uma rede social, que pode ser utilizada para melhorar métodos de desambiguação de nomes de autores. Esta dissertação apresenta um estudo do impacto de adicionar análise de redes sociais a métodos de desambiguação de nomes de autores baseados em informação sintática de atributos. Nós apresentamos uma abordagem de aprendizagem de máquina baseada em Programação Genética e a utilizamos para avaliar o impacto de adicionar análise de redes sociais a desambiguação de nomes de autores. Através de experimentos usando subconjuntos de bibliotecas digitais reais, nós demonstramos que o uso de análise de redes sociais melhora de forma significativa a qualidade dos resultados. Adicionalmente, nós demonstramos que as funções de casamento criadas por nossa abordagem baseada em Programação Genética são capazes de competir com métodos do estado da arte.Digital libraries have become an important source of information for scientific communities. However, by gathering data from different sources, the problem of duplicate and ambiguous information about author names arises. Traditional methods of name disambiguation use syntactic attribute information. However, recently the use of relationship networks, which provides semantic information, has been studied in data disambiguation. In author name disambiguation, the co-authorship relations can be used to create a social network, which can be used to improve author name disambiguation methods. This dissertation presents a study of the impact of adding social network analysis to author name disambiguation methods based on syntactic attribute information. We present a machine learning approach based on Genetic Programming and use it to evaluate the impact of social network analysis in author name disambiguation. Through experiments using subsets of real digital libraries, we show that the use of social network analysis significantly improves the quality of results. Also, we demonstrate that match functions created by our Genetic Programming approach are able to compete with state-of-the-art methods.application/pdfporBanco : DadosAgentes sociaisName disambiguationRelationship analysisSocial networksGenetic programmingMatch functionsDigital librariesDesambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genéticaAuthor name disambiguation in digital libraries using social networks and genetic programming info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2010mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000762203.pdf000762203.pdfTexto completoapplication/pdf896303http://www.lume.ufrgs.br/bitstream/10183/26968/1/000762203.pdfb5959f46b496da58a52fc853aa03a432MD51TEXT000762203.pdf.txt000762203.pdf.txtExtracted Texttext/plain129344http://www.lume.ufrgs.br/bitstream/10183/26968/2/000762203.pdf.txt50a8392a179827d035e0abef687b40f4MD52THUMBNAIL000762203.pdf.jpg000762203.pdf.jpgGenerated Thumbnailimage/jpeg1078http://www.lume.ufrgs.br/bitstream/10183/26968/3/000762203.pdf.jpg9cc38eb8608647cda93f5d221abe7f16MD5310183/269682018-10-11 08:57:48.16oai:www.lume.ufrgs.br:10183/26968Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-11T11:57:48Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| dc.title.alternative.en.fl_str_mv |
Author name disambiguation in digital libraries using social networks and genetic programming |
| title |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| spellingShingle |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética Levin, Felipe Hoppe Banco : Dados Agentes sociais Name disambiguation Relationship analysis Social networks Genetic programming Match functions Digital libraries |
| title_short |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| title_full |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| title_fullStr |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| title_full_unstemmed |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| title_sort |
Desambiguação de autores em bibliotecas digitais utilizando redes sociais e programação genética |
| author |
Levin, Felipe Hoppe |
| author_facet |
Levin, Felipe Hoppe |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Levin, Felipe Hoppe |
| dc.contributor.advisor1.fl_str_mv |
Heuser, Carlos Alberto |
| contributor_str_mv |
Heuser, Carlos Alberto |
| dc.subject.por.fl_str_mv |
Banco : Dados Agentes sociais |
| topic |
Banco : Dados Agentes sociais Name disambiguation Relationship analysis Social networks Genetic programming Match functions Digital libraries |
| dc.subject.eng.fl_str_mv |
Name disambiguation Relationship analysis Social networks Genetic programming Match functions Digital libraries |
| description |
Bibliotecas digitais tornaram-se uma importante fonte de informação para comunidades científicas. Entretanto, por coletar dados de diferentes fontes, surge o problema de informações ambíguas ou duplicadas de nomes de autores. Métodos tradicionais de desambiguação de nomes utilizam informação sintática de atributos. Todavia, recentemente o uso de redes de relacionamentos, que traz informação semântica, tem sido estudado em desambiguação de dados. Em desambiguação de nomes de autores, relações de co-autoria podem ser usadas para criar uma rede social, que pode ser utilizada para melhorar métodos de desambiguação de nomes de autores. Esta dissertação apresenta um estudo do impacto de adicionar análise de redes sociais a métodos de desambiguação de nomes de autores baseados em informação sintática de atributos. Nós apresentamos uma abordagem de aprendizagem de máquina baseada em Programação Genética e a utilizamos para avaliar o impacto de adicionar análise de redes sociais a desambiguação de nomes de autores. Através de experimentos usando subconjuntos de bibliotecas digitais reais, nós demonstramos que o uso de análise de redes sociais melhora de forma significativa a qualidade dos resultados. Adicionalmente, nós demonstramos que as funções de casamento criadas por nossa abordagem baseada em Programação Genética são capazes de competir com métodos do estado da arte. |
| publishDate |
2010 |
| dc.date.accessioned.fl_str_mv |
2010-12-16T04:19:20Z |
| dc.date.issued.fl_str_mv |
2010 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/26968 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
000762203 |
| url |
http://hdl.handle.net/10183/26968 |
| identifier_str_mv |
000762203 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/26968/1/000762203.pdf http://www.lume.ufrgs.br/bitstream/10183/26968/2/000762203.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/26968/3/000762203.pdf.jpg |
| bitstream.checksum.fl_str_mv |
b5959f46b496da58a52fc853aa03a432 50a8392a179827d035e0abef687b40f4 9cc38eb8608647cda93f5d221abe7f16 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831315885786136576 |