Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Weber, Cristofer
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Faculdade de Informática
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/6434
Resumo: Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.
id P_RS_d038a5bacd790cea8947565e494f2be0
oai_identifier_str oai:tede2.pucrs.br:tede/6434
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpediaINFORMÁTICAPROCESSAMENTO DA LINGUAGEM NATURALLINGUÍSTICA COMPUTACIONALCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAlgumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.Pontifícia Universidade Católica do Rio Grande do SulFaculdade de InformáticaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoVieira, Renata451.334.330-34Weber, Cristofer2015-12-14T19:55:11Z2015-03-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/6434porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2015-12-14T22:00:34Zoai:tede2.pucrs.br:tede/6434Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-12-14T22:00:34Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
spellingShingle Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
Weber, Cristofer
INFORMÁTICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGUÍSTICA COMPUTACIONAL
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_fullStr Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full_unstemmed Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_sort Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
author Weber, Cristofer
author_facet Weber, Cristofer
author_role author
dc.contributor.none.fl_str_mv Vieira, Renata
451.334.330-34
dc.contributor.author.fl_str_mv Weber, Cristofer
dc.subject.por.fl_str_mv INFORMÁTICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGUÍSTICA COMPUTACIONAL
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic INFORMÁTICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGUÍSTICA COMPUTACIONAL
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.
publishDate 2015
dc.date.none.fl_str_mv 2015-12-14T19:55:11Z
2015-03-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/6434
url http://tede2.pucrs.br/tede2/handle/tede/6434
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Faculdade de Informática
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Faculdade de Informática
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041276009807872