Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Weber, Cristofer

Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Detalhes bibliográficos
Ano de defesa:	2015
Autor(a) principal:	Weber, Cristofer
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Link de acesso:	http://tede2.pucrs.br/tede2/handle/tede/6434
Resumo:	Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.

Metadados do item

id	P_RS_d038a5bacd790cea8947565e494f2be0
oai_identifier_str	oai:tede2.pucrs.br:tede/6434
network_acronym_str	P_RS
network_name_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpediaINFORMÁTICAPROCESSAMENTO DA LINGUAGEM NATURALLINGUÍSTICA COMPUTACIONALCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAlgumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.Pontifícia Universidade Católica do Rio Grande do SulFaculdade de InformáticaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoVieira, Renata451.334.330-34Weber, Cristofer2015-12-14T19:55:11Z2015-03-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/6434porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2015-12-14T22:00:34Zoai:tede2.pucrs.br:tede/6434Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br\|\|opendoar:2015-12-14T22:00:34Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
spellingShingle	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia Weber, Cristofer INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_fullStr	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full_unstemmed	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_sort	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
author	Weber, Cristofer
author_facet	Weber, Cristofer
author_role	author
dc.contributor.none.fl_str_mv	Vieira, Renata 451.334.330-34
dc.contributor.author.fl_str_mv	Weber, Cristofer
dc.subject.por.fl_str_mv	INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic	INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description	Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.
publishDate	2015
dc.date.none.fl_str_mv	2015-12-14T19:55:11Z 2015-03-16
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://tede2.pucrs.br/tede2/handle/tede/6434
url	http://tede2.pucrs.br/tede2/handle/tede/6434
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv	Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informática Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS
instname_str	Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str	PUC_RS
institution	PUC_RS
reponame_str	Biblioteca Digital de Teses e Dissertações da PUC_RS
collection	Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv	biblioteca.central@pucrs.br\|\|
_version_	1850041276009807872

Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Registros relacionados