Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Weber, Cristofer
Orientador(a): Vieira, Renata
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontif?cia Universidade Cat?lica do Rio Grande do Sul
Programa de Pós-Graduação: Programa de P?s-Gradua??o em Ci?ncia da Computa??o
Departamento: Faculdade de Inform?tica
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/6434
Resumo: Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.
id P_RS_d038a5bacd790cea8947565e494f2be0
oai_identifier_str oai:tede2.pucrs.br:tede/6434
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Vieira, Renata451.334.330-34959.843.560-15Weber, Cristofer2015-12-14T19:55:11Z2015-03-16http://tede2.pucrs.br/tede2/handle/tede/6434Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obten??o destes exemplos pode ser um gargalo. Neste trabalho n?s investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem dispon?veis de forma gratuita, podem ser utilizados como corpus para a classifica??o de entidades nomeadas, uma tarefa fundamental de extra??o de informa??es e um passo necess?rio para outras tarefas como extra??o de rela??es e resolu??o de co-refer?ncias.Submitted by Setor de Tratamento da Informa??o - BC/PUCRS (tede2@pucrs.br) on 2015-12-14T19:55:10Z No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5)Made available in DSpace on 2015-12-14T19:55:11Z (GMT). No. of bitstreams: 1 476712 - Texto Completo.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015-03-16application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/163833/476712%20-%20Texto%20Completo.pdf.jpgporPontif?cia Universidade Cat?lica do Rio Grande do SulPrograma de P?s-Gradua??o em Ci?ncia da Computa??oPUCRSBrasilFaculdade de Inform?ticaINFORM?TICAPROCESSAMENTO DA LINGUAGEM NATURALLINGU?STICA COMPUTACIONALCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOConstru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpediainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis1974996533081274470600600600-30085425104011491443671711205811204509info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL476712 - Texto Completo.pdf.jpg476712 - Texto Completo.pdf.jpgimage/jpeg3892http://tede2.pucrs.br/tede2/bitstream/tede/6434/4/476712+-+Texto+Completo.pdf.jpgf31a0a67a1d0603c521aa2fe1cc32ef7MD54TEXT476712 - Texto Completo.pdf.txt476712 - Texto Completo.pdf.txttext/plain139726http://tede2.pucrs.br/tede2/bitstream/tede/6434/3/476712+-+Texto+Completo.pdf.txt7500ed933efcd0f1ad59c5337056c702MD53ORIGINAL476712 - Texto Completo.pdf476712 - Texto Completo.pdfapplication/pdf1416751http://tede2.pucrs.br/tede2/bitstream/tede/6434/2/476712+-+Texto+Completo.pdf0b603e0667dd53303efd13181a62d31eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8610http://tede2.pucrs.br/tede2/bitstream/tede/6434/1/license.txt5a9d6006225b368ef605ba16b4f6d1beMD51tede/64342015-12-14 20:00:34.272oai:tede2.pucrs.br:tede/6434QXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2HDp8OjbyBFbGV0csO0bmljYTogQ29tIGJhc2Ugbm8gZGlzcG9zdG8gbmEgTGVpIEZlZGVyYWwgbsK6OS42MTAsIGRlIDE5IGRlIGZldmVyZWlybyBkZSAxOTk4LCBvIGF1dG9yIEFVVE9SSVpBIGEgcHVibGljYcOnw6NvIGVsZXRyw7RuaWNhIGRhIHByZXNlbnRlIG9icmEgbm8gYWNlcnZvIGRhIEJpYmxpb3RlY2EgRGlnaXRhbCBkYSBQb250aWbDrWNpYSBVbml2ZXJzaWRhZGUgQ2F0w7NsaWNhIGRvIFJpbyBHcmFuZGUgZG8gU3VsLCBzZWRpYWRhIGEgQXYuIElwaXJhbmdhIDY2ODEsIFBvcnRvIEFsZWdyZSwgUmlvIEdyYW5kZSBkbyBTdWwsIGNvbSByZWdpc3RybyBkZSBDTlBKIDg4NjMwNDEzMDAwMi04MSBiZW0gY29tbyBlbSBvdXRyYXMgYmlibGlvdGVjYXMgZGlnaXRhaXMsIG5hY2lvbmFpcyBlIGludGVybmFjaW9uYWlzLCBjb25zw7NyY2lvcyBlIHJlZGVzIMOgcyBxdWFpcyBhIGJpYmxpb3RlY2EgZGEgUFVDUlMgcG9zc2EgYSB2aXIgcGFydGljaXBhciwgc2VtIMO0bnVzIGFsdXNpdm8gYW9zIGRpcmVpdG9zIGF1dG9yYWlzLCBhIHTDrXR1bG8gZGUgZGl2dWxnYcOnw6NvIGRhIHByb2R1w6fDo28gY2llbnTDrWZpY2EuCg==Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-12-14T22:00:34Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
title Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
spellingShingle Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
Weber, Cristofer
INFORM?TICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGU?STICA COMPUTACIONAL
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_fullStr Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full_unstemmed Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_sort Constru??o de um corpus anotado para classifica??o de entidades nomeadas utilizando a Wikipedia e a DBpedia
author Weber, Cristofer
author_facet Weber, Cristofer
author_role author
dc.contributor.advisor1.fl_str_mv Vieira, Renata
dc.contributor.advisor1ID.fl_str_mv 451.334.330-34
dc.contributor.authorID.fl_str_mv 959.843.560-15
dc.contributor.author.fl_str_mv Weber, Cristofer
contributor_str_mv Vieira, Renata
dc.subject.por.fl_str_mv INFORM?TICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGU?STICA COMPUTACIONAL
topic INFORM?TICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGU?STICA COMPUTACIONAL
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.
publishDate 2015
dc.date.accessioned.fl_str_mv 2015-12-14T19:55:11Z
dc.date.issued.fl_str_mv 2015-03-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/6434
url http://tede2.pucrs.br/tede2/handle/tede/6434
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv -3008542510401149144
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontif?cia Universidade Cat?lica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de P?s-Gradua??o em Ci?ncia da Computa??o
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Faculdade de Inform?tica
publisher.none.fl_str_mv Pontif?cia Universidade Cat?lica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/6434/4/476712+-+Texto+Completo.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/6434/3/476712+-+Texto+Completo.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/6434/2/476712+-+Texto+Completo.pdf
http://tede2.pucrs.br/tede2/bitstream/tede/6434/1/license.txt
bitstream.checksum.fl_str_mv f31a0a67a1d0603c521aa2fe1cc32ef7
7500ed933efcd0f1ad59c5337056c702
0b603e0667dd53303efd13181a62d31e
5a9d6006225b368ef605ba16b4f6d1be
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1796793217350369280