Extração de contextos definitórios a partir de textos em língua portuguesa
| Ano de defesa: | 2011 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Pontifícia Universidade Católica do Rio Grande do Sul
Faculdade de Informáca BR PUCRS Programa de Pós-Graduação em Ciência da Computação |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://tede2.pucrs.br/tede2/handle/tede/5206 |
Resumo: | O contexto definitório é a parte de um texto ou de um enunciado que fornece informação sobre um conceito, com base em seu uso. A extração de contextos definitórios a partir de textos é uma tarefa importante em várias aplicações. Diversos trabalhos usam este recurso como auxílio na construção de ontologias, no desenvolvimento de material de auxílio à tradução, na elaboração de sistemas de perguntas e respostas, na criação de glossários, dicionários, entre outros. Nesse sentido, este trabalho propõe um conjunto de heurísticas para fazer a extração automática de contextos potencialmente definitórios em textos de língua portuguesa. Os resultados dessas heurísticas foram avaliados por terminólogos. Os resultados mostram 35,1% de F-measure quando o conjunto de heuristicas foi aplicado a um corpus de Geologia Geral e 51,7% de F-measure quando aplicado a um corpus de Química Geral. Isso proporcionou uma redução, em ambos os corpus, de mais de 50% da quantidade de contextos para serem analisados pelo especialista, comparando-se com a extração de contextos em um concordanciador |
| id |
P_RS_cd2d01935bc951aa4ed8eab503638c20 |
|---|---|
| oai_identifier_str |
oai:tede2.pucrs.br:tede/5206 |
| network_acronym_str |
P_RS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository_id_str |
|
| spelling |
Extração de contextos definitórios a partir de textos em língua portuguesaINFORMÁTICAHEURÍSTICA (INFORMÁTICA)ENGENHARIA DE SOFTWARECNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOO contexto definitório é a parte de um texto ou de um enunciado que fornece informação sobre um conceito, com base em seu uso. A extração de contextos definitórios a partir de textos é uma tarefa importante em várias aplicações. Diversos trabalhos usam este recurso como auxílio na construção de ontologias, no desenvolvimento de material de auxílio à tradução, na elaboração de sistemas de perguntas e respostas, na criação de glossários, dicionários, entre outros. Nesse sentido, este trabalho propõe um conjunto de heurísticas para fazer a extração automática de contextos potencialmente definitórios em textos de língua portuguesa. Os resultados dessas heurísticas foram avaliados por terminólogos. Os resultados mostram 35,1% de F-measure quando o conjunto de heuristicas foi aplicado a um corpus de Geologia Geral e 51,7% de F-measure quando aplicado a um corpus de Química Geral. Isso proporcionou uma redução, em ambos os corpus, de mais de 50% da quantidade de contextos para serem analisados pelo especialista, comparando-se com a extração de contextos em um concordanciadorThe definitory context is part of a text or utterance that provides information about a concept based on its use. The extraction of definitions from texts is an important task in various applications. Several papers present this feature as an aid in the construction of ontologies, in the development of material for aid in translation, in question answering systems, in creation of glossaries, dictionaries, among others. Thus, this study proposes set of heuristics to make the automatic extraction of potentially definitory contexts contained in Portuguese texts. The results of these heuristics were evaluated by terminologists and obtained 35.1 % F-measure when applied in a General Geology corpus and 51.7 % F-measure when applied in a General Chemistry corpus, reducing in both more than 50%of the amount of contexts to be examined by a specialist compared with the contexts extraction through a concordancerPontifícia Universidade Católica do Rio Grande do SulFaculdade de InformácaBRPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoVieira, Renatahttp://lattes.cnpq.br/6218967777630412Wendt, Igor da Silveira2015-04-14T14:49:58Z2013-03-012011-03-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/5206porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2015-04-17T14:57:32Zoai:tede2.pucrs.br:tede/5206Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
| dc.title.none.fl_str_mv |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| title |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| spellingShingle |
Extração de contextos definitórios a partir de textos em língua portuguesa Wendt, Igor da Silveira INFORMÁTICA HEURÍSTICA (INFORMÁTICA) ENGENHARIA DE SOFTWARE CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| title_full |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| title_fullStr |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| title_full_unstemmed |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| title_sort |
Extração de contextos definitórios a partir de textos em língua portuguesa |
| author |
Wendt, Igor da Silveira |
| author_facet |
Wendt, Igor da Silveira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Vieira, Renata http://lattes.cnpq.br/6218967777630412 |
| dc.contributor.author.fl_str_mv |
Wendt, Igor da Silveira |
| dc.subject.por.fl_str_mv |
INFORMÁTICA HEURÍSTICA (INFORMÁTICA) ENGENHARIA DE SOFTWARE CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
INFORMÁTICA HEURÍSTICA (INFORMÁTICA) ENGENHARIA DE SOFTWARE CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
O contexto definitório é a parte de um texto ou de um enunciado que fornece informação sobre um conceito, com base em seu uso. A extração de contextos definitórios a partir de textos é uma tarefa importante em várias aplicações. Diversos trabalhos usam este recurso como auxílio na construção de ontologias, no desenvolvimento de material de auxílio à tradução, na elaboração de sistemas de perguntas e respostas, na criação de glossários, dicionários, entre outros. Nesse sentido, este trabalho propõe um conjunto de heurísticas para fazer a extração automática de contextos potencialmente definitórios em textos de língua portuguesa. Os resultados dessas heurísticas foram avaliados por terminólogos. Os resultados mostram 35,1% de F-measure quando o conjunto de heuristicas foi aplicado a um corpus de Geologia Geral e 51,7% de F-measure quando aplicado a um corpus de Química Geral. Isso proporcionou uma redução, em ambos os corpus, de mais de 50% da quantidade de contextos para serem analisados pelo especialista, comparando-se com a extração de contextos em um concordanciador |
| publishDate |
2011 |
| dc.date.none.fl_str_mv |
2011-03-15 2013-03-01 2015-04-14T14:49:58Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/5206 |
| url |
http://tede2.pucrs.br/tede2/handle/tede/5206 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informáca BR PUCRS Programa de Pós-Graduação em Ciência da Computação |
| publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Faculdade de Informáca BR PUCRS Programa de Pós-Graduação em Ciência da Computação |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
| instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| instacron_str |
PUC_RS |
| institution |
PUC_RS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
| _version_ |
1850041267085377536 |