Um modelo híbrido para o WSD em biomedicina
Ano de defesa: | 2013 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Pontifícia Universidade Católica do Rio Grande do Sul
|
Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação
|
Departamento: |
Faculdade de Informáca
|
País: |
BR
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://tede2.pucrs.br/tede2/handle/tede/5221 |
Resumo: | This work studies Word Sense Disambiguation (WSD) in the Biomedicine domain for English language, using external knowledge sources. Among the existing proposals for the selection of a sense for an ambiguous word, there is the graph-based approach. This approach uses a metric in the evaluation of graphs containing candidates to the correct sense for the ambiguous word. In this research, a set of metrics is analyzed individually, and, based on this evaluation, we propose a hybrid model for the selection of the metrics in order to determine the most adequate metric to be employed. The model makes use of a set of features and heuristics that determine a semi-supervised solution for WSD. The results obtained with experiments show an improvement in performance and reveal new perspectives of research. The proposed model raises the hit rate to 68,48%, increasing significantly in 3,52% the rate reported in literature |
id |
P_RS_724cfa18a4246b09fcdf94d6ad49f5d9 |
---|---|
oai_identifier_str |
oai:tede2.pucrs.br:tede/5221 |
network_acronym_str |
P_RS |
network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
repository_id_str |
|
spelling |
Lima, Vera Lúcia Strube deCPF:26551519091http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781127A8CPF:88892727087http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4795210P4Goulart, Rodrigo Rafael Vilarreal2015-04-14T14:50:02Z2013-06-242013-03-26GOULART, Rodrigo Rafael Vilarreal. Um modelo híbrido para o WSD em biomedicina. 2013. 76 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.http://tede2.pucrs.br/tede2/handle/tede/5221This work studies Word Sense Disambiguation (WSD) in the Biomedicine domain for English language, using external knowledge sources. Among the existing proposals for the selection of a sense for an ambiguous word, there is the graph-based approach. This approach uses a metric in the evaluation of graphs containing candidates to the correct sense for the ambiguous word. In this research, a set of metrics is analyzed individually, and, based on this evaluation, we propose a hybrid model for the selection of the metrics in order to determine the most adequate metric to be employed. The model makes use of a set of features and heuristics that determine a semi-supervised solution for WSD. The results obtained with experiments show an improvement in performance and reveal new perspectives of research. The proposed model raises the hit rate to 68,48%, increasing significantly in 3,52% the rate reported in literatureEste trabalho estuda o Word Sense Disambiguation no domínio da Biomedicina, para a língua inglesa, com uso de fontes externas de conhecimento. Dentre as propostas existentes para a seleção de um sentido para uma palavra ambígua, está a abordagem baseadas em grafos. Essa abordagem emprega uma métrica na avaliação de grafos que contêm candidatos ao sentido correto da palavra ambígua. Nesta pesquisa um conjunto de métricas é analisado individualmente e, com base nas avaliações, propõe-se um modelo híbrido de seleção de métricas com o objetivo de determinar a métrica mais adequada a ser empregada. O modelo faz uso de um conjunto de features e heurísticas que determinam uma solução semi-supervisionada para o WSD. Os resultados obtidos com experimentos apontam melhoria na performance e revelam novas perspectivas de pesquisa. O modelo proposto eleva a taxa de acerto a 68,48%, aumentando significativamente em 3,52% a taxa reportada na literaturaMade available in DSpace on 2015-04-14T14:50:02Z (GMT). No. of bitstreams: 1 448850.pdf: 2763654 bytes, checksum: 430bc12ce50b74821fe6a8aa37994260 (MD5) Previous issue date: 2013-03-26application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15395/448850.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICASEMÂNTICALINGUÍSTICA COMPUTACIONALALGORITMOS - GRAFOSBIOMEDICINACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm modelo híbrido para o WSD em biomedicinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL448850.pdf.jpg448850.pdf.jpgimage/jpeg3520http://tede2.pucrs.br/tede2/bitstream/tede/5221/3/448850.pdf.jpg286d95aed798725048380a94b166221dMD53TEXT448850.pdf.txt448850.pdf.txttext/plain171451http://tede2.pucrs.br/tede2/bitstream/tede/5221/2/448850.pdf.txt83f009a2c59cbce8e11c0da119e3539fMD52ORIGINAL448850.pdfapplication/pdf2763654http://tede2.pucrs.br/tede2/bitstream/tede/5221/1/448850.pdf430bc12ce50b74821fe6a8aa37994260MD51tede/52212015-04-17 11:57:32.017oai:tede2.pucrs.br:tede/5221Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
dc.title.por.fl_str_mv |
Um modelo híbrido para o WSD em biomedicina |
title |
Um modelo híbrido para o WSD em biomedicina |
spellingShingle |
Um modelo híbrido para o WSD em biomedicina Goulart, Rodrigo Rafael Vilarreal INFORMÁTICA SEMÂNTICA LINGUÍSTICA COMPUTACIONAL ALGORITMOS - GRAFOS BIOMEDICINA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Um modelo híbrido para o WSD em biomedicina |
title_full |
Um modelo híbrido para o WSD em biomedicina |
title_fullStr |
Um modelo híbrido para o WSD em biomedicina |
title_full_unstemmed |
Um modelo híbrido para o WSD em biomedicina |
title_sort |
Um modelo híbrido para o WSD em biomedicina |
author |
Goulart, Rodrigo Rafael Vilarreal |
author_facet |
Goulart, Rodrigo Rafael Vilarreal |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Lima, Vera Lúcia Strube de |
dc.contributor.advisor1ID.fl_str_mv |
CPF:26551519091 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781127A8 |
dc.contributor.authorID.fl_str_mv |
CPF:88892727087 |
dc.contributor.authorLattes.fl_str_mv |
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4795210P4 |
dc.contributor.author.fl_str_mv |
Goulart, Rodrigo Rafael Vilarreal |
contributor_str_mv |
Lima, Vera Lúcia Strube de |
dc.subject.por.fl_str_mv |
INFORMÁTICA SEMÂNTICA LINGUÍSTICA COMPUTACIONAL ALGORITMOS - GRAFOS BIOMEDICINA |
topic |
INFORMÁTICA SEMÂNTICA LINGUÍSTICA COMPUTACIONAL ALGORITMOS - GRAFOS BIOMEDICINA CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
This work studies Word Sense Disambiguation (WSD) in the Biomedicine domain for English language, using external knowledge sources. Among the existing proposals for the selection of a sense for an ambiguous word, there is the graph-based approach. This approach uses a metric in the evaluation of graphs containing candidates to the correct sense for the ambiguous word. In this research, a set of metrics is analyzed individually, and, based on this evaluation, we propose a hybrid model for the selection of the metrics in order to determine the most adequate metric to be employed. The model makes use of a set of features and heuristics that determine a semi-supervised solution for WSD. The results obtained with experiments show an improvement in performance and reveal new perspectives of research. The proposed model raises the hit rate to 68,48%, increasing significantly in 3,52% the rate reported in literature |
publishDate |
2013 |
dc.date.available.fl_str_mv |
2013-06-24 |
dc.date.issued.fl_str_mv |
2013-03-26 |
dc.date.accessioned.fl_str_mv |
2015-04-14T14:50:02Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
GOULART, Rodrigo Rafael Vilarreal. Um modelo híbrido para o WSD em biomedicina. 2013. 76 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013. |
dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/5221 |
identifier_str_mv |
GOULART, Rodrigo Rafael Vilarreal. Um modelo híbrido para o WSD em biomedicina. 2013. 76 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013. |
url |
http://tede2.pucrs.br/tede2/handle/tede/5221 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
1974996533081274470 |
dc.relation.confidence.fl_str_mv |
500 600 |
dc.relation.department.fl_str_mv |
1946639708616176246 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
PUCRS |
dc.publisher.country.fl_str_mv |
BR |
dc.publisher.department.fl_str_mv |
Faculdade de Informáca |
publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
instacron_str |
PUC_RS |
institution |
PUC_RS |
reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
bitstream.url.fl_str_mv |
http://tede2.pucrs.br/tede2/bitstream/tede/5221/3/448850.pdf.jpg http://tede2.pucrs.br/tede2/bitstream/tede/5221/2/448850.pdf.txt http://tede2.pucrs.br/tede2/bitstream/tede/5221/1/448850.pdf |
bitstream.checksum.fl_str_mv |
286d95aed798725048380a94b166221d 83f009a2c59cbce8e11c0da119e3539f 430bc12ce50b74821fe6a8aa37994260 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
_version_ |
1799765482756112384 |