Um modelo híbrido para o WSD em biomedicina

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Goulart, Rodrigo Rafael Vilarreal lattes
Orientador(a): Lima, Vera Lúcia Strube de lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Faculdade de Informáca
País: BR
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/5221
Resumo: This work studies Word Sense Disambiguation (WSD) in the Biomedicine domain for English language, using external knowledge sources. Among the existing proposals for the selection of a sense for an ambiguous word, there is the graph-based approach. This approach uses a metric in the evaluation of graphs containing candidates to the correct sense for the ambiguous word. In this research, a set of metrics is analyzed individually, and, based on this evaluation, we propose a hybrid model for the selection of the metrics in order to determine the most adequate metric to be employed. The model makes use of a set of features and heuristics that determine a semi-supervised solution for WSD. The results obtained with experiments show an improvement in performance and reveal new perspectives of research. The proposed model raises the hit rate to 68,48%, increasing significantly in 3,52% the rate reported in literature
id P_RS_724cfa18a4246b09fcdf94d6ad49f5d9
oai_identifier_str oai:tede2.pucrs.br:tede/5221
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Lima, Vera Lúcia Strube deCPF:26551519091http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781127A8CPF:88892727087http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4795210P4Goulart, Rodrigo Rafael Vilarreal2015-04-14T14:50:02Z2013-06-242013-03-26GOULART, Rodrigo Rafael Vilarreal. Um modelo híbrido para o WSD em biomedicina. 2013. 76 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.http://tede2.pucrs.br/tede2/handle/tede/5221This work studies Word Sense Disambiguation (WSD) in the Biomedicine domain for English language, using external knowledge sources. Among the existing proposals for the selection of a sense for an ambiguous word, there is the graph-based approach. This approach uses a metric in the evaluation of graphs containing candidates to the correct sense for the ambiguous word. In this research, a set of metrics is analyzed individually, and, based on this evaluation, we propose a hybrid model for the selection of the metrics in order to determine the most adequate metric to be employed. The model makes use of a set of features and heuristics that determine a semi-supervised solution for WSD. The results obtained with experiments show an improvement in performance and reveal new perspectives of research. The proposed model raises the hit rate to 68,48%, increasing significantly in 3,52% the rate reported in literatureEste trabalho estuda o Word Sense Disambiguation no domínio da Biomedicina, para a língua inglesa, com uso de fontes externas de conhecimento. Dentre as propostas existentes para a seleção de um sentido para uma palavra ambígua, está a abordagem baseadas em grafos. Essa abordagem emprega uma métrica na avaliação de grafos que contêm candidatos ao sentido correto da palavra ambígua. Nesta pesquisa um conjunto de métricas é analisado individualmente e, com base nas avaliações, propõe-se um modelo híbrido de seleção de métricas com o objetivo de determinar a métrica mais adequada a ser empregada. O modelo faz uso de um conjunto de features e heurísticas que determinam uma solução semi-supervisionada para o WSD. Os resultados obtidos com experimentos apontam melhoria na performance e revelam novas perspectivas de pesquisa. O modelo proposto eleva a taxa de acerto a 68,48%, aumentando significativamente em 3,52% a taxa reportada na literaturaMade available in DSpace on 2015-04-14T14:50:02Z (GMT). No. of bitstreams: 1 448850.pdf: 2763654 bytes, checksum: 430bc12ce50b74821fe6a8aa37994260 (MD5) Previous issue date: 2013-03-26application/pdfhttp://tede2.pucrs.br:80/tede2/retrieve/15395/448850.pdf.jpgporPontifícia Universidade Católica do Rio Grande do SulPrograma de Pós-Graduação em Ciência da ComputaçãoPUCRSBRFaculdade de InformácaINFORMÁTICASEMÂNTICALINGUÍSTICA COMPUTACIONALALGORITMOS - GRAFOSBIOMEDICINACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOUm modelo híbrido para o WSD em biomedicinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis19749965330812744705006001946639708616176246info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RSTHUMBNAIL448850.pdf.jpg448850.pdf.jpgimage/jpeg3520http://tede2.pucrs.br/tede2/bitstream/tede/5221/3/448850.pdf.jpg286d95aed798725048380a94b166221dMD53TEXT448850.pdf.txt448850.pdf.txttext/plain171451http://tede2.pucrs.br/tede2/bitstream/tede/5221/2/448850.pdf.txt83f009a2c59cbce8e11c0da119e3539fMD52ORIGINAL448850.pdfapplication/pdf2763654http://tede2.pucrs.br/tede2/bitstream/tede/5221/1/448850.pdf430bc12ce50b74821fe6a8aa37994260MD51tede/52212015-04-17 11:57:32.017oai:tede2.pucrs.br:tede/5221Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2015-04-17T14:57:32Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.por.fl_str_mv Um modelo híbrido para o WSD em biomedicina
title Um modelo híbrido para o WSD em biomedicina
spellingShingle Um modelo híbrido para o WSD em biomedicina
Goulart, Rodrigo Rafael Vilarreal
INFORMÁTICA
SEMÂNTICA
LINGUÍSTICA COMPUTACIONAL
ALGORITMOS - GRAFOS
BIOMEDICINA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Um modelo híbrido para o WSD em biomedicina
title_full Um modelo híbrido para o WSD em biomedicina
title_fullStr Um modelo híbrido para o WSD em biomedicina
title_full_unstemmed Um modelo híbrido para o WSD em biomedicina
title_sort Um modelo híbrido para o WSD em biomedicina
author Goulart, Rodrigo Rafael Vilarreal
author_facet Goulart, Rodrigo Rafael Vilarreal
author_role author
dc.contributor.advisor1.fl_str_mv Lima, Vera Lúcia Strube de
dc.contributor.advisor1ID.fl_str_mv CPF:26551519091
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781127A8
dc.contributor.authorID.fl_str_mv CPF:88892727087
dc.contributor.authorLattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4795210P4
dc.contributor.author.fl_str_mv Goulart, Rodrigo Rafael Vilarreal
contributor_str_mv Lima, Vera Lúcia Strube de
dc.subject.por.fl_str_mv INFORMÁTICA
SEMÂNTICA
LINGUÍSTICA COMPUTACIONAL
ALGORITMOS - GRAFOS
BIOMEDICINA
topic INFORMÁTICA
SEMÂNTICA
LINGUÍSTICA COMPUTACIONAL
ALGORITMOS - GRAFOS
BIOMEDICINA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This work studies Word Sense Disambiguation (WSD) in the Biomedicine domain for English language, using external knowledge sources. Among the existing proposals for the selection of a sense for an ambiguous word, there is the graph-based approach. This approach uses a metric in the evaluation of graphs containing candidates to the correct sense for the ambiguous word. In this research, a set of metrics is analyzed individually, and, based on this evaluation, we propose a hybrid model for the selection of the metrics in order to determine the most adequate metric to be employed. The model makes use of a set of features and heuristics that determine a semi-supervised solution for WSD. The results obtained with experiments show an improvement in performance and reveal new perspectives of research. The proposed model raises the hit rate to 68,48%, increasing significantly in 3,52% the rate reported in literature
publishDate 2013
dc.date.available.fl_str_mv 2013-06-24
dc.date.issued.fl_str_mv 2013-03-26
dc.date.accessioned.fl_str_mv 2015-04-14T14:50:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv GOULART, Rodrigo Rafael Vilarreal. Um modelo híbrido para o WSD em biomedicina. 2013. 76 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/5221
identifier_str_mv GOULART, Rodrigo Rafael Vilarreal. Um modelo híbrido para o WSD em biomedicina. 2013. 76 f. Tese (Doutorado em Ciência da Computação) - Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2013.
url http://tede2.pucrs.br/tede2/handle/tede/5221
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 1974996533081274470
dc.relation.confidence.fl_str_mv 500
600
dc.relation.department.fl_str_mv 1946639708616176246
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv PUCRS
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Faculdade de Informáca
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
bitstream.url.fl_str_mv http://tede2.pucrs.br/tede2/bitstream/tede/5221/3/448850.pdf.jpg
http://tede2.pucrs.br/tede2/bitstream/tede/5221/2/448850.pdf.txt
http://tede2.pucrs.br/tede2/bitstream/tede/5221/1/448850.pdf
bitstream.checksum.fl_str_mv 286d95aed798725048380a94b166221d
83f009a2c59cbce8e11c0da119e3539f
430bc12ce50b74821fe6a8aa37994260
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1799765482756112384