Aprendizado automático de relações semânticas entre tags de folksonomias.
| Ano de defesa: | 2016 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | , |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Campina Grande
|
| Programa de Pós-Graduação: |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
|
| Departamento: |
Centro de Engenharia Elétrica e Informática - CEEI
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://dspace.sti.ufcg.edu.br/handle/riufcg/885 |
Resumo: | As folksonomias têm despontado como ferramentas úteis de gerenciamento online de conteúdo digital. A exemplo dos populares websites Delicious, Flickr e BibSonomy, diariamente os usuários utilizam esses sistemas para efetuar upload de recursos web (e.g., url, fotos, vídeos e referências bibliográficas) e categorizá-los por meio de tags. A ausência de relações semânticas do tipo sinonímia e hiperonímia/hiponímia no espaço de tags das folksonomias reduz a capacidade do usuário de encontrar recursos relevantes. Para mitigar esse problema, muitos trabalhos de pesquisa se apoiam na aplicação de medidas de similaridade para detecção de sinonímia e construção automática de hierarquias de tags por meio de algoritmos heurísticos. Nesta tese de doutorado, o problema de detecção de sinonímia e hiperonímia/hiponímia entre pares de tags é modelado como um problema de classificação em Aprendizado de Máquina. A partir da literatura, várias medidas de similaridade consideradas boas indicadoras de sinonímia e hiperonímia/hiponímia foram identificadas e empregadas como atributos de aprendizagem. A incidência de um severo desbalanceamento e sobreposição de classes motivou a investigação de técnicas de balanceamento para superar ambos os problemas. Resultados experimentais usando dados reais das folksonomias BibSonomy e Delicious mostraram que a abordagem proposta denominada CPDST supera em termos de acurácia o baseline de melhor desempenho nas tarefas de detecção de sinonímia e hiperonímia/hiponímia. Também, aplicou-se a abordagem CPDST no contexto de geração de listas de tags semanticamente relacionadas, com o intuito de prover acesso a recursos adicionais anotados com outros conceitos pertencentes ao domínio da busca. Além da abordagem CPDST, foram propostos dois algoritmos fundamentados no acesso ao WordNet e ConceptNet para sugestão de listas especializadas com tags sinônimas e hipônimas. O resultado de uma avaliação quantitativa demonstrou que a abordagem CPDST provê listas de tags relevantes em relação às listas providas pelos métodos comparados. |
| id |
UFCG_58d5de2a9ddeac6e7080e20f02d8c8ee |
|---|---|
| oai_identifier_str |
oai:dspace.sti.ufcg.edu.br:riufcg/885 |
| network_acronym_str |
UFCG |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| repository_id_str |
|
| spelling |
MARINHO, Leandro Balby.MARINHO, L. B.http://lattes.cnpq.br/3728312501032061PIRES, Carlos Eduardo Santos.PIRES, C. E. S.http://lattes.cnpq.br/4986021622366786RÊGO, A. S. C.http://lattes.cnpq.br/1582109846489096RÊGO, Alex Sandro da Cunha.As folksonomias têm despontado como ferramentas úteis de gerenciamento online de conteúdo digital. A exemplo dos populares websites Delicious, Flickr e BibSonomy, diariamente os usuários utilizam esses sistemas para efetuar upload de recursos web (e.g., url, fotos, vídeos e referências bibliográficas) e categorizá-los por meio de tags. A ausência de relações semânticas do tipo sinonímia e hiperonímia/hiponímia no espaço de tags das folksonomias reduz a capacidade do usuário de encontrar recursos relevantes. Para mitigar esse problema, muitos trabalhos de pesquisa se apoiam na aplicação de medidas de similaridade para detecção de sinonímia e construção automática de hierarquias de tags por meio de algoritmos heurísticos. Nesta tese de doutorado, o problema de detecção de sinonímia e hiperonímia/hiponímia entre pares de tags é modelado como um problema de classificação em Aprendizado de Máquina. A partir da literatura, várias medidas de similaridade consideradas boas indicadoras de sinonímia e hiperonímia/hiponímia foram identificadas e empregadas como atributos de aprendizagem. A incidência de um severo desbalanceamento e sobreposição de classes motivou a investigação de técnicas de balanceamento para superar ambos os problemas. Resultados experimentais usando dados reais das folksonomias BibSonomy e Delicious mostraram que a abordagem proposta denominada CPDST supera em termos de acurácia o baseline de melhor desempenho nas tarefas de detecção de sinonímia e hiperonímia/hiponímia. Também, aplicou-se a abordagem CPDST no contexto de geração de listas de tags semanticamente relacionadas, com o intuito de prover acesso a recursos adicionais anotados com outros conceitos pertencentes ao domínio da busca. Além da abordagem CPDST, foram propostos dois algoritmos fundamentados no acesso ao WordNet e ConceptNet para sugestão de listas especializadas com tags sinônimas e hipônimas. O resultado de uma avaliação quantitativa demonstrou que a abordagem CPDST provê listas de tags relevantes em relação às listas providas pelos métodos comparados.Folksonomies have emerged as useful tools for online management of digital content. Popular websites as Delicious, Flickr and BibSonomy are now widespread with thousands of users using them daily to upload digital content (e.g., webpages, photos, videos and bibliographic information) and tagging for later retrieval. The lack of semantic relations such as synonym and hypernym/hyponym in the tag space may diminish the ability of users in finding relevant resources. Many research works in the literature employ similarity measures to detect synonymy and to build hierarchies of tags automatically by means of heuristic algorithms. In this thesis, the problems of synonym and subsumption detection between pairs of tags are cast as a pairwise classification problem. From the literature, several similarity measures that are good indicators of synonymy and subsumption were identified, which are used as learning features. Under this setting, there is a severe class imbalance and class overlapping which motivated us to investigate and employ class imbalance techniques to overcome these problems. A comprehensive set of experiments were conducted on two large real-world datasets of BibSonomy and Delicious systems, showing that the proposed approach named CPDST outperforms the best performing heuristic-based baseline in the tasks of synonym and subsumption detection. CPDST is also applied in the context of tag list generation for providing access to additional resources annotated with other semantically related tags. Besides CPDST approach, two algorithms based on WordNet and ConceptNet accesses are proposed for capturing specifically synonyms and hyponyms. The outcome of an evaluative quantitative analysis showed that CPDST approach yields relevant tag lists in relation to the produced ones by the compared methods.Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2018-06-05T14:49:44Z No. of bitstreams: 1 ALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdf: 1783053 bytes, checksum: 4ae3b5d42dde739cfd57afaa25fd7e63 (MD5)Made available in DSpace on 2018-06-05T14:49:44Z (GMT). No. of bitstreams: 1 ALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdf: 1783053 bytes, checksum: 4ae3b5d42dde739cfd57afaa25fd7e63 (MD5) Previous issue date: 2016Universidade Federal de Campina GrandePÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiênciasCiência da ComputaçãoFolksonomiaRelações SemânticasAprendizado de MáquinaSimilaridade SemânticaSinonímiaHiperonímiaHiponímiaFolksonomySemantic RelationsMachine LearningSemantic SimilaritySynonymyHypernymyHyponymyAprendizado automático de relações semânticas entre tags de folksonomias.20162018-06-05T14:49:44Z2018-06-052018-06-05T14:49:44Zhttps://dspace.sti.ufcg.edu.br/handle/riufcg/885RÊGO, A. S. da C. Aprendizado automático de relações semânticas entre tags de folksonomias. 2016. 167 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2016. https://dspace.sti.ufcg.edu.br/handle/riufcg/885info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGTEXTALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdf.txtALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdf.txttext/plain378058https://dspace.sti.ufcg.edu.br/bitstream/riufcg/885/2/ALEX+SANDRO+DA+CUNHA+R%C3%8AGO+-+TESE+%28PPGCC%29+2016.pdf.txt9d72fdf71f3672dd5cee480c099691f5MD52ORIGINALALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdfALEX SANDRO DA CUNHA RÊGO - TESE (PPGCC) 2016.pdfapplication/pdf3767861https://dspace.sti.ufcg.edu.br/bitstream/riufcg/885/1/ALEX+SANDRO+DA+CUNHA+R%C3%8AGO+-+TESE+%28PPGCC%29+2016.pdf763ca9b27169fb6fea11848529f3fc9fMD51riufcg/8852025-07-24 03:15:27.037oai:dspace.sti.ufcg.edu.br:riufcg/885Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-07-24T06:15:27Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
| dc.title.pt_BR.fl_str_mv |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| title |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| spellingShingle |
Aprendizado automático de relações semânticas entre tags de folksonomias. RÊGO, Alex Sandro da Cunha. Ciências Ciência da Computação Folksonomia Relações Semânticas Aprendizado de Máquina Similaridade Semântica Sinonímia Hiperonímia Hiponímia Folksonomy Semantic Relations Machine Learning Semantic Similarity Synonymy Hypernymy Hyponymy |
| title_short |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| title_full |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| title_fullStr |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| title_full_unstemmed |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| title_sort |
Aprendizado automático de relações semânticas entre tags de folksonomias. |
| author |
RÊGO, Alex Sandro da Cunha. |
| author_facet |
RÊGO, Alex Sandro da Cunha. |
| author_role |
author |
| dc.contributor.advisor2ID.pt_BR.fl_str_mv |
PIRES, C. E. S. |
| dc.contributor.advisor1.fl_str_mv |
MARINHO, Leandro Balby. |
| dc.contributor.advisor1ID.fl_str_mv |
MARINHO, L. B. |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3728312501032061 |
| dc.contributor.advisor2.fl_str_mv |
PIRES, Carlos Eduardo Santos. |
| dc.contributor.advisor2Lattes.fl_str_mv |
http://lattes.cnpq.br/4986021622366786 |
| dc.contributor.authorID.fl_str_mv |
RÊGO, A. S. C. |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/1582109846489096 |
| dc.contributor.author.fl_str_mv |
RÊGO, Alex Sandro da Cunha. |
| contributor_str_mv |
MARINHO, Leandro Balby. PIRES, Carlos Eduardo Santos. |
| dc.subject.cnpq.fl_str_mv |
Ciências Ciência da Computação |
| topic |
Ciências Ciência da Computação Folksonomia Relações Semânticas Aprendizado de Máquina Similaridade Semântica Sinonímia Hiperonímia Hiponímia Folksonomy Semantic Relations Machine Learning Semantic Similarity Synonymy Hypernymy Hyponymy |
| dc.subject.por.fl_str_mv |
Folksonomia Relações Semânticas Aprendizado de Máquina Similaridade Semântica Sinonímia Hiperonímia Hiponímia Folksonomy Semantic Relations Machine Learning Semantic Similarity Synonymy Hypernymy Hyponymy |
| description |
As folksonomias têm despontado como ferramentas úteis de gerenciamento online de conteúdo digital. A exemplo dos populares websites Delicious, Flickr e BibSonomy, diariamente os usuários utilizam esses sistemas para efetuar upload de recursos web (e.g., url, fotos, vídeos e referências bibliográficas) e categorizá-los por meio de tags. A ausência de relações semânticas do tipo sinonímia e hiperonímia/hiponímia no espaço de tags das folksonomias reduz a capacidade do usuário de encontrar recursos relevantes. Para mitigar esse problema, muitos trabalhos de pesquisa se apoiam na aplicação de medidas de similaridade para detecção de sinonímia e construção automática de hierarquias de tags por meio de algoritmos heurísticos. Nesta tese de doutorado, o problema de detecção de sinonímia e hiperonímia/hiponímia entre pares de tags é modelado como um problema de classificação em Aprendizado de Máquina. A partir da literatura, várias medidas de similaridade consideradas boas indicadoras de sinonímia e hiperonímia/hiponímia foram identificadas e empregadas como atributos de aprendizagem. A incidência de um severo desbalanceamento e sobreposição de classes motivou a investigação de técnicas de balanceamento para superar ambos os problemas. Resultados experimentais usando dados reais das folksonomias BibSonomy e Delicious mostraram que a abordagem proposta denominada CPDST supera em termos de acurácia o baseline de melhor desempenho nas tarefas de detecção de sinonímia e hiperonímia/hiponímia. Também, aplicou-se a abordagem CPDST no contexto de geração de listas de tags semanticamente relacionadas, com o intuito de prover acesso a recursos adicionais anotados com outros conceitos pertencentes ao domínio da busca. Além da abordagem CPDST, foram propostos dois algoritmos fundamentados no acesso ao WordNet e ConceptNet para sugestão de listas especializadas com tags sinônimas e hipônimas. O resultado de uma avaliação quantitativa demonstrou que a abordagem CPDST provê listas de tags relevantes em relação às listas providas pelos métodos comparados. |
| publishDate |
2016 |
| dc.date.issued.fl_str_mv |
2016 |
| dc.date.accessioned.fl_str_mv |
2018-06-05T14:49:44Z |
| dc.date.available.fl_str_mv |
2018-06-05 2018-06-05T14:49:44Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://dspace.sti.ufcg.edu.br/handle/riufcg/885 |
| dc.identifier.citation.fl_str_mv |
RÊGO, A. S. da C. Aprendizado automático de relações semânticas entre tags de folksonomias. 2016. 167 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2016. https://dspace.sti.ufcg.edu.br/handle/riufcg/885 |
| url |
https://dspace.sti.ufcg.edu.br/handle/riufcg/885 |
| identifier_str_mv |
RÊGO, A. S. da C. Aprendizado automático de relações semânticas entre tags de folksonomias. 2016. 167 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2016. https://dspace.sti.ufcg.edu.br/handle/riufcg/885 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
| dc.publisher.program.fl_str_mv |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
| dc.publisher.initials.fl_str_mv |
UFCG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Centro de Engenharia Elétrica e Informática - CEEI |
| publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
| instname_str |
Universidade Federal de Campina Grande (UFCG) |
| instacron_str |
UFCG |
| institution |
UFCG |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
| bitstream.url.fl_str_mv |
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/885/2/ALEX+SANDRO+DA+CUNHA+R%C3%8AGO+-+TESE+%28PPGCC%29+2016.pdf.txt https://dspace.sti.ufcg.edu.br/bitstream/riufcg/885/1/ALEX+SANDRO+DA+CUNHA+R%C3%8AGO+-+TESE+%28PPGCC%29+2016.pdf |
| bitstream.checksum.fl_str_mv |
9d72fdf71f3672dd5cee480c099691f5 763ca9b27169fb6fea11848529f3fc9f |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
| repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
| _version_ |
1863363382460022784 |