Enriching portuguese word embeddings with visual information
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://tede2.pucrs.br/tede2/handle/tede/9684 |
Resumo: | This dissertation focuses on the enrichment of existing Portuguese word embeddings with visual information in the form of visual embeddings. This information was extracted from images portraying given vocabulary terms and imagined visual embeddings learned for terms with not image data. These enriched embeddings were tested against their text-only counterparts in common NLP tasks, namely: word relatedness, analogy prediction, named entity recognition, and sentence similarity. These tasks were used to ascertain whether the enrichment has an impact on the embedding’s performance the above mentioned tasks. The results show an increase in performance for several tasks, which indicates that visual information fusion for word embeddings can be useful for word embedding based NLP tasks. |
| id |
P_RS_be7dc1dce781365d4f0ee3dadbc4f701 |
|---|---|
| oai_identifier_str |
oai:tede2.pucrs.br:tede/9684 |
| network_acronym_str |
P_RS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository_id_str |
|
| spelling |
Enriching portuguese word embeddings with visual informationEnriquecendo os embeddings de palavras em português com informações visuaisWord EmbeddingsMultimodalPortugueseGeosciencesNamed Entity RecognitionSentence SimilarityWord RelatednessPortuguêsGeociênciasReconhecimento de Entidades NomeadasSimilaridade de SentençasRelacionamento de PalavrasCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOThis dissertation focuses on the enrichment of existing Portuguese word embeddings with visual information in the form of visual embeddings. This information was extracted from images portraying given vocabulary terms and imagined visual embeddings learned for terms with not image data. These enriched embeddings were tested against their text-only counterparts in common NLP tasks, namely: word relatedness, analogy prediction, named entity recognition, and sentence similarity. These tasks were used to ascertain whether the enrichment has an impact on the embedding’s performance the above mentioned tasks. The results show an increase in performance for several tasks, which indicates that visual information fusion for word embeddings can be useful for word embedding based NLP tasks.Essa dissertação foca no enriquecimento de word embeddings pré-treinados na língua Portuguesa com o uso de informações visuais. Essas informações foram extraídas de imagens retratando certos termos do vocabulário e embeddings visuais "imaginadas" para termos sem dados de imagem. Essas embeddings enriquecidas foram testadas contra seus modelos textuais originais em tarefas comuns de PLN, sendo elas: relação entre palavras, predição de analogias, reconhecimento de entidades nomeadas e similaridade de sentenças. Essas tarefas foram utilizadas para descobrir se o enriquecimento tem impacto sobre a performance dos embeddings nas tarefas em questão. Os resultados demonstram um aumento de desempenho para algumas tarefas, o que indica que o enriquecimento com dados visuais é útil para tarefas de PLN baseadas em word embeddings.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESPontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoVieira, RenataConsoli, Bernardo Scapini2021-06-08T17:14:30Z2021-03-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/9684enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2021-06-08T23:00:14Zoai:tede2.pucrs.br:tede/9684Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2021-06-08T23:00:14Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
| dc.title.none.fl_str_mv |
Enriching portuguese word embeddings with visual information Enriquecendo os embeddings de palavras em português com informações visuais |
| title |
Enriching portuguese word embeddings with visual information |
| spellingShingle |
Enriching portuguese word embeddings with visual information Consoli, Bernardo Scapini Word Embeddings Multimodal Portuguese Geosciences Named Entity Recognition Sentence Similarity Word Relatedness Português Geociências Reconhecimento de Entidades Nomeadas Similaridade de Sentenças Relacionamento de Palavras CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| title_short |
Enriching portuguese word embeddings with visual information |
| title_full |
Enriching portuguese word embeddings with visual information |
| title_fullStr |
Enriching portuguese word embeddings with visual information |
| title_full_unstemmed |
Enriching portuguese word embeddings with visual information |
| title_sort |
Enriching portuguese word embeddings with visual information |
| author |
Consoli, Bernardo Scapini |
| author_facet |
Consoli, Bernardo Scapini |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Vieira, Renata |
| dc.contributor.author.fl_str_mv |
Consoli, Bernardo Scapini |
| dc.subject.por.fl_str_mv |
Word Embeddings Multimodal Portuguese Geosciences Named Entity Recognition Sentence Similarity Word Relatedness Português Geociências Reconhecimento de Entidades Nomeadas Similaridade de Sentenças Relacionamento de Palavras CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| topic |
Word Embeddings Multimodal Portuguese Geosciences Named Entity Recognition Sentence Similarity Word Relatedness Português Geociências Reconhecimento de Entidades Nomeadas Similaridade de Sentenças Relacionamento de Palavras CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| description |
This dissertation focuses on the enrichment of existing Portuguese word embeddings with visual information in the form of visual embeddings. This information was extracted from images portraying given vocabulary terms and imagined visual embeddings learned for terms with not image data. These enriched embeddings were tested against their text-only counterparts in common NLP tasks, namely: word relatedness, analogy prediction, named entity recognition, and sentence similarity. These tasks were used to ascertain whether the enrichment has an impact on the embedding’s performance the above mentioned tasks. The results show an increase in performance for several tasks, which indicates that visual information fusion for word embeddings can be useful for word embedding based NLP tasks. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-06-08T17:14:30Z 2021-03-19 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/9684 |
| url |
http://tede2.pucrs.br/tede2/handle/tede/9684 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
| instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| instacron_str |
PUC_RS |
| institution |
PUC_RS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
| _version_ |
1850041303546462208 |