Detecção não supervisionada de posicionamento em textos de tweets

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Dias, Marcelo dos Santos
Orientador(a): Becker, Karin
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/169098
Resumo: Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio.
id URGS_29f1674c1509a4296decbcaf5668236a
oai_identifier_str oai:www.lume.ufrgs.br:10183/169098
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Dias, Marcelo dos SantosBecker, Karin2017-10-03T02:27:23Z2017http://hdl.handle.net/10183/169098001047919Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio.Stance Detection is the task of automatically identifying if the author of a text is in favor of the given target, against the given target, or whether neither inference is likely. With the wide use of Twitter as a platform to express opinions and stances, the automatic analysis of this content becomes of high regard for companies, organizations and public figures. In general, works that explore such task adopt supervised or semi-supervised approaches. The present work proposes and evaluates a non-supervised process to detect stance in texts of tweets that has as entry only the target and a set of tweets to classify and is based on a hybrid approach composed by 2 stages: a) automatic labelling of tweets based on a set of heuristics and b) complementary classification based on supervised machine learning. The proposal succeeds when applied to public figures, overcoming the state-of-the-art. Beyond that, some alternatives are evaluated with the intention of increasing the performance when applied to other domains, revealing the possibility of use of strategies such as using seed targets and profiles depending on each domain characteristics.application/pdfporRecuperacao : InformacaoTwitterAnálise de dadosSentiment AnalysisAutomatic labellingStance DetectionDetecção não supervisionada de posicionamento em textos de tweetsUnsupervised stance detection in texts of tweets info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2017mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001047919.pdf001047919.pdfTexto completoapplication/pdf1062164http://www.lume.ufrgs.br/bitstream/10183/169098/1/001047919.pdf8c61442a7706f98031a967814e878fb1MD51TEXT001047919.pdf.txt001047919.pdf.txtExtracted Texttext/plain179773http://www.lume.ufrgs.br/bitstream/10183/169098/2/001047919.pdf.txt58247408a55a3759f2ef73756c2618beMD52THUMBNAIL001047919.pdf.jpg001047919.pdf.jpgGenerated Thumbnailimage/jpeg1045http://www.lume.ufrgs.br/bitstream/10183/169098/3/001047919.pdf.jpg2ff90c0f8c4618062aec44e5b601bb82MD5310183/1690982018-10-29 08:21:42.435oai:www.lume.ufrgs.br:10183/169098Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-29T11:21:42Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Detecção não supervisionada de posicionamento em textos de tweets
dc.title.alternative.en.fl_str_mv Unsupervised stance detection in texts of tweets
title Detecção não supervisionada de posicionamento em textos de tweets
spellingShingle Detecção não supervisionada de posicionamento em textos de tweets
Dias, Marcelo dos Santos
Recuperacao : Informacao
Twitter
Análise de dados
Sentiment Analysis
Automatic labelling
Stance Detection
title_short Detecção não supervisionada de posicionamento em textos de tweets
title_full Detecção não supervisionada de posicionamento em textos de tweets
title_fullStr Detecção não supervisionada de posicionamento em textos de tweets
title_full_unstemmed Detecção não supervisionada de posicionamento em textos de tweets
title_sort Detecção não supervisionada de posicionamento em textos de tweets
author Dias, Marcelo dos Santos
author_facet Dias, Marcelo dos Santos
author_role author
dc.contributor.author.fl_str_mv Dias, Marcelo dos Santos
dc.contributor.advisor1.fl_str_mv Becker, Karin
contributor_str_mv Becker, Karin
dc.subject.por.fl_str_mv Recuperacao : Informacao
Twitter
Análise de dados
topic Recuperacao : Informacao
Twitter
Análise de dados
Sentiment Analysis
Automatic labelling
Stance Detection
dc.subject.eng.fl_str_mv Sentiment Analysis
Automatic labelling
Stance Detection
description Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio.
publishDate 2017
dc.date.accessioned.fl_str_mv 2017-10-03T02:27:23Z
dc.date.issued.fl_str_mv 2017
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/169098
dc.identifier.nrb.pt_BR.fl_str_mv 001047919
url http://hdl.handle.net/10183/169098
identifier_str_mv 001047919
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/169098/1/001047919.pdf
http://www.lume.ufrgs.br/bitstream/10183/169098/2/001047919.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/169098/3/001047919.pdf.jpg
bitstream.checksum.fl_str_mv 8c61442a7706f98031a967814e878fb1
58247408a55a3759f2ef73756c2618be
2ff90c0f8c4618062aec44e5b601bb82
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br||lume@ufrgs.br
_version_ 1831316027671052288