Detecção não supervisionada de posicionamento em textos de tweets
| Ano de defesa: | 2017 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Link de acesso: | http://hdl.handle.net/10183/169098 |
Resumo: | Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio. |
| id |
URGS_29f1674c1509a4296decbcaf5668236a |
|---|---|
| oai_identifier_str |
oai:www.lume.ufrgs.br:10183/169098 |
| network_acronym_str |
URGS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| repository_id_str |
|
| spelling |
Dias, Marcelo dos SantosBecker, Karin2017-10-03T02:27:23Z2017http://hdl.handle.net/10183/169098001047919Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio.Stance Detection is the task of automatically identifying if the author of a text is in favor of the given target, against the given target, or whether neither inference is likely. With the wide use of Twitter as a platform to express opinions and stances, the automatic analysis of this content becomes of high regard for companies, organizations and public figures. In general, works that explore such task adopt supervised or semi-supervised approaches. The present work proposes and evaluates a non-supervised process to detect stance in texts of tweets that has as entry only the target and a set of tweets to classify and is based on a hybrid approach composed by 2 stages: a) automatic labelling of tweets based on a set of heuristics and b) complementary classification based on supervised machine learning. The proposal succeeds when applied to public figures, overcoming the state-of-the-art. Beyond that, some alternatives are evaluated with the intention of increasing the performance when applied to other domains, revealing the possibility of use of strategies such as using seed targets and profiles depending on each domain characteristics.application/pdfporRecuperacao : InformacaoTwitterAnálise de dadosSentiment AnalysisAutomatic labellingStance DetectionDetecção não supervisionada de posicionamento em textos de tweetsUnsupervised stance detection in texts of tweets info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2017mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL001047919.pdf001047919.pdfTexto completoapplication/pdf1062164http://www.lume.ufrgs.br/bitstream/10183/169098/1/001047919.pdf8c61442a7706f98031a967814e878fb1MD51TEXT001047919.pdf.txt001047919.pdf.txtExtracted Texttext/plain179773http://www.lume.ufrgs.br/bitstream/10183/169098/2/001047919.pdf.txt58247408a55a3759f2ef73756c2618beMD52THUMBNAIL001047919.pdf.jpg001047919.pdf.jpgGenerated Thumbnailimage/jpeg1045http://www.lume.ufrgs.br/bitstream/10183/169098/3/001047919.pdf.jpg2ff90c0f8c4618062aec44e5b601bb82MD5310183/1690982018-10-29 08:21:42.435oai:www.lume.ufrgs.br:10183/169098Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br||lume@ufrgs.bropendoar:18532018-10-29T11:21:42Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
| dc.title.pt_BR.fl_str_mv |
Detecção não supervisionada de posicionamento em textos de tweets |
| dc.title.alternative.en.fl_str_mv |
Unsupervised stance detection in texts of tweets |
| title |
Detecção não supervisionada de posicionamento em textos de tweets |
| spellingShingle |
Detecção não supervisionada de posicionamento em textos de tweets Dias, Marcelo dos Santos Recuperacao : Informacao Análise de dados Sentiment Analysis Automatic labelling Stance Detection |
| title_short |
Detecção não supervisionada de posicionamento em textos de tweets |
| title_full |
Detecção não supervisionada de posicionamento em textos de tweets |
| title_fullStr |
Detecção não supervisionada de posicionamento em textos de tweets |
| title_full_unstemmed |
Detecção não supervisionada de posicionamento em textos de tweets |
| title_sort |
Detecção não supervisionada de posicionamento em textos de tweets |
| author |
Dias, Marcelo dos Santos |
| author_facet |
Dias, Marcelo dos Santos |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Dias, Marcelo dos Santos |
| dc.contributor.advisor1.fl_str_mv |
Becker, Karin |
| contributor_str_mv |
Becker, Karin |
| dc.subject.por.fl_str_mv |
Recuperacao : Informacao Análise de dados |
| topic |
Recuperacao : Informacao Análise de dados Sentiment Analysis Automatic labelling Stance Detection |
| dc.subject.eng.fl_str_mv |
Sentiment Analysis Automatic labelling Stance Detection |
| description |
Detecção de posicionamento é a tarefa de automaticamente identificar se o autor de um texto é favorável, contrário, ou nem favorável e nem contrário a uma dada proposição ou alvo. Com o amplo uso do Twitter como plataforma para expressar opiniões e posicionamentos, a análise automatizada deste conteúdo torna-se de grande valia para empresas, organizações e figuras públicas. Em geral, os trabalhos que exploram tal tarefa adotam abordagens supervisionadas ou semi-supervisionadas. O presente trabalho propõe e avalia um processo não supervisionado de detecção de posicionamento em textos de tweets que tem como entrada apenas o alvo e um conjunto de tweets a rotular e é baseado em uma abordagem híbrida composta por 2 etapas: a) rotulação automática de tweets baseada em um conjunto de heurísticas e b) classificação complementar baseada em aprendizado supervisionado de máquina. A proposta tem êxito quando aplicada a figuras públicas, superando o estado-da-arte. Além disso, são avaliadas alternativas no intuito de melhorar seu desempenho quando aplicada a outros domínios, revelando a possibilidade de se empregar estratégias tais como o uso de alvos e perfis semente dependendo das características de cada domínio. |
| publishDate |
2017 |
| dc.date.accessioned.fl_str_mv |
2017-10-03T02:27:23Z |
| dc.date.issued.fl_str_mv |
2017 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/169098 |
| dc.identifier.nrb.pt_BR.fl_str_mv |
001047919 |
| url |
http://hdl.handle.net/10183/169098 |
| identifier_str_mv |
001047919 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
| instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
| instacron_str |
UFRGS |
| institution |
UFRGS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| collection |
Biblioteca Digital de Teses e Dissertações da UFRGS |
| bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/169098/1/001047919.pdf http://www.lume.ufrgs.br/bitstream/10183/169098/2/001047919.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/169098/3/001047919.pdf.jpg |
| bitstream.checksum.fl_str_mv |
8c61442a7706f98031a967814e878fb1 58247408a55a3759f2ef73756c2618be 2ff90c0f8c4618062aec44e5b601bb82 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
| repository.mail.fl_str_mv |
lume@ufrgs.br||lume@ufrgs.br |
| _version_ |
1831316027671052288 |