Análise adaptativa de fluxos de sentimento

Detalhes bibliográficos
Ano de defesa: 2012
Autor(a) principal: Ismael Santana Silva
Orientador(a): Renato Antonio Celso Ferreira
Banca de defesa: Gisele Lobo Pappa, Nivio Ziviani, Wagner Meira Junior
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/ESBF-8SVFPH
Resumo: Nos últimos anos, a tarefa de análise de sentimentos tem atraído o interesse de pesquisadores de aprendizado de máquina. Esse interesse tem crescido significativamente devido o grande volume de conteúdo opinativo gerado e compartilhado através das mídias sociais online. Considerando os benefícios de conhecer o sentimento da população em relação a diferentes tópicos e entidades, a análise deste conteúdo, gerado pelas mídias sociais, se faz uma tarefa promissora e necessária. Muitas técnicas de classificação automática têm sido utilizadas para realizar a análise de sentimento, contudo é consenso que o modelo de chegada de mensagens a partir de mídias sociais segue o paradigma de fluxo de dados e as técnicas de classificação tradicionais não estão adequadas para tratar as características especificas deste fluxo de sentimento que é criado. Entre os desafios impostos às técnicas classificação podemos destacar: (1) o concept drift (i.e., constantes mudanças nas características dos dados, que neste trabalho foi abordado como sentiment drift), (2) a necessidade de atualização em tempo real do modelo de classificação a partir de mensagens mais recentes e (3) a limitação de tempo de computação e dados para treinamento, o que torna ainda mais difícil os dois primeiros desafios citados.
id UFMG_c85e856840f40eebf94008758c7eb78d
oai_identifier_str oai:repositorio.ufmg.br:1843/ESBF-8SVFPH
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Renato Antonio Celso FerreiraAdriano Alonso VelosoGisele Lobo PappaNivio ZivianiWagner Meira JuniorIsmael Santana Silva2019-08-13T17:19:45Z2019-08-13T17:19:45Z2012-03-26http://hdl.handle.net/1843/ESBF-8SVFPHNos últimos anos, a tarefa de análise de sentimentos tem atraído o interesse de pesquisadores de aprendizado de máquina. Esse interesse tem crescido significativamente devido o grande volume de conteúdo opinativo gerado e compartilhado através das mídias sociais online. Considerando os benefícios de conhecer o sentimento da população em relação a diferentes tópicos e entidades, a análise deste conteúdo, gerado pelas mídias sociais, se faz uma tarefa promissora e necessária. Muitas técnicas de classificação automática têm sido utilizadas para realizar a análise de sentimento, contudo é consenso que o modelo de chegada de mensagens a partir de mídias sociais segue o paradigma de fluxo de dados e as técnicas de classificação tradicionais não estão adequadas para tratar as características especificas deste fluxo de sentimento que é criado. Entre os desafios impostos às técnicas classificação podemos destacar: (1) o concept drift (i.e., constantes mudanças nas características dos dados, que neste trabalho foi abordado como sentiment drift), (2) a necessidade de atualização em tempo real do modelo de classificação a partir de mensagens mais recentes e (3) a limitação de tempo de computação e dados para treinamento, o que torna ainda mais difícil os dois primeiros desafios citados.In recent years, the sentiment analysis task has attracted the interest of the machine learning researchers. This interest has grown significantly due to the large volume of opinionated content generated and shared via social media. Considering the benefits of to know the sentiment of the population regarding to different topics and entities, the analysis of the generated content by social media, it is a promising and necessary task. Many automatic classification techniques have been used to perform sentiment analysis, however is consensus that the arrival pattern of messages from social media follows the data stream paradigm and the traditional classification techniques are not adequate to address the specific characteristics of the created sentiment stream. Among the challenges to the classification techniques can be highlighted: (1) concept drift (i.e., constant changes in data characteristics, which in this study was approached as sentiment drift), (2) the need of real-time update of the classification model from the most recent messages and (3) the limitation of computing and training resource, which makes the two firsts cited challenges more difficult.We analyze these problems from a proposal of semi-supervised learning. Our algorithm adapts the training set, to the changes in the data, from a self-augmenting training process with the passes of the stream. It uses a small seed of initial training and then classification models are produced in real time using association rules. This strategy keeps the model up-to-date incrementally, so that at any time of the event the model reflects the sentiment that is being transmitted. In order to address the sentiment drift, messages to training are projected on-demand, according to the message content that is being classified. Projection of the training data offers a number of advantages including the ability to quickly detect emerging trends in the information stream. We conducted a case study using the Twitter messages, posted in real time, related to major events in 2010 year. In these experiments the performance of the prediction keeps the same or increases, with the passes of the stream and the inclusion of new messages in the training set. We evaluated the proposed solution in different languages, in cases where the sentiment distribution changed in different way over time and in cases where the initial training seed is rather small.Universidade Federal de Minas GeraisUFMGAnálise de sentimentoInfluência (Psicologia) Redes de relações sociaisComputaçãoRedes de relações sociaisConcept DriftAnálise de sentimentoAprendizado de máquinaFluxo de dadosMídias SociaisAnálise adaptativa de fluxos de sentimentoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALismaelsantanasilva.pdfapplication/pdf5279675https://repositorio.ufmg.br/bitstream/1843/ESBF-8SVFPH/1/ismaelsantanasilva.pdfcee816fe7f0e255a7c12382a8fab6db0MD51TEXTismaelsantanasilva.pdf.txtismaelsantanasilva.pdf.txtExtracted texttext/plain141876https://repositorio.ufmg.br/bitstream/1843/ESBF-8SVFPH/2/ismaelsantanasilva.pdf.txtef14883498deeac0992ac896ad0ea86cMD521843/ESBF-8SVFPH2019-11-14 16:18:20.843oai:repositorio.ufmg.br:1843/ESBF-8SVFPHRepositório de PublicaçõesPUBhttps://repositorio.ufmg.br/oaiopendoar:2019-11-14T19:18:20Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.pt_BR.fl_str_mv Análise adaptativa de fluxos de sentimento
title Análise adaptativa de fluxos de sentimento
spellingShingle Análise adaptativa de fluxos de sentimento
Ismael Santana Silva
Concept Drift
Análise de sentimento
Aprendizado de máquina
Fluxo de dados
Mídias Sociais
Análise de sentimento
Influência (Psicologia) Redes de relações sociais
Computação
Redes de relações sociais
title_short Análise adaptativa de fluxos de sentimento
title_full Análise adaptativa de fluxos de sentimento
title_fullStr Análise adaptativa de fluxos de sentimento
title_full_unstemmed Análise adaptativa de fluxos de sentimento
title_sort Análise adaptativa de fluxos de sentimento
author Ismael Santana Silva
author_facet Ismael Santana Silva
author_role author
dc.contributor.advisor1.fl_str_mv Renato Antonio Celso Ferreira
dc.contributor.advisor-co1.fl_str_mv Adriano Alonso Veloso
dc.contributor.referee1.fl_str_mv Gisele Lobo Pappa
dc.contributor.referee2.fl_str_mv Nivio Ziviani
dc.contributor.referee3.fl_str_mv Wagner Meira Junior
dc.contributor.author.fl_str_mv Ismael Santana Silva
contributor_str_mv Renato Antonio Celso Ferreira
Adriano Alonso Veloso
Gisele Lobo Pappa
Nivio Ziviani
Wagner Meira Junior
dc.subject.por.fl_str_mv Concept Drift
Análise de sentimento
Aprendizado de máquina
Fluxo de dados
Mídias Sociais
topic Concept Drift
Análise de sentimento
Aprendizado de máquina
Fluxo de dados
Mídias Sociais
Análise de sentimento
Influência (Psicologia) Redes de relações sociais
Computação
Redes de relações sociais
dc.subject.other.pt_BR.fl_str_mv Análise de sentimento
Influência (Psicologia) Redes de relações sociais
Computação
Redes de relações sociais
description Nos últimos anos, a tarefa de análise de sentimentos tem atraído o interesse de pesquisadores de aprendizado de máquina. Esse interesse tem crescido significativamente devido o grande volume de conteúdo opinativo gerado e compartilhado através das mídias sociais online. Considerando os benefícios de conhecer o sentimento da população em relação a diferentes tópicos e entidades, a análise deste conteúdo, gerado pelas mídias sociais, se faz uma tarefa promissora e necessária. Muitas técnicas de classificação automática têm sido utilizadas para realizar a análise de sentimento, contudo é consenso que o modelo de chegada de mensagens a partir de mídias sociais segue o paradigma de fluxo de dados e as técnicas de classificação tradicionais não estão adequadas para tratar as características especificas deste fluxo de sentimento que é criado. Entre os desafios impostos às técnicas classificação podemos destacar: (1) o concept drift (i.e., constantes mudanças nas características dos dados, que neste trabalho foi abordado como sentiment drift), (2) a necessidade de atualização em tempo real do modelo de classificação a partir de mensagens mais recentes e (3) a limitação de tempo de computação e dados para treinamento, o que torna ainda mais difícil os dois primeiros desafios citados.
publishDate 2012
dc.date.issued.fl_str_mv 2012-03-26
dc.date.accessioned.fl_str_mv 2019-08-13T17:19:45Z
dc.date.available.fl_str_mv 2019-08-13T17:19:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/ESBF-8SVFPH
url http://hdl.handle.net/1843/ESBF-8SVFPH
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.publisher.initials.fl_str_mv UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br/bitstream/1843/ESBF-8SVFPH/1/ismaelsantanasilva.pdf
https://repositorio.ufmg.br/bitstream/1843/ESBF-8SVFPH/2/ismaelsantanasilva.pdf.txt
bitstream.checksum.fl_str_mv cee816fe7f0e255a7c12382a8fab6db0
ef14883498deeac0992ac896ad0ea86c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv
_version_ 1801677227563155456