Estudo comparativo de análise de sentimentos aplicado à notícias públicas

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: CARVALHO, Caio Magno Aguiar de lattes
Orientador(a): BARROS FILHO, Allan Kardec Duailibe lattes
Banca de defesa: FONSECA, João Viana lattes, AGUILAR, Paulo Armando Cavalcante lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Maranhão
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
Departamento: DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://tedebc.ufma.br/jspui/handle/tede/tede/2110
Resumo: In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029.
id UFMA_f0fe615f2ed1f9668d4ab5a840bfacb5
oai_identifier_str oai:tede2:tede/2110
network_acronym_str UFMA
network_name_str Biblioteca Digital de Teses e Dissertações da UFMA
repository_id_str
spelling BARROS FILHO, Allan Kardec Duailibe340.225.893-53http://lattes.cnpq.br/0492330410079141SANTANA, Ewaldo Eder Carvalhohttp://lattes.cnpq.br/0660692009750374FONSECA, João Vianahttp://lattes.cnpq.br/0029055473709795AGUILAR, Paulo Armando Cavalcantehttp://lattes.cnpq.br/3426006850096168050.249.683-52http://lattes.cnpq.br/4384265285656589CARVALHO, Caio Magno Aguiar de2018-03-12T20:37:46Z2018-02-20CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018.https://tedebc.ufma.br/jspui/handle/tede/tede/2110In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029.No período eleitoral, grande parte da opinião pública sobre partidos e candidatos é formada a partir de notícias veiculadas através dos meios de comunicação de massa: TV, radio, jornal e principalmente internet, através de portais de notícias online. Entretanto, existe um debate sobre a verdadeira imparcialidade desses meios ao transmitir a informação aos telespectadores. Alguns acusam a mídia de favorecer algumas figuras políticas e suas agendas, enquanto outros reafirmam a imparcialidade deste meio de comunicação. Entretanto, julgar a parcialidade de notícias políticas é uma tarefa que está sujeita a subjetividade do avaliador, que nem sempre reflete a realidade. Neste contexto, os métodos providos pelo Processamento de Linguagem Natural, através do campo de estudo da Análise de Sentimento, podem trazer uma visão menos enviesada nessa discussão. Análise de Sentimento é campo que alia as ferramentas de mineração de texto com ferramentas aprendizagem de máquina afim de classificar textos de acordo com sentimento expresso: positivo, negativo ou neutro. Neste trabalho é proposto um estudo comparativo entre as técnicas de representação de texto, seleção de atributos e ferramentas de aprendizagem de máquina para se classificar notícias políticas coletadas em portais online sobre as eleições brasileiras de 2014 quanto a sua opinião/sentimento (positivo, negativo ou neutro). Neste estudo os classificadores Naïve Bayes, Support Vector Machines e Regressão Logística (ou MaxEnt) são avaliados juntamente com as técnicas de seleção de atributos Qui Quadrado, Categorical Proportional Difference e Categorical Probability Proportional Difference. Os experimentos conduzidos visam escolher a melhor representação vetorial do texto, o melhor método de seleção de atributos e o melhor classificador para a base de dados proposta. A avaliação é realizada através de validação cruzada medindo-se a acurácia média e seu desvio-padrão para cada experimento. Os resultados experimentais apontam para representação bag-of-words utilizando vocabulário de unibigrams selecionados pela técnica Categorical Probability Proportional Difference juntamente com o classificador MaxEnt, atigindo uma acurácia média de 84,45% com um desvio-padrão de 0.029.Submitted by Rosivalda Pereira (mrs.pereira@ufma.br) on 2018-03-12T20:37:46Z No. of bitstreams: 1 CaioCarvalho.pdf: 591482 bytes, checksum: 969ab2857b424b51dc57ddd2543ea1a5 (MD5)Made available in DSpace on 2018-03-12T20:37:46Z (GMT). No. of bitstreams: 1 CaioCarvalho.pdf: 591482 bytes, checksum: 969ab2857b424b51dc57ddd2543ea1a5 (MD5) Previous issue date: 2018-02-20application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETUFMABrasilDEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCETProcessamento de Linguagem NaturalAnálise de SentimentoAprendizagem de MáquinaSeleção de atributosSistemas de InformaçãoEstudo comparativo de análise de sentimentos aplicado à notícias públicasComparative Study of Sentiment Analysis Applied to Political Newsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALCaioCarvalho.pdfCaioCarvalho.pdfapplication/pdf591482http://tedebc.ufma.br:8080/bitstream/tede/2110/2/CaioCarvalho.pdf969ab2857b424b51dc57ddd2543ea1a5MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/2110/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/21102018-03-12 17:37:46.3oai:tede2:tede/2110IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312018-03-12T20:37:46Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false
dc.title.por.fl_str_mv Estudo comparativo de análise de sentimentos aplicado à notícias públicas
dc.title.alternative.por.fl_str_mv Comparative Study of Sentiment Analysis Applied to Political News
title Estudo comparativo de análise de sentimentos aplicado à notícias públicas
spellingShingle Estudo comparativo de análise de sentimentos aplicado à notícias públicas
CARVALHO, Caio Magno Aguiar de
Processamento de Linguagem Natural
Análise de Sentimento
Aprendizagem de Máquina
Seleção de atributos
Sistemas de Informação
title_short Estudo comparativo de análise de sentimentos aplicado à notícias públicas
title_full Estudo comparativo de análise de sentimentos aplicado à notícias públicas
title_fullStr Estudo comparativo de análise de sentimentos aplicado à notícias públicas
title_full_unstemmed Estudo comparativo de análise de sentimentos aplicado à notícias públicas
title_sort Estudo comparativo de análise de sentimentos aplicado à notícias públicas
author CARVALHO, Caio Magno Aguiar de
author_facet CARVALHO, Caio Magno Aguiar de
author_role author
dc.contributor.advisor1.fl_str_mv BARROS FILHO, Allan Kardec Duailibe
dc.contributor.advisor1ID.fl_str_mv 340.225.893-53
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0492330410079141
dc.contributor.advisor-co1.fl_str_mv SANTANA, Ewaldo Eder Carvalho
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/0660692009750374
dc.contributor.referee1.fl_str_mv FONSECA, João Viana
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/0029055473709795
dc.contributor.referee2.fl_str_mv AGUILAR, Paulo Armando Cavalcante
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/3426006850096168
dc.contributor.authorID.fl_str_mv 050.249.683-52
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4384265285656589
dc.contributor.author.fl_str_mv CARVALHO, Caio Magno Aguiar de
contributor_str_mv BARROS FILHO, Allan Kardec Duailibe
SANTANA, Ewaldo Eder Carvalho
FONSECA, João Viana
AGUILAR, Paulo Armando Cavalcante
dc.subject.por.fl_str_mv Processamento de Linguagem Natural
Análise de Sentimento
Aprendizagem de Máquina
Seleção de atributos
topic Processamento de Linguagem Natural
Análise de Sentimento
Aprendizagem de Máquina
Seleção de atributos
Sistemas de Informação
dc.subject.cnpq.fl_str_mv Sistemas de Informação
description In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029.
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-03-12T20:37:46Z
dc.date.issued.fl_str_mv 2018-02-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018.
dc.identifier.uri.fl_str_mv https://tedebc.ufma.br/jspui/handle/tede/tede/2110
identifier_str_mv CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018.
url https://tedebc.ufma.br/jspui/handle/tede/tede/2110
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
dc.publisher.initials.fl_str_mv UFMA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
publisher.none.fl_str_mv Universidade Federal do Maranhão
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFMA
instname:Universidade Federal do Maranhão (UFMA)
instacron:UFMA
instname_str Universidade Federal do Maranhão (UFMA)
instacron_str UFMA
institution UFMA
reponame_str Biblioteca Digital de Teses e Dissertações da UFMA
collection Biblioteca Digital de Teses e Dissertações da UFMA
bitstream.url.fl_str_mv http://tedebc.ufma.br:8080/bitstream/tede/2110/2/CaioCarvalho.pdf
http://tedebc.ufma.br:8080/bitstream/tede/2110/1/license.txt
bitstream.checksum.fl_str_mv 969ab2857b424b51dc57ddd2543ea1a5
97eeade1fce43278e63fe063657f8083
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)
repository.mail.fl_str_mv repositorio@ufma.br||repositorio@ufma.br
_version_ 1797055608549015552