Estudo comparativo de análise de sentimentos aplicado à notícias públicas
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal do Maranhão
|
Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
|
Departamento: |
DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://tedebc.ufma.br/jspui/handle/tede/tede/2110 |
Resumo: | In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029. |
id |
UFMA_f0fe615f2ed1f9668d4ab5a840bfacb5 |
---|---|
oai_identifier_str |
oai:tede2:tede/2110 |
network_acronym_str |
UFMA |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
repository_id_str |
|
spelling |
BARROS FILHO, Allan Kardec Duailibe340.225.893-53http://lattes.cnpq.br/0492330410079141SANTANA, Ewaldo Eder Carvalhohttp://lattes.cnpq.br/0660692009750374FONSECA, João Vianahttp://lattes.cnpq.br/0029055473709795AGUILAR, Paulo Armando Cavalcantehttp://lattes.cnpq.br/3426006850096168050.249.683-52http://lattes.cnpq.br/4384265285656589CARVALHO, Caio Magno Aguiar de2018-03-12T20:37:46Z2018-02-20CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018.https://tedebc.ufma.br/jspui/handle/tede/tede/2110In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029.No período eleitoral, grande parte da opinião pública sobre partidos e candidatos é formada a partir de notícias veiculadas através dos meios de comunicação de massa: TV, radio, jornal e principalmente internet, através de portais de notícias online. Entretanto, existe um debate sobre a verdadeira imparcialidade desses meios ao transmitir a informação aos telespectadores. Alguns acusam a mídia de favorecer algumas figuras políticas e suas agendas, enquanto outros reafirmam a imparcialidade deste meio de comunicação. Entretanto, julgar a parcialidade de notícias políticas é uma tarefa que está sujeita a subjetividade do avaliador, que nem sempre reflete a realidade. Neste contexto, os métodos providos pelo Processamento de Linguagem Natural, através do campo de estudo da Análise de Sentimento, podem trazer uma visão menos enviesada nessa discussão. Análise de Sentimento é campo que alia as ferramentas de mineração de texto com ferramentas aprendizagem de máquina afim de classificar textos de acordo com sentimento expresso: positivo, negativo ou neutro. Neste trabalho é proposto um estudo comparativo entre as técnicas de representação de texto, seleção de atributos e ferramentas de aprendizagem de máquina para se classificar notícias políticas coletadas em portais online sobre as eleições brasileiras de 2014 quanto a sua opinião/sentimento (positivo, negativo ou neutro). Neste estudo os classificadores Naïve Bayes, Support Vector Machines e Regressão Logística (ou MaxEnt) são avaliados juntamente com as técnicas de seleção de atributos Qui Quadrado, Categorical Proportional Difference e Categorical Probability Proportional Difference. Os experimentos conduzidos visam escolher a melhor representação vetorial do texto, o melhor método de seleção de atributos e o melhor classificador para a base de dados proposta. A avaliação é realizada através de validação cruzada medindo-se a acurácia média e seu desvio-padrão para cada experimento. Os resultados experimentais apontam para representação bag-of-words utilizando vocabulário de unibigrams selecionados pela técnica Categorical Probability Proportional Difference juntamente com o classificador MaxEnt, atigindo uma acurácia média de 84,45% com um desvio-padrão de 0.029.Submitted by Rosivalda Pereira (mrs.pereira@ufma.br) on 2018-03-12T20:37:46Z No. of bitstreams: 1 CaioCarvalho.pdf: 591482 bytes, checksum: 969ab2857b424b51dc57ddd2543ea1a5 (MD5)Made available in DSpace on 2018-03-12T20:37:46Z (GMT). No. of bitstreams: 1 CaioCarvalho.pdf: 591482 bytes, checksum: 969ab2857b424b51dc57ddd2543ea1a5 (MD5) Previous issue date: 2018-02-20application/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETUFMABrasilDEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCETProcessamento de Linguagem NaturalAnálise de SentimentoAprendizagem de MáquinaSeleção de atributosSistemas de InformaçãoEstudo comparativo de análise de sentimentos aplicado à notícias públicasComparative Study of Sentiment Analysis Applied to Political Newsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALCaioCarvalho.pdfCaioCarvalho.pdfapplication/pdf591482http://tedebc.ufma.br:8080/bitstream/tede/2110/2/CaioCarvalho.pdf969ab2857b424b51dc57ddd2543ea1a5MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82255http://tedebc.ufma.br:8080/bitstream/tede/2110/1/license.txt97eeade1fce43278e63fe063657f8083MD51tede/21102018-03-12 17:37:46.3oai:tede2:tede/2110IExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpDb20gYSBhcHJlc2VudGHDp8OjbyBkZXN0YSBsaWNlbsOnYSxvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBjb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRvIE1hcmFuaMOjbyAoVUZNQSkgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IGRpc3RyaWJ1aXIgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVRk1BIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGTUEgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVUZNQSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRk1BLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVUZNQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBhbMOpbSBkYXF1ZWxhcyBjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoKRGVjbGFyYSB0YW1iw6ltIHF1ZSB0b2RhcyBhcyBhZmlsaWHDp8O1ZXMgY29ycG9yYXRpdmFzIG91IGluc3RpdHVjaW9uYWlzIGUgdG9kYXMgYXMgZm9udGVzIGRlIGFwb2lvIGZpbmFuY2Vpcm8gYW8gdHJhYmFsaG8gZXN0w6NvIGRldmlkYW1lbnRlIGNpdGFkYXMgb3UgbWVuY2lvbmFkYXMgZSBjZXJ0aWZpY2EgcXVlIG7Do28gaMOhIG5lbmh1bSBpbnRlcmVzc2UgY29tZXJjaWFsIG91IGFzc29jaWF0aXZvIHF1ZSByZXByZXNlbnRlIGNvbmZsaXRvIGRlIGludGVyZXNzZSBlbSBjb25leMOjbyBjb20gbyB0cmFiYWxobyBzdWJtZXRpZG8uCgoKCgoKCgo=Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312018-03-12T20:37:46Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false |
dc.title.por.fl_str_mv |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
dc.title.alternative.por.fl_str_mv |
Comparative Study of Sentiment Analysis Applied to Political News |
title |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
spellingShingle |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas CARVALHO, Caio Magno Aguiar de Processamento de Linguagem Natural Análise de Sentimento Aprendizagem de Máquina Seleção de atributos Sistemas de Informação |
title_short |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
title_full |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
title_fullStr |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
title_full_unstemmed |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
title_sort |
Estudo comparativo de análise de sentimentos aplicado à notícias públicas |
author |
CARVALHO, Caio Magno Aguiar de |
author_facet |
CARVALHO, Caio Magno Aguiar de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
BARROS FILHO, Allan Kardec Duailibe |
dc.contributor.advisor1ID.fl_str_mv |
340.225.893-53 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0492330410079141 |
dc.contributor.advisor-co1.fl_str_mv |
SANTANA, Ewaldo Eder Carvalho |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/0660692009750374 |
dc.contributor.referee1.fl_str_mv |
FONSECA, João Viana |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/0029055473709795 |
dc.contributor.referee2.fl_str_mv |
AGUILAR, Paulo Armando Cavalcante |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/3426006850096168 |
dc.contributor.authorID.fl_str_mv |
050.249.683-52 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4384265285656589 |
dc.contributor.author.fl_str_mv |
CARVALHO, Caio Magno Aguiar de |
contributor_str_mv |
BARROS FILHO, Allan Kardec Duailibe SANTANA, Ewaldo Eder Carvalho FONSECA, João Viana AGUILAR, Paulo Armando Cavalcante |
dc.subject.por.fl_str_mv |
Processamento de Linguagem Natural Análise de Sentimento Aprendizagem de Máquina Seleção de atributos |
topic |
Processamento de Linguagem Natural Análise de Sentimento Aprendizagem de Máquina Seleção de atributos Sistemas de Informação |
dc.subject.cnpq.fl_str_mv |
Sistemas de Informação |
description |
In the elections period, the public opinion about parties and candidates is partially influenced by mainstream media as TV, radio, newspappers and mainly internet through newswire media. However, there is a debate about the impartiality in these media when transmitting news. Sometimes it is acused to favour some political entities and its agendas, while others affirm its neutrality. Assess news article in this context is not a simple task, because the evaluation could be influenced by some biases of who assesses that article. The methods provided by Natural Language Processing, through the field of Sentiment Analysis, could bring a less biased viewpoint of that question. Sentiment Analysis joins text mining techiniques and machine learning tools to classify texts according its sentiment polarity (positive, negative or neutral).In this work we propose a comparative study between sentiment analysis text representation models, feature selection techiniques and machine learning classifiers in order to classify the polarity of political online news about 2014 brazilian elections. In this study the classifiers Naïve Bayes, Support Vector Machine and Logistic Regression (MaxEnt) are evaluated with feature selection techinques as Chi Square, Categorical Proportional Difference, Categorical Probability Propotional Difference. The experiments sought to choose the best text representation, feature selection techinique and machine learning classifier. The evaluation is made by cross validation measuring accuracy mean and its standard deviation. The experimental results pointed to the bag-of-words representation with unibigram selected by Categorical Probability Proportional Difference with MaxEnt classifier achieving 84.45% with standard deviation of 0.029. |
publishDate |
2018 |
dc.date.accessioned.fl_str_mv |
2018-03-12T20:37:46Z |
dc.date.issued.fl_str_mv |
2018-02-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018. |
dc.identifier.uri.fl_str_mv |
https://tedebc.ufma.br/jspui/handle/tede/tede/2110 |
identifier_str_mv |
CARVALHO, Caio Magno Aguiar de. Estudo comparativo de análise de sentimentos aplicado à notícias públicas. 2018. 48 f. Dissertação (Mestrado em Engenharia de Eletricidade) - Universidade Federal do Maranhão, São Luís, 2018. |
url |
https://tedebc.ufma.br/jspui/handle/tede/tede/2110 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET |
dc.publisher.initials.fl_str_mv |
UFMA |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
DEPARTAMENTO DE ENGENHARIA DA ELETRICIDADE/CCET |
publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFMA instname:Universidade Federal do Maranhão (UFMA) instacron:UFMA |
instname_str |
Universidade Federal do Maranhão (UFMA) |
instacron_str |
UFMA |
institution |
UFMA |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
collection |
Biblioteca Digital de Teses e Dissertações da UFMA |
bitstream.url.fl_str_mv |
http://tedebc.ufma.br:8080/bitstream/tede/2110/2/CaioCarvalho.pdf http://tedebc.ufma.br:8080/bitstream/tede/2110/1/license.txt |
bitstream.checksum.fl_str_mv |
969ab2857b424b51dc57ddd2543ea1a5 97eeade1fce43278e63fe063657f8083 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA) |
repository.mail.fl_str_mv |
repositorio@ufma.br||repositorio@ufma.br |
_version_ |
1797055608549015552 |