Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Santos, Allisfrank dos
Orientador(a): Camargo, Heloisa de Arruda lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação - PPGCC
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/20474
Resumo: In the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity.
id SCAR_74a534e118eea27b1e6086f4aa4ac9a1
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/20474
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Santos, Allisfrank dosCamargo, Heloisa de Arrudahttp://lattes.cnpq.br/0487231065057783http://lattes.cnpq.br/56847403017460852024-09-05T11:49:41Z2024-09-05T11:49:41Z2019-02-28SANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20474.https://repositorio.ufscar.br/handle/20.500.14289/20474In the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity.No mundo globalizado, a análise de dados, principalmente os textuais, tem se tornado de grande importância para aquisição de conhecimento e informação a partir de dados gerados das mais variadas fontes de dados. Neste aspecto, a internet e as redes sociais compõem a principal base de dados textuais. A Análise de Sentimento é uma forma de mineração de dados na forma de texto, sendo que este tipo de análise visa identificar e/ou analisar a opinião dos usuários sobre uma entidade ou sobre os sentimentos em relação a temas variados. Diversos pesquisadores têm utilizado a Análise de Sentimento para compreender o comportamento dos usuários por meio da polaridade, que podem ser em duas ou três classes. Entretanto, o desafio que se coloca é encontrar meios que ultrapassem a classificação tradicional e conseguir fazer uma análise mais real dos sentimentos expressos, explorando a ideia de análise multiclasse (por meio de classes emocionais). Partindo desses fatos, esse trabalho tem por objetivo estudar aspectos da Análise de Sentimentos com relação ao número de classes de emoções a serem analisadas, bem como a forma de representação dos textos a serem submetidos para classificação. Para isso, foram utilizados algoritmos clássicos de Aprendizado de Máquina (SVM, kNN e Naive Bayes) e uso de técnicas de vetorização como TF - IDF e Word2Vec. Os resultados encontrados mostram que um número reduzido de classes aliado ao uso de Word2Vec como método de representação textual melhoram o resultado da classificação, principalmente com o uso do classificador SVM, obtendo uma acurácia de 58.8% para a base emocional e 68.6% para a base de polaridade.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessAnálise de sentimentosAprendizado de máquinaPolaridadeEmoçõesClassificaçãoSentiment analysisMachine learningPolarityEmotionClassificationCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAnálise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquinaMulticlass sentiment analysis: a comprehensive approach the use of machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissertação_Oficial_Allisfrank_dos_Santos.pdf.txtDissertação_Oficial_Allisfrank_dos_Santos.pdf.txtExtracted texttext/plain103704https://repositorio.ufscar.br/bitstreams/3e2b95ef-a9dc-4028-b9ef-fe07e86b241a/download6af81cf797f181dfe7ad543191453d6aMD53falseAnonymousREADTHUMBNAILDissertação_Oficial_Allisfrank_dos_Santos.pdf.jpgDissertação_Oficial_Allisfrank_dos_Santos.pdf.jpgGenerated Thumbnailimage/jpeg4619https://repositorio.ufscar.br/bitstreams/62bc540a-239a-4590-ab36-f145a6aaa02c/download66638ddf42d0e94091bde23ee99dab04MD54falseAnonymousREADORIGINALDissertação_Oficial_Allisfrank_dos_Santos.pdfDissertação_Oficial_Allisfrank_dos_Santos.pdfDissertação_Oficial_Allisfrank_dos_Santosapplication/pdf1163941https://repositorio.ufscar.br/bitstreams/07519215-bcc1-4503-b901-5fa4a470d68b/download15f164223de5171ac240bdf5600f6f22MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81030https://repositorio.ufscar.br/bitstreams/b1a68f7c-139b-4678-99b5-806eb7555285/downloadc6e5ca9ee4112329286834c9257d9d4cMD52falseAnonymousREAD20.500.14289/204742025-02-06 03:08:31.676http://creativecommons.org/licenses/by-sa/3.0/br/Attribution-ShareAlike 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/20474https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T06:08:31Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
dc.title.alternative.por.fl_str_mv Multiclass sentiment analysis: a comprehensive approach the use of machine learning
title Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
spellingShingle Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
Santos, Allisfrank dos
Análise de sentimentos
Aprendizado de máquina
Polaridade
Emoções
Classificação
Sentiment analysis
Machine learning
Polarity
Emotion
Classification
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
title_short Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
title_full Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
title_fullStr Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
title_full_unstemmed Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
title_sort Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
author Santos, Allisfrank dos
author_facet Santos, Allisfrank dos
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/5684740301746085
dc.contributor.author.fl_str_mv Santos, Allisfrank dos
dc.contributor.advisor1.fl_str_mv Camargo, Heloisa de Arruda
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/0487231065057783
contributor_str_mv Camargo, Heloisa de Arruda
dc.subject.por.fl_str_mv Análise de sentimentos
Aprendizado de máquina
Polaridade
Emoções
Classificação
topic Análise de sentimentos
Aprendizado de máquina
Polaridade
Emoções
Classificação
Sentiment analysis
Machine learning
Polarity
Emotion
Classification
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
dc.subject.eng.fl_str_mv Sentiment analysis
Machine learning
Polarity
Emotion
Classification
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
description In the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity.
publishDate 2019
dc.date.issued.fl_str_mv 2019-02-28
dc.date.accessioned.fl_str_mv 2024-09-05T11:49:41Z
dc.date.available.fl_str_mv 2024-09-05T11:49:41Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20474.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/20474
identifier_str_mv SANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20474.
url https://repositorio.ufscar.br/handle/20.500.14289/20474
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-ShareAlike 3.0 Brazil
http://creativecommons.org/licenses/by-sa/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação - PPGCC
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/3e2b95ef-a9dc-4028-b9ef-fe07e86b241a/download
https://repositorio.ufscar.br/bitstreams/62bc540a-239a-4590-ab36-f145a6aaa02c/download
https://repositorio.ufscar.br/bitstreams/07519215-bcc1-4503-b901-5fa4a470d68b/download
https://repositorio.ufscar.br/bitstreams/b1a68f7c-139b-4678-99b5-806eb7555285/download
bitstream.checksum.fl_str_mv 6af81cf797f181dfe7ad543191453d6a
66638ddf42d0e94091bde23ee99dab04
15f164223de5171ac240bdf5600f6f22
c6e5ca9ee4112329286834c9257d9d4c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688772833378304