Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/20474 |
Resumo: | In the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity. |
| id |
SCAR_74a534e118eea27b1e6086f4aa4ac9a1 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/20474 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Santos, Allisfrank dosCamargo, Heloisa de Arrudahttp://lattes.cnpq.br/0487231065057783http://lattes.cnpq.br/56847403017460852024-09-05T11:49:41Z2024-09-05T11:49:41Z2019-02-28SANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20474.https://repositorio.ufscar.br/handle/20.500.14289/20474In the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity.No mundo globalizado, a análise de dados, principalmente os textuais, tem se tornado de grande importância para aquisição de conhecimento e informação a partir de dados gerados das mais variadas fontes de dados. Neste aspecto, a internet e as redes sociais compõem a principal base de dados textuais. A Análise de Sentimento é uma forma de mineração de dados na forma de texto, sendo que este tipo de análise visa identificar e/ou analisar a opinião dos usuários sobre uma entidade ou sobre os sentimentos em relação a temas variados. Diversos pesquisadores têm utilizado a Análise de Sentimento para compreender o comportamento dos usuários por meio da polaridade, que podem ser em duas ou três classes. Entretanto, o desafio que se coloca é encontrar meios que ultrapassem a classificação tradicional e conseguir fazer uma análise mais real dos sentimentos expressos, explorando a ideia de análise multiclasse (por meio de classes emocionais). Partindo desses fatos, esse trabalho tem por objetivo estudar aspectos da Análise de Sentimentos com relação ao número de classes de emoções a serem analisadas, bem como a forma de representação dos textos a serem submetidos para classificação. Para isso, foram utilizados algoritmos clássicos de Aprendizado de Máquina (SVM, kNN e Naive Bayes) e uso de técnicas de vetorização como TF - IDF e Word2Vec. Os resultados encontrados mostram que um número reduzido de classes aliado ao uso de Word2Vec como método de representação textual melhoram o resultado da classificação, principalmente com o uso do classificador SVM, obtendo uma acurácia de 58.8% para a base emocional e 68.6% para a base de polaridade.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/info:eu-repo/semantics/openAccessAnálise de sentimentosAprendizado de máquinaPolaridadeEmoçõesClassificaçãoSentiment analysisMachine learningPolarityEmotionClassificationCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAnálise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquinaMulticlass sentiment analysis: a comprehensive approach the use of machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTDissertação_Oficial_Allisfrank_dos_Santos.pdf.txtDissertação_Oficial_Allisfrank_dos_Santos.pdf.txtExtracted texttext/plain103704https://repositorio.ufscar.br/bitstreams/3e2b95ef-a9dc-4028-b9ef-fe07e86b241a/download6af81cf797f181dfe7ad543191453d6aMD53falseAnonymousREADTHUMBNAILDissertação_Oficial_Allisfrank_dos_Santos.pdf.jpgDissertação_Oficial_Allisfrank_dos_Santos.pdf.jpgGenerated Thumbnailimage/jpeg4619https://repositorio.ufscar.br/bitstreams/62bc540a-239a-4590-ab36-f145a6aaa02c/download66638ddf42d0e94091bde23ee99dab04MD54falseAnonymousREADORIGINALDissertação_Oficial_Allisfrank_dos_Santos.pdfDissertação_Oficial_Allisfrank_dos_Santos.pdfDissertação_Oficial_Allisfrank_dos_Santosapplication/pdf1163941https://repositorio.ufscar.br/bitstreams/07519215-bcc1-4503-b901-5fa4a470d68b/download15f164223de5171ac240bdf5600f6f22MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81030https://repositorio.ufscar.br/bitstreams/b1a68f7c-139b-4678-99b5-806eb7555285/downloadc6e5ca9ee4112329286834c9257d9d4cMD52falseAnonymousREAD20.500.14289/204742025-02-06 03:08:31.676http://creativecommons.org/licenses/by-sa/3.0/br/Attribution-ShareAlike 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/20474https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T06:08:31Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| dc.title.alternative.por.fl_str_mv |
Multiclass sentiment analysis: a comprehensive approach the use of machine learning |
| title |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| spellingShingle |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina Santos, Allisfrank dos Análise de sentimentos Aprendizado de máquina Polaridade Emoções Classificação Sentiment analysis Machine learning Polarity Emotion Classification CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| title_short |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| title_full |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| title_fullStr |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| title_full_unstemmed |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| title_sort |
Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina |
| author |
Santos, Allisfrank dos |
| author_facet |
Santos, Allisfrank dos |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/5684740301746085 |
| dc.contributor.author.fl_str_mv |
Santos, Allisfrank dos |
| dc.contributor.advisor1.fl_str_mv |
Camargo, Heloisa de Arruda |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0487231065057783 |
| contributor_str_mv |
Camargo, Heloisa de Arruda |
| dc.subject.por.fl_str_mv |
Análise de sentimentos Aprendizado de máquina Polaridade Emoções Classificação |
| topic |
Análise de sentimentos Aprendizado de máquina Polaridade Emoções Classificação Sentiment analysis Machine learning Polarity Emotion Classification CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Sentiment analysis Machine learning Polarity Emotion Classification |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| description |
In the globalized world, the analysis of data generated from the most varied sources, especially the textual ones, has become of great importance for the acquisition of knowledge and information. In this respect, the Internet and social networks make up the main textual database. The Sentiment Analysis is a form of data mining in text format, and the purpose of this type of analysis is to identify and / or analyze users' opinions about an entity or about sentiment related to various topics. Several researchers have used the Sentiment Analysis to understand user behavior through polarity, which can be separated into two or three classes. However, the challenge ahead is to find ways that go beyond the traditional classification and achieve a more real analysis of the expressed feelings, exploring t he idea of multiclass analysis (through emotional classes). Based on these facts, this paper aims to study aspects of the Sentiment Analysis related to the number of classes of emotions to be analyzed, as well as the representation form of the texts to be submitted for classification. For this, classic Machine Learning algorithms (SVM, kNN and Naive Bayes) as well as vectorization techniques such as TF - IDF and Word2Vec were used. The results show that a reduced number of classes allied to the use of Word2Vec as a textual representation method improves the classification result, especially with the use of the SVM classifier, obtaining an accuracy of 58.8% for the emotional base and 68.6% for the basis of polarity. |
| publishDate |
2019 |
| dc.date.issued.fl_str_mv |
2019-02-28 |
| dc.date.accessioned.fl_str_mv |
2024-09-05T11:49:41Z |
| dc.date.available.fl_str_mv |
2024-09-05T11:49:41Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20474. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/20474 |
| identifier_str_mv |
SANTOS, Allisfrank dos. Análise de sentimento multiclasse: uma abordagem com o uso de aprendizado de máquina. 2019. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2019. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/20474. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/20474 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/3e2b95ef-a9dc-4028-b9ef-fe07e86b241a/download https://repositorio.ufscar.br/bitstreams/62bc540a-239a-4590-ab36-f145a6aaa02c/download https://repositorio.ufscar.br/bitstreams/07519215-bcc1-4503-b901-5fa4a470d68b/download https://repositorio.ufscar.br/bitstreams/b1a68f7c-139b-4678-99b5-806eb7555285/download |
| bitstream.checksum.fl_str_mv |
6af81cf797f181dfe7ad543191453d6a 66638ddf42d0e94091bde23ee99dab04 15f164223de5171ac240bdf5600f6f22 c6e5ca9ee4112329286834c9257d9d4c |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688772833378304 |