Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Becker, Willian Eduardo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
PLN
NLP
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/8269
Resumo: A utilização de redes sociais tornou-se uma atividade cotidiana na sociedade atual. Com o enorme, e ininterrupto, fluxo de informações geradas nestes espaços, abre-se a possibilidade de explorar estes dados de diversas formas. A Análise de Sentimento (AS) é uma tarefa que visa obter conhecimento sobre a polaridade das mensagens postadas, através de diversas técnicas de Processamento de Linguagem Natural, onde a maioria das soluções lida com somente um idioma de cada vez. Entretanto, abordagens que não restringem se a explorar somente uma língua, estão mais próximas de extraírem todo o conhecimento e possibilidades destes dados. Abordagens recentes baseadas em Aprendizado de Máquina propõem-se a resolver a AS apoiando-se principalmente nas Redes Neurais Profundas (Deep Learning), as quais obtiveram bons resultados nesta tarefa. Neste trabalho são propostas três arquiteturas de Redes Neurais Convolucionais que lidam com dados multi-linguais extraídos do Twitter contendo quatro línguas. Os dois primeiros modelos propostos caracterizam-se pelo fato de possuírem um total de parâmetros muito menor que os demais baselines considerados, e ainda assim, obtêm resultados superiores com uma boa margem de diferença. O último modelo proposto é capaz de realizar uma classificação multitarefa, identificando a polaridade das sentenças e também a língua. Com este último modelo obtém-se uma acurácia de 74.43% para AS e 98.40% para Identificação da Língua em um dataset com quatro línguas, mostrando-se a melhor escolha entre todos os baselines analisados.
id P_RS_9e0fac3be4aaccfcb9399bed520719ad
oai_identifier_str oai:tede2.pucrs.br:tede/8269
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingualRedes Neurais ConvolucionaisInteligência ArtificialAnálise de SentimentoAprendizado ProfundoPLNConvolutional Neural NetworksArtificial IntelligenceSentiment AnalysisDeep LearningNLPCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOA utilização de redes sociais tornou-se uma atividade cotidiana na sociedade atual. Com o enorme, e ininterrupto, fluxo de informações geradas nestes espaços, abre-se a possibilidade de explorar estes dados de diversas formas. A Análise de Sentimento (AS) é uma tarefa que visa obter conhecimento sobre a polaridade das mensagens postadas, através de diversas técnicas de Processamento de Linguagem Natural, onde a maioria das soluções lida com somente um idioma de cada vez. Entretanto, abordagens que não restringem se a explorar somente uma língua, estão mais próximas de extraírem todo o conhecimento e possibilidades destes dados. Abordagens recentes baseadas em Aprendizado de Máquina propõem-se a resolver a AS apoiando-se principalmente nas Redes Neurais Profundas (Deep Learning), as quais obtiveram bons resultados nesta tarefa. Neste trabalho são propostas três arquiteturas de Redes Neurais Convolucionais que lidam com dados multi-linguais extraídos do Twitter contendo quatro línguas. Os dois primeiros modelos propostos caracterizam-se pelo fato de possuírem um total de parâmetros muito menor que os demais baselines considerados, e ainda assim, obtêm resultados superiores com uma boa margem de diferença. O último modelo proposto é capaz de realizar uma classificação multitarefa, identificando a polaridade das sentenças e também a língua. Com este último modelo obtém-se uma acurácia de 74.43% para AS e 98.40% para Identificação da Língua em um dataset com quatro línguas, mostrando-se a melhor escolha entre todos os baselines analisados.Nowadays, the use of social media has become a daily activity of our society. The huge and uninterrupt flow of information in these spaces opens up the possibility of exploring this data in different ways. Sentiment Analysis (SA) is a task that aims to obtain knowledge about the polarity of a given text relying on several techniques of Natural Language Processing, with most of solutions dealing with only one language at a time. However, approaches that are not restricted to explore only one language are more related to extract the whole knowledge and possibilities of these data. Recent approaches based on Machine Learning propose to solve SA by using mainly Deep Learning Neural Networks have obtained good results in this task. In this work is proposed three Convolutional Neural Network architectures that deal with multilingual Twitter data of four languages. The first and second proposed models are characterized by the fact they require substantially less learnable parameters than other considered baselines while are more accurate than several other Deep Neural architectures. The third proposed model is able to perform a multitask classification by identifying the polarity of a given sentences and also its language. This model reaches an accuracy of 74.43% for SA and 98.40% for Language Identification in the four-language multilingual dataset. Results confirm that proposed model is the best choice for both sentiment and language classification by outperforming the considered baselines.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoBarros, Rodrigo Coelhohttp://lattes.cnpq.br/8172124241767828Becker, Willian Eduardo2018-09-04T14:57:29Z2017-11-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/8269porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2018-09-04T15:01:16Zoai:tede2.pucrs.br:tede/8269Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2018-09-04T15:01:16Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
spellingShingle Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
Becker, Willian Eduardo
Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_full Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_fullStr Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_full_unstemmed Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
title_sort Uma abordagem de redes neurais convolucionais para análise de sentimento multi-lingual
author Becker, Willian Eduardo
author_facet Becker, Willian Eduardo
author_role author
dc.contributor.none.fl_str_mv Barros, Rodrigo Coelho
http://lattes.cnpq.br/8172124241767828
dc.contributor.author.fl_str_mv Becker, Willian Eduardo
dc.subject.por.fl_str_mv Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic Redes Neurais Convolucionais
Inteligência Artificial
Análise de Sentimento
Aprendizado Profundo
PLN
Convolutional Neural Networks
Artificial Intelligence
Sentiment Analysis
Deep Learning
NLP
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description A utilização de redes sociais tornou-se uma atividade cotidiana na sociedade atual. Com o enorme, e ininterrupto, fluxo de informações geradas nestes espaços, abre-se a possibilidade de explorar estes dados de diversas formas. A Análise de Sentimento (AS) é uma tarefa que visa obter conhecimento sobre a polaridade das mensagens postadas, através de diversas técnicas de Processamento de Linguagem Natural, onde a maioria das soluções lida com somente um idioma de cada vez. Entretanto, abordagens que não restringem se a explorar somente uma língua, estão mais próximas de extraírem todo o conhecimento e possibilidades destes dados. Abordagens recentes baseadas em Aprendizado de Máquina propõem-se a resolver a AS apoiando-se principalmente nas Redes Neurais Profundas (Deep Learning), as quais obtiveram bons resultados nesta tarefa. Neste trabalho são propostas três arquiteturas de Redes Neurais Convolucionais que lidam com dados multi-linguais extraídos do Twitter contendo quatro línguas. Os dois primeiros modelos propostos caracterizam-se pelo fato de possuírem um total de parâmetros muito menor que os demais baselines considerados, e ainda assim, obtêm resultados superiores com uma boa margem de diferença. O último modelo proposto é capaz de realizar uma classificação multitarefa, identificando a polaridade das sentenças e também a língua. Com este último modelo obtém-se uma acurácia de 74.43% para AS e 98.40% para Identificação da Língua em um dataset com quatro línguas, mostrando-se a melhor escolha entre todos os baselines analisados.
publishDate 2017
dc.date.none.fl_str_mv 2017-11-24
2018-09-04T14:57:29Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/8269
url http://tede2.pucrs.br/tede2/handle/tede/8269
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041291788779520