Análise multimodal em blogs brasileiros

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Molin, Greice Pinho Dal
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
CNN
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/9049
Resumo: O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social.
id P_RS_ef2eed3cc313b74ccc9a132ac9a98213
oai_identifier_str oai:tede2.pucrs.br:tede/9049
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Análise multimodal em blogs brasileirosCross-Media BlogsetText Sentiment AnalysisImage Sentiment AnalysisLexiconsDomain ContradictionAnálise de Sentimentos em TextoAnálise de Sentimentos em ImagensCorpusLéxicosContradição Entre DomíniosCNNCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOO uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social.The use of social media is increasingly present in our lives. It is through images, texts and videos that humans try to communicate on social networks and expose their opinions in the face of everyday events. Due to the increased volume of data transmitted over the Internet, it is difficult to perform a human analysis of the media without the use of computer resources. Scientific communities, with various motivations, such as: analyzing feelings in text, in images, detecting opinions in blogs, among others, feel challenged to discover characteristics to be extracted from these contents, being an example of the analysis of emotions in blogs. Although the area of classification of feelings through texts and images is under development, there are still several challenges. The main challenge is to build algorithms and methods that can infer subtle and subjective feelings as humans perceive them. This paper presents the corpus Cross-media Brazilian Blog, a dataset that was built based on BlogSet-BR. In addition, it was built the Ground Truth of these data (based on the opinions of subjects) about the feelings perceived in the texts and images of these blogs, which in this work become available for use. Some technologies used to predict sentiment in text and images have been tested in the Cross-Media Brazilian Blog corpus and compared with Ground Truth. In addition to the analyzes performed on the texts, a research was conducted specifically on contradictory posts, i.e. when the image is positive and the text is negative, or vice versa, when present on the same blog. Results indicate that methodologies for detecting feelings in blogs can be customized to detect conflicting posts and be able to better identify feelings in social media posts.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoMusse, Soraia Raupphttp://lattes.cnpq.br/2302314954133011Molin, Greice Pinho Dal2019-12-02T12:24:56Z2019-08-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/9049porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2019-12-02T14:00:21Zoai:tede2.pucrs.br:tede/9049Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2019-12-02T14:00:21Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Análise multimodal em blogs brasileiros
title Análise multimodal em blogs brasileiros
spellingShingle Análise multimodal em blogs brasileiros
Molin, Greice Pinho Dal
Cross-Media Blogset
Text Sentiment Analysis
Image Sentiment Analysis
Lexicons
Domain Contradiction
Análise de Sentimentos em Texto
Análise de Sentimentos em Imagens
Corpus
Léxicos
Contradição Entre Domínios
CNN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Análise multimodal em blogs brasileiros
title_full Análise multimodal em blogs brasileiros
title_fullStr Análise multimodal em blogs brasileiros
title_full_unstemmed Análise multimodal em blogs brasileiros
title_sort Análise multimodal em blogs brasileiros
author Molin, Greice Pinho Dal
author_facet Molin, Greice Pinho Dal
author_role author
dc.contributor.none.fl_str_mv Musse, Soraia Raupp
http://lattes.cnpq.br/2302314954133011
dc.contributor.author.fl_str_mv Molin, Greice Pinho Dal
dc.subject.por.fl_str_mv Cross-Media Blogset
Text Sentiment Analysis
Image Sentiment Analysis
Lexicons
Domain Contradiction
Análise de Sentimentos em Texto
Análise de Sentimentos em Imagens
Corpus
Léxicos
Contradição Entre Domínios
CNN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic Cross-Media Blogset
Text Sentiment Analysis
Image Sentiment Analysis
Lexicons
Domain Contradiction
Análise de Sentimentos em Texto
Análise de Sentimentos em Imagens
Corpus
Léxicos
Contradição Entre Domínios
CNN
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-02T12:24:56Z
2019-08-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/9049
url http://tede2.pucrs.br/tede2/handle/tede/9049
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041297952309248