Análise multimodal em blogs brasileiros
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://tede2.pucrs.br/tede2/handle/tede/9049 |
Resumo: | O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social. |
| id |
P_RS_ef2eed3cc313b74ccc9a132ac9a98213 |
|---|---|
| oai_identifier_str |
oai:tede2.pucrs.br:tede/9049 |
| network_acronym_str |
P_RS |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository_id_str |
|
| spelling |
Análise multimodal em blogs brasileirosCross-Media BlogsetText Sentiment AnalysisImage Sentiment AnalysisLexiconsDomain ContradictionAnálise de Sentimentos em TextoAnálise de Sentimentos em ImagensCorpusLéxicosContradição Entre DomíniosCNNCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOO uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social.The use of social media is increasingly present in our lives. It is through images, texts and videos that humans try to communicate on social networks and expose their opinions in the face of everyday events. Due to the increased volume of data transmitted over the Internet, it is difficult to perform a human analysis of the media without the use of computer resources. Scientific communities, with various motivations, such as: analyzing feelings in text, in images, detecting opinions in blogs, among others, feel challenged to discover characteristics to be extracted from these contents, being an example of the analysis of emotions in blogs. Although the area of classification of feelings through texts and images is under development, there are still several challenges. The main challenge is to build algorithms and methods that can infer subtle and subjective feelings as humans perceive them. This paper presents the corpus Cross-media Brazilian Blog, a dataset that was built based on BlogSet-BR. In addition, it was built the Ground Truth of these data (based on the opinions of subjects) about the feelings perceived in the texts and images of these blogs, which in this work become available for use. Some technologies used to predict sentiment in text and images have been tested in the Cross-Media Brazilian Blog corpus and compared with Ground Truth. In addition to the analyzes performed on the texts, a research was conducted specifically on contradictory posts, i.e. when the image is positive and the text is negative, or vice versa, when present on the same blog. Results indicate that methodologies for detecting feelings in blogs can be customized to detect conflicting posts and be able to better identify feelings in social media posts.Pontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoMusse, Soraia Raupphttp://lattes.cnpq.br/2302314954133011Molin, Greice Pinho Dal2019-12-02T12:24:56Z2019-08-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/9049porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2019-12-02T14:00:21Zoai:tede2.pucrs.br:tede/9049Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2019-12-02T14:00:21Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false |
| dc.title.none.fl_str_mv |
Análise multimodal em blogs brasileiros |
| title |
Análise multimodal em blogs brasileiros |
| spellingShingle |
Análise multimodal em blogs brasileiros Molin, Greice Pinho Dal Cross-Media Blogset Text Sentiment Analysis Image Sentiment Analysis Lexicons Domain Contradiction Análise de Sentimentos em Texto Análise de Sentimentos em Imagens Corpus Léxicos Contradição Entre Domínios CNN CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| title_short |
Análise multimodal em blogs brasileiros |
| title_full |
Análise multimodal em blogs brasileiros |
| title_fullStr |
Análise multimodal em blogs brasileiros |
| title_full_unstemmed |
Análise multimodal em blogs brasileiros |
| title_sort |
Análise multimodal em blogs brasileiros |
| author |
Molin, Greice Pinho Dal |
| author_facet |
Molin, Greice Pinho Dal |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Musse, Soraia Raupp http://lattes.cnpq.br/2302314954133011 |
| dc.contributor.author.fl_str_mv |
Molin, Greice Pinho Dal |
| dc.subject.por.fl_str_mv |
Cross-Media Blogset Text Sentiment Analysis Image Sentiment Analysis Lexicons Domain Contradiction Análise de Sentimentos em Texto Análise de Sentimentos em Imagens Corpus Léxicos Contradição Entre Domínios CNN CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| topic |
Cross-Media Blogset Text Sentiment Analysis Image Sentiment Analysis Lexicons Domain Contradiction Análise de Sentimentos em Texto Análise de Sentimentos em Imagens Corpus Léxicos Contradição Entre Domínios CNN CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO |
| description |
O uso de mídias sociais está cada vez mais presente em nossas vidas. É através de imagens, textos e vídeos que os seres humanos tentam se comunicar nas redes sociais e expor suas opiniões diante dos acontecimentos cotidianos. Devido ao aumento do volume de dados transmitidos pela internet, torna-se difícil realizar uma análise humana da mídia sem o uso de recursos computacionais. As comunidades científicas, com diversas motivações, tais como: análisar sentimentos em texto, em imagens, detectar opiniões em blogs, dentre outras, sentem-se desafiadas a descobrirem características a serem extraídas desses conteúdos, sendo um exemplo a análise de emoções em blogs. Embora a área de classificação de sentimentos através de textos e imagens esteja em desenvolvimento, ainda existem vários desafios. O principal desafio é construir algoritmos e métodos que possam inferir sentimentos sutis e subjetivos como os humanos os percebem. Neste trabalho é apresentado o corpus Cross-media Brazilian Blog, um conjunto de dados que foi construído com base no BlogSet-BR. Além disso, construiu-se o Ground Truth desses dados (com base nas opiniões de sujeitos) sobre os sentimentos percebidos nos textos e nas imagens destes blogs, que neste trabalho se tornam disponíveis para uso. Algumas tecnologias utilizadas para prever o sentimento em textos e em imagens foram testadas no corpus Cross-media Brazilian Blog e comparadas com o Ground Truth e são apresentadas e discutidas neste trabalho. Em adição às análises realizadas sobre os textos, realizou-se uma pesquisa especificamente sobre posts contraditórios, ou seja, quando a imagem é positiva e o texto é negativo, ou vice-versa, quando presentes no mesmo blog. Resultados indicam que metodologias para detecção de sentimentos em blogs podem ser customizadas para detectar postagens contraditórias e serem capazes de melhor identificar sentimentos nas postagens de mídia social. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-12-02T12:24:56Z 2019-08-30 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://tede2.pucrs.br/tede2/handle/tede/9049 |
| url |
http://tede2.pucrs.br/tede2/handle/tede/9049 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| publisher.none.fl_str_mv |
Pontifícia Universidade Católica do Rio Grande do Sul Escola Politécnica Brasil PUCRS Programa de Pós-Graduação em Ciência da Computação |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) instacron:PUC_RS |
| instname_str |
Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| instacron_str |
PUC_RS |
| institution |
PUC_RS |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| collection |
Biblioteca Digital de Teses e Dissertações da PUC_RS |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS) |
| repository.mail.fl_str_mv |
biblioteca.central@pucrs.br|| |
| _version_ |
1850041297952309248 |