FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.repositorio.ufc.br/handle/riufc/63379 |
Resumo: | In recent years, the large-scale propagation through social midia of false, misleading, or distorted information, i.e. disinformation, has become a serious social problem, harming organizations and individuals and negatively impacting democratic processes, economy, health and public safety. Thus, the study and development of methods for automatic detection of misinformation, as well as the detection of malicious users that spread misinformation, gained the attention of academia and industry. In Brazil and in several other countries, the mobile messaging application WhatsApp is one of the midia in which misinformation circulates the most. However, there are still few works in the literature that address the detection of misinformation in this specific scenario. In this dissertation, we propose the construction of FakeWhatsApp.Br: a dataset of messages obtained from public WhatsApp groups, containing propagation information (social and temporal), where messages shared more than once were labeled as containing or not misinformation. From this resource, we carry out a series of classification experiments using different machine learning techniques to detect messages with misinformation and misinformation spreaders. Classification methods based on natural language processing and user attributes were compared and discussed, analyzing the advantages and limitations of each approach and identifying the particularities and challenges of these problems. The results obtained in this work provide initial contributions to the study of these problems and point to future research in the context of misinformation on WhatsApp. |
| id |
UFC-7_add2fa3b7216d42988c9f9ddd49498ab |
|---|---|
| oai_identifier_str |
oai:repositorio.ufc.br:riufc/63379 |
| network_acronym_str |
UFC-7 |
| network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
| repository_id_str |
|
| spelling |
Cunha, Lucas Cabral Carneiro daMonteiro Filho, José Maria da Silva2022-01-07T12:58:19Z2022-01-07T12:58:19Z2021CUNHA, Lucas Cabral Carneiro da. FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR. 2021. 130 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2021.http://www.repositorio.ufc.br/handle/riufc/63379In recent years, the large-scale propagation through social midia of false, misleading, or distorted information, i.e. disinformation, has become a serious social problem, harming organizations and individuals and negatively impacting democratic processes, economy, health and public safety. Thus, the study and development of methods for automatic detection of misinformation, as well as the detection of malicious users that spread misinformation, gained the attention of academia and industry. In Brazil and in several other countries, the mobile messaging application WhatsApp is one of the midia in which misinformation circulates the most. However, there are still few works in the literature that address the detection of misinformation in this specific scenario. In this dissertation, we propose the construction of FakeWhatsApp.Br: a dataset of messages obtained from public WhatsApp groups, containing propagation information (social and temporal), where messages shared more than once were labeled as containing or not misinformation. From this resource, we carry out a series of classification experiments using different machine learning techniques to detect messages with misinformation and misinformation spreaders. Classification methods based on natural language processing and user attributes were compared and discussed, analyzing the advantages and limitations of each approach and identifying the particularities and challenges of these problems. The results obtained in this work provide initial contributions to the study of these problems and point to future research in the context of misinformation on WhatsApp.Nos últimos anos, a propagação em larga escala através das redes sociais de informações falsas, enganosas ou distorcidas tornou-se um grave problema social. A disseminação de desinformação tem prejudicado organizações e indivíduos e impactando negativamente processos democráticos, economia, saúde e segurança pública. Assim, o estudo e desenvolvimento de métodos para detecção automática de desinformação, bem como de usuários maliciosos que espalham desinformação em larga escala, ganhou a atenção da academia e da indústria. No Brasil e em diversos outros países, o aplicativo móvel de mensagens WhatsApp é um dos meios onde mais circula desinformação. Porém, encontram-se ainda poucos trabalhos na literatura que abordem a detecção de desinformação nesse cenário específico. Nessa dissertação, propomos a construção e disponibilização do FakeWhatsApp.Br: um conjunto de dados de mensagens obtidas de grupos públicos de WhatsApp, contendo informações de propagação (social e temporal), onde as mensagens compartilhadas mais de uma vez foram rotuladas como contendo ou não desinformação. A partir desse recurso, realizamos uma série de experimentos de classificação utilizando diferentes técnicas de aprendizado de máquina para detectar mensagens que contenham desinformação e detectar desinformadores. Foram comparados e discutidos métodos de classificação baseados em processamento de linguagem natural e em atributos de usuários, analisando as vantagens e limitações de cada abordagem e identificando as particularidades e desafios destes problemas. Os resultados obtidos neste trabalho fornecem contribuições iniciais para o estudo destas questões e realizam apontamentos para pesquisas futuras no contexto de desinformação no WhatsApp.DesinformaçãoDesinformadoresAprendizado de MáquinaWhatsAppProcessamento de Linguagem NaturalFakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BRFakeWhatsApp.BR: detection of misinformation and misinformers in WhatsApp public groups in PT-BRinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccessORIGINAL2021_dis_lcccunha.pdf2021_dis_lcccunha.pdfapplication/pdf3270497http://repositorio.ufc.br/bitstream/riufc/63379/3/2021_dis_lcccunha.pdf5fde9b89af246f128f918af5c3ddabcbMD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/63379/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54riufc/633792022-01-07 09:58:19.311oai:repositorio.ufc.br:riufc/63379Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2022-01-07T12:58:19Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
| dc.title.pt_BR.fl_str_mv |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| dc.title.en.pt_BR.fl_str_mv |
FakeWhatsApp.BR: detection of misinformation and misinformers in WhatsApp public groups in PT-BR |
| title |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| spellingShingle |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR Cunha, Lucas Cabral Carneiro da Desinformação Desinformadores Aprendizado de Máquina Processamento de Linguagem Natural |
| title_short |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| title_full |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| title_fullStr |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| title_full_unstemmed |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| title_sort |
FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR |
| author |
Cunha, Lucas Cabral Carneiro da |
| author_facet |
Cunha, Lucas Cabral Carneiro da |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Cunha, Lucas Cabral Carneiro da |
| dc.contributor.advisor1.fl_str_mv |
Monteiro Filho, José Maria da Silva |
| contributor_str_mv |
Monteiro Filho, José Maria da Silva |
| dc.subject.por.fl_str_mv |
Desinformação Desinformadores Aprendizado de Máquina Processamento de Linguagem Natural |
| topic |
Desinformação Desinformadores Aprendizado de Máquina Processamento de Linguagem Natural |
| description |
In recent years, the large-scale propagation through social midia of false, misleading, or distorted information, i.e. disinformation, has become a serious social problem, harming organizations and individuals and negatively impacting democratic processes, economy, health and public safety. Thus, the study and development of methods for automatic detection of misinformation, as well as the detection of malicious users that spread misinformation, gained the attention of academia and industry. In Brazil and in several other countries, the mobile messaging application WhatsApp is one of the midia in which misinformation circulates the most. However, there are still few works in the literature that address the detection of misinformation in this specific scenario. In this dissertation, we propose the construction of FakeWhatsApp.Br: a dataset of messages obtained from public WhatsApp groups, containing propagation information (social and temporal), where messages shared more than once were labeled as containing or not misinformation. From this resource, we carry out a series of classification experiments using different machine learning techniques to detect messages with misinformation and misinformation spreaders. Classification methods based on natural language processing and user attributes were compared and discussed, analyzing the advantages and limitations of each approach and identifying the particularities and challenges of these problems. The results obtained in this work provide initial contributions to the study of these problems and point to future research in the context of misinformation on WhatsApp. |
| publishDate |
2021 |
| dc.date.issued.fl_str_mv |
2021 |
| dc.date.accessioned.fl_str_mv |
2022-01-07T12:58:19Z |
| dc.date.available.fl_str_mv |
2022-01-07T12:58:19Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
CUNHA, Lucas Cabral Carneiro da. FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR. 2021. 130 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2021. |
| dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufc.br/handle/riufc/63379 |
| identifier_str_mv |
CUNHA, Lucas Cabral Carneiro da. FakeWhatsApp.BR: detecção de desinformação e desinformadores em grupos públicos do WhatsApp em PT-BR. 2021. 130 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2021. |
| url |
http://www.repositorio.ufc.br/handle/riufc/63379 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
| instname_str |
Universidade Federal do Ceará (UFC) |
| instacron_str |
UFC |
| institution |
UFC |
| reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
| collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
| bitstream.url.fl_str_mv |
http://repositorio.ufc.br/bitstream/riufc/63379/3/2021_dis_lcccunha.pdf http://repositorio.ufc.br/bitstream/riufc/63379/4/license.txt |
| bitstream.checksum.fl_str_mv |
5fde9b89af246f128f918af5c3ddabcb 8a4605be74aa9ea9d79846c1fba20a33 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
| repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
| _version_ |
1847793075002277888 |