Utilizando modelos de Machine Learning para classificar fake news de COVID-19

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: TIGRE, Matheus Felipe Ferreira da Silva Lisboa
Orientador(a): SADOK, Djamel Fawzi Hadj
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/55324
Resumo: Com a chegada da pandemia de COVID-19 a internet se tornou um meio de comunicação muito utilizado para divulgação e consumo de informações sobre o que estava acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de Inteligência Artificiail que consigam classificá-las de maneira automática. Para esse fim, modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de dados de texto em Português do Brasil, foi necessária a criação de um dataset colhendo textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com diferentes modelos de Machine Learning comparando diferentes combinações de Features foi identificado um desempenho superior quando utilizado como modelo o Random Forest.
id UFPE_f3dbbf925aebfba5613f989c1b0e5af8
oai_identifier_str oai:repositorio.ufpe.br:123456789/55324
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling TIGRE, Matheus Felipe Ferreira da Silva Lisboahttp://lattes.cnpq.br/2507661329840573http://lattes.cnpq.br/3776300004312848SADOK, Djamel Fawzi Hadj2024-03-04T14:15:37Z2024-03-04T14:15:37Z2023-02-28TIGRE, Matheus Felipe Ferreira da Silva Lisboa. Utilizando modelos de Machine Learning para classificar fake news de COVID-19. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.https://repositorio.ufpe.br/handle/123456789/55324Com a chegada da pandemia de COVID-19 a internet se tornou um meio de comunicação muito utilizado para divulgação e consumo de informações sobre o que estava acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de Inteligência Artificiail que consigam classificá-las de maneira automática. Para esse fim, modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de dados de texto em Português do Brasil, foi necessária a criação de um dataset colhendo textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com diferentes modelos de Machine Learning comparando diferentes combinações de Features foi identificado um desempenho superior quando utilizado como modelo o Random Forest.CNPqWith the arrival of the COVID-19 pandemic, the internet has become a means of com- munication widely used for the dissemination and consumption of information related to this illness that was occurring worldwide and how ways to prevent from virus contamination. How- ever, at the same time, a great deal of news that often lacked any scientific basis was used to mislead Brazil’s population in what is commonly known as Fake News. Due to its significant volume, manually verifying the soundness and veracity of each piece of news was practically impossible. As a result, there is a need for the use of verification strategies based on emerging technologies such as Artificial Intelligence capable of sifting among and classifying the news. This is yet a new area where machine Learning models can contribute a great deal in the combat of fake news. As there were no available text datasets in the Brazilian Portuguese language in this context, it was first necessary to create a new dataset by searching for texts in the verified press vehicles that later showed different structures after the text analysis. This work shows that when running Machine Learning models, an experiment comparing different features combinations, such as vectorization techniques and textual metrics, achieved good performance when utilizing Random Forest as a classification model.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessRedes de computadores e Sistemas distribuídosMachine LearningFake NewsCOVID-19Utilizando modelos de Machine Learning para classificar fake news de COVID-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPECC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/55324/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/55324/3/license.txt5e89a1613ddc8510c6576f4b23a78973MD53ORIGINALDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdfDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdfapplication/pdf845182https://repositorio.ufpe.br/bitstream/123456789/55324/1/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdff2b6a8c8fea9b76bf976a90880152a1dMD51TEXTDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.txtDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.txtExtracted texttext/plain74771https://repositorio.ufpe.br/bitstream/123456789/55324/4/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.txt4fa40e8173d5ef9175f5e0d658ed9557MD54THUMBNAILDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.jpgDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.jpgGenerated Thumbnailimage/jpeg1224https://repositorio.ufpe.br/bitstream/123456789/55324/5/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.jpg53cf090c570de8ba9ae50984b11c3d68MD55123456789/553242024-03-06 02:23:29.913oai:repositorio.ufpe.br:123456789/55324VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212024-03-06T05:23:29Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Utilizando modelos de Machine Learning para classificar fake news de COVID-19
title Utilizando modelos de Machine Learning para classificar fake news de COVID-19
spellingShingle Utilizando modelos de Machine Learning para classificar fake news de COVID-19
TIGRE, Matheus Felipe Ferreira da Silva Lisboa
Redes de computadores e Sistemas distribuídos
Machine Learning
Fake News
COVID-19
title_short Utilizando modelos de Machine Learning para classificar fake news de COVID-19
title_full Utilizando modelos de Machine Learning para classificar fake news de COVID-19
title_fullStr Utilizando modelos de Machine Learning para classificar fake news de COVID-19
title_full_unstemmed Utilizando modelos de Machine Learning para classificar fake news de COVID-19
title_sort Utilizando modelos de Machine Learning para classificar fake news de COVID-19
author TIGRE, Matheus Felipe Ferreira da Silva Lisboa
author_facet TIGRE, Matheus Felipe Ferreira da Silva Lisboa
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2507661329840573
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/3776300004312848
dc.contributor.author.fl_str_mv TIGRE, Matheus Felipe Ferreira da Silva Lisboa
dc.contributor.advisor1.fl_str_mv SADOK, Djamel Fawzi Hadj
contributor_str_mv SADOK, Djamel Fawzi Hadj
dc.subject.por.fl_str_mv Redes de computadores e Sistemas distribuídos
Machine Learning
Fake News
COVID-19
topic Redes de computadores e Sistemas distribuídos
Machine Learning
Fake News
COVID-19
description Com a chegada da pandemia de COVID-19 a internet se tornou um meio de comunicação muito utilizado para divulgação e consumo de informações sobre o que estava acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de Inteligência Artificiail que consigam classificá-las de maneira automática. Para esse fim, modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de dados de texto em Português do Brasil, foi necessária a criação de um dataset colhendo textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com diferentes modelos de Machine Learning comparando diferentes combinações de Features foi identificado um desempenho superior quando utilizado como modelo o Random Forest.
publishDate 2023
dc.date.issued.fl_str_mv 2023-02-28
dc.date.accessioned.fl_str_mv 2024-03-04T14:15:37Z
dc.date.available.fl_str_mv 2024-03-04T14:15:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TIGRE, Matheus Felipe Ferreira da Silva Lisboa. Utilizando modelos de Machine Learning para classificar fake news de COVID-19. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/55324
identifier_str_mv TIGRE, Matheus Felipe Ferreira da Silva Lisboa. Utilizando modelos de Machine Learning para classificar fake news de COVID-19. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.
url https://repositorio.ufpe.br/handle/123456789/55324
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/55324/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/55324/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/55324/1/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf
https://repositorio.ufpe.br/bitstream/123456789/55324/4/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/55324/5/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.jpg
bitstream.checksum.fl_str_mv e39d27027a6cc9cb039ad269a5db8e34
5e89a1613ddc8510c6576f4b23a78973
f2b6a8c8fea9b76bf976a90880152a1d
4fa40e8173d5ef9175f5e0d658ed9557
53cf090c570de8ba9ae50984b11c3d68
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1862741656317460480