Utilizando modelos de Machine Learning para classificar fake news de COVID-19
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/55324 |
Resumo: | Com a chegada da pandemia de COVID-19 a internet se tornou um meio de comunicação muito utilizado para divulgação e consumo de informações sobre o que estava acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de Inteligência Artificiail que consigam classificá-las de maneira automática. Para esse fim, modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de dados de texto em Português do Brasil, foi necessária a criação de um dataset colhendo textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com diferentes modelos de Machine Learning comparando diferentes combinações de Features foi identificado um desempenho superior quando utilizado como modelo o Random Forest. |
| id |
UFPE_f3dbbf925aebfba5613f989c1b0e5af8 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/55324 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
TIGRE, Matheus Felipe Ferreira da Silva Lisboahttp://lattes.cnpq.br/2507661329840573http://lattes.cnpq.br/3776300004312848SADOK, Djamel Fawzi Hadj2024-03-04T14:15:37Z2024-03-04T14:15:37Z2023-02-28TIGRE, Matheus Felipe Ferreira da Silva Lisboa. Utilizando modelos de Machine Learning para classificar fake news de COVID-19. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023.https://repositorio.ufpe.br/handle/123456789/55324Com a chegada da pandemia de COVID-19 a internet se tornou um meio de comunicação muito utilizado para divulgação e consumo de informações sobre o que estava acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de Inteligência Artificiail que consigam classificá-las de maneira automática. Para esse fim, modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de dados de texto em Português do Brasil, foi necessária a criação de um dataset colhendo textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com diferentes modelos de Machine Learning comparando diferentes combinações de Features foi identificado um desempenho superior quando utilizado como modelo o Random Forest.CNPqWith the arrival of the COVID-19 pandemic, the internet has become a means of com- munication widely used for the dissemination and consumption of information related to this illness that was occurring worldwide and how ways to prevent from virus contamination. How- ever, at the same time, a great deal of news that often lacked any scientific basis was used to mislead Brazil’s population in what is commonly known as Fake News. Due to its significant volume, manually verifying the soundness and veracity of each piece of news was practically impossible. As a result, there is a need for the use of verification strategies based on emerging technologies such as Artificial Intelligence capable of sifting among and classifying the news. This is yet a new area where machine Learning models can contribute a great deal in the combat of fake news. As there were no available text datasets in the Brazilian Portuguese language in this context, it was first necessary to create a new dataset by searching for texts in the verified press vehicles that later showed different structures after the text analysis. This work shows that when running Machine Learning models, an experiment comparing different features combinations, such as vectorization techniques and textual metrics, achieved good performance when utilizing Random Forest as a classification model.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessRedes de computadores e Sistemas distribuídosMachine LearningFake NewsCOVID-19Utilizando modelos de Machine Learning para classificar fake news de COVID-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPECC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/55324/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/55324/3/license.txt5e89a1613ddc8510c6576f4b23a78973MD53ORIGINALDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdfDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdfapplication/pdf845182https://repositorio.ufpe.br/bitstream/123456789/55324/1/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdff2b6a8c8fea9b76bf976a90880152a1dMD51TEXTDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.txtDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.txtExtracted texttext/plain74771https://repositorio.ufpe.br/bitstream/123456789/55324/4/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.txt4fa40e8173d5ef9175f5e0d658ed9557MD54THUMBNAILDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.jpgDISSERTAÇÃO Matheus Felipe Ferreira da Silva Lisboa Tigre.pdf.jpgGenerated Thumbnailimage/jpeg1224https://repositorio.ufpe.br/bitstream/123456789/55324/5/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.jpg53cf090c570de8ba9ae50984b11c3d68MD55123456789/553242024-03-06 02:23:29.913oai:repositorio.ufpe.br:123456789/55324VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212024-03-06T05:23:29Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.pt_BR.fl_str_mv |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| title |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| spellingShingle |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 TIGRE, Matheus Felipe Ferreira da Silva Lisboa Redes de computadores e Sistemas distribuídos Machine Learning Fake News COVID-19 |
| title_short |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| title_full |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| title_fullStr |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| title_full_unstemmed |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| title_sort |
Utilizando modelos de Machine Learning para classificar fake news de COVID-19 |
| author |
TIGRE, Matheus Felipe Ferreira da Silva Lisboa |
| author_facet |
TIGRE, Matheus Felipe Ferreira da Silva Lisboa |
| author_role |
author |
| dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2507661329840573 |
| dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3776300004312848 |
| dc.contributor.author.fl_str_mv |
TIGRE, Matheus Felipe Ferreira da Silva Lisboa |
| dc.contributor.advisor1.fl_str_mv |
SADOK, Djamel Fawzi Hadj |
| contributor_str_mv |
SADOK, Djamel Fawzi Hadj |
| dc.subject.por.fl_str_mv |
Redes de computadores e Sistemas distribuídos Machine Learning Fake News COVID-19 |
| topic |
Redes de computadores e Sistemas distribuídos Machine Learning Fake News COVID-19 |
| description |
Com a chegada da pandemia de COVID-19 a internet se tornou um meio de comunicação muito utilizado para divulgação e consumo de informações sobre o que estava acontecendo no mundo e também de como se prevenir da contaminação do vírus. Acontece que ao mesmo tempo também eram espalhadas notícias que muitas vezes não condiziam com a realidade e eram utilizadas para confundir a população do Brasil, as chamadas Fake News. Devido ao seu grande volume, verificar todas de maneira manual pode ser uma tarefa quase impossível e com isso surge a necessidade da utilização de técnicas de Inteligência Artificiail que consigam classificá-las de maneira automática. Para esse fim, modelos de Machine Learning podem vir a ser utilizados. Como não existiam bases de dados de texto em Português do Brasil, foi necessária a criação de um dataset colhendo textos em veículos de imprensa verificados e posteriormente ocorreu a análise dessas bases identificando diferenças em suas estruturas. Por fim, ao realizar experimentos com diferentes modelos de Machine Learning comparando diferentes combinações de Features foi identificado um desempenho superior quando utilizado como modelo o Random Forest. |
| publishDate |
2023 |
| dc.date.issued.fl_str_mv |
2023-02-28 |
| dc.date.accessioned.fl_str_mv |
2024-03-04T14:15:37Z |
| dc.date.available.fl_str_mv |
2024-03-04T14:15:37Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
TIGRE, Matheus Felipe Ferreira da Silva Lisboa. Utilizando modelos de Machine Learning para classificar fake news de COVID-19. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/55324 |
| identifier_str_mv |
TIGRE, Matheus Felipe Ferreira da Silva Lisboa. Utilizando modelos de Machine Learning para classificar fake news de COVID-19. 2023. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2023. |
| url |
https://repositorio.ufpe.br/handle/123456789/55324 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
| dc.publisher.initials.fl_str_mv |
UFPE |
| dc.publisher.country.fl_str_mv |
Brasil |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/55324/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/55324/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/55324/1/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf https://repositorio.ufpe.br/bitstream/123456789/55324/4/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/55324/5/DISSERTA%c3%87%c3%83O%20Matheus%20Felipe%20Ferreira%20da%20Silva%20Lisboa%20Tigre.pdf.jpg |
| bitstream.checksum.fl_str_mv |
e39d27027a6cc9cb039ad269a5db8e34 5e89a1613ddc8510c6576f4b23a78973 f2b6a8c8fea9b76bf976a90880152a1d 4fa40e8173d5ef9175f5e0d658ed9557 53cf090c570de8ba9ae50984b11c3d68 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1862741656317460480 |