Metodologia para detecção de noticias falsas usando rotulo de vies politico
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/64520 |
Resumo: | A proliferação de notícias falsas se tornou um dos grandes dilemas da atualidade. Com a pro- pagação em massa de material desinformativo em contextos eleitorais, o debate acerca de como o viés político impacta na produção e disseminação de fake news tem crescido. Por conta da grande quantidade de postagens e textos veiculados nos meios digitais, soluções de classifi- cação automatizadas têm ganhado destaque. Grande parte das abordagens estabelecidas na literatura realizam o processamento e análise apenas do texto das notícias, ou de outras peças de mídia como imagens ou vídeos, desconsiderando que, em diversos contextos, a desinfor- mação é associada a questões políticas de modo a induzir indivíduos a determinada opinião. Tendo em vista que o viés influencia nos processos de captação, redação e edição da notícia, há, então, uma escolha de palavras direcionada pelo viés por parte dos redatores das notícias falsas. Nesse sentido, este estudo visa avaliar como a incorporação do viés político em modelos de classificação pode contribuir na detecção de notícias falsas. Para isso, foi adotada uma me- todologia para incutir o rótulo de viés aos textos correspondentes, a partir da concatenação das bases de notícias com a base de rótulos de viés extraídos de portais. Desse modo, foram com- parados três cenários: um cenário em que apenas o texto é avaliado, um cenário em que apenas o rótulo do viés é avaliado e um cenário em que o texto é concatenado com o rótulo do viés. Em cada um dos cenários, foram utilizados sete algoritmos de aprendizagem de máquina e três extratores de características em três bases de fake news distintas. Constatou-se uma melhora significativa às abordagens tradicionais, com aumento de até 29,28% na acurácia e de 50,72% no F1-Score dos modelos a partir da rotulação, com a proposta tendo apresentado os melhores índices na maioria dos experimentos avaliados, indicando que o viés político pode ser um fator importante no processo de classificação de notícias falsas. Os resultados também apontam para o classificador Support Vector Machine (SVM) e para o extrator de características LLAMA 2 como aqueles que obtiveram melhor desempenho, além da proposta se mostrar eficiente tanto para o texto, quanto para o título da notícia. |
| id |
UFPE_f47b50f5b97845a9be2c26a9fbdf7e8d |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/64520 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
LISBOA, Lucas Albuquerquehttp://lattes.cnpq.br/8129123583622787http://lattes.cnpq.br/8577312109146354http://lattes.cnpq.br/3241407043892610CAVALCANTI, George Darmiton da CunhaNASCIMENTO, Francimaria Rayanne dos Santos2025-07-21T12:18:03Z2025-07-21T12:18:03Z2024-10-29https://repositorio.ufpe.br/handle/123456789/64520A proliferação de notícias falsas se tornou um dos grandes dilemas da atualidade. Com a pro- pagação em massa de material desinformativo em contextos eleitorais, o debate acerca de como o viés político impacta na produção e disseminação de fake news tem crescido. Por conta da grande quantidade de postagens e textos veiculados nos meios digitais, soluções de classifi- cação automatizadas têm ganhado destaque. Grande parte das abordagens estabelecidas na literatura realizam o processamento e análise apenas do texto das notícias, ou de outras peças de mídia como imagens ou vídeos, desconsiderando que, em diversos contextos, a desinfor- mação é associada a questões políticas de modo a induzir indivíduos a determinada opinião. Tendo em vista que o viés influencia nos processos de captação, redação e edição da notícia, há, então, uma escolha de palavras direcionada pelo viés por parte dos redatores das notícias falsas. Nesse sentido, este estudo visa avaliar como a incorporação do viés político em modelos de classificação pode contribuir na detecção de notícias falsas. Para isso, foi adotada uma me- todologia para incutir o rótulo de viés aos textos correspondentes, a partir da concatenação das bases de notícias com a base de rótulos de viés extraídos de portais. Desse modo, foram com- parados três cenários: um cenário em que apenas o texto é avaliado, um cenário em que apenas o rótulo do viés é avaliado e um cenário em que o texto é concatenado com o rótulo do viés. Em cada um dos cenários, foram utilizados sete algoritmos de aprendizagem de máquina e três extratores de características em três bases de fake news distintas. Constatou-se uma melhora significativa às abordagens tradicionais, com aumento de até 29,28% na acurácia e de 50,72% no F1-Score dos modelos a partir da rotulação, com a proposta tendo apresentado os melhores índices na maioria dos experimentos avaliados, indicando que o viés político pode ser um fator importante no processo de classificação de notícias falsas. Os resultados também apontam para o classificador Support Vector Machine (SVM) e para o extrator de características LLAMA 2 como aqueles que obtiveram melhor desempenho, além da proposta se mostrar eficiente tanto para o texto, quanto para o título da notícia.The proliferation of fake news has become one of the great dilemmas of the present time. With the mass spread of disinformative material in electoral contexts, the debate surrounding how political bias impacts the production and dissemination of fake news has grown. Due to the large amount of posts and texts circulating in digital media, automated classification solutions have gained prominence. Most of the approaches established in the literature only process and analyze the text of the news or other media pieces, such as images or videos, disregarding that, in many contexts, disinformation is associated with political issues to induce individuals toward a particular opinion. Given that bias influences the processes of gathering, writing and editing news, there is a biased word choice by the authors of fake news. In this sense, this study aims to evaluate how the incorporation of political bias into classification models can contribute to the detection of fake news. For this, a methodology was adopted to incorporate bias labels into the corresponding texts by merging the news datasets with the bias label dataset extracted from portals. Thus, three scenarios were compared: a scenario in which only the text is evaluated, a scenario in which only the bias label is evaluated, and a scenario in which the text is concatenated with the bias label. In each of the scenarios, seven machine learning algorithms and three feature extractors were used across three distinct fake news datasets. A significant improvement was observed compared to traditional approaches, with an increase of up to 29.28% in accuracy and 50.72% in the F1-Score of the models using bias labeling. The proposed method showed the best performance in most of the evaluated experiments, indicating that political bias can be an important factor in the process of classifying fake news. The results also point to the Support Vector Machine (SVM) classifier and the LLAMA 2 feature extractor as the ones that achieved the best performance. Furthermore, the proposed method proved to be efficient for both the text and the title of the news.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessNoticias falsasAvaliação de classificadoresProcessamento de linguagem naturalVies politicoMetodologia para detecção de noticias falsas usando rotulo de vies politicoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALDISSERTAÇÃO Lucas Albuquerque Lisboa.pdfDISSERTAÇÃO Lucas Albuquerque Lisboa.pdfapplication/pdf3082894https://repositorio.ufpe.br/bitstream/123456789/64520/1/DISSERTA%c3%87%c3%83O%20Lucas%20Albuquerque%20Lisboa.pdfbd4abf712bf4072b7c9c9c4a2d18b521MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/64520/2/license.txt5e89a1613ddc8510c6576f4b23a78973MD52TEXTDISSERTAÇÃO Lucas Albuquerque Lisboa.pdf.txtDISSERTAÇÃO Lucas Albuquerque Lisboa.pdf.txtExtracted texttext/plain197563https://repositorio.ufpe.br/bitstream/123456789/64520/3/DISSERTA%c3%87%c3%83O%20Lucas%20Albuquerque%20Lisboa.pdf.txtfaf0c11e77c063d9cfe709b71000c427MD53THUMBNAILDISSERTAÇÃO Lucas Albuquerque Lisboa.pdf.jpgDISSERTAÇÃO Lucas Albuquerque Lisboa.pdf.jpgGenerated Thumbnailimage/jpeg1287https://repositorio.ufpe.br/bitstream/123456789/64520/4/DISSERTA%c3%87%c3%83O%20Lucas%20Albuquerque%20Lisboa.pdf.jpga88ed289e612c08f82b5eea3c8e41641MD54123456789/645202025-07-27 14:50:49.665oai:repositorio.ufpe.br:123456789/64520VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-07-27T17:50:49Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.pt_BR.fl_str_mv |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| title |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| spellingShingle |
Metodologia para detecção de noticias falsas usando rotulo de vies politico LISBOA, Lucas Albuquerque Noticias falsas Avaliação de classificadores Processamento de linguagem natural Vies politico |
| title_short |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| title_full |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| title_fullStr |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| title_full_unstemmed |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| title_sort |
Metodologia para detecção de noticias falsas usando rotulo de vies politico |
| author |
LISBOA, Lucas Albuquerque |
| author_facet |
LISBOA, Lucas Albuquerque |
| author_role |
author |
| dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8129123583622787 |
| dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/8577312109146354 |
| dc.contributor.advisor-coLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/3241407043892610 |
| dc.contributor.author.fl_str_mv |
LISBOA, Lucas Albuquerque |
| dc.contributor.advisor1.fl_str_mv |
CAVALCANTI, George Darmiton da Cunha |
| dc.contributor.advisor-co1.fl_str_mv |
NASCIMENTO, Francimaria Rayanne dos Santos |
| contributor_str_mv |
CAVALCANTI, George Darmiton da Cunha NASCIMENTO, Francimaria Rayanne dos Santos |
| dc.subject.por.fl_str_mv |
Noticias falsas Avaliação de classificadores Processamento de linguagem natural Vies politico |
| topic |
Noticias falsas Avaliação de classificadores Processamento de linguagem natural Vies politico |
| description |
A proliferação de notícias falsas se tornou um dos grandes dilemas da atualidade. Com a pro- pagação em massa de material desinformativo em contextos eleitorais, o debate acerca de como o viés político impacta na produção e disseminação de fake news tem crescido. Por conta da grande quantidade de postagens e textos veiculados nos meios digitais, soluções de classifi- cação automatizadas têm ganhado destaque. Grande parte das abordagens estabelecidas na literatura realizam o processamento e análise apenas do texto das notícias, ou de outras peças de mídia como imagens ou vídeos, desconsiderando que, em diversos contextos, a desinfor- mação é associada a questões políticas de modo a induzir indivíduos a determinada opinião. Tendo em vista que o viés influencia nos processos de captação, redação e edição da notícia, há, então, uma escolha de palavras direcionada pelo viés por parte dos redatores das notícias falsas. Nesse sentido, este estudo visa avaliar como a incorporação do viés político em modelos de classificação pode contribuir na detecção de notícias falsas. Para isso, foi adotada uma me- todologia para incutir o rótulo de viés aos textos correspondentes, a partir da concatenação das bases de notícias com a base de rótulos de viés extraídos de portais. Desse modo, foram com- parados três cenários: um cenário em que apenas o texto é avaliado, um cenário em que apenas o rótulo do viés é avaliado e um cenário em que o texto é concatenado com o rótulo do viés. Em cada um dos cenários, foram utilizados sete algoritmos de aprendizagem de máquina e três extratores de características em três bases de fake news distintas. Constatou-se uma melhora significativa às abordagens tradicionais, com aumento de até 29,28% na acurácia e de 50,72% no F1-Score dos modelos a partir da rotulação, com a proposta tendo apresentado os melhores índices na maioria dos experimentos avaliados, indicando que o viés político pode ser um fator importante no processo de classificação de notícias falsas. Os resultados também apontam para o classificador Support Vector Machine (SVM) e para o extrator de características LLAMA 2 como aqueles que obtiveram melhor desempenho, além da proposta se mostrar eficiente tanto para o texto, quanto para o título da notícia. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-10-29 |
| dc.date.accessioned.fl_str_mv |
2025-07-21T12:18:03Z |
| dc.date.available.fl_str_mv |
2025-07-21T12:18:03Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/64520 |
| url |
https://repositorio.ufpe.br/handle/123456789/64520 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
| dc.publisher.initials.fl_str_mv |
UFPE |
| dc.publisher.country.fl_str_mv |
Brasil |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/64520/1/DISSERTA%c3%87%c3%83O%20Lucas%20Albuquerque%20Lisboa.pdf https://repositorio.ufpe.br/bitstream/123456789/64520/2/license.txt https://repositorio.ufpe.br/bitstream/123456789/64520/3/DISSERTA%c3%87%c3%83O%20Lucas%20Albuquerque%20Lisboa.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/64520/4/DISSERTA%c3%87%c3%83O%20Lucas%20Albuquerque%20Lisboa.pdf.jpg |
| bitstream.checksum.fl_str_mv |
bd4abf712bf4072b7c9c9c4a2d18b521 5e89a1613ddc8510c6576f4b23a78973 faf0c11e77c063d9cfe709b71000c427 a88ed289e612c08f82b5eea3c8e41641 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1862741700351361024 |