Liardetector: a linguistic-based approach for identifying fake news

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Almeida, Thais Gomes de
Outros Autores: http://lattes.cnpq.br/5141073637181801
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.ufam.edu.br/handle/tede/7686
Resumo: Devido à infraestrutura da Web existente e à popularidade das plataformas de mídia sociais, é fácil compartilhar informações de forma massiva. Embora esse cenário online traga benefícios para a sociedade, ele também favorece que grupos maliciosos propaguem desinformação (notícias falsas) na Web, causando danos que vão desde afetar a reputação de entidades públicas (empresas, celebridades) a interferir em processos políticos. Neste trabalho, propomos uma nova abordagem de classificação baseada em padrões linguísticos para identificar notícias falsas. Tal abordagem reduz a dimensionalidade do espaço de características ao codificar distribuições de probabilidade de tokens (por exemplo, palavras) como valores de divergência e entropia. Nós descrevemos resultados experimentais, usando vários conjuntos de dados, que mostram que nossa abordagem é uma solução que melhora tanto a eficácia, quanto eficiência de modelos de aprendizagem. Em comparação com o \textit{baseline}, nossa abordagem usa quatro ordens de magnitude menos atributos e obtém um ganho de até 74,3% de eficácia (Medida-F).
id UFAM_985fa0feb2590fc8e012dce9a75231c5
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/7686
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling Liardetector: a linguistic-based approach for identifying fake newsLiardetector: uma abordagem baseada em aspectos linguísticos para identificar notícias falsasFake newsAprendizado de máquinaCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃONotícias falsasClassificaçãoRepresentação de dadosAprendizagem supervisionadaDevido à infraestrutura da Web existente e à popularidade das plataformas de mídia sociais, é fácil compartilhar informações de forma massiva. Embora esse cenário online traga benefícios para a sociedade, ele também favorece que grupos maliciosos propaguem desinformação (notícias falsas) na Web, causando danos que vão desde afetar a reputação de entidades públicas (empresas, celebridades) a interferir em processos políticos. Neste trabalho, propomos uma nova abordagem de classificação baseada em padrões linguísticos para identificar notícias falsas. Tal abordagem reduz a dimensionalidade do espaço de características ao codificar distribuições de probabilidade de tokens (por exemplo, palavras) como valores de divergência e entropia. Nós descrevemos resultados experimentais, usando vários conjuntos de dados, que mostram que nossa abordagem é uma solução que melhora tanto a eficácia, quanto eficiência de modelos de aprendizagem. Em comparação com o \textit{baseline}, nossa abordagem usa quatro ordens de magnitude menos atributos e obtém um ganho de até 74,3% de eficácia (Medida-F).Due to the existing Web infrastructure and the popularity of social media platforms, it is easy to share information in large scale. Although this online scenario brings benefits to the society, it also favors malicious groups that propagate misinformation (e.g., alternative facts, fake news) on the Web, causing damages that range from affecting the reputation of public entities (companies, celebrities) to interfering on political process. In this work, we propose a novel classification approach based on linguistic patterns for identifying fake news. Our approach reduces the dimensionality of the feature space by encoding probability distributions of tokens (e.g., words) as Shannon entropy and Jensen-Shannon divergence values. We report experimental results using multiple data sets, which show that our approach is a win-win solution that improves efficacy and efficiency. Compared to the baseline, our approach uses four orders of magnitude less features, and achieve a gain up to 74.3% of F1-score.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorFiz mestrado sanduíche na Universidade de Nova IorqueUniversidade Federal do AmazonasInstituto de ComputaçãoBrasilUFAMPrograma de Pós-graduação em InformáticaNakamura, Eduardo Freirehttp://lattes.cnpq.br/1448696292042915Silva, Altigran Soares dahttp://lattes.cnpq.br/3405503472010994Freire, JulianaAlmeida, Thais Gomes dehttp://lattes.cnpq.br/51410736371818012020-02-27T13:16:56Z2019-04-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALMEIDA, Thais Gomes de. Liardetector: a linguistic-based approach for identifying fake news. 2019. 86 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2019.https://tede.ufam.edu.br/handle/tede/7686enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2020-02-28T05:04:27Zoai:https://tede.ufam.edu.br/handle/:tede/7686Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922020-02-28T05:04:27Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Liardetector: a linguistic-based approach for identifying fake news
Liardetector: uma abordagem baseada em aspectos linguísticos para identificar notícias falsas
title Liardetector: a linguistic-based approach for identifying fake news
spellingShingle Liardetector: a linguistic-based approach for identifying fake news
Almeida, Thais Gomes de
Fake news
Aprendizado de máquina
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Notícias falsas
Classificação
Representação de dados
Aprendizagem supervisionada
title_short Liardetector: a linguistic-based approach for identifying fake news
title_full Liardetector: a linguistic-based approach for identifying fake news
title_fullStr Liardetector: a linguistic-based approach for identifying fake news
title_full_unstemmed Liardetector: a linguistic-based approach for identifying fake news
title_sort Liardetector: a linguistic-based approach for identifying fake news
author Almeida, Thais Gomes de
author_facet Almeida, Thais Gomes de
http://lattes.cnpq.br/5141073637181801
author_role author
author2 http://lattes.cnpq.br/5141073637181801
author2_role author
dc.contributor.none.fl_str_mv Nakamura, Eduardo Freire
http://lattes.cnpq.br/1448696292042915
Silva, Altigran Soares da
http://lattes.cnpq.br/3405503472010994
Freire, Juliana
dc.contributor.author.fl_str_mv Almeida, Thais Gomes de
http://lattes.cnpq.br/5141073637181801
dc.subject.por.fl_str_mv Fake news
Aprendizado de máquina
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Notícias falsas
Classificação
Representação de dados
Aprendizagem supervisionada
topic Fake news
Aprendizado de máquina
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Notícias falsas
Classificação
Representação de dados
Aprendizagem supervisionada
description Devido à infraestrutura da Web existente e à popularidade das plataformas de mídia sociais, é fácil compartilhar informações de forma massiva. Embora esse cenário online traga benefícios para a sociedade, ele também favorece que grupos maliciosos propaguem desinformação (notícias falsas) na Web, causando danos que vão desde afetar a reputação de entidades públicas (empresas, celebridades) a interferir em processos políticos. Neste trabalho, propomos uma nova abordagem de classificação baseada em padrões linguísticos para identificar notícias falsas. Tal abordagem reduz a dimensionalidade do espaço de características ao codificar distribuições de probabilidade de tokens (por exemplo, palavras) como valores de divergência e entropia. Nós descrevemos resultados experimentais, usando vários conjuntos de dados, que mostram que nossa abordagem é uma solução que melhora tanto a eficácia, quanto eficiência de modelos de aprendizagem. Em comparação com o \textit{baseline}, nossa abordagem usa quatro ordens de magnitude menos atributos e obtém um ganho de até 74,3% de eficácia (Medida-F).
publishDate 2019
dc.date.none.fl_str_mv 2019-04-18
2020-02-27T13:16:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALMEIDA, Thais Gomes de. Liardetector: a linguistic-based approach for identifying fake news. 2019. 86 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2019.
https://tede.ufam.edu.br/handle/tede/7686
identifier_str_mv ALMEIDA, Thais Gomes de. Liardetector: a linguistic-based approach for identifying fake news. 2019. 86 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2019.
url https://tede.ufam.edu.br/handle/tede/7686
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1797040504982994944