Aplicação de algoritmos não supervisionados em dados eleitorais

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Polizeli, Mateus Vendramini [UNIFESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/48912/001300002d785
Idioma: por
Instituição de defesa: Universidade Federal de São Paulo (UNIFESP)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459
https://repositorio.unifesp.br/handle/11600/59852
Resumo: Given the incessant search of society for clarity in government spending, management efficiency and transparency using the public agency, the structuring of works that allow a thorough investigation to efficiently monitor these actions becomes relevant. From an initial study in the literature, it was verified the existence of a series of controls and disclosure of accountability of sectors and public agencies. However, despite initiatives such as these, there is still little work considering further investigation to capture possible irregularities in the policy instrument. Thus, the objective of this project is to study some mechanisms for detecting anomalies associated with the 2018 electoral candidate data set. The proposed methodologies are based on unsupervised algorithms K-Means and Isolation Forest in an attempt to create a decision support tool for regulators to direct human resources for research. A combination of these algorithms, referred to here as KM+IF, is also suggested in order to improve accuracy and decrease the error rates associated with the models. The results observed in this project indicate that the proposal KM+IF shows good performance for situations where the variables of interest are available. However, it may yield unsatisfactory results when they are not available. In the case study for the set of electoral candidates, the overall result of the KM+IF algorithm was lower than the individual result of the K-Means and Isolation Forest techniques.
id UFSP_1ac26c11e6d0996fb4e40b3b936ada22
oai_identifier_str oai:repositorio.unifesp.br:11600/59852
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str
spelling Aplicação de algoritmos não supervisionados em dados eleitoraisAnomaly DetectionOutliersElectoral DataIsolation ForestK-Means.Detecção De AnomaliasOutliersDados EleitoraisIsolation ForestK-MeansGiven the incessant search of society for clarity in government spending, management efficiency and transparency using the public agency, the structuring of works that allow a thorough investigation to efficiently monitor these actions becomes relevant. From an initial study in the literature, it was verified the existence of a series of controls and disclosure of accountability of sectors and public agencies. However, despite initiatives such as these, there is still little work considering further investigation to capture possible irregularities in the policy instrument. Thus, the objective of this project is to study some mechanisms for detecting anomalies associated with the 2018 electoral candidate data set. The proposed methodologies are based on unsupervised algorithms K-Means and Isolation Forest in an attempt to create a decision support tool for regulators to direct human resources for research. A combination of these algorithms, referred to here as KM+IF, is also suggested in order to improve accuracy and decrease the error rates associated with the models. The results observed in this project indicate that the proposal KM+IF shows good performance for situations where the variables of interest are available. However, it may yield unsatisfactory results when they are not available. In the case study for the set of electoral candidates, the overall result of the KM+IF algorithm was lower than the individual result of the K-Means and Isolation Forest techniques.Diante da busca incessante da sociedade por clareza nos gastos públicos, eficiência na gestão e transparência com uso da máquina pública, torna-se relevante a estruturação de trabalhos que possibilitem uma apuração aprofundada para acompanhamento eficiente dessas ações. A partir de um estudo inicial na literatura, verificou-se a existência de uma série de controles e divulgação de prestação de contas de setores e órgãos públicos. Contudo, apesar de iniciativas como essas, ainda há poucos trabalhos considerando uma investigação mais aprofundada para capturar possíveis irregularidades do meio político. Dessa forma, o objetivo deste projeto é estudar alguns mecanismos de detecção de anomalias associados ao conjunto de dados das candidaturas eleitorais de 2018. As metodologias propostas são baseadas nos algoritmos não supervisionados K-Means e Isolation Forest como tentativa de criar uma ferramenta de apoio à tomada de decisão para os reguladores, visando direcionar os recursos humanos para investigação. É sugerida também uma combinação desses algoritmos, denominado aqui como KM+IF, com intuito de melhorar a acurácia e diminuir as taxas de erro associadas aos modelos. Os resultados observados neste projeto indicam que a proposta KM+IF mostra boa performance para situações onde estão disponíveis as variáveis de interesse. Entretanto, pode apresentar resultados insatisfatórios quando tais não estão disponíveis. No estudo de caso realizado para o conjunto de candidaturas eleitorais, o resultado geral do algoritmo KM+IF foi inferior ao resultado individual das técnicas K-Means e Isolation Forest.Dados abertos - Sucupira - Teses e dissertações (2019)Universidade Federal de São Paulo (UNIFESP)Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]Universidade Federal de São Paulo (UNIFESP)Polizeli, Mateus Vendramini [UNIFESP]2021-01-19T16:36:38Z2021-01-19T16:36:38Z2019-12-03info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459MATEUS VENDRAMINI POLIZELI.pdfhttps://repositorio.unifesp.br/handle/11600/59852ark:/48912/001300002d785porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-07-27T09:01:21Zoai:repositorio.unifesp.br:11600/59852Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-07-27T09:01:21Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.none.fl_str_mv Aplicação de algoritmos não supervisionados em dados eleitorais
title Aplicação de algoritmos não supervisionados em dados eleitorais
spellingShingle Aplicação de algoritmos não supervisionados em dados eleitorais
Polizeli, Mateus Vendramini [UNIFESP]
Anomaly Detection
Outliers
Electoral Data
Isolation Forest
K-Means.
Detecção De Anomalias
Outliers
Dados Eleitorais
Isolation Forest
K-Means
title_short Aplicação de algoritmos não supervisionados em dados eleitorais
title_full Aplicação de algoritmos não supervisionados em dados eleitorais
title_fullStr Aplicação de algoritmos não supervisionados em dados eleitorais
title_full_unstemmed Aplicação de algoritmos não supervisionados em dados eleitorais
title_sort Aplicação de algoritmos não supervisionados em dados eleitorais
author Polizeli, Mateus Vendramini [UNIFESP]
author_facet Polizeli, Mateus Vendramini [UNIFESP]
author_role author
dc.contributor.none.fl_str_mv Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]
Universidade Federal de São Paulo (UNIFESP)
dc.contributor.author.fl_str_mv Polizeli, Mateus Vendramini [UNIFESP]
dc.subject.por.fl_str_mv Anomaly Detection
Outliers
Electoral Data
Isolation Forest
K-Means.
Detecção De Anomalias
Outliers
Dados Eleitorais
Isolation Forest
K-Means
topic Anomaly Detection
Outliers
Electoral Data
Isolation Forest
K-Means.
Detecção De Anomalias
Outliers
Dados Eleitorais
Isolation Forest
K-Means
description Given the incessant search of society for clarity in government spending, management efficiency and transparency using the public agency, the structuring of works that allow a thorough investigation to efficiently monitor these actions becomes relevant. From an initial study in the literature, it was verified the existence of a series of controls and disclosure of accountability of sectors and public agencies. However, despite initiatives such as these, there is still little work considering further investigation to capture possible irregularities in the policy instrument. Thus, the objective of this project is to study some mechanisms for detecting anomalies associated with the 2018 electoral candidate data set. The proposed methodologies are based on unsupervised algorithms K-Means and Isolation Forest in an attempt to create a decision support tool for regulators to direct human resources for research. A combination of these algorithms, referred to here as KM+IF, is also suggested in order to improve accuracy and decrease the error rates associated with the models. The results observed in this project indicate that the proposal KM+IF shows good performance for situations where the variables of interest are available. However, it may yield unsatisfactory results when they are not available. In the case study for the set of electoral candidates, the overall result of the KM+IF algorithm was lower than the individual result of the K-Means and Isolation Forest techniques.
publishDate 2019
dc.date.none.fl_str_mv 2019-12-03
2021-01-19T16:36:38Z
2021-01-19T16:36:38Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459
MATEUS VENDRAMINI POLIZELI.pdf
https://repositorio.unifesp.br/handle/11600/59852
dc.identifier.dark.fl_str_mv ark:/48912/001300002d785
url https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459
https://repositorio.unifesp.br/handle/11600/59852
identifier_str_mv MATEUS VENDRAMINI POLIZELI.pdf
ark:/48912/001300002d785
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1848498002577063936