Aplicação de algoritmos não supervisionados em dados eleitorais

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Polizeli, Mateus Vendramini [UNIFESP]
Orientador(a): Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/48912/001300002d785
Idioma: por
Instituição de defesa: Universidade Federal de São Paulo (UNIFESP)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459
https://repositorio.unifesp.br/handle/11600/59852
Resumo: Diante da busca incessante da sociedade por clareza nos gastos públicos, eficiência na gestão e transparência com uso da máquina pública, torna-se relevante a estruturação de trabalhos que possibilitem uma apuração aprofundada para acompanhamento eficiente dessas ações. A partir de um estudo inicial na literatura, verificou-se a existência de uma série de controles e divulgação de prestação de contas de setores e órgãos públicos. Contudo, apesar de iniciativas como essas, ainda há poucos trabalhos considerando uma investigação mais aprofundada para capturar possíveis irregularidades do meio político. Dessa forma, o objetivo deste projeto é estudar alguns mecanismos de detecção de anomalias associados ao conjunto de dados das candidaturas eleitorais de 2018. As metodologias propostas são baseadas nos algoritmos não supervisionados K-Means e Isolation Forest como tentativa de criar uma ferramenta de apoio à tomada de decisão para os reguladores, visando direcionar os recursos humanos para investigação. É sugerida também uma combinação desses algoritmos, denominado aqui como KM+IF, com intuito de melhorar a acurácia e diminuir as taxas de erro associadas aos modelos. Os resultados observados neste projeto indicam que a proposta KM+IF mostra boa performance para situações onde estão disponíveis as variáveis de interesse. Entretanto, pode apresentar resultados insatisfatórios quando tais não estão disponíveis. No estudo de caso realizado para o conjunto de candidaturas eleitorais, o resultado geral do algoritmo KM+IF foi inferior ao resultado individual das técnicas K-Means e Isolation Forest.
id UFSP_1ac26c11e6d0996fb4e40b3b936ada22
oai_identifier_str oai:repositorio.unifesp.br:11600/59852
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str
spelling MestradoPolizeli, Mateus Vendramini [UNIFESP]Universidade Federal de São Paulo (UNIFESP)Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]2021-01-19T16:36:38Z2021-01-19T16:36:38Z2019-12-03Diante da busca incessante da sociedade por clareza nos gastos públicos, eficiência na gestão e transparência com uso da máquina pública, torna-se relevante a estruturação de trabalhos que possibilitem uma apuração aprofundada para acompanhamento eficiente dessas ações. A partir de um estudo inicial na literatura, verificou-se a existência de uma série de controles e divulgação de prestação de contas de setores e órgãos públicos. Contudo, apesar de iniciativas como essas, ainda há poucos trabalhos considerando uma investigação mais aprofundada para capturar possíveis irregularidades do meio político. Dessa forma, o objetivo deste projeto é estudar alguns mecanismos de detecção de anomalias associados ao conjunto de dados das candidaturas eleitorais de 2018. As metodologias propostas são baseadas nos algoritmos não supervisionados K-Means e Isolation Forest como tentativa de criar uma ferramenta de apoio à tomada de decisão para os reguladores, visando direcionar os recursos humanos para investigação. É sugerida também uma combinação desses algoritmos, denominado aqui como KM+IF, com intuito de melhorar a acurácia e diminuir as taxas de erro associadas aos modelos. Os resultados observados neste projeto indicam que a proposta KM+IF mostra boa performance para situações onde estão disponíveis as variáveis de interesse. Entretanto, pode apresentar resultados insatisfatórios quando tais não estão disponíveis. No estudo de caso realizado para o conjunto de candidaturas eleitorais, o resultado geral do algoritmo KM+IF foi inferior ao resultado individual das técnicas K-Means e Isolation Forest.Given the incessant search of society for clarity in government spending, management efficiency and transparency using the public agency, the structuring of works that allow a thorough investigation to efficiently monitor these actions becomes relevant. From an initial study in the literature, it was verified the existence of a series of controls and disclosure of accountability of sectors and public agencies. However, despite initiatives such as these, there is still little work considering further investigation to capture possible irregularities in the policy instrument. Thus, the objective of this project is to study some mechanisms for detecting anomalies associated with the 2018 electoral candidate data set. The proposed methodologies are based on unsupervised algorithms K-Means and Isolation Forest in an attempt to create a decision support tool for regulators to direct human resources for research. A combination of these algorithms, referred to here as KM+IF, is also suggested in order to improve accuracy and decrease the error rates associated with the models. The results observed in this project indicate that the proposal KM+IF shows good performance for situations where the variables of interest are available. However, it may yield unsatisfactory results when they are not available. In the case study for the set of electoral candidates, the overall result of the KM+IF algorithm was lower than the individual result of the K-Means and Isolation Forest techniques.Dados abertos - Sucupira - Teses e dissertações (2019)https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459MATEUS VENDRAMINI POLIZELI.pdfhttps://repositorio.unifesp.br/handle/11600/59852ark:/48912/001300002d785porUniversidade Federal de São Paulo (UNIFESP)info:eu-repo/semantics/openAccessDetecção De AnomaliasOutliersDados EleitoraisIsolation ForestK-MeansAnomaly DetectionOutliersElectoral DataIsolation ForestK-Means.Aplicação de algoritmos não supervisionados em dados eleitoraisinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPSão José dos Campos, Instituto de Ciência e TecnologiaPesquisa OperacionalPesquisa OperacionalMétodos De OtimizaçãoORIGINALMATEUS VENDRAMINI POLIZELI.pdfapplication/pdf2517353https://repositorio.unifesp.br/bitstreams/8b6ecac9-b96b-478c-a4c1-b02017f0e581/download550bc61ac2ead6ae9fb7623870e5168cMD51TEXTMATEUS VENDRAMINI POLIZELI.pdf.txtMATEUS VENDRAMINI POLIZELI.pdf.txtExtracted texttext/plain103446https://repositorio.unifesp.br/bitstreams/c64fa75d-4de7-4913-9eac-f5d9505e195d/download9d177929383652c47f4826a120774adfMD54THUMBNAILMATEUS VENDRAMINI POLIZELI.pdf.jpgMATEUS VENDRAMINI POLIZELI.pdf.jpgGenerated Thumbnailimage/jpeg3486https://repositorio.unifesp.br/bitstreams/01e45fcc-56d6-4b01-9b05-3b0447ae3858/downloadcb1c2c97d4d3c67e3b38b42cf2f25cf5MD5511600/598522024-07-27 09:01:21.986oai:repositorio.unifesp.br:11600/59852https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-07-27T09:01:21Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.pt.fl_str_mv Aplicação de algoritmos não supervisionados em dados eleitorais
title Aplicação de algoritmos não supervisionados em dados eleitorais
spellingShingle Aplicação de algoritmos não supervisionados em dados eleitorais
Polizeli, Mateus Vendramini [UNIFESP]
Detecção De Anomalias
Outliers
Dados Eleitorais
Isolation Forest
K-Means
Anomaly Detection
Outliers
Electoral Data
Isolation Forest
K-Means.
title_short Aplicação de algoritmos não supervisionados em dados eleitorais
title_full Aplicação de algoritmos não supervisionados em dados eleitorais
title_fullStr Aplicação de algoritmos não supervisionados em dados eleitorais
title_full_unstemmed Aplicação de algoritmos não supervisionados em dados eleitorais
title_sort Aplicação de algoritmos não supervisionados em dados eleitorais
author Polizeli, Mateus Vendramini [UNIFESP]
author_facet Polizeli, Mateus Vendramini [UNIFESP]
author_role author
dc.contributor.institution.pt.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.contributor.author.fl_str_mv Polizeli, Mateus Vendramini [UNIFESP]
dc.contributor.advisor1.fl_str_mv Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]
contributor_str_mv Bueno, Luis Felipe Cesar Da Rocha [UNIFESP]
dc.subject.por.fl_str_mv Detecção De Anomalias
Outliers
Dados Eleitorais
Isolation Forest
K-Means
topic Detecção De Anomalias
Outliers
Dados Eleitorais
Isolation Forest
K-Means
Anomaly Detection
Outliers
Electoral Data
Isolation Forest
K-Means.
dc.subject.eng.fl_str_mv Anomaly Detection
Outliers
Electoral Data
Isolation Forest
K-Means.
description Diante da busca incessante da sociedade por clareza nos gastos públicos, eficiência na gestão e transparência com uso da máquina pública, torna-se relevante a estruturação de trabalhos que possibilitem uma apuração aprofundada para acompanhamento eficiente dessas ações. A partir de um estudo inicial na literatura, verificou-se a existência de uma série de controles e divulgação de prestação de contas de setores e órgãos públicos. Contudo, apesar de iniciativas como essas, ainda há poucos trabalhos considerando uma investigação mais aprofundada para capturar possíveis irregularidades do meio político. Dessa forma, o objetivo deste projeto é estudar alguns mecanismos de detecção de anomalias associados ao conjunto de dados das candidaturas eleitorais de 2018. As metodologias propostas são baseadas nos algoritmos não supervisionados K-Means e Isolation Forest como tentativa de criar uma ferramenta de apoio à tomada de decisão para os reguladores, visando direcionar os recursos humanos para investigação. É sugerida também uma combinação desses algoritmos, denominado aqui como KM+IF, com intuito de melhorar a acurácia e diminuir as taxas de erro associadas aos modelos. Os resultados observados neste projeto indicam que a proposta KM+IF mostra boa performance para situações onde estão disponíveis as variáveis de interesse. Entretanto, pode apresentar resultados insatisfatórios quando tais não estão disponíveis. No estudo de caso realizado para o conjunto de candidaturas eleitorais, o resultado geral do algoritmo KM+IF foi inferior ao resultado individual das técnicas K-Means e Isolation Forest.
publishDate 2019
dc.date.issued.fl_str_mv 2019-12-03
dc.date.accessioned.fl_str_mv 2021-01-19T16:36:38Z
dc.date.available.fl_str_mv 2021-01-19T16:36:38Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.pt.fl_str_mv https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459
dc.identifier.uri.fl_str_mv https://repositorio.unifesp.br/handle/11600/59852
dc.identifier.dark.fl_str_mv ark:/48912/001300002d785
dc.identifier.file.none.fl_str_mv MATEUS VENDRAMINI POLIZELI.pdf
url https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=7928459
https://repositorio.unifesp.br/handle/11600/59852
identifier_str_mv MATEUS VENDRAMINI POLIZELI.pdf
ark:/48912/001300002d785
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
publisher.none.fl_str_mv Universidade Federal de São Paulo (UNIFESP)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
bitstream.url.fl_str_mv https://repositorio.unifesp.br/bitstreams/8b6ecac9-b96b-478c-a4c1-b02017f0e581/download
https://repositorio.unifesp.br/bitstreams/c64fa75d-4de7-4913-9eac-f5d9505e195d/download
https://repositorio.unifesp.br/bitstreams/01e45fcc-56d6-4b01-9b05-3b0447ae3858/download
bitstream.checksum.fl_str_mv 550bc61ac2ead6ae9fb7623870e5168c
9d177929383652c47f4826a120774adf
cb1c2c97d4d3c67e3b38b42cf2f25cf5
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1865648742911180800