Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Horta, Guilherme Garcia
Orientador(a): Loiola, Murilo Bellezoni
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do ABC
Programa de Pós-Graduação: Programa de Pós-Graduação em Engenharia da Informação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=127832&midiaext=81772
Resumo: Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
id UFBC_25f701bc1f1a1f6db55042e78eea075d
oai_identifier_str oai:BDTD:127832
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisDesbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito2024-06-21Loiola, Murilo BellezoniHorta, Guilherme GarciaUniversidade Federal do ABCPrograma de Pós-Graduação em Engenharia da InformaçãoUFABCporCLASSIFICAÇÃOAMOSTRAGEMSOBREPOSIÇÃO DE DADOSDESBALANCEAMENTO DE DADOSDETECÇÃO DE FRAUDES EM CARTÕES DE CRÉDITOR-VALORR-VALOR AUMENTADOCLASSIFICATIONSAMPLINGIMBALANCED DATADATA OVERLAPCREDIT CARD FRAUD DETECTIONR-VALUEAUGMENTED R-VALUEPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA INFORMAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorAs fraudes em cartões de crédito são um problema crescente na sociedade moderna, especialmente com o aumento das modalidades de compras e pagamentos online. Logo, há alta demanda para sistemas de prevenção e detecção de fraudes que sejam robustos e confiáveis. A tarefa de detecção de fraudes pode ser tratada como um problema de classificação e, neste contexto, múltiplos autores relatam dificuldades ao treinar os classificadores nos conjuntos de dados de fraudes, que possivelmente apresentam forte desbalanceamento e sobreposição entre as classes. Técnicas de pré-processamento de amostragem, como sobre-amostragem e sub-amostragem, são frequentemente utilizadas na fase de pré-processamento para tratar o problema do desbalanceamento. Por outro lado, métricas de avaliação como o R-Valor e o R-Valor Aumentado foram apresentadas nos últimos anos para medir o nível de sobreposição presente nos dados. Portanto, este trabalho se propõe a analisar os comportamentos de diferentes classificadores quando há utilização de técnicas de amostragem em conjuntos de dados sintéticos desbalanceados e sobrepostos, além de estender este estudo em aplicação real, para um conjunto de dados de fraudes em cartões de crédito, objetivamente medindo os efeitos nas métricas acima mencionadas e também nos desempenhos de classificação. Este trabalho indica que a utilização da métrica R-Valor Aumentado é mais apropriada em cenário de dados desbalanceados em comparação ao R-Valor. Entretanto, este trabalho conclui que, para os conjuntos de dados estudados, os resultados de classificação obtidos após a aplicação das técnicas escolhidas de amostragem não apresentaram diferenças significativas em relação à não aplicação das mesmas, o que sugere, conforme já indicado na literatura, que a sobreposição de classes pode ser mais crítica que o desbalanceamento em si. Outra questão trazida à tona por este estudo é a relação entre a dispersão observada dos dados de cada classe em relação ao desempenho de classificação dos estimadores. Além disso, apontamos que os algoritmos de classificação baseados em árvores de decisão obtiveram resultados bons para o conjunto de dados real de fraudes, considerando as circunstâncias de alto desbalanceamento e classes sobrepostas significativamente.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=127832&midiaext=81772application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:13:34Zoai:BDTD:127832Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2025-06-06T14:03:03Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.pt.fl_str_mv Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
title Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
spellingShingle Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
Horta, Guilherme Garcia
title_short Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
title_full Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
title_fullStr Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
title_full_unstemmed Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
title_sort Desbalanceamento, sobreposição e classificação de dados com aplicação em detecção de fraudes em cartões de crédito
author Horta, Guilherme Garcia
author_facet Horta, Guilherme Garcia
author_role author
dc.contributor.advisor1.fl_str_mv Loiola, Murilo Bellezoni
dc.contributor.author.fl_str_mv Horta, Guilherme Garcia
contributor_str_mv Loiola, Murilo Bellezoni
description Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
publishDate 2024
dc.date.issued.fl_str_mv 2024-06-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=127832&midiaext=81772
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=127832&midiaext=81772
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do ABC
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia da Informação
dc.publisher.initials.fl_str_mv UFABC
publisher.none.fl_str_mv Universidade Federal do ABC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1854475893283487744