Análise comparativa de métodos de seleção de variáveis em problemas de classificação

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Cunha, Luna Wagner
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05122025-154559/
Resumo: Neste trabalho é apresentada uma comparação abrangente entre o método SHAP e o método Lasso para seleção de variáveis. As metodologias de ambas as técnicas são exploradas e justapostas, alavancando métricas de verificação de classificação, como precisão, recall, pontuação F1 e acurácia em cenários de banco de dados simulados e reais. Os testes aplicados mostram o SHAP como um bom competidor para métodos de seleção de variáveis, com resultados inclusive levemente superiores em relação ao Lasso nos casos aqui apresentados, tanto na base simulada quando na base real, mantendo níveis de acurácia competitivos em relação ao modelo completo. Apesar de ficar um pouco próximo na acurácia, o SHAP reduz notavelmente o espaço de variáveis, demonstrando sua proeza na seleção. Além disso, um estudo de robustez usando valores de perturbação em treinamento, teste e em ambos conjuntamente, confirma a resiliência das variáveis selecionadas pelo SHAP, particularmente em termos de acurácia. Essas análises destacam a eficácia do método SHAP como uma ferramenta versátil e poderosa para seleção de variáveis, prometendo melhor interpretabilidade e desempenho em aplicações de aprendizado de máquina.
id USP_dae68d9420a6d79bcb72afdaa4520426
oai_identifier_str oai:teses.usp.br:tde-05122025-154559
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Análise comparativa de métodos de seleção de variáveis em problemas de classificaçãoComparative analysis of variable selection methods in classification problemsAprendizado de máquinaFeature selectionLASSOLASSOMachine learningSeleção de variáveisSHAP valuesValores SHAPNeste trabalho é apresentada uma comparação abrangente entre o método SHAP e o método Lasso para seleção de variáveis. As metodologias de ambas as técnicas são exploradas e justapostas, alavancando métricas de verificação de classificação, como precisão, recall, pontuação F1 e acurácia em cenários de banco de dados simulados e reais. Os testes aplicados mostram o SHAP como um bom competidor para métodos de seleção de variáveis, com resultados inclusive levemente superiores em relação ao Lasso nos casos aqui apresentados, tanto na base simulada quando na base real, mantendo níveis de acurácia competitivos em relação ao modelo completo. Apesar de ficar um pouco próximo na acurácia, o SHAP reduz notavelmente o espaço de variáveis, demonstrando sua proeza na seleção. Além disso, um estudo de robustez usando valores de perturbação em treinamento, teste e em ambos conjuntamente, confirma a resiliência das variáveis selecionadas pelo SHAP, particularmente em termos de acurácia. Essas análises destacam a eficácia do método SHAP como uma ferramenta versátil e poderosa para seleção de variáveis, prometendo melhor interpretabilidade e desempenho em aplicações de aprendizado de máquina.In this study, a comprehensive comparison between the SHAP method and the Lasso method for variable selection is presented. The methodologies of both techniques are explored and juxtaposed, utilizing key selection metrics such as precision, recall, F1 score, and accuracy in both simulated and real database scenarios. The tests applied show SHAP as a good competitor for variable selection methods, with results even slightly superior to Lasso in the cases presented here, both on a simulated and real basis, maintaining competitive accuracy levels in relation to the complete model. Despite being somewhat close in accuracy, SHAP notably reduces the variable space, demonstrating its selection prowess. Additionally, a robustness study involving perturbation values in training, testing, and combined datasets confirms the resilience of the variables selected by SHAP, particularly in terms of accuracy. These analyses underscore the efficacy of the SHAP method as a versatile and potent tool for variable selection, promising improved interpretability and performance in machine learning applications.Biblioteca Digitais de Teses e Dissertações da USPNovelli, Cibele Maria RussoCunha, Luna Wagner2024-11-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/104/104131/tde-05122025-154559/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-12-05T17:56:02Zoai:teses.usp.br:tde-05122025-154559Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-12-05T17:56:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise comparativa de métodos de seleção de variáveis em problemas de classificação
Comparative analysis of variable selection methods in classification problems
title Análise comparativa de métodos de seleção de variáveis em problemas de classificação
spellingShingle Análise comparativa de métodos de seleção de variáveis em problemas de classificação
Cunha, Luna Wagner
Aprendizado de máquina
Feature selection
LASSO
LASSO
Machine learning
Seleção de variáveis
SHAP values
Valores SHAP
title_short Análise comparativa de métodos de seleção de variáveis em problemas de classificação
title_full Análise comparativa de métodos de seleção de variáveis em problemas de classificação
title_fullStr Análise comparativa de métodos de seleção de variáveis em problemas de classificação
title_full_unstemmed Análise comparativa de métodos de seleção de variáveis em problemas de classificação
title_sort Análise comparativa de métodos de seleção de variáveis em problemas de classificação
author Cunha, Luna Wagner
author_facet Cunha, Luna Wagner
author_role author
dc.contributor.none.fl_str_mv Novelli, Cibele Maria Russo
dc.contributor.author.fl_str_mv Cunha, Luna Wagner
dc.subject.por.fl_str_mv Aprendizado de máquina
Feature selection
LASSO
LASSO
Machine learning
Seleção de variáveis
SHAP values
Valores SHAP
topic Aprendizado de máquina
Feature selection
LASSO
LASSO
Machine learning
Seleção de variáveis
SHAP values
Valores SHAP
description Neste trabalho é apresentada uma comparação abrangente entre o método SHAP e o método Lasso para seleção de variáveis. As metodologias de ambas as técnicas são exploradas e justapostas, alavancando métricas de verificação de classificação, como precisão, recall, pontuação F1 e acurácia em cenários de banco de dados simulados e reais. Os testes aplicados mostram o SHAP como um bom competidor para métodos de seleção de variáveis, com resultados inclusive levemente superiores em relação ao Lasso nos casos aqui apresentados, tanto na base simulada quando na base real, mantendo níveis de acurácia competitivos em relação ao modelo completo. Apesar de ficar um pouco próximo na acurácia, o SHAP reduz notavelmente o espaço de variáveis, demonstrando sua proeza na seleção. Além disso, um estudo de robustez usando valores de perturbação em treinamento, teste e em ambos conjuntamente, confirma a resiliência das variáveis selecionadas pelo SHAP, particularmente em termos de acurácia. Essas análises destacam a eficácia do método SHAP como uma ferramenta versátil e poderosa para seleção de variáveis, prometendo melhor interpretabilidade e desempenho em aplicações de aprendizado de máquina.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05122025-154559/
url https://www.teses.usp.br/teses/disponiveis/104/104131/tde-05122025-154559/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492187920203776