Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Leonardo Augusto Ferreira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1843/78202
Resumo: Advances in Machine Learning (ML) are transforming how researchers conduct science in sensitive domains such as healthcare, education, justice, and criminal investigation. In response to this transformation, Explainable Artificial Intelligence (XAI) has emerged as a crucial research topic. This paper presents an innovative method called GPX (Genetic Programming Explainer), based on Genetic Programming for symbolic regression, aiming to provide clear and local explanations for decisions made by AI systems. GPX generates a set of samples in the neighborhood of the prediction to be explained and creates a local explanation model. The tree structure generated by GPX provides a symbolically, analytically comprehensible, and possibly non-linear expression that reflects the local behavior of the complex model. The use of partial derivatives from Genetic Programming results allows GPX to effectively communicate feature importance, producing user-friendly explanations. Additionally, the method can formulate counterfactual explanations, offering deeper insights into model behavior. Through comprehensive experiments on diverse datasets, GPX demonstrated excellence in four crucial aspects of XAI: providing understandable arguments, maintaining fidelity in classification and regression tasks, ensuring explanation stability, and promoting novel explanations. Compared to existing techniques such as LIME, GPX rivals or surpasses these approaches, as demonstrated by fidelity metrics. An innovative aspect of this work is the introduction of cosine similarity as an XAI strategy, which increases trust in the provided explanations. Despite the stochastic nature of Genetic Programming, the explanations generated by GPX remain stable, as validated by the stability metric. In summary, GPX shows promise in delivering informative arguments, ensuring fidelity and stability of explanations, and fostering the generation of novel explanations. This work represents an advance in XAI methods and encourages the exploration of symbolic regression via Genetic Programming to enhance explainability.
id UFMG_fcb18aa2976fd698c70e142a5fc3df1f
oai_identifier_str oai:repositorio.ufmg.br:1843/78202
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling 2024-11-22T13:46:22Z2025-09-08T23:44:36Z2024-11-22T13:46:22Z2024-10-01https://hdl.handle.net/1843/78202Advances in Machine Learning (ML) are transforming how researchers conduct science in sensitive domains such as healthcare, education, justice, and criminal investigation. In response to this transformation, Explainable Artificial Intelligence (XAI) has emerged as a crucial research topic. This paper presents an innovative method called GPX (Genetic Programming Explainer), based on Genetic Programming for symbolic regression, aiming to provide clear and local explanations for decisions made by AI systems. GPX generates a set of samples in the neighborhood of the prediction to be explained and creates a local explanation model. The tree structure generated by GPX provides a symbolically, analytically comprehensible, and possibly non-linear expression that reflects the local behavior of the complex model. The use of partial derivatives from Genetic Programming results allows GPX to effectively communicate feature importance, producing user-friendly explanations. Additionally, the method can formulate counterfactual explanations, offering deeper insights into model behavior. Through comprehensive experiments on diverse datasets, GPX demonstrated excellence in four crucial aspects of XAI: providing understandable arguments, maintaining fidelity in classification and regression tasks, ensuring explanation stability, and promoting novel explanations. Compared to existing techniques such as LIME, GPX rivals or surpasses these approaches, as demonstrated by fidelity metrics. An innovative aspect of this work is the introduction of cosine similarity as an XAI strategy, which increases trust in the provided explanations. Despite the stochastic nature of Genetic Programming, the explanations generated by GPX remain stable, as validated by the stability metric. In summary, GPX shows promise in delivering informative arguments, ensuring fidelity and stability of explanations, and fostering the generation of novel explanations. This work represents an advance in XAI methods and encourages the exploration of symbolic regression via Genetic Programming to enhance explainability.CNPq - Conselho Nacional de Desenvolvimento Científico e TecnológicoFAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas GeraisCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorporUniversidade Federal de Minas GeraisInterpretabilidadeAprendizado de MáquinaProgramação GenéticaExplicabilidadeEngenharia elétricaAprendizado do computadorInteligência artificialProgramação genética (Computação)Investigação da programação genética para explicabilidade em modelos de aprendizado de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisLeonardo Augusto Ferreirainfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGhttp://lattes.cnpq.br/1479597705871460Frederico Gadelha Guimarãeshttp://lattes.cnpq.br/2472681535872194Rodrigo César Pedrosa SilvaMichel BessaniAurora Trinidad Ramirez PozoCarlos Alberto Severiano JuniorGisele Lobo PappaOs avanços em Machine Learning (ML) estão transformando a forma como os pesquisadores conduzem a ciência em domínios sensíveis como saúde, educação, justiça e investigação criminal. Em resposta a essa transformação, a Inteligência Artificial Explicável (XAI) emergiu como um tópico de pesquisa crucial. Este artigo apresenta um método inovador denominado GPX (Genetic Programming Explainer), baseado em Programação Genética para regressão simbólica, com o objetivo de fornecer explicações claras e locais para decisões geradas por sistemas de IA. A GPX gera um conjunto de amostras na vizinhança da previsão a ser explicada e cria um modelo de explicação local. A estrutura de árvore gerada pela GPX fornece uma expressão simbólica, analiticamente compreensível e possivelmente não linear, que reflete o comportamento local do modelo complexo. A utilização de derivadas parciais dos resultados da Programação Genética permite à GPX comunicar efetivamente a importância das características, produzindo explicações fáceis de entender. Além disso, o método é capaz de formular explicações contrafactuais, oferecendo uma visão mais profunda sobre o comportamento dos modelos. Através de experimentos abrangentes em diversos conjuntos de dados, a GPX demonstrou excelência em quatro aspectos cruciais da XAI: fornecimento de argumentos compreensíveis, manutenção da fidelidade em tarefas de classificação e regressão, garantia de estabilidade das explicações e promoção de novas explicações. Comparada a técnicas existentes, como o LIME, a GPX rivaliza ou supera essas abordagens, conforme demonstrado pelas métricas de fidelidade. Um aspecto inovador deste trabalho é a introdução da similaridade cosseno como uma estratégia XAI, que aumenta a confiança nas explicações fornecidas. Apesar da natureza estocástica da Programação Genética, as explicações geradas pela GPX mantêm-se estáveis, conforme validado pela métrica de estabilidade. Em resumo, a GPX se mostra promissora na entrega de argumentos informativos, assegurando a fidelidade e a estabilidade das explicações, além de potencializar a geração de novas explicações. Este trabalho representa um avanço nos métodos de XAI e encoraja a exploração da regressão simbólica via Programação Genética para aprimorar a explicabilidade.BrasilENG - DEPARTAMENTO DE ENGENHARIA ELÉTRICAPrograma de Pós-Graduação em Engenharia ElétricaUFMGORIGINALLeonardo_Ferreira_Tese.pdfapplication/pdf2838945https://repositorio.ufmg.br//bitstreams/984aefae-fc20-493b-90d8-59be438be676/downloada2aeca6537dc73b737c848fc76d6a1f4MD51trueAnonymousREADLICENSElicense.txttext/plain2118https://repositorio.ufmg.br//bitstreams/01a8d1a0-e421-41bb-9fbb-a9c8355c94d7/downloadcda590c95a0b51b4d15f60c9642ca272MD52falseAnonymousREAD1843/782022025-09-08 20:44:36.318open.accessoai:repositorio.ufmg.br:1843/78202https://repositorio.ufmg.br/Repositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2025-09-08T23:44:36Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4K
dc.title.none.fl_str_mv Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
title Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
spellingShingle Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
Leonardo Augusto Ferreira
Engenharia elétrica
Aprendizado do computador
Inteligência artificial
Programação genética (Computação)
Interpretabilidade
Aprendizado de Máquina
Programação Genética
Explicabilidade
title_short Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
title_full Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
title_fullStr Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
title_full_unstemmed Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
title_sort Investigação da programação genética para explicabilidade em modelos de aprendizado de máquina
author Leonardo Augusto Ferreira
author_facet Leonardo Augusto Ferreira
author_role author
dc.contributor.author.fl_str_mv Leonardo Augusto Ferreira
dc.subject.por.fl_str_mv Engenharia elétrica
Aprendizado do computador
Inteligência artificial
Programação genética (Computação)
topic Engenharia elétrica
Aprendizado do computador
Inteligência artificial
Programação genética (Computação)
Interpretabilidade
Aprendizado de Máquina
Programação Genética
Explicabilidade
dc.subject.other.none.fl_str_mv Interpretabilidade
Aprendizado de Máquina
Programação Genética
Explicabilidade
description Advances in Machine Learning (ML) are transforming how researchers conduct science in sensitive domains such as healthcare, education, justice, and criminal investigation. In response to this transformation, Explainable Artificial Intelligence (XAI) has emerged as a crucial research topic. This paper presents an innovative method called GPX (Genetic Programming Explainer), based on Genetic Programming for symbolic regression, aiming to provide clear and local explanations for decisions made by AI systems. GPX generates a set of samples in the neighborhood of the prediction to be explained and creates a local explanation model. The tree structure generated by GPX provides a symbolically, analytically comprehensible, and possibly non-linear expression that reflects the local behavior of the complex model. The use of partial derivatives from Genetic Programming results allows GPX to effectively communicate feature importance, producing user-friendly explanations. Additionally, the method can formulate counterfactual explanations, offering deeper insights into model behavior. Through comprehensive experiments on diverse datasets, GPX demonstrated excellence in four crucial aspects of XAI: providing understandable arguments, maintaining fidelity in classification and regression tasks, ensuring explanation stability, and promoting novel explanations. Compared to existing techniques such as LIME, GPX rivals or surpasses these approaches, as demonstrated by fidelity metrics. An innovative aspect of this work is the introduction of cosine similarity as an XAI strategy, which increases trust in the provided explanations. Despite the stochastic nature of Genetic Programming, the explanations generated by GPX remain stable, as validated by the stability metric. In summary, GPX shows promise in delivering informative arguments, ensuring fidelity and stability of explanations, and fostering the generation of novel explanations. This work represents an advance in XAI methods and encourages the exploration of symbolic regression via Genetic Programming to enhance explainability.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-11-22T13:46:22Z
2025-09-08T23:44:36Z
dc.date.available.fl_str_mv 2024-11-22T13:46:22Z
dc.date.issued.fl_str_mv 2024-10-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1843/78202
url https://hdl.handle.net/1843/78202
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
bitstream.url.fl_str_mv https://repositorio.ufmg.br//bitstreams/984aefae-fc20-493b-90d8-59be438be676/download
https://repositorio.ufmg.br//bitstreams/01a8d1a0-e421-41bb-9fbb-a9c8355c94d7/download
bitstream.checksum.fl_str_mv a2aeca6537dc73b737c848fc76d6a1f4
cda590c95a0b51b4d15f60c9642ca272
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1862105945506578432