Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Popolin Neto, Mário
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/
Resumo: Classification models have immense potential and ubiquitous future, considering the vast number of prediction tasks in different domains where such models are applicable. Models interpretability may be just as important as performance, providing global and local explanations to interpret the acquired knowledge and audit decisions. In addition to the predictive ability, classification models can also be employed as descriptive tools, where interpretability involves data explanations. Logic rules have been widely used in interpretability solutions, and Decision Trees are well recognized for consistent logic rules generation. The Random Forest approach (Decision Trees ensemble) has been broadly adopted due to its ability to produce accurate results and deal with multivariate datasets. However, Random Forest models interpretability faces the challenge of handling a substantial number of logic rules. Based on logic rules visualization into a matrix-like visual metaphor, this doctoral thesis leads to Visual Analytics methods for Random Forest models interpretability, supporting models and data explanations covering predictive and descriptive purposes. For models (predictive) explanations, ExMatrix arranges logic rules towards global and local visual representations, providing overviews and decisions reasoning. Global explanations can unveil the knowledge learned by the model from a class-labeled dataset, whereas local explanations focus on a particular data instance classification. For data (descriptive) explanations, VAX handles logic rules, resulting in descriptive rules visualization for automated data insights. Data explanations support the identification and visual interpretation of patterns in multivariate datasets. Any problem denoted by a class-labeled dataset is a potential use case for the proposed methods. ExMatrix was applied in analytical chemistry, and VAX was used in real-world datasets for multivariate data analyses. The main contribution of this doctoral thesis lies in Visual Analytics methods supporting Random Forest interpretability for predictive and descriptive purposes in model and data explanations.
id USP_0df515e6b86726d745d0fca16b6e635e
oai_identifier_str oai:teses.usp.br:tde-03032022-105725
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizationsIntepretabilidade de Random Forest - explicando modelos de classificação e dados multivariados por meio de visualizações de regras lógicasClassification Models Interpretability and Models and Multivariate Data ExplanationsIntepretailidade de modelos de classificação e Explicações de modelos e de dados multivariadosLogic Rules VisualizationRandom ForestRandom forestVisualização de regras lógicasClassification models have immense potential and ubiquitous future, considering the vast number of prediction tasks in different domains where such models are applicable. Models interpretability may be just as important as performance, providing global and local explanations to interpret the acquired knowledge and audit decisions. In addition to the predictive ability, classification models can also be employed as descriptive tools, where interpretability involves data explanations. Logic rules have been widely used in interpretability solutions, and Decision Trees are well recognized for consistent logic rules generation. The Random Forest approach (Decision Trees ensemble) has been broadly adopted due to its ability to produce accurate results and deal with multivariate datasets. However, Random Forest models interpretability faces the challenge of handling a substantial number of logic rules. Based on logic rules visualization into a matrix-like visual metaphor, this doctoral thesis leads to Visual Analytics methods for Random Forest models interpretability, supporting models and data explanations covering predictive and descriptive purposes. For models (predictive) explanations, ExMatrix arranges logic rules towards global and local visual representations, providing overviews and decisions reasoning. Global explanations can unveil the knowledge learned by the model from a class-labeled dataset, whereas local explanations focus on a particular data instance classification. For data (descriptive) explanations, VAX handles logic rules, resulting in descriptive rules visualization for automated data insights. Data explanations support the identification and visual interpretation of patterns in multivariate datasets. Any problem denoted by a class-labeled dataset is a potential use case for the proposed methods. ExMatrix was applied in analytical chemistry, and VAX was used in real-world datasets for multivariate data analyses. The main contribution of this doctoral thesis lies in Visual Analytics methods supporting Random Forest interpretability for predictive and descriptive purposes in model and data explanations.Modelos de classificação possuem imenso potencial e futuro ubíquo, considerando o vasto número de tarefas preditivas em diferentes domínios onde estes modelos são aplicáveis. A interpretabilidade dos modelos pode ser tão importante quanto a performance, fornecendo explicações globais e locais para interpretar os conhecimentos adquiridos e auditar decisões. Além da capacidade preditiva, modelos de classificação podem ser aplicados como ferramentas descritivas, onde intepretabilidade envolve explicações de dados. Regras lógicas vêm sendo amplamente utilizadas em soluções para interpretabilidade e Decision Trees são reconhecidas pela geração de regras lógicas consistentes. A abordagem Random Forest conjunto de Decision Trees tem sido amplamente adotada devido a sua habilidade em produzir resultados precisos e manipular conjuntos de dados multivariados. Entretanto, a intepretabilidade de modelos Random Forest enfrenta o desafio de gerir um número considerável de regras. Baseado na visualização de regras lógicas em uma metáfora visual em formato de matriz, esta tese de doutorado resulta em métodos de Visual Analytics para a intepretabilidade de modelos Random Forest, suportando explicações de modelos e de dados cobrindo propósitos preditivos e descritivos. Para explicações de modelos (preditivo), ExMatrix dispõe regras lógicas a formar representações visuais globais e locais, fornecendo visões gerais e análises de decisões. Explicações globais podem revelar o conhecimento aprendido pelo modelo a partir de um conjunto de dados rotulados, enquanto explicações locais focam na classificação de uma instância de dados em particular. Para explicações de dados (descritivo), VAX processa regras lógicas resultando na visualização de regras descritivas para insights automáticos dos dados. Explicações de dados permitem a identificação e a interpretação visual de padrões em conjuntos de dados multivariados. Qualquer problema representado por um conjunto de dados rotulados é um potencial caso de uso para os métodos propostos. O método ExMatrix foi aplicado em química analítica e o método VAX empregado em conjuntos de dados reais para análises de dados multivariados. A principal contribuição desta tese de doutorado reside em métodos de Visual Analytics suportando a interpretabilidade de Random Forest para propósitos preditivos e descritivos em explicações de modelo e de dados.Biblioteca Digitais de Teses e Dissertações da USPPaulovich, Fernando VieiraPopolin Neto, Mário2021-12-15info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-04-24T17:33:24Zoai:teses.usp.br:tde-03032022-105725Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-04-24T17:33:24Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
Intepretabilidade de Random Forest - explicando modelos de classificação e dados multivariados por meio de visualizações de regras lógicas
title Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
spellingShingle Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
Popolin Neto, Mário
Classification Models Interpretability and Models and Multivariate Data Explanations
Intepretailidade de modelos de classificação e Explicações de modelos e de dados multivariados
Logic Rules Visualization
Random Forest
Random forest
Visualização de regras lógicas
title_short Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
title_full Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
title_fullStr Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
title_full_unstemmed Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
title_sort Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations
author Popolin Neto, Mário
author_facet Popolin Neto, Mário
author_role author
dc.contributor.none.fl_str_mv Paulovich, Fernando Vieira
dc.contributor.author.fl_str_mv Popolin Neto, Mário
dc.subject.por.fl_str_mv Classification Models Interpretability and Models and Multivariate Data Explanations
Intepretailidade de modelos de classificação e Explicações de modelos e de dados multivariados
Logic Rules Visualization
Random Forest
Random forest
Visualização de regras lógicas
topic Classification Models Interpretability and Models and Multivariate Data Explanations
Intepretailidade de modelos de classificação e Explicações de modelos e de dados multivariados
Logic Rules Visualization
Random Forest
Random forest
Visualização de regras lógicas
description Classification models have immense potential and ubiquitous future, considering the vast number of prediction tasks in different domains where such models are applicable. Models interpretability may be just as important as performance, providing global and local explanations to interpret the acquired knowledge and audit decisions. In addition to the predictive ability, classification models can also be employed as descriptive tools, where interpretability involves data explanations. Logic rules have been widely used in interpretability solutions, and Decision Trees are well recognized for consistent logic rules generation. The Random Forest approach (Decision Trees ensemble) has been broadly adopted due to its ability to produce accurate results and deal with multivariate datasets. However, Random Forest models interpretability faces the challenge of handling a substantial number of logic rules. Based on logic rules visualization into a matrix-like visual metaphor, this doctoral thesis leads to Visual Analytics methods for Random Forest models interpretability, supporting models and data explanations covering predictive and descriptive purposes. For models (predictive) explanations, ExMatrix arranges logic rules towards global and local visual representations, providing overviews and decisions reasoning. Global explanations can unveil the knowledge learned by the model from a class-labeled dataset, whereas local explanations focus on a particular data instance classification. For data (descriptive) explanations, VAX handles logic rules, resulting in descriptive rules visualization for automated data insights. Data explanations support the identification and visual interpretation of patterns in multivariate datasets. Any problem denoted by a class-labeled dataset is a potential use case for the proposed methods. ExMatrix was applied in analytical chemistry, and VAX was used in real-world datasets for multivariate data analyses. The main contribution of this doctoral thesis lies in Visual Analytics methods supporting Random Forest interpretability for predictive and descriptive purposes in model and data explanations.
publishDate 2021
dc.date.none.fl_str_mv 2021-12-15
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815257828697309184