O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Minatel, Diego
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
DIF
IRT
TRI
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/
Resumo: Um dos principais desafios atuais em Inteligência Artificial é desenvolver modelos mais imparciais, que não perpetuem os diversos tipos de preconceitos presentes na sociedade. Com esse objetivo, surge um campo de pesquisa emergente denominado Senso de Justiça em Aprendizado de Máquina, que visa incorporar conceitos de justiça ao processo de aprendizado. Esses conceitos podem ser integrados nas diferentes etapas desse processo, e a literatura propõe diversos métodos para esse fim, todos focados predominantemente na melhoria de um único conceito de justiça, ao mesmo tempo que tentam preservar a qualidade das previsões. No entanto, ao priorizar a maximização de apenas um conceito, pode ocorrer a deterioração de outras noções de justiça. Em vista disso, este trabalho propõe os métodos DIF-SR, DIF-MS e DIF-PP, baseados nos princípios do Funcionamento Diferencial dos Itens (DIF), que se distinguem pela etapa do processo de aprendizado em que são aplicados: pré-processamento, seleção de modelo e pós-processamento, respectivamente. O DIF é amplamente utilizado na elaboração de testes imparciais, identificando quais questões favorecem ou prejudicam grupos sociodemográficos distintos, com o objetivo de eliminá-las do teste. Além disso, é possível determinar quais dessas questões são mais imparciais para diferentes grupos de pessoas analisados. Por não se fundamentar em nenhum conceito específico de justiça e por possuir um arcabouço matemático robusto para avaliação, a aplicação do DIF representa uma abordagem promissora para induzir modelos de aprendizado de máquina mais justos. Para viabilizar a aplicação das definições de DIF nos métodos propostos, foi desenvolvida uma modelagem inédita que transforma as previsões dos classificadores em itens de teste de avaliação. Os resultados experimentais indicam que os métodos DIF-SR, DIF-MS e DIF-PP contribuem para a indução de classificadores mais imparciais, melhorando múltiplas noções de justiça e, consequentemente, minimizando a propagação de efeitos discriminatórios.
id USP_45e4b7118d6e7cd22ee91c2175564abc
oai_identifier_str oai:teses.usp.br:tde-06012025-175603
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais JustosDifferential Item Functioning in Inducing Fairer ClassifiersAnálise de justiçaAprendizado supervisionadoBiasDIFDIFFairness analysisIRTItem response theoryModel selectionPós-processamentoPostprocessingPré-processamentoPreprocessingSeleção de modeloSupervised learningTeoria da resposta itemTRIUnfairnessViésUm dos principais desafios atuais em Inteligência Artificial é desenvolver modelos mais imparciais, que não perpetuem os diversos tipos de preconceitos presentes na sociedade. Com esse objetivo, surge um campo de pesquisa emergente denominado Senso de Justiça em Aprendizado de Máquina, que visa incorporar conceitos de justiça ao processo de aprendizado. Esses conceitos podem ser integrados nas diferentes etapas desse processo, e a literatura propõe diversos métodos para esse fim, todos focados predominantemente na melhoria de um único conceito de justiça, ao mesmo tempo que tentam preservar a qualidade das previsões. No entanto, ao priorizar a maximização de apenas um conceito, pode ocorrer a deterioração de outras noções de justiça. Em vista disso, este trabalho propõe os métodos DIF-SR, DIF-MS e DIF-PP, baseados nos princípios do Funcionamento Diferencial dos Itens (DIF), que se distinguem pela etapa do processo de aprendizado em que são aplicados: pré-processamento, seleção de modelo e pós-processamento, respectivamente. O DIF é amplamente utilizado na elaboração de testes imparciais, identificando quais questões favorecem ou prejudicam grupos sociodemográficos distintos, com o objetivo de eliminá-las do teste. Além disso, é possível determinar quais dessas questões são mais imparciais para diferentes grupos de pessoas analisados. Por não se fundamentar em nenhum conceito específico de justiça e por possuir um arcabouço matemático robusto para avaliação, a aplicação do DIF representa uma abordagem promissora para induzir modelos de aprendizado de máquina mais justos. Para viabilizar a aplicação das definições de DIF nos métodos propostos, foi desenvolvida uma modelagem inédita que transforma as previsões dos classificadores em itens de teste de avaliação. Os resultados experimentais indicam que os métodos DIF-SR, DIF-MS e DIF-PP contribuem para a indução de classificadores mais imparciais, melhorando múltiplas noções de justiça e, consequentemente, minimizando a propagação de efeitos discriminatórios.One of the main challenges in artificial intelligence is to develop more impartial models that do not perpetuate the different types of prejudices in society. With this goal, an emerging field of research called Fairness in Machine Learning arises, which aims to incorporate fairness notions into the learning process. These notions can be integrated at different stages of this process, and the literature proposes several methods for this purpose, all predominantly focused on improving a single fairness notion while at the same time trying to preserve the quality of predictions. However, other fairness notions may deteriorate by prioritizing the maximization of just one of these concepts. Given this, this research proposes the DIF-SR, DIF-MS, and DIF-PP methods based on the principles of Differential Item Functioning (DIF), which are distinguished by the stage of the learning process in which we applied them: pre-processing, model selection, and post-processing, respectively. The DIF is widely used in the development of fairer tests. It identifies which questions favor or harm different sociodemographic groups and aims to eliminate them from the test. Furthermore, it is possible to determine which questions are most unbiased for the different groups of people analyzed. Because it is not based on any specific fairness notions concept of fairness and has a robust mathematical framework for evaluation, the application of DIF represents a promising approach to creating fairer machine learning models. We developed a novel modeling technique that transforms the classifiers\' predictions into evaluation test items, enabling the application of DIF definitions in the proposed methods. The experimental results indicate that the DIF-SR, DIF-MS, and DIF-PP methods contribute to the induction of more impartial classifiers, jointly improving several fairness notions and minimizing the propagation of discriminatory effects.Biblioteca Digitais de Teses e Dissertações da USPCúri, MarianaLopes, Alneu de AndradeMinatel, Diego2024-11-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-01-10T14:08:26Zoai:teses.usp.br:tde-06012025-175603Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-01-10T14:08:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
Differential Item Functioning in Inducing Fairer Classifiers
title O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
spellingShingle O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
Minatel, Diego
Análise de justiça
Aprendizado supervisionado
Bias
DIF
DIF
Fairness analysis
IRT
Item response theory
Model selection
Pós-processamento
Postprocessing
Pré-processamento
Preprocessing
Seleção de modelo
Supervised learning
Teoria da resposta item
TRI
Unfairness
Viés
title_short O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
title_full O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
title_fullStr O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
title_full_unstemmed O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
title_sort O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
author Minatel, Diego
author_facet Minatel, Diego
author_role author
dc.contributor.none.fl_str_mv Cúri, Mariana
Lopes, Alneu de Andrade
dc.contributor.author.fl_str_mv Minatel, Diego
dc.subject.por.fl_str_mv Análise de justiça
Aprendizado supervisionado
Bias
DIF
DIF
Fairness analysis
IRT
Item response theory
Model selection
Pós-processamento
Postprocessing
Pré-processamento
Preprocessing
Seleção de modelo
Supervised learning
Teoria da resposta item
TRI
Unfairness
Viés
topic Análise de justiça
Aprendizado supervisionado
Bias
DIF
DIF
Fairness analysis
IRT
Item response theory
Model selection
Pós-processamento
Postprocessing
Pré-processamento
Preprocessing
Seleção de modelo
Supervised learning
Teoria da resposta item
TRI
Unfairness
Viés
description Um dos principais desafios atuais em Inteligência Artificial é desenvolver modelos mais imparciais, que não perpetuem os diversos tipos de preconceitos presentes na sociedade. Com esse objetivo, surge um campo de pesquisa emergente denominado Senso de Justiça em Aprendizado de Máquina, que visa incorporar conceitos de justiça ao processo de aprendizado. Esses conceitos podem ser integrados nas diferentes etapas desse processo, e a literatura propõe diversos métodos para esse fim, todos focados predominantemente na melhoria de um único conceito de justiça, ao mesmo tempo que tentam preservar a qualidade das previsões. No entanto, ao priorizar a maximização de apenas um conceito, pode ocorrer a deterioração de outras noções de justiça. Em vista disso, este trabalho propõe os métodos DIF-SR, DIF-MS e DIF-PP, baseados nos princípios do Funcionamento Diferencial dos Itens (DIF), que se distinguem pela etapa do processo de aprendizado em que são aplicados: pré-processamento, seleção de modelo e pós-processamento, respectivamente. O DIF é amplamente utilizado na elaboração de testes imparciais, identificando quais questões favorecem ou prejudicam grupos sociodemográficos distintos, com o objetivo de eliminá-las do teste. Além disso, é possível determinar quais dessas questões são mais imparciais para diferentes grupos de pessoas analisados. Por não se fundamentar em nenhum conceito específico de justiça e por possuir um arcabouço matemático robusto para avaliação, a aplicação do DIF representa uma abordagem promissora para induzir modelos de aprendizado de máquina mais justos. Para viabilizar a aplicação das definições de DIF nos métodos propostos, foi desenvolvida uma modelagem inédita que transforma as previsões dos classificadores em itens de teste de avaliação. Os resultados experimentais indicam que os métodos DIF-SR, DIF-MS e DIF-PP contribuem para a indução de classificadores mais imparciais, melhorando múltiplas noções de justiça e, consequentemente, minimizando a propagação de efeitos discriminatórios.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1831214825106046976