O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/ |
Resumo: | Um dos principais desafios atuais em Inteligência Artificial é desenvolver modelos mais imparciais, que não perpetuem os diversos tipos de preconceitos presentes na sociedade. Com esse objetivo, surge um campo de pesquisa emergente denominado Senso de Justiça em Aprendizado de Máquina, que visa incorporar conceitos de justiça ao processo de aprendizado. Esses conceitos podem ser integrados nas diferentes etapas desse processo, e a literatura propõe diversos métodos para esse fim, todos focados predominantemente na melhoria de um único conceito de justiça, ao mesmo tempo que tentam preservar a qualidade das previsões. No entanto, ao priorizar a maximização de apenas um conceito, pode ocorrer a deterioração de outras noções de justiça. Em vista disso, este trabalho propõe os métodos DIF-SR, DIF-MS e DIF-PP, baseados nos princípios do Funcionamento Diferencial dos Itens (DIF), que se distinguem pela etapa do processo de aprendizado em que são aplicados: pré-processamento, seleção de modelo e pós-processamento, respectivamente. O DIF é amplamente utilizado na elaboração de testes imparciais, identificando quais questões favorecem ou prejudicam grupos sociodemográficos distintos, com o objetivo de eliminá-las do teste. Além disso, é possível determinar quais dessas questões são mais imparciais para diferentes grupos de pessoas analisados. Por não se fundamentar em nenhum conceito específico de justiça e por possuir um arcabouço matemático robusto para avaliação, a aplicação do DIF representa uma abordagem promissora para induzir modelos de aprendizado de máquina mais justos. Para viabilizar a aplicação das definições de DIF nos métodos propostos, foi desenvolvida uma modelagem inédita que transforma as previsões dos classificadores em itens de teste de avaliação. Os resultados experimentais indicam que os métodos DIF-SR, DIF-MS e DIF-PP contribuem para a indução de classificadores mais imparciais, melhorando múltiplas noções de justiça e, consequentemente, minimizando a propagação de efeitos discriminatórios. |
| id |
USP_45e4b7118d6e7cd22ee91c2175564abc |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-06012025-175603 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais JustosDifferential Item Functioning in Inducing Fairer ClassifiersAnálise de justiçaAprendizado supervisionadoBiasDIFDIFFairness analysisIRTItem response theoryModel selectionPós-processamentoPostprocessingPré-processamentoPreprocessingSeleção de modeloSupervised learningTeoria da resposta itemTRIUnfairnessViésUm dos principais desafios atuais em Inteligência Artificial é desenvolver modelos mais imparciais, que não perpetuem os diversos tipos de preconceitos presentes na sociedade. Com esse objetivo, surge um campo de pesquisa emergente denominado Senso de Justiça em Aprendizado de Máquina, que visa incorporar conceitos de justiça ao processo de aprendizado. Esses conceitos podem ser integrados nas diferentes etapas desse processo, e a literatura propõe diversos métodos para esse fim, todos focados predominantemente na melhoria de um único conceito de justiça, ao mesmo tempo que tentam preservar a qualidade das previsões. No entanto, ao priorizar a maximização de apenas um conceito, pode ocorrer a deterioração de outras noções de justiça. Em vista disso, este trabalho propõe os métodos DIF-SR, DIF-MS e DIF-PP, baseados nos princípios do Funcionamento Diferencial dos Itens (DIF), que se distinguem pela etapa do processo de aprendizado em que são aplicados: pré-processamento, seleção de modelo e pós-processamento, respectivamente. O DIF é amplamente utilizado na elaboração de testes imparciais, identificando quais questões favorecem ou prejudicam grupos sociodemográficos distintos, com o objetivo de eliminá-las do teste. Além disso, é possível determinar quais dessas questões são mais imparciais para diferentes grupos de pessoas analisados. Por não se fundamentar em nenhum conceito específico de justiça e por possuir um arcabouço matemático robusto para avaliação, a aplicação do DIF representa uma abordagem promissora para induzir modelos de aprendizado de máquina mais justos. Para viabilizar a aplicação das definições de DIF nos métodos propostos, foi desenvolvida uma modelagem inédita que transforma as previsões dos classificadores em itens de teste de avaliação. Os resultados experimentais indicam que os métodos DIF-SR, DIF-MS e DIF-PP contribuem para a indução de classificadores mais imparciais, melhorando múltiplas noções de justiça e, consequentemente, minimizando a propagação de efeitos discriminatórios.One of the main challenges in artificial intelligence is to develop more impartial models that do not perpetuate the different types of prejudices in society. With this goal, an emerging field of research called Fairness in Machine Learning arises, which aims to incorporate fairness notions into the learning process. These notions can be integrated at different stages of this process, and the literature proposes several methods for this purpose, all predominantly focused on improving a single fairness notion while at the same time trying to preserve the quality of predictions. However, other fairness notions may deteriorate by prioritizing the maximization of just one of these concepts. Given this, this research proposes the DIF-SR, DIF-MS, and DIF-PP methods based on the principles of Differential Item Functioning (DIF), which are distinguished by the stage of the learning process in which we applied them: pre-processing, model selection, and post-processing, respectively. The DIF is widely used in the development of fairer tests. It identifies which questions favor or harm different sociodemographic groups and aims to eliminate them from the test. Furthermore, it is possible to determine which questions are most unbiased for the different groups of people analyzed. Because it is not based on any specific fairness notions concept of fairness and has a robust mathematical framework for evaluation, the application of DIF represents a promising approach to creating fairer machine learning models. We developed a novel modeling technique that transforms the classifiers\' predictions into evaluation test items, enabling the application of DIF definitions in the proposed methods. The experimental results indicate that the DIF-SR, DIF-MS, and DIF-PP methods contribute to the induction of more impartial classifiers, jointly improving several fairness notions and minimizing the propagation of discriminatory effects.Biblioteca Digitais de Teses e Dissertações da USPCúri, MarianaLopes, Alneu de AndradeMinatel, Diego2024-11-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-01-10T14:08:26Zoai:teses.usp.br:tde-06012025-175603Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-01-10T14:08:26Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos Differential Item Functioning in Inducing Fairer Classifiers |
| title |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos |
| spellingShingle |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos Minatel, Diego Análise de justiça Aprendizado supervisionado Bias DIF DIF Fairness analysis IRT Item response theory Model selection Pós-processamento Postprocessing Pré-processamento Preprocessing Seleção de modelo Supervised learning Teoria da resposta item TRI Unfairness Viés |
| title_short |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos |
| title_full |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos |
| title_fullStr |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos |
| title_full_unstemmed |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos |
| title_sort |
O Funcionamento Diferencial dos Itens na Indução de Classificadores Mais Justos |
| author |
Minatel, Diego |
| author_facet |
Minatel, Diego |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Cúri, Mariana Lopes, Alneu de Andrade |
| dc.contributor.author.fl_str_mv |
Minatel, Diego |
| dc.subject.por.fl_str_mv |
Análise de justiça Aprendizado supervisionado Bias DIF DIF Fairness analysis IRT Item response theory Model selection Pós-processamento Postprocessing Pré-processamento Preprocessing Seleção de modelo Supervised learning Teoria da resposta item TRI Unfairness Viés |
| topic |
Análise de justiça Aprendizado supervisionado Bias DIF DIF Fairness analysis IRT Item response theory Model selection Pós-processamento Postprocessing Pré-processamento Preprocessing Seleção de modelo Supervised learning Teoria da resposta item TRI Unfairness Viés |
| description |
Um dos principais desafios atuais em Inteligência Artificial é desenvolver modelos mais imparciais, que não perpetuem os diversos tipos de preconceitos presentes na sociedade. Com esse objetivo, surge um campo de pesquisa emergente denominado Senso de Justiça em Aprendizado de Máquina, que visa incorporar conceitos de justiça ao processo de aprendizado. Esses conceitos podem ser integrados nas diferentes etapas desse processo, e a literatura propõe diversos métodos para esse fim, todos focados predominantemente na melhoria de um único conceito de justiça, ao mesmo tempo que tentam preservar a qualidade das previsões. No entanto, ao priorizar a maximização de apenas um conceito, pode ocorrer a deterioração de outras noções de justiça. Em vista disso, este trabalho propõe os métodos DIF-SR, DIF-MS e DIF-PP, baseados nos princípios do Funcionamento Diferencial dos Itens (DIF), que se distinguem pela etapa do processo de aprendizado em que são aplicados: pré-processamento, seleção de modelo e pós-processamento, respectivamente. O DIF é amplamente utilizado na elaboração de testes imparciais, identificando quais questões favorecem ou prejudicam grupos sociodemográficos distintos, com o objetivo de eliminá-las do teste. Além disso, é possível determinar quais dessas questões são mais imparciais para diferentes grupos de pessoas analisados. Por não se fundamentar em nenhum conceito específico de justiça e por possuir um arcabouço matemático robusto para avaliação, a aplicação do DIF representa uma abordagem promissora para induzir modelos de aprendizado de máquina mais justos. Para viabilizar a aplicação das definições de DIF nos métodos propostos, foi desenvolvida uma modelagem inédita que transforma as previsões dos classificadores em itens de teste de avaliação. Os resultados experimentais indicam que os métodos DIF-SR, DIF-MS e DIF-PP contribuem para a indução de classificadores mais imparciais, melhorando múltiplas noções de justiça e, consequentemente, minimizando a propagação de efeitos discriminatórios. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-11-08 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012025-175603/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1831214825106046976 |