Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Marques, Charles Gleison Nunes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
Resumo: A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.
id UFOR_ee015c6a18e062cd68b8a9c87e0e2cb3
oai_identifier_str oai::127411
network_acronym_str UFOR
network_name_str Biblioteca Digital de Teses e Dissertações da UNIFOR
repository_id_str
spelling Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoasDesenvolvimento de softwareProteção de dadosA maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.The way in which software systems deal with their users (and their data) has become a predominant concern in recent years, where various branches of society have joined the debate from researchers to legislators, politicians and the general public. We have seen an increasing use and deployment of machine learning technologies that employ personal data and information to make decisions and recommendations that affect people¿s daily lives. However, the way in which software systems consider, process and display the outputs of algorithms, whether automatic learning or not, for their users may suffer bias. In addition, several governments and legal bodies have passed bills on data protection, privacy and property. Therefore, from developers to software managers, they need to be equipped with tools that help in the way they treat and manipulate personal data in their software systems so that they can avoid the presence of bias when developing software. Thus, in this work, we present the Bias Free Software Toolkit, or Bifros<T>. Taking advantage of techniques such as natural language processing, knowledge graphs and static code analysis, this tool is able to identify the classes that represent people in a software system. Then, detect the instances in which people are ranked in the software, which is a known symptom of several different biases and, at the end, inform the user in which places there are possible biases in ordering people. The evaluation of the tool in open source systems indicates good results of precision and recall. Keywords: Knowledge Graph. Code Mining. Bias. Fairness. Software DevelopmentDissertação enviada com certificação e autorização via CI 7305/22 em 04/02/2022Furtado, João José Vasco PeixotoPaixão, Matheus Henrique EstevesCaminha Neto, Carlos de OliveiraPinheiro, Vladia Celia MonteiroAlmeida, Virgílio Augusto FernandesUniversidade de Fortaleza. Programa de Pós-Graduação em Informática AplicadaMarques, Charles Gleison Nunes2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411https://uol.unifor.br/auth-sophia/exibicao/26656porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess2024-01-24T20:38:29Zoai::127411Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br||bib@unifor.bropendoar:2024-01-24T20:38:29Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false
dc.title.none.fl_str_mv Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
spellingShingle Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
Marques, Charles Gleison Nunes
Desenvolvimento de software
Proteção de dados
title_short Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_full Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_fullStr Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_full_unstemmed Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_sort Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
author Marques, Charles Gleison Nunes
author_facet Marques, Charles Gleison Nunes
author_role author
dc.contributor.none.fl_str_mv Furtado, João José Vasco Peixoto
Paixão, Matheus Henrique Esteves
Caminha Neto, Carlos de Oliveira
Pinheiro, Vladia Celia Monteiro
Almeida, Virgílio Augusto Fernandes
Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
dc.contributor.author.fl_str_mv Marques, Charles Gleison Nunes
dc.subject.por.fl_str_mv Desenvolvimento de software
Proteção de dados
topic Desenvolvimento de software
Proteção de dados
description A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.
publishDate 2020
dc.date.none.fl_str_mv 2020
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
url https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://uol.unifor.br/auth-sophia/exibicao/26656
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR
instname:Universidade de Fortaleza (UNIFOR)
instacron:UNIFOR
instname_str Universidade de Fortaleza (UNIFOR)
instacron_str UNIFOR
institution UNIFOR
reponame_str Biblioteca Digital de Teses e Dissertações da UNIFOR
collection Biblioteca Digital de Teses e Dissertações da UNIFOR
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)
repository.mail.fl_str_mv bib@unifor.br||bib@unifor.br
_version_ 1797239927411310592