Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
Ano de defesa: | 2020 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411 |
Resumo: | A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software. |
id |
UFOR_ee015c6a18e062cd68b8a9c87e0e2cb3 |
---|---|
oai_identifier_str |
oai::127411 |
network_acronym_str |
UFOR |
network_name_str |
Biblioteca Digital de Teses e Dissertações da UNIFOR |
repository_id_str |
|
spelling |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoasDesenvolvimento de softwareProteção de dadosA maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.The way in which software systems deal with their users (and their data) has become a predominant concern in recent years, where various branches of society have joined the debate from researchers to legislators, politicians and the general public. We have seen an increasing use and deployment of machine learning technologies that employ personal data and information to make decisions and recommendations that affect people¿s daily lives. However, the way in which software systems consider, process and display the outputs of algorithms, whether automatic learning or not, for their users may suffer bias. In addition, several governments and legal bodies have passed bills on data protection, privacy and property. Therefore, from developers to software managers, they need to be equipped with tools that help in the way they treat and manipulate personal data in their software systems so that they can avoid the presence of bias when developing software. Thus, in this work, we present the Bias Free Software Toolkit, or Bifros<T>. Taking advantage of techniques such as natural language processing, knowledge graphs and static code analysis, this tool is able to identify the classes that represent people in a software system. Then, detect the instances in which people are ranked in the software, which is a known symptom of several different biases and, at the end, inform the user in which places there are possible biases in ordering people. The evaluation of the tool in open source systems indicates good results of precision and recall. Keywords: Knowledge Graph. Code Mining. Bias. Fairness. Software DevelopmentDissertação enviada com certificação e autorização via CI 7305/22 em 04/02/2022Furtado, João José Vasco PeixotoPaixão, Matheus Henrique EstevesCaminha Neto, Carlos de OliveiraPinheiro, Vladia Celia MonteiroAlmeida, Virgílio Augusto FernandesUniversidade de Fortaleza. Programa de Pós-Graduação em Informática AplicadaMarques, Charles Gleison Nunes2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411https://uol.unifor.br/auth-sophia/exibicao/26656porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess2024-01-24T20:38:29Zoai::127411Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br||bib@unifor.bropendoar:2024-01-24T20:38:29Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false |
dc.title.none.fl_str_mv |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
title |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
spellingShingle |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas Marques, Charles Gleison Nunes Desenvolvimento de software Proteção de dados |
title_short |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
title_full |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
title_fullStr |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
title_full_unstemmed |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
title_sort |
Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas |
author |
Marques, Charles Gleison Nunes |
author_facet |
Marques, Charles Gleison Nunes |
author_role |
author |
dc.contributor.none.fl_str_mv |
Furtado, João José Vasco Peixoto Paixão, Matheus Henrique Esteves Caminha Neto, Carlos de Oliveira Pinheiro, Vladia Celia Monteiro Almeida, Virgílio Augusto Fernandes Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada |
dc.contributor.author.fl_str_mv |
Marques, Charles Gleison Nunes |
dc.subject.por.fl_str_mv |
Desenvolvimento de software Proteção de dados |
topic |
Desenvolvimento de software Proteção de dados |
description |
A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411 |
url |
https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://uol.unifor.br/auth-sophia/exibicao/26656 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR instname:Universidade de Fortaleza (UNIFOR) instacron:UNIFOR |
instname_str |
Universidade de Fortaleza (UNIFOR) |
instacron_str |
UNIFOR |
institution |
UNIFOR |
reponame_str |
Biblioteca Digital de Teses e Dissertações da UNIFOR |
collection |
Biblioteca Digital de Teses e Dissertações da UNIFOR |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR) |
repository.mail.fl_str_mv |
bib@unifor.br||bib@unifor.br |
_version_ |
1797239927411310592 |