Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas

Marques, Charles Gleison Nunes

Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas

Detalhes bibliográficos
Ano de defesa:	2020
Autor(a) principal:	Marques, Charles Gleison Nunes
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Desenvolvimento de software Proteção de dados
Link de acesso:	https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
Resumo:	A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.

Metadados do item

id	UFOR_ee015c6a18e062cd68b8a9c87e0e2cb3
oai_identifier_str	oai::127411
network_acronym_str	UFOR
network_name_str	Biblioteca Digital de Teses e Dissertações da UNIFOR
repository_id_str
spelling	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoasDesenvolvimento de softwareProteção de dadosA maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.The way in which software systems deal with their users (and their data) has become a predominant concern in recent years, where various branches of society have joined the debate from researchers to legislators, politicians and the general public. We have seen an increasing use and deployment of machine learning technologies that employ personal data and information to make decisions and recommendations that affect people¿s daily lives. However, the way in which software systems consider, process and display the outputs of algorithms, whether automatic learning or not, for their users may suffer bias. In addition, several governments and legal bodies have passed bills on data protection, privacy and property. Therefore, from developers to software managers, they need to be equipped with tools that help in the way they treat and manipulate personal data in their software systems so that they can avoid the presence of bias when developing software. Thus, in this work, we present the Bias Free Software Toolkit, or Bifros<T>. Taking advantage of techniques such as natural language processing, knowledge graphs and static code analysis, this tool is able to identify the classes that represent people in a software system. Then, detect the instances in which people are ranked in the software, which is a known symptom of several different biases and, at the end, inform the user in which places there are possible biases in ordering people. The evaluation of the tool in open source systems indicates good results of precision and recall. Keywords: Knowledge Graph. Code Mining. Bias. Fairness. Software DevelopmentDissertação enviada com certificação e autorização via CI 7305/22 em 04/02/2022Furtado, João José Vasco PeixotoPaixão, Matheus Henrique EstevesCaminha Neto, Carlos de OliveiraPinheiro, Vladia Celia MonteiroAlmeida, Virgílio Augusto FernandesUniversidade de Fortaleza. Programa de Pós-Graduação em Informática AplicadaMarques, Charles Gleison Nunes2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411https://uol.unifor.br/auth-sophia/exibicao/26656porreponame:Biblioteca Digital de Teses e Dissertações da UNIFORinstname:Universidade de Fortaleza (UNIFOR)instacron:UNIFORinfo:eu-repo/semantics/openAccess2024-01-24T20:38:29Zoai::127411Biblioteca Digital de Teses e Dissertaçõeshttps://www.unifor.br/bdtdONGhttp://dspace.unifor.br/oai/requestbib@unifor.br\|\|bib@unifor.bropendoar:2024-01-24T20:38:29Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)false
dc.title.none.fl_str_mv	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
spellingShingle	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas Marques, Charles Gleison Nunes Desenvolvimento de software Proteção de dados
title_short	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_full	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_fullStr	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_full_unstemmed	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
title_sort	Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas
author	Marques, Charles Gleison Nunes
author_facet	Marques, Charles Gleison Nunes
author_role	author
dc.contributor.none.fl_str_mv	Furtado, João José Vasco Peixoto Paixão, Matheus Henrique Esteves Caminha Neto, Carlos de Oliveira Pinheiro, Vladia Celia Monteiro Almeida, Virgílio Augusto Fernandes Universidade de Fortaleza. Programa de Pós-Graduação em Informática Aplicada
dc.contributor.author.fl_str_mv	Marques, Charles Gleison Nunes
dc.subject.por.fl_str_mv	Desenvolvimento de software Proteção de dados
topic	Desenvolvimento de software Proteção de dados
description	A maneira como os sistemas de software lidam com seus usuários (e seus dados) tornou-se uma preocupação predominante nos últimos anos, onde vários ramos da sociedade se juntaram ao debate de pesquisadores a legisladores, políticos e o público em geral. Observamos um crescente uso e implantação de tecnologias de aprendizado de máquina que empregam dados e informações pessoais para tomar decisões e recomendações que afetam a vida cotidiana das pessoas. No entanto, a maneira pela qual os sistemas de software consideram, processam e exibem as saídas de algoritmos, quer seja de aprendizado automático ou não, para seus usuários pode sofrer vieses. Além disso, vários governos e órgãos legais aprovaram projetos de lei sobre proteção de dados, privacidade e propriedade. Portanto, desde desenvolvedores a gestores de software precisam estar equipados com ferramentas que ajudem na maneira como tratam e manipulam dados pessoais em seus sistemas de software para que possam evitar a presença de vieses ao desenvolver softwares. Assim, neste trabalho, apresentamos a Bias Free Software Toolkit, ou Bifros<T>. Fazendo proveito de técnicas como processamento de linguagem natural, grafos de conhecimento e análise estática de código, esta ferramenta é capaz de identificar as classes que representam pessoas em um sistema de software. Em seguida, detectar as instâncias em que as pessoas são ranqueadas no software, que é um sintoma conhecido de vários vieses diferentes e, ao final, informar para o usuário em quais locais há possível viés de ordenação de pessoas. A avaliação da ferramenta em sistemas de código aberto indica bons resultados de precision e recall. Palavras-chave: Grafo de Conhecimento. Mineração de código. Viés. Justiça. Desenvolvimento de software.
publishDate	2020
dc.date.none.fl_str_mv	2020
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
url	https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/127411
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv	https://uol.unifor.br/auth-sophia/exibicao/26656
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR instname:Universidade de Fortaleza (UNIFOR) instacron:UNIFOR
instname_str	Universidade de Fortaleza (UNIFOR)
instacron_str	UNIFOR
institution	UNIFOR
reponame_str	Biblioteca Digital de Teses e Dissertações da UNIFOR
collection	Biblioteca Digital de Teses e Dissertações da UNIFOR
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UNIFOR - Universidade de Fortaleza (UNIFOR)
repository.mail.fl_str_mv	bib@unifor.br\|\|bib@unifor.br
_version_	1797239927411310592

Identificação de viés em código fonte: o caso da seleção automática de ordenações de pessoas

Registros relacionados