Reduzindo viés em classificação de tons de pele em bases de dados de imagens
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29112022-161352/ |
Resumo: | Grandes conjuntos de dados de imagens de faces são frequentemente usados para treinar e implementar soluções de visão computacional para reconhecimento facial. Nesse contexto, a aplicação de tais modelos em diferentes populações levanta preocupações sobre a existência de exemplos suficientes e representativos para as diversas classes / grupos em termos de gênero, idade e cor da pele, entre outros atributos. O viés de seleção desses dados é inserido durante a coleta. É difícil encontrar bancos de dados que sejam anotados por cor da pele ou atributos étnico-raciais, o que também dificulta o estudo de viés de seleção nesse contexto em aprendizado de máquina. O objetivo deste projeto de pesquisa é propor e avaliar um método para detecção de tons de pele em imagens que tenham desempenho equilibrado para diferentes tipos de pele e que permita auditar bases de dados de forma a minimizar problemas com viés de seleção em modelos de reconhecimento facial em direção a uma classificação justa. O método proposto consiste em aplicar diferentes abordagens de processamento de imagens e algoritmos para rotulagem automática da cor da pele, selecionando as melhores abordagens para cada tipo de cor de pele (usando o sistema de classificação Fitzpatrick Skin Type) de acordo com o F-score obtido e aplicando-as em ordem de prioridade. Mostramos que o uso de uma única abordagem tende a direcionar os melhores resultados para faixas específicas de tons de pele, enquanto a combinação reduz o viés geral e melhora a classificação em diferentes tipos de pele. Aplicamos a proposta no banco de dados de faces LFW e no banco de dados dermatológico Fitzpatrick17k usando transformações gama, CLAHE, equalização de histogramas e filtros estatísticos de ordem não linear. Mostramos que um extrator de características com pesos pré treinados da Facenet usando o modelo de rede neural convolucional ResNet50 como base tem pior desempenho na distinção de pessoas de pele escura e que é possível mitigar esse efeito através de técnicas de pré-processamento de imagens combinando abordagens que sejam melhores em cada faixa de tom de pele para obter um método de rotulação automática de grandes bancos de dados que se aproxime da rotulação manual. Por fim, disponibilizamos para futuros trabalhos, além da descrição do método, um destacamento da LFW com anotações manuais de tons de pele de 150 pessoas únicas e anotações de cor de pele para cada imagem da base LFW completa feitas a partir do método de classificação automática proposto. |
| id |
USP_b8535cead4a5bc6f6250797e0266e95e |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-29112022-161352 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Reduzindo viés em classificação de tons de pele em bases de dados de imagensReducing bias in skin tone classification in image databasesClassificação de tom de peleClassificação justaDiversidade de facesFace recognitionFair classificationImage ProcessingProcessamento de imagensReconhecimento facialRepresentativenessSkin tone classificationGrandes conjuntos de dados de imagens de faces são frequentemente usados para treinar e implementar soluções de visão computacional para reconhecimento facial. Nesse contexto, a aplicação de tais modelos em diferentes populações levanta preocupações sobre a existência de exemplos suficientes e representativos para as diversas classes / grupos em termos de gênero, idade e cor da pele, entre outros atributos. O viés de seleção desses dados é inserido durante a coleta. É difícil encontrar bancos de dados que sejam anotados por cor da pele ou atributos étnico-raciais, o que também dificulta o estudo de viés de seleção nesse contexto em aprendizado de máquina. O objetivo deste projeto de pesquisa é propor e avaliar um método para detecção de tons de pele em imagens que tenham desempenho equilibrado para diferentes tipos de pele e que permita auditar bases de dados de forma a minimizar problemas com viés de seleção em modelos de reconhecimento facial em direção a uma classificação justa. O método proposto consiste em aplicar diferentes abordagens de processamento de imagens e algoritmos para rotulagem automática da cor da pele, selecionando as melhores abordagens para cada tipo de cor de pele (usando o sistema de classificação Fitzpatrick Skin Type) de acordo com o F-score obtido e aplicando-as em ordem de prioridade. Mostramos que o uso de uma única abordagem tende a direcionar os melhores resultados para faixas específicas de tons de pele, enquanto a combinação reduz o viés geral e melhora a classificação em diferentes tipos de pele. Aplicamos a proposta no banco de dados de faces LFW e no banco de dados dermatológico Fitzpatrick17k usando transformações gama, CLAHE, equalização de histogramas e filtros estatísticos de ordem não linear. Mostramos que um extrator de características com pesos pré treinados da Facenet usando o modelo de rede neural convolucional ResNet50 como base tem pior desempenho na distinção de pessoas de pele escura e que é possível mitigar esse efeito através de técnicas de pré-processamento de imagens combinando abordagens que sejam melhores em cada faixa de tom de pele para obter um método de rotulação automática de grandes bancos de dados que se aproxime da rotulação manual. Por fim, disponibilizamos para futuros trabalhos, além da descrição do método, um destacamento da LFW com anotações manuais de tons de pele de 150 pessoas únicas e anotações de cor de pele para cada imagem da base LFW completa feitas a partir do método de classificação automática proposto.Large face datasets are often used to train and deploy Computer Vision solutions for face recognition. In this context, the application of such models in different populations raises concerns about the existence of sufficient and representative examples for the diverse classes/groups in terms of gender, age and skin color, among others attributes. The selection bias in such data may be inserted during the sample collection. It is difficult to find databases that are annotated by skin color or ethnic-racial attributes, which also makes it difficult to study selection bias in this context in machine learning. The objective of this work is to propose and evaluate an automatic classification method for skin tones in images with balanced performance across different skin types and that allows auditing databases in order to minimize problems with selection bias in facial recognition models towards a fair classification. The proposed method consists of applying different processing approaches and algorithms for automatic skin color labeling, selecting the best approaches for each skin color type (using the dermatologist approved Fitzpatrick Skin Type classification system) according to the F-score obtained and applying them in an order of priority. We show that using a single approach will bias the best results towards specific skin tone ranges, while combining it reduce the overall bias and improves classification across different skin types. We applied the proposal in the LFW faces database and in the Fitzpatrick17k dermatological database using gamma transformations, CLAHE, histogram equalization and non-linear order statistics filters. We showed that a feature extractor with pre-trained weights from Facenet using the convolutional neural network model ResNet50 as a base has worse performance in distinguishing dark-skinned people and that it is possible to mitigate this effect through image pre-processing techniques combining approaches that are best across each skin tone range to achieve an auto-labeling approach of large databases that approximates manual labeling. Finally, we provide for future works, in addition to the description of the method, an LFW detachment with manual annotations of skin tones of 150 unique people and also skin color annotations for each image of the complete LFW base made from of the proposed automatic classification method.Biblioteca Digitais de Teses e Dissertações da USPPonti, Moacir AntonelliManoel, Luiz Augusto Vieira2022-09-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-29112022-161352/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2022-11-29T19:12:00Zoai:teses.usp.br:tde-29112022-161352Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212022-11-29T19:12Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens Reducing bias in skin tone classification in image databases |
| title |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens |
| spellingShingle |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens Manoel, Luiz Augusto Vieira Classificação de tom de pele Classificação justa Diversidade de faces Face recognition Fair classification Image Processing Processamento de imagens Reconhecimento facial Representativeness Skin tone classification |
| title_short |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens |
| title_full |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens |
| title_fullStr |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens |
| title_full_unstemmed |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens |
| title_sort |
Reduzindo viés em classificação de tons de pele em bases de dados de imagens |
| author |
Manoel, Luiz Augusto Vieira |
| author_facet |
Manoel, Luiz Augusto Vieira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ponti, Moacir Antonelli |
| dc.contributor.author.fl_str_mv |
Manoel, Luiz Augusto Vieira |
| dc.subject.por.fl_str_mv |
Classificação de tom de pele Classificação justa Diversidade de faces Face recognition Fair classification Image Processing Processamento de imagens Reconhecimento facial Representativeness Skin tone classification |
| topic |
Classificação de tom de pele Classificação justa Diversidade de faces Face recognition Fair classification Image Processing Processamento de imagens Reconhecimento facial Representativeness Skin tone classification |
| description |
Grandes conjuntos de dados de imagens de faces são frequentemente usados para treinar e implementar soluções de visão computacional para reconhecimento facial. Nesse contexto, a aplicação de tais modelos em diferentes populações levanta preocupações sobre a existência de exemplos suficientes e representativos para as diversas classes / grupos em termos de gênero, idade e cor da pele, entre outros atributos. O viés de seleção desses dados é inserido durante a coleta. É difícil encontrar bancos de dados que sejam anotados por cor da pele ou atributos étnico-raciais, o que também dificulta o estudo de viés de seleção nesse contexto em aprendizado de máquina. O objetivo deste projeto de pesquisa é propor e avaliar um método para detecção de tons de pele em imagens que tenham desempenho equilibrado para diferentes tipos de pele e que permita auditar bases de dados de forma a minimizar problemas com viés de seleção em modelos de reconhecimento facial em direção a uma classificação justa. O método proposto consiste em aplicar diferentes abordagens de processamento de imagens e algoritmos para rotulagem automática da cor da pele, selecionando as melhores abordagens para cada tipo de cor de pele (usando o sistema de classificação Fitzpatrick Skin Type) de acordo com o F-score obtido e aplicando-as em ordem de prioridade. Mostramos que o uso de uma única abordagem tende a direcionar os melhores resultados para faixas específicas de tons de pele, enquanto a combinação reduz o viés geral e melhora a classificação em diferentes tipos de pele. Aplicamos a proposta no banco de dados de faces LFW e no banco de dados dermatológico Fitzpatrick17k usando transformações gama, CLAHE, equalização de histogramas e filtros estatísticos de ordem não linear. Mostramos que um extrator de características com pesos pré treinados da Facenet usando o modelo de rede neural convolucional ResNet50 como base tem pior desempenho na distinção de pessoas de pele escura e que é possível mitigar esse efeito através de técnicas de pré-processamento de imagens combinando abordagens que sejam melhores em cada faixa de tom de pele para obter um método de rotulação automática de grandes bancos de dados que se aproxime da rotulação manual. Por fim, disponibilizamos para futuros trabalhos, além da descrição do método, um destacamento da LFW com anotações manuais de tons de pele de 150 pessoas únicas e anotações de cor de pele para cada imagem da base LFW completa feitas a partir do método de classificação automática proposto. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-09-26 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29112022-161352/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29112022-161352/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258583988699136 |