Skin Tone Classification of Human Faces using the MST Scale

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Matias, Vitor Pereira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/
Resumo: Skin tone is a critical attribute for fairness and accountability in computer vision (CV), often approximated by ethnicity. CV algorithms are usually data hungry. However, to perform skin tone classification, existing benchmarks lack diversity. Also, available datasets are limited in size, accessibility and range of skin tone scales (≤le;6 classes). We introduced a dataset with 42,313 facial images from 3,564 individuals, sourced from public datasets (e.g., CASIA-WebFace, CASIA Face-Africa, LFW) and annotated using the 10-class Monk Skin Tone (MST) Scale. We proposed and evaluated two classification pipelines: SkinToneCCV, a classical approach using preprocessing and hand-crafted features, and SkinToneNet, a Convolutional Neural Network (CNN). Evaluation spanned image- and identity-level dataset splits, including generalization toward out-of-domain MST-labelled datasets. We further studied four loss functions: Cross-Entropy, Weighted Cross-Entropy, Ordinal Cross-Entropy (OCE) and Weighted OCE showing that DenseNet121 with OCE offered the best trade-off between accuracy and ordinal consistency. SkinToneNet significantly outperformed SkinToneCCV, with DenseNet121 achieving 93.2% weighted off-by-one accuracy under the identity-level split. These results established a strong MST-based baseline and demonstrated the effectiveness of ordinal-aware losses for skin tone prediction.
id USP_05581f0fc1f4018ec2d112a916392331
oai_identifier_str oai:teses.usp.br:tde-27082025-203858
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Skin Tone Classification of Human Faces using the MST ScaleClassificação de Tons de Pele de Faces Humanas usando a Escala MSTAprendizado ProfundoClassificaçãoClassificationComputer visionCriação de DatasetsDataset creationDeep learningSkin toneTons de PeleVisão ComputacionalSkin tone is a critical attribute for fairness and accountability in computer vision (CV), often approximated by ethnicity. CV algorithms are usually data hungry. However, to perform skin tone classification, existing benchmarks lack diversity. Also, available datasets are limited in size, accessibility and range of skin tone scales (≤le;6 classes). We introduced a dataset with 42,313 facial images from 3,564 individuals, sourced from public datasets (e.g., CASIA-WebFace, CASIA Face-Africa, LFW) and annotated using the 10-class Monk Skin Tone (MST) Scale. We proposed and evaluated two classification pipelines: SkinToneCCV, a classical approach using preprocessing and hand-crafted features, and SkinToneNet, a Convolutional Neural Network (CNN). Evaluation spanned image- and identity-level dataset splits, including generalization toward out-of-domain MST-labelled datasets. We further studied four loss functions: Cross-Entropy, Weighted Cross-Entropy, Ordinal Cross-Entropy (OCE) and Weighted OCE showing that DenseNet121 with OCE offered the best trade-off between accuracy and ordinal consistency. SkinToneNet significantly outperformed SkinToneCCV, with DenseNet121 achieving 93.2% weighted off-by-one accuracy under the identity-level split. These results established a strong MST-based baseline and demonstrated the effectiveness of ordinal-aware losses for skin tone prediction.O tom de pele é um atributo importante para criação de algoritmos de visão computacional (CV) mais justos, frequentemente aproximado por etnia. Hoje em dia, é comum que algoritmos de CV precisem de massivas quantidades de dados. No entanto, para classificar tons de pele os benchmarks existentes carecem de diversidade, e os conjuntos de dados disponíveis são limitados em tamanho, acessibilidade e na escala de anotação de tom de pele (com ≤6 classes). Nesse trabalho, apresentamos um conjunto de dados com 42.313 imagens faciais de 3.564 identidades, provenientes de bases públicas (por exemplo, CASIAWebFace, CASIA Face-África, LFW) e anotadas usando a escala Monk Skin Tone (MST) de 10 classes. Com esse conjunto avaliamos dois pipelines de classificação: SkinToneCCV, uma abordagem clássica em pré-processamento e descritores manuais, e SkinToneNet, uma CNN (Rede Neural Convolucional). A avaliação abrange uma divisão de dados em nível de imagem e em nível de indivíduos, também mostramos a generalização do modelo para conjuntos de dados fora do nosso domínio. Quatro funções de perda foram testadas: Entropia Cruzada, Entropia Cruzada Ponderada, Entropia Cruzada Ordinal (OCE) e OCE Ponderada, estas mostraram que a DenseNet121 com OCE oferece o melhor equilíbrio entre acurácia e consistência ordinal. O SkinToneNet supera significativamente o SkinToneCCV, com a DenseNet121 alcançando 93,2% de acurácia ponderada off-by-one na divisão em nível de identidade. Esses resultados estabelecem uma linha de base robusta baseada e demonstram a eficácia da consistência ordinal para predição de tom de pele.Biblioteca Digitais de Teses e Dissertações da USPBatista Neto, João do Espírito SantoMatias, Vitor Pereira2025-06-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-08-28T09:03:02Zoai:teses.usp.br:tde-27082025-203858Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-28T09:03:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Skin Tone Classification of Human Faces using the MST Scale
Classificação de Tons de Pele de Faces Humanas usando a Escala MST
title Skin Tone Classification of Human Faces using the MST Scale
spellingShingle Skin Tone Classification of Human Faces using the MST Scale
Matias, Vitor Pereira
Aprendizado Profundo
Classificação
Classification
Computer vision
Criação de Datasets
Dataset creation
Deep learning
Skin tone
Tons de Pele
Visão Computacional
title_short Skin Tone Classification of Human Faces using the MST Scale
title_full Skin Tone Classification of Human Faces using the MST Scale
title_fullStr Skin Tone Classification of Human Faces using the MST Scale
title_full_unstemmed Skin Tone Classification of Human Faces using the MST Scale
title_sort Skin Tone Classification of Human Faces using the MST Scale
author Matias, Vitor Pereira
author_facet Matias, Vitor Pereira
author_role author
dc.contributor.none.fl_str_mv Batista Neto, João do Espírito Santo
dc.contributor.author.fl_str_mv Matias, Vitor Pereira
dc.subject.por.fl_str_mv Aprendizado Profundo
Classificação
Classification
Computer vision
Criação de Datasets
Dataset creation
Deep learning
Skin tone
Tons de Pele
Visão Computacional
topic Aprendizado Profundo
Classificação
Classification
Computer vision
Criação de Datasets
Dataset creation
Deep learning
Skin tone
Tons de Pele
Visão Computacional
description Skin tone is a critical attribute for fairness and accountability in computer vision (CV), often approximated by ethnicity. CV algorithms are usually data hungry. However, to perform skin tone classification, existing benchmarks lack diversity. Also, available datasets are limited in size, accessibility and range of skin tone scales (≤le;6 classes). We introduced a dataset with 42,313 facial images from 3,564 individuals, sourced from public datasets (e.g., CASIA-WebFace, CASIA Face-Africa, LFW) and annotated using the 10-class Monk Skin Tone (MST) Scale. We proposed and evaluated two classification pipelines: SkinToneCCV, a classical approach using preprocessing and hand-crafted features, and SkinToneNet, a Convolutional Neural Network (CNN). Evaluation spanned image- and identity-level dataset splits, including generalization toward out-of-domain MST-labelled datasets. We further studied four loss functions: Cross-Entropy, Weighted Cross-Entropy, Ordinal Cross-Entropy (OCE) and Weighted OCE showing that DenseNet121 with OCE offered the best trade-off between accuracy and ordinal consistency. SkinToneNet significantly outperformed SkinToneCCV, with DenseNet121 achieving 93.2% weighted off-by-one accuracy under the identity-level split. These results established a strong MST-based baseline and demonstrated the effectiveness of ordinal-aware losses for skin tone prediction.
publishDate 2025
dc.date.none.fl_str_mv 2025-06-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/
url https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370491266433024