Skin Tone Classification of Human Faces using the MST Scale
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/ |
Resumo: | Skin tone is a critical attribute for fairness and accountability in computer vision (CV), often approximated by ethnicity. CV algorithms are usually data hungry. However, to perform skin tone classification, existing benchmarks lack diversity. Also, available datasets are limited in size, accessibility and range of skin tone scales (≤le;6 classes). We introduced a dataset with 42,313 facial images from 3,564 individuals, sourced from public datasets (e.g., CASIA-WebFace, CASIA Face-Africa, LFW) and annotated using the 10-class Monk Skin Tone (MST) Scale. We proposed and evaluated two classification pipelines: SkinToneCCV, a classical approach using preprocessing and hand-crafted features, and SkinToneNet, a Convolutional Neural Network (CNN). Evaluation spanned image- and identity-level dataset splits, including generalization toward out-of-domain MST-labelled datasets. We further studied four loss functions: Cross-Entropy, Weighted Cross-Entropy, Ordinal Cross-Entropy (OCE) and Weighted OCE showing that DenseNet121 with OCE offered the best trade-off between accuracy and ordinal consistency. SkinToneNet significantly outperformed SkinToneCCV, with DenseNet121 achieving 93.2% weighted off-by-one accuracy under the identity-level split. These results established a strong MST-based baseline and demonstrated the effectiveness of ordinal-aware losses for skin tone prediction. |
| id |
USP_05581f0fc1f4018ec2d112a916392331 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-27082025-203858 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Skin Tone Classification of Human Faces using the MST ScaleClassificação de Tons de Pele de Faces Humanas usando a Escala MSTAprendizado ProfundoClassificaçãoClassificationComputer visionCriação de DatasetsDataset creationDeep learningSkin toneTons de PeleVisão ComputacionalSkin tone is a critical attribute for fairness and accountability in computer vision (CV), often approximated by ethnicity. CV algorithms are usually data hungry. However, to perform skin tone classification, existing benchmarks lack diversity. Also, available datasets are limited in size, accessibility and range of skin tone scales (≤le;6 classes). We introduced a dataset with 42,313 facial images from 3,564 individuals, sourced from public datasets (e.g., CASIA-WebFace, CASIA Face-Africa, LFW) and annotated using the 10-class Monk Skin Tone (MST) Scale. We proposed and evaluated two classification pipelines: SkinToneCCV, a classical approach using preprocessing and hand-crafted features, and SkinToneNet, a Convolutional Neural Network (CNN). Evaluation spanned image- and identity-level dataset splits, including generalization toward out-of-domain MST-labelled datasets. We further studied four loss functions: Cross-Entropy, Weighted Cross-Entropy, Ordinal Cross-Entropy (OCE) and Weighted OCE showing that DenseNet121 with OCE offered the best trade-off between accuracy and ordinal consistency. SkinToneNet significantly outperformed SkinToneCCV, with DenseNet121 achieving 93.2% weighted off-by-one accuracy under the identity-level split. These results established a strong MST-based baseline and demonstrated the effectiveness of ordinal-aware losses for skin tone prediction.O tom de pele é um atributo importante para criação de algoritmos de visão computacional (CV) mais justos, frequentemente aproximado por etnia. Hoje em dia, é comum que algoritmos de CV precisem de massivas quantidades de dados. No entanto, para classificar tons de pele os benchmarks existentes carecem de diversidade, e os conjuntos de dados disponíveis são limitados em tamanho, acessibilidade e na escala de anotação de tom de pele (com ≤6 classes). Nesse trabalho, apresentamos um conjunto de dados com 42.313 imagens faciais de 3.564 identidades, provenientes de bases públicas (por exemplo, CASIAWebFace, CASIA Face-África, LFW) e anotadas usando a escala Monk Skin Tone (MST) de 10 classes. Com esse conjunto avaliamos dois pipelines de classificação: SkinToneCCV, uma abordagem clássica em pré-processamento e descritores manuais, e SkinToneNet, uma CNN (Rede Neural Convolucional). A avaliação abrange uma divisão de dados em nível de imagem e em nível de indivíduos, também mostramos a generalização do modelo para conjuntos de dados fora do nosso domínio. Quatro funções de perda foram testadas: Entropia Cruzada, Entropia Cruzada Ponderada, Entropia Cruzada Ordinal (OCE) e OCE Ponderada, estas mostraram que a DenseNet121 com OCE oferece o melhor equilíbrio entre acurácia e consistência ordinal. O SkinToneNet supera significativamente o SkinToneCCV, com a DenseNet121 alcançando 93,2% de acurácia ponderada off-by-one na divisão em nível de identidade. Esses resultados estabelecem uma linha de base robusta baseada e demonstram a eficácia da consistência ordinal para predição de tom de pele.Biblioteca Digitais de Teses e Dissertações da USPBatista Neto, João do Espírito SantoMatias, Vitor Pereira2025-06-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-08-28T09:03:02Zoai:teses.usp.br:tde-27082025-203858Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-28T09:03:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Skin Tone Classification of Human Faces using the MST Scale Classificação de Tons de Pele de Faces Humanas usando a Escala MST |
| title |
Skin Tone Classification of Human Faces using the MST Scale |
| spellingShingle |
Skin Tone Classification of Human Faces using the MST Scale Matias, Vitor Pereira Aprendizado Profundo Classificação Classification Computer vision Criação de Datasets Dataset creation Deep learning Skin tone Tons de Pele Visão Computacional |
| title_short |
Skin Tone Classification of Human Faces using the MST Scale |
| title_full |
Skin Tone Classification of Human Faces using the MST Scale |
| title_fullStr |
Skin Tone Classification of Human Faces using the MST Scale |
| title_full_unstemmed |
Skin Tone Classification of Human Faces using the MST Scale |
| title_sort |
Skin Tone Classification of Human Faces using the MST Scale |
| author |
Matias, Vitor Pereira |
| author_facet |
Matias, Vitor Pereira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Batista Neto, João do Espírito Santo |
| dc.contributor.author.fl_str_mv |
Matias, Vitor Pereira |
| dc.subject.por.fl_str_mv |
Aprendizado Profundo Classificação Classification Computer vision Criação de Datasets Dataset creation Deep learning Skin tone Tons de Pele Visão Computacional |
| topic |
Aprendizado Profundo Classificação Classification Computer vision Criação de Datasets Dataset creation Deep learning Skin tone Tons de Pele Visão Computacional |
| description |
Skin tone is a critical attribute for fairness and accountability in computer vision (CV), often approximated by ethnicity. CV algorithms are usually data hungry. However, to perform skin tone classification, existing benchmarks lack diversity. Also, available datasets are limited in size, accessibility and range of skin tone scales (≤le;6 classes). We introduced a dataset with 42,313 facial images from 3,564 individuals, sourced from public datasets (e.g., CASIA-WebFace, CASIA Face-Africa, LFW) and annotated using the 10-class Monk Skin Tone (MST) Scale. We proposed and evaluated two classification pipelines: SkinToneCCV, a classical approach using preprocessing and hand-crafted features, and SkinToneNet, a Convolutional Neural Network (CNN). Evaluation spanned image- and identity-level dataset splits, including generalization toward out-of-domain MST-labelled datasets. We further studied four loss functions: Cross-Entropy, Weighted Cross-Entropy, Ordinal Cross-Entropy (OCE) and Weighted OCE showing that DenseNet121 with OCE offered the best trade-off between accuracy and ordinal consistency. SkinToneNet significantly outperformed SkinToneCCV, with DenseNet121 achieving 93.2% weighted off-by-one accuracy under the identity-level split. These results established a strong MST-based baseline and demonstrated the effectiveness of ordinal-aware losses for skin tone prediction. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-06-13 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/ |
| url |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27082025-203858/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370491266433024 |