Margin-based learning to enhance open-set semantic segmentation

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Brilhador, Anderson
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/36088
Resumo: Semantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.
id UTFPR-12_1314c1b64238c68aced502e787ddae8c
oai_identifier_str oai:repositorio.utfpr.edu.br:1/36088
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Margin-based learning to enhance open-set semantic segmentationAprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto abertoImagens digitaisAprendizado profundo (Aprendizado do computador)Computação semânticaSegmentação de imagemSistemas de reconhecimento de padrõesVisão por computadorRedes neurais (Computação)Digital imagesDeep learning (Machine learning)Semantic computingImage segmentationPattern recognition systemsComputer visionNeural networks (Computer science)CNPQ::ENGENHARIAS::ENGENHARIA ELETRICAEngenharia ElétricaSemantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.A segmentação semântica recebeu grande atenção como uma solução viável para interpretar efetivamente informações em imagens digitais. As soluções são normalmente construídas com uma percepção estática de conjunto fechado, onde todos os rótulos são conhecidos a priori. No entanto, em aplicações do mundo real, é preciso lidar com objetos de classes desconhecidas. A segmentação semântica de conjunto aberto (OSSS) é uma abordagem que incorpora a percepção de conjunto aberto na segmentação semântica, permitindo o reconhecimento de classes desconhecidas de objetos. Embora vários estudos tenham explorado o OSSS, seu desempenho permanece limitado devido à baixa qualidade de representação de características e desafios como dados desbalanceados, regiões de limites incertas e mudanças semânticas. Esses desafios resultam em modelos de segmentação semântica de conjunto fechado que constroem espaços de incorporação com limites de decisão sobrepostos e espaço aberto insuficiente para acomodar classes desconhecidas, impactando negativamente o desempenho do reconhecimento de conjunto aberto. Esta tese apresenta duas novas funções de perda baseadas em aprendizado baseado em margem e atenção a amostras difíceis para aprimorar o reconhecimento de conjunto aberto. Dois novos classificadores de conjunto aberto são propostos: um que emprega Componentes Principais e o outro que usa Distância Prototípica. Ambos são projetados para se beneficiar dos recursos gerados pelas funções de perda propostas. Experimentos foram conduzidos em seis conjuntos de dados, dos quais três foram originalmente propostos neste trabalho, e os resultados demonstram que os métodos propostos superam estratégias de aprendizado de última geração em OSSS. Essas descobertas ressaltam a importância de tais abordagens de aprendizagem, abrindo caminho para sua aplicação em sistemas do mundo real que exigem reconhecimento robusto de conjuntos abertos.Universidade Tecnológica Federal do ParanáCuritibaBrasilPrograma de Pós-Graduação em Engenharia Elétrica e Informática IndustrialUTFPRLazzaretti, André Eugêniohttps://orcid.org/0000-0003-1861-3369http://lattes.cnpq.br/7649611874688878Lopes, Heitor Silvériohttps://orcid.org/0000-0003-3984-1432http://lattes.cnpq.br/4045818083957064Lazzaretti, André Eugêniohttps://orcid.org/0000-0003-1861-3369http://lattes.cnpq.br/7649611874688878Gomes, David Menottihttps://orcid.org/0000-0003-2430-2030http://lattes.cnpq.br/6692968437800167Lopes, Fabrício Martinshttp://orcid.org/0000-0002-8786-3313http://lattes.cnpq.br/1660070580824436Pedrini, Héliohttps://orcid.org/0000-0003-0125-630Xhttp://lattes.cnpq.br/9600140904712115Bugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118Brilhador, Anderson2025-03-13T20:39:27Z2025-03-13T20:39:27Z2025-02-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/36088enghttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-03-14T06:10:47Zoai:repositorio.utfpr.edu.br:1/36088Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-03-14T06:10:47Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Margin-based learning to enhance open-set semantic segmentation
Aprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto aberto
title Margin-based learning to enhance open-set semantic segmentation
spellingShingle Margin-based learning to enhance open-set semantic segmentation
Brilhador, Anderson
Imagens digitais
Aprendizado profundo (Aprendizado do computador)
Computação semântica
Segmentação de imagem
Sistemas de reconhecimento de padrões
Visão por computador
Redes neurais (Computação)
Digital images
Deep learning (Machine learning)
Semantic computing
Image segmentation
Pattern recognition systems
Computer vision
Neural networks (Computer science)
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Engenharia Elétrica
title_short Margin-based learning to enhance open-set semantic segmentation
title_full Margin-based learning to enhance open-set semantic segmentation
title_fullStr Margin-based learning to enhance open-set semantic segmentation
title_full_unstemmed Margin-based learning to enhance open-set semantic segmentation
title_sort Margin-based learning to enhance open-set semantic segmentation
author Brilhador, Anderson
author_facet Brilhador, Anderson
author_role author
dc.contributor.none.fl_str_mv Lazzaretti, André Eugênio
https://orcid.org/0000-0003-1861-3369
http://lattes.cnpq.br/7649611874688878
Lopes, Heitor Silvério
https://orcid.org/0000-0003-3984-1432
http://lattes.cnpq.br/4045818083957064
Lazzaretti, André Eugênio
https://orcid.org/0000-0003-1861-3369
http://lattes.cnpq.br/7649611874688878
Gomes, David Menotti
https://orcid.org/0000-0003-2430-2030
http://lattes.cnpq.br/6692968437800167
Lopes, Fabrício Martins
http://orcid.org/0000-0002-8786-3313
http://lattes.cnpq.br/1660070580824436
Pedrini, Hélio
https://orcid.org/0000-0003-0125-630X
http://lattes.cnpq.br/9600140904712115
Bugatti, Pedro Henrique
https://orcid.org/0000-0001-9421-9254
http://lattes.cnpq.br/2177467029991118
dc.contributor.author.fl_str_mv Brilhador, Anderson
dc.subject.por.fl_str_mv Imagens digitais
Aprendizado profundo (Aprendizado do computador)
Computação semântica
Segmentação de imagem
Sistemas de reconhecimento de padrões
Visão por computador
Redes neurais (Computação)
Digital images
Deep learning (Machine learning)
Semantic computing
Image segmentation
Pattern recognition systems
Computer vision
Neural networks (Computer science)
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Engenharia Elétrica
topic Imagens digitais
Aprendizado profundo (Aprendizado do computador)
Computação semântica
Segmentação de imagem
Sistemas de reconhecimento de padrões
Visão por computador
Redes neurais (Computação)
Digital images
Deep learning (Machine learning)
Semantic computing
Image segmentation
Pattern recognition systems
Computer vision
Neural networks (Computer science)
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Engenharia Elétrica
description Semantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.
publishDate 2025
dc.date.none.fl_str_mv 2025-03-13T20:39:27Z
2025-03-13T20:39:27Z
2025-02-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.
http://repositorio.utfpr.edu.br/jspui/handle/1/36088
identifier_str_mv BRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.
url http://repositorio.utfpr.edu.br/jspui/handle/1/36088
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498346934861824