Margin-based learning to enhance open-set semantic segmentation
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Curitiba Brasil Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/36088 |
Resumo: | Semantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition. |
| id |
UTFPR-12_1314c1b64238c68aced502e787ddae8c |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/36088 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Margin-based learning to enhance open-set semantic segmentationAprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto abertoImagens digitaisAprendizado profundo (Aprendizado do computador)Computação semânticaSegmentação de imagemSistemas de reconhecimento de padrõesVisão por computadorRedes neurais (Computação)Digital imagesDeep learning (Machine learning)Semantic computingImage segmentationPattern recognition systemsComputer visionNeural networks (Computer science)CNPQ::ENGENHARIAS::ENGENHARIA ELETRICAEngenharia ElétricaSemantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition.A segmentação semântica recebeu grande atenção como uma solução viável para interpretar efetivamente informações em imagens digitais. As soluções são normalmente construídas com uma percepção estática de conjunto fechado, onde todos os rótulos são conhecidos a priori. No entanto, em aplicações do mundo real, é preciso lidar com objetos de classes desconhecidas. A segmentação semântica de conjunto aberto (OSSS) é uma abordagem que incorpora a percepção de conjunto aberto na segmentação semântica, permitindo o reconhecimento de classes desconhecidas de objetos. Embora vários estudos tenham explorado o OSSS, seu desempenho permanece limitado devido à baixa qualidade de representação de características e desafios como dados desbalanceados, regiões de limites incertas e mudanças semânticas. Esses desafios resultam em modelos de segmentação semântica de conjunto fechado que constroem espaços de incorporação com limites de decisão sobrepostos e espaço aberto insuficiente para acomodar classes desconhecidas, impactando negativamente o desempenho do reconhecimento de conjunto aberto. Esta tese apresenta duas novas funções de perda baseadas em aprendizado baseado em margem e atenção a amostras difíceis para aprimorar o reconhecimento de conjunto aberto. Dois novos classificadores de conjunto aberto são propostos: um que emprega Componentes Principais e o outro que usa Distância Prototípica. Ambos são projetados para se beneficiar dos recursos gerados pelas funções de perda propostas. Experimentos foram conduzidos em seis conjuntos de dados, dos quais três foram originalmente propostos neste trabalho, e os resultados demonstram que os métodos propostos superam estratégias de aprendizado de última geração em OSSS. Essas descobertas ressaltam a importância de tais abordagens de aprendizagem, abrindo caminho para sua aplicação em sistemas do mundo real que exigem reconhecimento robusto de conjuntos abertos.Universidade Tecnológica Federal do ParanáCuritibaBrasilPrograma de Pós-Graduação em Engenharia Elétrica e Informática IndustrialUTFPRLazzaretti, André Eugêniohttps://orcid.org/0000-0003-1861-3369http://lattes.cnpq.br/7649611874688878Lopes, Heitor Silvériohttps://orcid.org/0000-0003-3984-1432http://lattes.cnpq.br/4045818083957064Lazzaretti, André Eugêniohttps://orcid.org/0000-0003-1861-3369http://lattes.cnpq.br/7649611874688878Gomes, David Menottihttps://orcid.org/0000-0003-2430-2030http://lattes.cnpq.br/6692968437800167Lopes, Fabrício Martinshttp://orcid.org/0000-0002-8786-3313http://lattes.cnpq.br/1660070580824436Pedrini, Héliohttps://orcid.org/0000-0003-0125-630Xhttp://lattes.cnpq.br/9600140904712115Bugatti, Pedro Henriquehttps://orcid.org/0000-0001-9421-9254http://lattes.cnpq.br/2177467029991118Brilhador, Anderson2025-03-13T20:39:27Z2025-03-13T20:39:27Z2025-02-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/36088enghttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-03-14T06:10:47Zoai:repositorio.utfpr.edu.br:1/36088Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-03-14T06:10:47Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Margin-based learning to enhance open-set semantic segmentation Aprendizagem baseada em margem para aprimorar a segmentação semântica de conjunto aberto |
| title |
Margin-based learning to enhance open-set semantic segmentation |
| spellingShingle |
Margin-based learning to enhance open-set semantic segmentation Brilhador, Anderson Imagens digitais Aprendizado profundo (Aprendizado do computador) Computação semântica Segmentação de imagem Sistemas de reconhecimento de padrões Visão por computador Redes neurais (Computação) Digital images Deep learning (Machine learning) Semantic computing Image segmentation Pattern recognition systems Computer vision Neural networks (Computer science) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Engenharia Elétrica |
| title_short |
Margin-based learning to enhance open-set semantic segmentation |
| title_full |
Margin-based learning to enhance open-set semantic segmentation |
| title_fullStr |
Margin-based learning to enhance open-set semantic segmentation |
| title_full_unstemmed |
Margin-based learning to enhance open-set semantic segmentation |
| title_sort |
Margin-based learning to enhance open-set semantic segmentation |
| author |
Brilhador, Anderson |
| author_facet |
Brilhador, Anderson |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Lazzaretti, André Eugênio https://orcid.org/0000-0003-1861-3369 http://lattes.cnpq.br/7649611874688878 Lopes, Heitor Silvério https://orcid.org/0000-0003-3984-1432 http://lattes.cnpq.br/4045818083957064 Lazzaretti, André Eugênio https://orcid.org/0000-0003-1861-3369 http://lattes.cnpq.br/7649611874688878 Gomes, David Menotti https://orcid.org/0000-0003-2430-2030 http://lattes.cnpq.br/6692968437800167 Lopes, Fabrício Martins http://orcid.org/0000-0002-8786-3313 http://lattes.cnpq.br/1660070580824436 Pedrini, Hélio https://orcid.org/0000-0003-0125-630X http://lattes.cnpq.br/9600140904712115 Bugatti, Pedro Henrique https://orcid.org/0000-0001-9421-9254 http://lattes.cnpq.br/2177467029991118 |
| dc.contributor.author.fl_str_mv |
Brilhador, Anderson |
| dc.subject.por.fl_str_mv |
Imagens digitais Aprendizado profundo (Aprendizado do computador) Computação semântica Segmentação de imagem Sistemas de reconhecimento de padrões Visão por computador Redes neurais (Computação) Digital images Deep learning (Machine learning) Semantic computing Image segmentation Pattern recognition systems Computer vision Neural networks (Computer science) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Engenharia Elétrica |
| topic |
Imagens digitais Aprendizado profundo (Aprendizado do computador) Computação semântica Segmentação de imagem Sistemas de reconhecimento de padrões Visão por computador Redes neurais (Computação) Digital images Deep learning (Machine learning) Semantic computing Image segmentation Pattern recognition systems Computer vision Neural networks (Computer science) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA Engenharia Elétrica |
| description |
Semantic segmentation has received wide attention as a feasible solution for effectively interpreting information in digital images. Solutions are typically built with a static closed-set perception, where all labels are known a priori. However, in real-world applications, one has to handle objects from unknown classes. Open-set semantic segmentation (OSSS) is an approach that incorporates open-set perception into semantic segmentation, allowing the recognition of unknown classes of objects. While various studies have explored OSSS, its performance remains limited due to low feature representation quality and challenges like imbalanced data, uncertain boundary regions, and semantic shifts. These challenges result in closed-set semantic segmentation models that build embedding spaces with overlapping decision boundaries and insufficient open space to accommodate unknown classes, thereby negatively impacting open-set recognition performance. This thesis presents two novel loss functions based on margin-based learning and hard sample attention to enhance open-set recognition. Two novel open-set classifiers are proposed: one that employs Principal Components and the other that uses Prototypical Distance. Both are designed to benefit from the features generated by the proposed loss functions. Experiments were conducted on six datasets, of which three were originally proposed in this work, and the results demonstrate that the proposed methods outperform state-of-the-art learning strategies in OSSS. These findings underscore the significance of such learning approaches, paving the way for their application in real-world systems requiring robust open-set recognition. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-03-13T20:39:27Z 2025-03-13T20:39:27Z 2025-02-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
BRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025. http://repositorio.utfpr.edu.br/jspui/handle/1/36088 |
| identifier_str_mv |
BRILHADOR, Anderson. Margin-Based learning to enhance open-set semantic segmentation. 2025. Tese (Doutorado em Engenharia Elétrica e Informática Industrial) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/36088 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498346934861824 |