[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: IAN MONTEIRO NUNES
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: MAXWELL
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2
http://doi.org/10.17771/PUCRio.acad.62040
Resumo: [pt] Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Portanto, todos os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas na fase de testes. Modelos de Reconhecimento de Conjunto Aberto e Segmentação Semântica surgem para lidar com esse tipo de cenário para, respectivamente, tarefas de reconhecimento visual e rotulagem densa. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. Este trabalho testou as técnicas propostas em dados de sensoriamento remoto, estabelecendo novo estado-da-arte para os resultados dos conjuntos de dados utilizados. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe duas técnicas distintas para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussianas para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos mostra que ambos os métodos propostos produzem melhor consistência semântica em suas predições do que as métodos de referência, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites do objetos. Além disso, OpenGMM e CoReSeg superaram o estado-da-arte estabelecido pelos métodos de referência para conjuntos de dados de Vaihingen e de Potsdam disponibilizados pelo ISPRS. A terceira abordagem proposta é um procedimento geral de pósprocessamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels mal classificados dentro dessas regiões. Também propusemos um novo método para geração de superpixels chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pósprocessado com FuSC estabeleceu um novo estado-da-arte para segmentaçao de ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em https://github.com/iannunes.
id PUC_RIO-1_4581bfb9e849320223438be7e04c2bac
oai_identifier_str oai:MAXWELL.puc-rio.br:62040
network_acronym_str PUC_RIO-1
network_name_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository_id_str
spelling [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES [pt] SEGMENTAÇÃO SEMÂNTICA DE CONJUNTO ABERTO APLICADA A IMAGENS DE SENSORIAMENTO REMOTO [pt] SENSORIAMENTO REMOTO[pt] AUTO-ENCODER[pt] CLASSIFICACAO[pt] SEGMENTACAO[pt] CONJUNTO ABERTO[pt] REDE NEURAL CONVOLUCIONAL[pt] APRENDIZADO PROFUNDO[pt] CIENCIA DE DADOS[en] REMOTE SENSING[en] AUTO-ENCODER[en] RECOGNITION[en] SEGMENTATION[en] OPEN-SET[en] CONVOLUTIONAL NEURAL NETWORK[en] DEEP LEARNING[en] DATA SCIENCE[pt] Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Portanto, todos os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas na fase de testes. Modelos de Reconhecimento de Conjunto Aberto e Segmentação Semântica surgem para lidar com esse tipo de cenário para, respectivamente, tarefas de reconhecimento visual e rotulagem densa. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. Este trabalho testou as técnicas propostas em dados de sensoriamento remoto, estabelecendo novo estado-da-arte para os resultados dos conjuntos de dados utilizados. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe duas técnicas distintas para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussianas para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos mostra que ambos os métodos propostos produzem melhor consistência semântica em suas predições do que as métodos de referência, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites do objetos. Além disso, OpenGMM e CoReSeg superaram o estado-da-arte estabelecido pelos métodos de referência para conjuntos de dados de Vaihingen e de Potsdam disponibilizados pelo ISPRS. A terceira abordagem proposta é um procedimento geral de pósprocessamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels mal classificados dentro dessas regiões. Também propusemos um novo método para geração de superpixels chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pósprocessado com FuSC estabeleceu um novo estado-da-arte para segmentaçao de ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em https://github.com/iannunes.[en] Collecting samples that exhaust all possible classes for real-world tasks is usually difficult or impossible due to many different factors. In a realistic/feasible scenario, methods should be aware that the training data is incomplete and that not all knowledge is available. Therefore all developed methods should be able to identify the unknown samples while correctly executing the proposed task to the known classes in the tests phase. Open-Set Recognition and Semantic Segmentation models emerge to handle this kind of scenario for, respectively, visual recognition and dense labeling tasks. Initially, this work proposes a novel taxonomy aiming to organize the literature and provide an understanding of the theoretical trends that guided the existing approaches that may influence future methods. This work tested the proposed techniques on remote sensing data, establishing new state-of-the-art results for the used datasets. Remote sensing data differs from RGB data as it deals with a plethora of sensors and with a high geographical variation. Open set segmentation is a relatively new and unexplored task, with just a handful of methods proposed to model such tasks. This work also proposes two distinct techniques to perform open-set semantic segmentation. First, a method called OpenGMM extends the OpenPCS framework using a Gaussian Mixture of Models to model the distribution of pixels for each class in a multimodal manner. Second, the Conditional Reconstruction for Openset Semantic Segmentation (CoReSeg) method tackles the issue using classconditioned reconstruction of the input images according to their pixel-wise mask. CoReSeg conditions each input pixel to all known classes, expecting higher errors for pixels of unknown classes. Qualitative results observation suggested that both proposed methods produce better semantic consistency in their predictions than the baselines, resulting in cleaner segmentation maps that better fit object boundaries. Also, OpenGMM and CoReSeg outperformed state-of-the-art baseline methods on Vaihingen and Potsdam ISPRS datasets. The third proposed approach is a general post-processing procedure that uses superpixels to enforce highly homogeneous regions to behave equally, rectifying erroneous classified pixels within these regions. We also proposed a novel superpixel generation method called FuSC. All proposed approaches improved the quantitative and the qualitative results for both datasets. Besides that, CoReSeg s prediction post-processed with FuSC achieved state-of-the-art results for both datasets. The official implementation of all proposed approaches is available at https://github.com/iannunes.MAXWELLMARCUS VINICIUS SOLEDADE POGGI DE ARAGAOMARCUS VINICIUS SOLEDADE POGGI DE ARAGAOIAN MONTEIRO NUNES2023-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2http://doi.org/10.17771/PUCRio.acad.62040engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2023-03-21T00:00:00Zoai:MAXWELL.puc-rio.br:62040Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342023-03-21T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false
dc.title.none.fl_str_mv [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
[pt] SEGMENTAÇÃO SEMÂNTICA DE CONJUNTO ABERTO APLICADA A IMAGENS DE SENSORIAMENTO REMOTO
title [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
spellingShingle [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
IAN MONTEIRO NUNES
[pt] SENSORIAMENTO REMOTO
[pt] AUTO-ENCODER
[pt] CLASSIFICACAO
[pt] SEGMENTACAO
[pt] CONJUNTO ABERTO
[pt] REDE NEURAL CONVOLUCIONAL
[pt] APRENDIZADO PROFUNDO
[pt] CIENCIA DE DADOS
[en] REMOTE SENSING
[en] AUTO-ENCODER
[en] RECOGNITION
[en] SEGMENTATION
[en] OPEN-SET
[en] CONVOLUTIONAL NEURAL NETWORK
[en] DEEP LEARNING
[en] DATA SCIENCE
title_short [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
title_full [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
title_fullStr [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
title_full_unstemmed [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
title_sort [en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
author IAN MONTEIRO NUNES
author_facet IAN MONTEIRO NUNES
author_role author
dc.contributor.none.fl_str_mv MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO
dc.contributor.author.fl_str_mv IAN MONTEIRO NUNES
dc.subject.por.fl_str_mv [pt] SENSORIAMENTO REMOTO
[pt] AUTO-ENCODER
[pt] CLASSIFICACAO
[pt] SEGMENTACAO
[pt] CONJUNTO ABERTO
[pt] REDE NEURAL CONVOLUCIONAL
[pt] APRENDIZADO PROFUNDO
[pt] CIENCIA DE DADOS
[en] REMOTE SENSING
[en] AUTO-ENCODER
[en] RECOGNITION
[en] SEGMENTATION
[en] OPEN-SET
[en] CONVOLUTIONAL NEURAL NETWORK
[en] DEEP LEARNING
[en] DATA SCIENCE
topic [pt] SENSORIAMENTO REMOTO
[pt] AUTO-ENCODER
[pt] CLASSIFICACAO
[pt] SEGMENTACAO
[pt] CONJUNTO ABERTO
[pt] REDE NEURAL CONVOLUCIONAL
[pt] APRENDIZADO PROFUNDO
[pt] CIENCIA DE DADOS
[en] REMOTE SENSING
[en] AUTO-ENCODER
[en] RECOGNITION
[en] SEGMENTATION
[en] OPEN-SET
[en] CONVOLUTIONAL NEURAL NETWORK
[en] DEEP LEARNING
[en] DATA SCIENCE
description [pt] Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Portanto, todos os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas na fase de testes. Modelos de Reconhecimento de Conjunto Aberto e Segmentação Semântica surgem para lidar com esse tipo de cenário para, respectivamente, tarefas de reconhecimento visual e rotulagem densa. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. Este trabalho testou as técnicas propostas em dados de sensoriamento remoto, estabelecendo novo estado-da-arte para os resultados dos conjuntos de dados utilizados. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe duas técnicas distintas para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussianas para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos mostra que ambos os métodos propostos produzem melhor consistência semântica em suas predições do que as métodos de referência, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites do objetos. Além disso, OpenGMM e CoReSeg superaram o estado-da-arte estabelecido pelos métodos de referência para conjuntos de dados de Vaihingen e de Potsdam disponibilizados pelo ISPRS. A terceira abordagem proposta é um procedimento geral de pósprocessamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels mal classificados dentro dessas regiões. Também propusemos um novo método para geração de superpixels chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pósprocessado com FuSC estabeleceu um novo estado-da-arte para segmentaçao de ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em https://github.com/iannunes.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-21
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2
http://doi.org/10.17771/PUCRio.acad.62040
url https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2
http://doi.org/10.17771/PUCRio.acad.62040
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv MAXWELL
publisher.none.fl_str_mv MAXWELL
dc.source.none.fl_str_mv reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)
instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron:PUC_RIO
instname_str Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
instacron_str PUC_RIO
institution PUC_RIO
reponame_str Repositório Institucional da PUC-RIO (Projeto Maxwell)
collection Repositório Institucional da PUC-RIO (Projeto Maxwell)
repository.name.fl_str_mv Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)
repository.mail.fl_str_mv
_version_ 1856395962231029760