[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
MAXWELL
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2 http://doi.org/10.17771/PUCRio.acad.62040 |
Resumo: | [pt] Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Portanto, todos os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas na fase de testes. Modelos de Reconhecimento de Conjunto Aberto e Segmentação Semântica surgem para lidar com esse tipo de cenário para, respectivamente, tarefas de reconhecimento visual e rotulagem densa. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. Este trabalho testou as técnicas propostas em dados de sensoriamento remoto, estabelecendo novo estado-da-arte para os resultados dos conjuntos de dados utilizados. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe duas técnicas distintas para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussianas para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos mostra que ambos os métodos propostos produzem melhor consistência semântica em suas predições do que as métodos de referência, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites do objetos. Além disso, OpenGMM e CoReSeg superaram o estado-da-arte estabelecido pelos métodos de referência para conjuntos de dados de Vaihingen e de Potsdam disponibilizados pelo ISPRS. A terceira abordagem proposta é um procedimento geral de pósprocessamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels mal classificados dentro dessas regiões. Também propusemos um novo método para geração de superpixels chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pósprocessado com FuSC estabeleceu um novo estado-da-arte para segmentaçao de ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em https://github.com/iannunes. |
| id |
PUC_RIO-1_4581bfb9e849320223438be7e04c2bac |
|---|---|
| oai_identifier_str |
oai:MAXWELL.puc-rio.br:62040 |
| network_acronym_str |
PUC_RIO-1 |
| network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository_id_str |
|
| spelling |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES [pt] SEGMENTAÇÃO SEMÂNTICA DE CONJUNTO ABERTO APLICADA A IMAGENS DE SENSORIAMENTO REMOTO [pt] SENSORIAMENTO REMOTO[pt] AUTO-ENCODER[pt] CLASSIFICACAO[pt] SEGMENTACAO[pt] CONJUNTO ABERTO[pt] REDE NEURAL CONVOLUCIONAL[pt] APRENDIZADO PROFUNDO[pt] CIENCIA DE DADOS[en] REMOTE SENSING[en] AUTO-ENCODER[en] RECOGNITION[en] SEGMENTATION[en] OPEN-SET[en] CONVOLUTIONAL NEURAL NETWORK[en] DEEP LEARNING[en] DATA SCIENCE[pt] Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Portanto, todos os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas na fase de testes. Modelos de Reconhecimento de Conjunto Aberto e Segmentação Semântica surgem para lidar com esse tipo de cenário para, respectivamente, tarefas de reconhecimento visual e rotulagem densa. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. Este trabalho testou as técnicas propostas em dados de sensoriamento remoto, estabelecendo novo estado-da-arte para os resultados dos conjuntos de dados utilizados. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe duas técnicas distintas para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussianas para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos mostra que ambos os métodos propostos produzem melhor consistência semântica em suas predições do que as métodos de referência, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites do objetos. Além disso, OpenGMM e CoReSeg superaram o estado-da-arte estabelecido pelos métodos de referência para conjuntos de dados de Vaihingen e de Potsdam disponibilizados pelo ISPRS. A terceira abordagem proposta é um procedimento geral de pósprocessamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels mal classificados dentro dessas regiões. Também propusemos um novo método para geração de superpixels chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pósprocessado com FuSC estabeleceu um novo estado-da-arte para segmentaçao de ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em https://github.com/iannunes.[en] Collecting samples that exhaust all possible classes for real-world tasks is usually difficult or impossible due to many different factors. In a realistic/feasible scenario, methods should be aware that the training data is incomplete and that not all knowledge is available. Therefore all developed methods should be able to identify the unknown samples while correctly executing the proposed task to the known classes in the tests phase. Open-Set Recognition and Semantic Segmentation models emerge to handle this kind of scenario for, respectively, visual recognition and dense labeling tasks. Initially, this work proposes a novel taxonomy aiming to organize the literature and provide an understanding of the theoretical trends that guided the existing approaches that may influence future methods. This work tested the proposed techniques on remote sensing data, establishing new state-of-the-art results for the used datasets. Remote sensing data differs from RGB data as it deals with a plethora of sensors and with a high geographical variation. Open set segmentation is a relatively new and unexplored task, with just a handful of methods proposed to model such tasks. This work also proposes two distinct techniques to perform open-set semantic segmentation. First, a method called OpenGMM extends the OpenPCS framework using a Gaussian Mixture of Models to model the distribution of pixels for each class in a multimodal manner. Second, the Conditional Reconstruction for Openset Semantic Segmentation (CoReSeg) method tackles the issue using classconditioned reconstruction of the input images according to their pixel-wise mask. CoReSeg conditions each input pixel to all known classes, expecting higher errors for pixels of unknown classes. Qualitative results observation suggested that both proposed methods produce better semantic consistency in their predictions than the baselines, resulting in cleaner segmentation maps that better fit object boundaries. Also, OpenGMM and CoReSeg outperformed state-of-the-art baseline methods on Vaihingen and Potsdam ISPRS datasets. The third proposed approach is a general post-processing procedure that uses superpixels to enforce highly homogeneous regions to behave equally, rectifying erroneous classified pixels within these regions. We also proposed a novel superpixel generation method called FuSC. All proposed approaches improved the quantitative and the qualitative results for both datasets. Besides that, CoReSeg s prediction post-processed with FuSC achieved state-of-the-art results for both datasets. The official implementation of all proposed approaches is available at https://github.com/iannunes.MAXWELLMARCUS VINICIUS SOLEDADE POGGI DE ARAGAOMARCUS VINICIUS SOLEDADE POGGI DE ARAGAOIAN MONTEIRO NUNES2023-03-21info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2http://doi.org/10.17771/PUCRio.acad.62040engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2023-03-21T00:00:00Zoai:MAXWELL.puc-rio.br:62040Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342023-03-21T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
| dc.title.none.fl_str_mv |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES [pt] SEGMENTAÇÃO SEMÂNTICA DE CONJUNTO ABERTO APLICADA A IMAGENS DE SENSORIAMENTO REMOTO |
| title |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES |
| spellingShingle |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES IAN MONTEIRO NUNES [pt] SENSORIAMENTO REMOTO [pt] AUTO-ENCODER [pt] CLASSIFICACAO [pt] SEGMENTACAO [pt] CONJUNTO ABERTO [pt] REDE NEURAL CONVOLUCIONAL [pt] APRENDIZADO PROFUNDO [pt] CIENCIA DE DADOS [en] REMOTE SENSING [en] AUTO-ENCODER [en] RECOGNITION [en] SEGMENTATION [en] OPEN-SET [en] CONVOLUTIONAL NEURAL NETWORK [en] DEEP LEARNING [en] DATA SCIENCE |
| title_short |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES |
| title_full |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES |
| title_fullStr |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES |
| title_full_unstemmed |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES |
| title_sort |
[en] OPEN-SET SEMANTIC SEGMENTATION FOR REMOTE SENSING IMAGES |
| author |
IAN MONTEIRO NUNES |
| author_facet |
IAN MONTEIRO NUNES |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO |
| dc.contributor.author.fl_str_mv |
IAN MONTEIRO NUNES |
| dc.subject.por.fl_str_mv |
[pt] SENSORIAMENTO REMOTO [pt] AUTO-ENCODER [pt] CLASSIFICACAO [pt] SEGMENTACAO [pt] CONJUNTO ABERTO [pt] REDE NEURAL CONVOLUCIONAL [pt] APRENDIZADO PROFUNDO [pt] CIENCIA DE DADOS [en] REMOTE SENSING [en] AUTO-ENCODER [en] RECOGNITION [en] SEGMENTATION [en] OPEN-SET [en] CONVOLUTIONAL NEURAL NETWORK [en] DEEP LEARNING [en] DATA SCIENCE |
| topic |
[pt] SENSORIAMENTO REMOTO [pt] AUTO-ENCODER [pt] CLASSIFICACAO [pt] SEGMENTACAO [pt] CONJUNTO ABERTO [pt] REDE NEURAL CONVOLUCIONAL [pt] APRENDIZADO PROFUNDO [pt] CIENCIA DE DADOS [en] REMOTE SENSING [en] AUTO-ENCODER [en] RECOGNITION [en] SEGMENTATION [en] OPEN-SET [en] CONVOLUTIONAL NEURAL NETWORK [en] DEEP LEARNING [en] DATA SCIENCE |
| description |
[pt] Coletar amostras que esgotam todas as classes possíveis para tarefas do mundo real geralmente é difícil ou impossível devido a muitos fatores diferentes. Em um cenário realista/viável, os métodos devem estar cientes de que os dados de treinamento estão incompletos e que nem todo o conhecimento está disponível. Portanto, todos os métodos desenvolvidos devem ser capazes de identificar as amostras desconhecidas enquanto executam corretamente a tarefa proposta para as classes conhecidas na fase de testes. Modelos de Reconhecimento de Conjunto Aberto e Segmentação Semântica surgem para lidar com esse tipo de cenário para, respectivamente, tarefas de reconhecimento visual e rotulagem densa. Inicialmente, este trabalho propõe uma nova taxonomia com o objetivo de organizar a literatura e fornecer uma compreensão das tendências teóricas que guiaram as abordagens existentes que podem influenciar métodos futuros. Este trabalho testou as técnicas propostas em dados de sensoriamento remoto, estabelecendo novo estado-da-arte para os resultados dos conjuntos de dados utilizados. A segmentação de conjuntos abertos é uma tarefa relativamente nova e inexplorada, com apenas um punhado de métodos propostos para modelar tais tarefas. Este trabalho também propõe duas técnicas distintas para realizar a segmentação semântica de conjunto aberto. Primeiro, um método chamado OpenGMM estende a estrutura OpenPCS usando uma mistura gaussianas para modelar a distribuição de pixels para cada classe de maneira multimodal. Em segundo lugar, o método de Reconstrução Condicional para Segmentação Semântica de Conjunto Aberto (CoReSeg) aborda o problema usando a reconstrução condicionada por classe das imagens de entrada de acordo com sua máscara. CoReSeg condiciona cada pixel de entrada para todas as classes conhecidas, esperando erros maiores para pixels de classes desconhecidas. A observação dos resultados qualitativos mostra que ambos os métodos propostos produzem melhor consistência semântica em suas predições do que as métodos de referência, resultando em mapas de segmentação mais limpos que se ajustam melhor aos limites do objetos. Além disso, OpenGMM e CoReSeg superaram o estado-da-arte estabelecido pelos métodos de referência para conjuntos de dados de Vaihingen e de Potsdam disponibilizados pelo ISPRS. A terceira abordagem proposta é um procedimento geral de pósprocessamento que usa superpixels para forçar regiões altamente homogêneas a se comportarem igualmente, corrigindo pixels mal classificados dentro dessas regiões. Também propusemos um novo método para geração de superpixels chamado FuSC. Todas as abordagens propostas melhoraram os resultados quantitativos e qualitativos para ambos os conjuntos de dados. Além disso, CoReSeg pósprocessado com FuSC estabeleceu um novo estado-da-arte para segmentaçao de ambos os conjuntos de dados. A implementação oficial de todas as abordagens propostas está disponível em https://github.com/iannunes. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-03-21 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2 http://doi.org/10.17771/PUCRio.acad.62040 |
| url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=62040&idi=2 http://doi.org/10.17771/PUCRio.acad.62040 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
MAXWELL |
| publisher.none.fl_str_mv |
MAXWELL |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
| instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| instacron_str |
PUC_RIO |
| institution |
PUC_RIO |
| reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| repository.mail.fl_str_mv |
|
| _version_ |
1856395962231029760 |