[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
MAXWELL
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=2 http://doi.org/10.17771/PUCRio.acad.71193 |
Resumo: | [pt] Desenvolver modelos de Deep Learning no mundo real requer algumas atenções que geralmente não são consideradas durante o treinamento. Em tais cenários, onde não é possível controlar a informação consumida pelo modelo, é importante que o modelo consiga identificar quando uma amostra não pertence a nenhuma das classes conhecidas. Essa capacidade do modelo é incluída usando métodos para detecção de amostras fora da distribuição (OOD), técnica cujo objetivo é distinguir amostras de classes desconhecidas em relação às classes conhecidas. Esses métodos geralmente dependem de características intermediárias ou de saída para calcular os scores para desconhecimento, mas o espaço do gradiente ainda é pouco explorado para essa tarefa por conta de sua maior complexidade na geração de uma representação do gradiente mais adequado. Entretanto, o espaço do gradiente geralmente traz uma representação mais rica em relação ao conhecimento ou desconhecimento do modelo em relação à saída esperada para a amostra de entrada, que é totalmente aderente ao que é esperado para uma tarefa de OOD detection. Com base nesta ideia, este trabalho propõe uma nova família de métodos usando características de gradiente, denominada GradVec, usando o vetor de gradiente como representação de entrada para diferentes métodos de detecção OOD. A ideia principal é que o gradiente do modelo apresenta, de maneira mais informativa, o conhecimento de que uma amostra pertence a uma classe conhecida, podendo distinguir das outras desconhecidas. Os métodos GradVec não alteram o procedimento de treinamento do modelo e nenhum dado adicional é necessário para ajustar o detector OOD, e pode ser usado em qualquer modelo pré-treinado. A abordagem foi avaliada em diferentes tarefas, como classificação de imagens, classificação de texto e segmentação semântica. Nossa abordagem apresenta resultados superiores em diferentes cenários para detecção OOD na classificação de imagens e análise de sentimento, reduzindo a FPR95 em 88,17 por cento e 56,91 por cento, respectivamente. |
| id |
PUC_RIO-1_d14e07402eabdfad79328d8727cb65e0 |
|---|---|
| oai_identifier_str |
oai:MAXWELL.puc-rio.br:71193 |
| network_acronym_str |
PUC_RIO-1 |
| network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository_id_str |
|
| spelling |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING[en] GRADVEC: EXPLORING GRADIENT FEATURES FOR IMPROVED OUT-OF-DISTRIBUTION DETECTION IN DEEP LEARNING[pt] APRENDIZADO PROFUNDO[pt] DETECCAO DE AMOSTRAS FORA DA DISTRIBUICAO[pt] ESPACO DE GRADIENTE[en] DEEP LEARNING[en] OUT OF DISTRIBUTION DETECTION[en] GRADIENT SPACE[pt] Desenvolver modelos de Deep Learning no mundo real requer algumas atenções que geralmente não são consideradas durante o treinamento. Em tais cenários, onde não é possível controlar a informação consumida pelo modelo, é importante que o modelo consiga identificar quando uma amostra não pertence a nenhuma das classes conhecidas. Essa capacidade do modelo é incluída usando métodos para detecção de amostras fora da distribuição (OOD), técnica cujo objetivo é distinguir amostras de classes desconhecidas em relação às classes conhecidas. Esses métodos geralmente dependem de características intermediárias ou de saída para calcular os scores para desconhecimento, mas o espaço do gradiente ainda é pouco explorado para essa tarefa por conta de sua maior complexidade na geração de uma representação do gradiente mais adequado. Entretanto, o espaço do gradiente geralmente traz uma representação mais rica em relação ao conhecimento ou desconhecimento do modelo em relação à saída esperada para a amostra de entrada, que é totalmente aderente ao que é esperado para uma tarefa de OOD detection. Com base nesta ideia, este trabalho propõe uma nova família de métodos usando características de gradiente, denominada GradVec, usando o vetor de gradiente como representação de entrada para diferentes métodos de detecção OOD. A ideia principal é que o gradiente do modelo apresenta, de maneira mais informativa, o conhecimento de que uma amostra pertence a uma classe conhecida, podendo distinguir das outras desconhecidas. Os métodos GradVec não alteram o procedimento de treinamento do modelo e nenhum dado adicional é necessário para ajustar o detector OOD, e pode ser usado em qualquer modelo pré-treinado. A abordagem foi avaliada em diferentes tarefas, como classificação de imagens, classificação de texto e segmentação semântica. Nossa abordagem apresenta resultados superiores em diferentes cenários para detecção OOD na classificação de imagens e análise de sentimento, reduzindo a FPR95 em 88,17 por cento e 56,91 por cento, respectivamente.[en] Deploying Deep Learning models in real-world requires considerations that are generally overlooked during training. In real-world scenarios, where the input data cannot be controlled, it is important for a model to identify when a sample does not belong to any known class. This issue is accomplished using out-of-distribution (OOD) detection, a technique designed to distinguish unk nown samples from those in the in-distribution classes. These methods mainly rely on model output scores or intermediate features to calculate OOD scores. However, the gradient space remains underexplored for this task due to the complexity involved in generating a suitable gradient representation. However, the gradient space is generally known for providing a richer representation of the model s knowledge or uncertainty regarding the expected output for the input sample, which is fully aligned with what is expected for an OOD detection task. Based on this idea, in this work we propose a new family of methods using gradient features, named GradVec, which uses the gradient vector as input representation for different OOD detection methods. The main idea is that the model gradient presents, in a more informative way, the knowledge that a sample belongs to a known class, being able to distinguish it from other unknown ones. GradVec methods do not change the model training procedure, with no additional data needed to adjust the OOD detector, and it is applica ble to any pre-trained model. We evaluated our model in different tasks, such as image classification, text classification, and semantic segmentation. Our ap proach presents superior results in different scenarios for OOD detection in image classification and sentiment analysis, reducing FPR95 by 88.17 percent and 56.91 percent, respectively.MAXWELLMARLEY MARIA BERNARDES REBUZZI VELLASCOMARLEY MARIA BERNARDES REBUZZI VELLASCOTHIAGO MEDEIROS CARVALHO2025-06-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=2http://doi.org/10.17771/PUCRio.acad.71193engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2025-06-24T00:00:00Zoai:MAXWELL.puc-rio.br:71193Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342025-06-24T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
| dc.title.none.fl_str_mv |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING [en] GRADVEC: EXPLORING GRADIENT FEATURES FOR IMPROVED OUT-OF-DISTRIBUTION DETECTION IN DEEP LEARNING |
| title |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING |
| spellingShingle |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING THIAGO MEDEIROS CARVALHO [pt] APRENDIZADO PROFUNDO [pt] DETECCAO DE AMOSTRAS FORA DA DISTRIBUICAO [pt] ESPACO DE GRADIENTE [en] DEEP LEARNING [en] OUT OF DISTRIBUTION DETECTION [en] GRADIENT SPACE |
| title_short |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING |
| title_full |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING |
| title_fullStr |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING |
| title_full_unstemmed |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING |
| title_sort |
[pt] GRADVEC: EXPLORANDO O ESPAÇO DE GRADIENTE PARA MELHORAR A DETECÇÃO DE AMOSTRAS FORA DA DISTRIBUIÇÃO EM DEEP LEARNING |
| author |
THIAGO MEDEIROS CARVALHO |
| author_facet |
THIAGO MEDEIROS CARVALHO |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
MARLEY MARIA BERNARDES REBUZZI VELLASCO MARLEY MARIA BERNARDES REBUZZI VELLASCO |
| dc.contributor.author.fl_str_mv |
THIAGO MEDEIROS CARVALHO |
| dc.subject.por.fl_str_mv |
[pt] APRENDIZADO PROFUNDO [pt] DETECCAO DE AMOSTRAS FORA DA DISTRIBUICAO [pt] ESPACO DE GRADIENTE [en] DEEP LEARNING [en] OUT OF DISTRIBUTION DETECTION [en] GRADIENT SPACE |
| topic |
[pt] APRENDIZADO PROFUNDO [pt] DETECCAO DE AMOSTRAS FORA DA DISTRIBUICAO [pt] ESPACO DE GRADIENTE [en] DEEP LEARNING [en] OUT OF DISTRIBUTION DETECTION [en] GRADIENT SPACE |
| description |
[pt] Desenvolver modelos de Deep Learning no mundo real requer algumas atenções que geralmente não são consideradas durante o treinamento. Em tais cenários, onde não é possível controlar a informação consumida pelo modelo, é importante que o modelo consiga identificar quando uma amostra não pertence a nenhuma das classes conhecidas. Essa capacidade do modelo é incluída usando métodos para detecção de amostras fora da distribuição (OOD), técnica cujo objetivo é distinguir amostras de classes desconhecidas em relação às classes conhecidas. Esses métodos geralmente dependem de características intermediárias ou de saída para calcular os scores para desconhecimento, mas o espaço do gradiente ainda é pouco explorado para essa tarefa por conta de sua maior complexidade na geração de uma representação do gradiente mais adequado. Entretanto, o espaço do gradiente geralmente traz uma representação mais rica em relação ao conhecimento ou desconhecimento do modelo em relação à saída esperada para a amostra de entrada, que é totalmente aderente ao que é esperado para uma tarefa de OOD detection. Com base nesta ideia, este trabalho propõe uma nova família de métodos usando características de gradiente, denominada GradVec, usando o vetor de gradiente como representação de entrada para diferentes métodos de detecção OOD. A ideia principal é que o gradiente do modelo apresenta, de maneira mais informativa, o conhecimento de que uma amostra pertence a uma classe conhecida, podendo distinguir das outras desconhecidas. Os métodos GradVec não alteram o procedimento de treinamento do modelo e nenhum dado adicional é necessário para ajustar o detector OOD, e pode ser usado em qualquer modelo pré-treinado. A abordagem foi avaliada em diferentes tarefas, como classificação de imagens, classificação de texto e segmentação semântica. Nossa abordagem apresenta resultados superiores em diferentes cenários para detecção OOD na classificação de imagens e análise de sentimento, reduzindo a FPR95 em 88,17 por cento e 56,91 por cento, respectivamente. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-06-23 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=2 http://doi.org/10.17771/PUCRio.acad.71193 |
| url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=71193&idi=2 http://doi.org/10.17771/PUCRio.acad.71193 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
MAXWELL |
| publisher.none.fl_str_mv |
MAXWELL |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
| instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| instacron_str |
PUC_RIO |
| institution |
PUC_RIO |
| reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| repository.mail.fl_str_mv |
|
| _version_ |
1856395972517560320 |