Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
Ano de defesa: | 2022 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de São Paulo
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.unifesp.br/handle/11600/65718 |
Resumo: | As técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%. |
id |
UFSP_a6915fd3657614642a25eb902a05ec40 |
---|---|
oai_identifier_str |
oai:repositorio.unifesp.br/:11600/65718 |
network_acronym_str |
UFSP |
network_name_str |
Repositório Institucional da UNIFESP |
repository_id_str |
|
spelling |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.Mixup-based Deep Metric Learning Approaches for Incomplete Supervision.Aprendizado de MáquinaAprendizado ProfundoAprendizado MétricoAprendizado Profundo de MétricaClassificação de ImagensAs técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)2021/01870-5Universidade Federal de São PauloFaria, Fabio Augusto [UNIFESP]http://lattes.cnpq.br/3828728429230356http://lattes.cnpq.br/1837287108723885Buris, Luiz Henrique [UNIFESP]2022-10-10T12:05:43Z2022-10-10T12:05:43Z2022-08-19info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion87 f.application/pdfhttps://repositorio.unifesp.br/handle/11600/65718porSão José dos Campos, SPinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-12T00:13:10Zoai:repositorio.unifesp.br/:11600/65718Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-12T00:13:10Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false |
dc.title.none.fl_str_mv |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. Mixup-based Deep Metric Learning Approaches for Incomplete Supervision. |
title |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. |
spellingShingle |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. Buris, Luiz Henrique [UNIFESP] Aprendizado de Máquina Aprendizado Profundo Aprendizado Métrico Aprendizado Profundo de Métrica Classificação de Imagens |
title_short |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. |
title_full |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. |
title_fullStr |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. |
title_full_unstemmed |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. |
title_sort |
Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta. |
author |
Buris, Luiz Henrique [UNIFESP] |
author_facet |
Buris, Luiz Henrique [UNIFESP] |
author_role |
author |
dc.contributor.none.fl_str_mv |
Faria, Fabio Augusto [UNIFESP] http://lattes.cnpq.br/3828728429230356 http://lattes.cnpq.br/1837287108723885 |
dc.contributor.author.fl_str_mv |
Buris, Luiz Henrique [UNIFESP] |
dc.subject.por.fl_str_mv |
Aprendizado de Máquina Aprendizado Profundo Aprendizado Métrico Aprendizado Profundo de Métrica Classificação de Imagens |
topic |
Aprendizado de Máquina Aprendizado Profundo Aprendizado Métrico Aprendizado Profundo de Métrica Classificação de Imagens |
description |
As técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022-10-10T12:05:43Z 2022-10-10T12:05:43Z 2022-08-19 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.unifesp.br/handle/11600/65718 |
url |
https://repositorio.unifesp.br/handle/11600/65718 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
87 f. application/pdf |
dc.coverage.none.fl_str_mv |
São José dos Campos, SP |
dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
instname_str |
Universidade Federal de São Paulo (UNIFESP) |
instacron_str |
UNIFESP |
institution |
UNIFESP |
reponame_str |
Repositório Institucional da UNIFESP |
collection |
Repositório Institucional da UNIFESP |
repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
_version_ |
1833924491633229824 |