Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Buris, Luiz Henrique [UNIFESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Paulo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.unifesp.br/handle/11600/65718
Resumo: As técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%.
id UFSP_a6915fd3657614642a25eb902a05ec40
oai_identifier_str oai:repositorio.unifesp.br/:11600/65718
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str
spelling Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.Mixup-based Deep Metric Learning Approaches for Incomplete Supervision.Aprendizado de MáquinaAprendizado ProfundoAprendizado MétricoAprendizado Profundo de MétricaClassificação de ImagensAs técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)2021/01870-5Universidade Federal de São PauloFaria, Fabio Augusto [UNIFESP]http://lattes.cnpq.br/3828728429230356http://lattes.cnpq.br/1837287108723885Buris, Luiz Henrique [UNIFESP]2022-10-10T12:05:43Z2022-10-10T12:05:43Z2022-08-19info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion87 f.application/pdfhttps://repositorio.unifesp.br/handle/11600/65718porSão José dos Campos, SPinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESP2024-08-12T00:13:10Zoai:repositorio.unifesp.br/:11600/65718Repositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652024-08-12T00:13:10Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)false
dc.title.none.fl_str_mv Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
Mixup-based Deep Metric Learning Approaches for Incomplete Supervision.
title Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
spellingShingle Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
Buris, Luiz Henrique [UNIFESP]
Aprendizado de Máquina
Aprendizado Profundo
Aprendizado Métrico
Aprendizado Profundo de Métrica
Classificação de Imagens
title_short Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
title_full Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
title_fullStr Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
title_full_unstemmed Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
title_sort Técnicas de Aprendizado Profundo de Métrica baseadas em Mixup para Supervisão Incompleta.
author Buris, Luiz Henrique [UNIFESP]
author_facet Buris, Luiz Henrique [UNIFESP]
author_role author
dc.contributor.none.fl_str_mv Faria, Fabio Augusto [UNIFESP]
http://lattes.cnpq.br/3828728429230356
http://lattes.cnpq.br/1837287108723885
dc.contributor.author.fl_str_mv Buris, Luiz Henrique [UNIFESP]
dc.subject.por.fl_str_mv Aprendizado de Máquina
Aprendizado Profundo
Aprendizado Métrico
Aprendizado Profundo de Métrica
Classificação de Imagens
topic Aprendizado de Máquina
Aprendizado Profundo
Aprendizado Métrico
Aprendizado Profundo de Métrica
Classificação de Imagens
description As técnicas de Aprendizado Profundo (do inglês, Deep Learning) mais especificamente, aquelas baseadas em Redes Neurais Convolucionais (CNN) têm alcançado resultados surpreendentes em diferentes áreas do conhecimento (e.g., medicina, agricultura e segurança). No entanto, a utilização dessas técnicas, em muitas das aplicações de mundo real, se torna desafiadora, por causa da necessidade de grandes coleções de dados rotulados na etapa de treinamento, as quais nem sempre são possíveis de se obter, devido aos elevados custos e tempo gasto. Vários trabalhos na literatura têm buscado soluções para superar tais desafios, propondo estratégias e técnicas que podem aprender modelos satisfatórios com menos dados, como os aprendizados fracamente supervisionado e semi-supervisionado, porém essas abordagens geralmente não incluem o desafio de memorização das redes neurais durante etapa de treinamento. Além disso, o uso de abordagens de aumento de dados (do inglês, Data Augmentation) também aparece como alternativa para a falta de dados rotulados, aumentando esse conjunto de dados rotulados por meio de simples operações geométricas (rotação, translação, espelhamento e recortes) ou utilizando de técnicas complexas de regularização de conjunto de dados de treinamento da literatura (Mixup). Neste sentido, esse trabalho de mestrado propôs melhorar os resultados de classificação de imagens em cenários de treinamentos reduzidos (supervisão incompleta), propondo três novas abordagens supervisionadas (MbDML 1, MbDML 2 e MbDML 3) e uma abordagem semi-supervisionada (MbDML 4) baseadas em uma técnica de aprendizado de métrica (NNGK) e um método de aumento virtual de dados (Mixup). Nos experimentos realizados é possível observar que as abordagens de última geração em aprendizado profundo de métrica podem não funcionar bem nos cenários de supervisão incompleta. Além disso, as abordagens MbDML propostas superam essas abordagens existentes na literatura em duas famosas bases de imagens (Cifar10 e Cifar100) e conseguem resultados similares em outras duas bases (MNIST e Flowers17). Finalmente, todas as abordagens supervisionadas conseguem melhorar os resultados da versão original da técnica NNGK na tarefa de classificação de imagens tradicional (supervisão completa) em todas as três bases (Flowers102, Cars196 e LeafsnapFields), com ganhos relativos que vão de 2,96% a 6,91%.
publishDate 2022
dc.date.none.fl_str_mv 2022-10-10T12:05:43Z
2022-10-10T12:05:43Z
2022-08-19
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.unifesp.br/handle/11600/65718
url https://repositorio.unifesp.br/handle/11600/65718
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 87 f.
application/pdf
dc.coverage.none.fl_str_mv São José dos Campos, SP
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo
publisher.none.fl_str_mv Universidade Federal de São Paulo
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1833924491633229824