An investigation of neural architecture search in the context of deep multi-task learning.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: GADELHA, Guilherme Monteiro. lattes
Orientador(a): GOMES, Herman Martins. lattes, BATISTA, Leonardo Vidal. lattes
Banca de defesa: ARAÚJO , Tiago Maritan Ugulino de., PAIVA , Anselmo Cardoso de., MARINHO , Leandro Balby., PEREIRA , Eanes Torres.
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Campina Grande
Programa de Pós-Graduação: PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
Departamento: Centro de Engenharia Elétrica e Informática - CEEI
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://dspace.sti.ufcg.edu.br/handle/riufcg/36528
Resumo: O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.
id UFCG_fe8425b83402aef0af8173b7b9667fb5
oai_identifier_str oai:dspace.sti.ufcg.edu.br:riufcg/36528
network_acronym_str UFCG
network_name_str Biblioteca Digital de Teses e Dissertações da UFCG
repository_id_str
spelling GOMES, Herman Martins.GOMES, H. M.http://lattes.cnpq.br/4223020694433271BATISTA, Leonardo Vidal.BATISTA, L. V.http://lattes.cnpq.br/1047122596139990ARAÚJO , Tiago Maritan Ugulino de.PAIVA , Anselmo Cardoso de.MARINHO , Leandro Balby.PEREIRA , Eanes Torres.GADELHA, G. M.http://lattes.cnpq.br/4071050262331837GADELHA, Guilherme Monteiro.O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.Multi-task learning (MTL) is a design paradigm for neural networks that aims to improve generalization while solving multiple tasks simultaneously in a single network. MTL has been successful in various fields such as Natural Language Processing, Speech Recognition, Computer Vision, and Drug Discovery. Neural Architecture Search (NAS) is a subfield of Deep Learning that proposes methods to automatically design neural networks by searching and arranging layers and blocks to maximize an objective function. Currently, there are few methods in the literature that explore the use of NAS to build MTL networks. In this context, this work investigates a sequence of comparative experiments between multi-task networks, single-task networks, and networks created with a neural architecture search strategy. These experiments aim to understand better the differences between these paradigms of neural network design and compare the results achieved by each. We investigated neural network architectures for different use cases, such as the ICAO-FVC dataset, MNIST, FASHION-MNIST, Celeb-A, and CIFAR-10 datasets. Additionally, we experimented with a well-established dataset of NAS to benchmark new proposed methods in the field. Our experiments have revealed that the NAS technique, developed through Reinforcement Learning, is capable of discovering optimal architectures in a shorter time than the current state-of-theart technique based on Regularized Evolution. Furthermore, this technique has demonstrated competitive results across various datasets of multi-task learning, in terms of accuracy and equal error rate. While it may not be the top performer in the case of ICAO-FVC, it still delivers a competitive outcome and holds the potential to uncover even better architectures than the best handcrafted one.Submitted by Michelle Lima (michelle.lima@ufcg.edu.br) on 2024-07-08T19:42:38Z No. of bitstreams: 1 GUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf: 4333450 bytes, checksum: fa1464e8fbbe1a317e6569ffa84eba18 (MD5)Made available in DSpace on 2024-07-08T19:42:38Z (GMT). No. of bitstreams: 1 GUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf: 4333450 bytes, checksum: fa1464e8fbbe1a317e6569ffa84eba18 (MD5) Previous issue date: 2024-01-29CNPqUniversidade Federal de Campina GrandePÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da Computação.Neural architecture searchMulti-task learningImage classificationPesquisa de arquitetura neuralAprendizagem multitarefaClassificação de imagensAn investigation of neural architecture search in the context of deep multi-task learning.Uma investigação da busca de arquitetura neural no contexto de aprendizagem multitarefa profunda.2024-01-292024-07-08T19:42:38Z2024-07-082024-07-08T19:42:38Zhttps://dspace.sti.ufcg.edu.br/handle/riufcg/36528GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisenginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGTEXTGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf.txtGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf.txttext/plain173578https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/3/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdf.txta8b31760c52ae51a971ea9fc58af8d72MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdfGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdfapplication/pdf4333450https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/1/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdffa1464e8fbbe1a317e6569ffa84eba18MD51riufcg/365282025-07-24 03:09:43.986oai:dspace.sti.ufcg.edu.br:riufcg/36528Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-07-24T06:09:43Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false
dc.title.pt_BR.fl_str_mv An investigation of neural architecture search in the context of deep multi-task learning.
dc.title.alternative.pt_BR.fl_str_mv Uma investigação da busca de arquitetura neural no contexto de aprendizagem multitarefa profunda.
title An investigation of neural architecture search in the context of deep multi-task learning.
spellingShingle An investigation of neural architecture search in the context of deep multi-task learning.
GADELHA, Guilherme Monteiro.
Ciência da Computação.
Neural architecture search
Multi-task learning
Image classification
Pesquisa de arquitetura neural
Aprendizagem multitarefa
Classificação de imagens
title_short An investigation of neural architecture search in the context of deep multi-task learning.
title_full An investigation of neural architecture search in the context of deep multi-task learning.
title_fullStr An investigation of neural architecture search in the context of deep multi-task learning.
title_full_unstemmed An investigation of neural architecture search in the context of deep multi-task learning.
title_sort An investigation of neural architecture search in the context of deep multi-task learning.
author GADELHA, Guilherme Monteiro.
author_facet GADELHA, Guilherme Monteiro.
author_role author
dc.contributor.advisor2ID.pt_BR.fl_str_mv BATISTA, L. V.
dc.contributor.advisor1.fl_str_mv GOMES, Herman Martins.
dc.contributor.advisor1ID.fl_str_mv GOMES, H. M.
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4223020694433271
dc.contributor.advisor2.fl_str_mv BATISTA, Leonardo Vidal.
dc.contributor.advisor2Lattes.fl_str_mv http://lattes.cnpq.br/1047122596139990
dc.contributor.referee1.fl_str_mv ARAÚJO , Tiago Maritan Ugulino de.
dc.contributor.referee2.fl_str_mv PAIVA , Anselmo Cardoso de.
dc.contributor.referee3.fl_str_mv MARINHO , Leandro Balby.
dc.contributor.referee4.fl_str_mv PEREIRA , Eanes Torres.
dc.contributor.authorID.fl_str_mv GADELHA, G. M.
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4071050262331837
dc.contributor.author.fl_str_mv GADELHA, Guilherme Monteiro.
contributor_str_mv GOMES, Herman Martins.
BATISTA, Leonardo Vidal.
ARAÚJO , Tiago Maritan Ugulino de.
PAIVA , Anselmo Cardoso de.
MARINHO , Leandro Balby.
PEREIRA , Eanes Torres.
dc.subject.cnpq.fl_str_mv Ciência da Computação.
topic Ciência da Computação.
Neural architecture search
Multi-task learning
Image classification
Pesquisa de arquitetura neural
Aprendizagem multitarefa
Classificação de imagens
dc.subject.por.fl_str_mv Neural architecture search
Multi-task learning
Image classification
Pesquisa de arquitetura neural
Aprendizagem multitarefa
Classificação de imagens
description O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.
publishDate 2024
dc.date.issued.fl_str_mv 2024-01-29
dc.date.accessioned.fl_str_mv 2024-07-08T19:42:38Z
dc.date.available.fl_str_mv 2024-07-08
2024-07-08T19:42:38Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://dspace.sti.ufcg.edu.br/handle/riufcg/36528
dc.identifier.citation.fl_str_mv GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.
url https://dspace.sti.ufcg.edu.br/handle/riufcg/36528
identifier_str_mv GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.publisher.program.fl_str_mv PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFCG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Centro de Engenharia Elétrica e Informática - CEEI
publisher.none.fl_str_mv Universidade Federal de Campina Grande
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFCG
instname:Universidade Federal de Campina Grande (UFCG)
instacron:UFCG
instname_str Universidade Federal de Campina Grande (UFCG)
instacron_str UFCG
institution UFCG
reponame_str Biblioteca Digital de Teses e Dissertações da UFCG
collection Biblioteca Digital de Teses e Dissertações da UFCG
bitstream.url.fl_str_mv https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/3/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdf.txt
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/2/license.txt
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/1/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdf
bitstream.checksum.fl_str_mv a8b31760c52ae51a971ea9fc58af8d72
8a4605be74aa9ea9d79846c1fba20a33
fa1464e8fbbe1a317e6569ffa84eba18
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)
repository.mail.fl_str_mv bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br
_version_ 1863363552691093504