An investigation of neural architecture search in the context of deep multi-task learning.
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | , |
| Banca de defesa: | , , , |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal de Campina Grande
|
| Programa de Pós-Graduação: |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
|
| Departamento: |
Centro de Engenharia Elétrica e Informática - CEEI
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://dspace.sti.ufcg.edu.br/handle/riufcg/36528 |
Resumo: | O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão. |
| id |
UFCG_fe8425b83402aef0af8173b7b9667fb5 |
|---|---|
| oai_identifier_str |
oai:dspace.sti.ufcg.edu.br:riufcg/36528 |
| network_acronym_str |
UFCG |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| repository_id_str |
|
| spelling |
GOMES, Herman Martins.GOMES, H. M.http://lattes.cnpq.br/4223020694433271BATISTA, Leonardo Vidal.BATISTA, L. V.http://lattes.cnpq.br/1047122596139990ARAÚJO , Tiago Maritan Ugulino de.PAIVA , Anselmo Cardoso de.MARINHO , Leandro Balby.PEREIRA , Eanes Torres.GADELHA, G. M.http://lattes.cnpq.br/4071050262331837GADELHA, Guilherme Monteiro.O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão.Multi-task learning (MTL) is a design paradigm for neural networks that aims to improve generalization while solving multiple tasks simultaneously in a single network. MTL has been successful in various fields such as Natural Language Processing, Speech Recognition, Computer Vision, and Drug Discovery. Neural Architecture Search (NAS) is a subfield of Deep Learning that proposes methods to automatically design neural networks by searching and arranging layers and blocks to maximize an objective function. Currently, there are few methods in the literature that explore the use of NAS to build MTL networks. In this context, this work investigates a sequence of comparative experiments between multi-task networks, single-task networks, and networks created with a neural architecture search strategy. These experiments aim to understand better the differences between these paradigms of neural network design and compare the results achieved by each. We investigated neural network architectures for different use cases, such as the ICAO-FVC dataset, MNIST, FASHION-MNIST, Celeb-A, and CIFAR-10 datasets. Additionally, we experimented with a well-established dataset of NAS to benchmark new proposed methods in the field. Our experiments have revealed that the NAS technique, developed through Reinforcement Learning, is capable of discovering optimal architectures in a shorter time than the current state-of-theart technique based on Regularized Evolution. Furthermore, this technique has demonstrated competitive results across various datasets of multi-task learning, in terms of accuracy and equal error rate. While it may not be the top performer in the case of ICAO-FVC, it still delivers a competitive outcome and holds the potential to uncover even better architectures than the best handcrafted one.Submitted by Michelle Lima (michelle.lima@ufcg.edu.br) on 2024-07-08T19:42:38Z No. of bitstreams: 1 GUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf: 4333450 bytes, checksum: fa1464e8fbbe1a317e6569ffa84eba18 (MD5)Made available in DSpace on 2024-07-08T19:42:38Z (GMT). No. of bitstreams: 1 GUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf: 4333450 bytes, checksum: fa1464e8fbbe1a317e6569ffa84eba18 (MD5) Previous issue date: 2024-01-29CNPqUniversidade Federal de Campina GrandePÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃOUFCGBrasilCentro de Engenharia Elétrica e Informática - CEEICiência da Computação.Neural architecture searchMulti-task learningImage classificationPesquisa de arquitetura neuralAprendizagem multitarefaClassificação de imagensAn investigation of neural architecture search in the context of deep multi-task learning.Uma investigação da busca de arquitetura neural no contexto de aprendizagem multitarefa profunda.2024-01-292024-07-08T19:42:38Z2024-07-082024-07-08T19:42:38Zhttps://dspace.sti.ufcg.edu.br/handle/riufcg/36528GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024.info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisenginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFCGinstname:Universidade Federal de Campina Grande (UFCG)instacron:UFCGTEXTGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf.txtGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdf.txttext/plain173578https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/3/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdf.txta8b31760c52ae51a971ea9fc58af8d72MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52ORIGINALGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdfGUILHERME MONTEIRO GADELHA – TESE (PPGCC) 2024.pdfapplication/pdf4333450https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/1/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdffa1464e8fbbe1a317e6569ffa84eba18MD51riufcg/365282025-07-24 03:09:43.986oai:dspace.sti.ufcg.edu.br:riufcg/36528Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bdtd.ufcg.edu.br/PUBhttp://dspace.sti.ufcg.edu.br:8080/oai/requestbdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.bropendoar:48512025-07-24T06:09:43Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG)false |
| dc.title.pt_BR.fl_str_mv |
An investigation of neural architecture search in the context of deep multi-task learning. |
| dc.title.alternative.pt_BR.fl_str_mv |
Uma investigação da busca de arquitetura neural no contexto de aprendizagem multitarefa profunda. |
| title |
An investigation of neural architecture search in the context of deep multi-task learning. |
| spellingShingle |
An investigation of neural architecture search in the context of deep multi-task learning. GADELHA, Guilherme Monteiro. Ciência da Computação. Neural architecture search Multi-task learning Image classification Pesquisa de arquitetura neural Aprendizagem multitarefa Classificação de imagens |
| title_short |
An investigation of neural architecture search in the context of deep multi-task learning. |
| title_full |
An investigation of neural architecture search in the context of deep multi-task learning. |
| title_fullStr |
An investigation of neural architecture search in the context of deep multi-task learning. |
| title_full_unstemmed |
An investigation of neural architecture search in the context of deep multi-task learning. |
| title_sort |
An investigation of neural architecture search in the context of deep multi-task learning. |
| author |
GADELHA, Guilherme Monteiro. |
| author_facet |
GADELHA, Guilherme Monteiro. |
| author_role |
author |
| dc.contributor.advisor2ID.pt_BR.fl_str_mv |
BATISTA, L. V. |
| dc.contributor.advisor1.fl_str_mv |
GOMES, Herman Martins. |
| dc.contributor.advisor1ID.fl_str_mv |
GOMES, H. M. |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4223020694433271 |
| dc.contributor.advisor2.fl_str_mv |
BATISTA, Leonardo Vidal. |
| dc.contributor.advisor2Lattes.fl_str_mv |
http://lattes.cnpq.br/1047122596139990 |
| dc.contributor.referee1.fl_str_mv |
ARAÚJO , Tiago Maritan Ugulino de. |
| dc.contributor.referee2.fl_str_mv |
PAIVA , Anselmo Cardoso de. |
| dc.contributor.referee3.fl_str_mv |
MARINHO , Leandro Balby. |
| dc.contributor.referee4.fl_str_mv |
PEREIRA , Eanes Torres. |
| dc.contributor.authorID.fl_str_mv |
GADELHA, G. M. |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4071050262331837 |
| dc.contributor.author.fl_str_mv |
GADELHA, Guilherme Monteiro. |
| contributor_str_mv |
GOMES, Herman Martins. BATISTA, Leonardo Vidal. ARAÚJO , Tiago Maritan Ugulino de. PAIVA , Anselmo Cardoso de. MARINHO , Leandro Balby. PEREIRA , Eanes Torres. |
| dc.subject.cnpq.fl_str_mv |
Ciência da Computação. |
| topic |
Ciência da Computação. Neural architecture search Multi-task learning Image classification Pesquisa de arquitetura neural Aprendizagem multitarefa Classificação de imagens |
| dc.subject.por.fl_str_mv |
Neural architecture search Multi-task learning Image classification Pesquisa de arquitetura neural Aprendizagem multitarefa Classificação de imagens |
| description |
O aprendizado multitarefa (MTL) é um paradigma de design para redes neurais que visa melhorar a generalização enquanto resolve múltiplas tarefas simultaneamente em uma única rede. A MTL tem tido sucesso em vários campos, como Processamento de Linguagem Natural, Reconhecimento de Fala, Visão Computacional e Descoberta de Medicamentos. Neural Architecture Search (NAS) é um subcampo do Deep Learning que propõe métodos para projetar redes neurais automaticamente, pesquisando e organizando camadas e blocos para maximizar uma função objetivo. Atualmente, existem poucos métodos na literatura que exploram o uso de NAS para construção de redes MTL. Neste contexto, este trabalho investiga uma sequência de experimentos comparativos entre redes multitarefa, redes monotarefa e redes criadas com uma estratégia de busca de arquitetura neural. Esses experimentos visam compreender melhor as diferenças entre esses paradigmas de projeto de redes neurais e comparar os resultados alcançados por cada um. Investigamos arquiteturas de redes neurais para diferentes casos de uso, como o conjunto de dados ICAO-FVC, conjuntos de dados MNIST, FASHION-MNIST, Celeb-A e CIFAR-10. Além disso, testamos um conjunto de dados bem estabelecido de NAS para avaliar novos métodos propostos em campo. Nossos experimentos revelaram que a técnica NAS, desenvolvida através do Reinforcement Learning, é capaz de descobrir arquiteturas ótimas em um tempo menor do que a atual técnica de última geração baseada na Evolução Regularizada. Além disso, esta técnica demonstrou resultados competitivos em vários conjuntos de dados de aprendizagem multitarefa, em termos de acurácia e equal error rate. Embora possa não ter o melhor desempenho no caso do ICAO-FVC, ainda oferece um resultado competitivo e tem o potencial de descobrir arquiteturas ainda melhores do que a melhor feita à mão. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-01-29 |
| dc.date.accessioned.fl_str_mv |
2024-07-08T19:42:38Z |
| dc.date.available.fl_str_mv |
2024-07-08 2024-07-08T19:42:38Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://dspace.sti.ufcg.edu.br/handle/riufcg/36528 |
| dc.identifier.citation.fl_str_mv |
GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. |
| url |
https://dspace.sti.ufcg.edu.br/handle/riufcg/36528 |
| identifier_str_mv |
GADELHA, Guilherme Monteiro. An investigation of neural architecture search in the context of deep multi-task learning. 2024. 105 f. Tese (Doutorado em Ciência da Computação) – Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande, Paraíba, Brasil, 2024. |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
| dc.publisher.program.fl_str_mv |
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO |
| dc.publisher.initials.fl_str_mv |
UFCG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Centro de Engenharia Elétrica e Informática - CEEI |
| publisher.none.fl_str_mv |
Universidade Federal de Campina Grande |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFCG instname:Universidade Federal de Campina Grande (UFCG) instacron:UFCG |
| instname_str |
Universidade Federal de Campina Grande (UFCG) |
| instacron_str |
UFCG |
| institution |
UFCG |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFCG |
| collection |
Biblioteca Digital de Teses e Dissertações da UFCG |
| bitstream.url.fl_str_mv |
https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/3/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdf.txt https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/2/license.txt https://dspace.sti.ufcg.edu.br/bitstream/riufcg/36528/1/GUILHERME+MONTEIRO+GADELHA+%E2%80%93+TESE+%28PPGCC%29+2024.pdf |
| bitstream.checksum.fl_str_mv |
a8b31760c52ae51a971ea9fc58af8d72 8a4605be74aa9ea9d79846c1fba20a33 fa1464e8fbbe1a317e6569ffa84eba18 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFCG - Universidade Federal de Campina Grande (UFCG) |
| repository.mail.fl_str_mv |
bdtd@setor.ufcg.edu.br || bdtd@setor.ufcg.edu.br |
| _version_ |
1863363552691093504 |