Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.fei.edu.br/handle/FEI/5748 |
Resumo: | Há abstrações do aprendizado dos seres vivos aplicados ao aprendizado de máquina que são ineficazes em apresentar o comportamento de aprendizado de seres vivos. Seres vivos conseguem aprender a resolver novas tarefas sem que isso cause o esquecimento de tarefas aprendidas anteriormente, melhorando conhecimentos sobre tarefas passadas. Os agentes autônomos, principalmente aqueles baseados em modelos de redes neurais, quando expostos a uma sequência de tarefas, esquecem as soluções das primeiras tarefas aprendidas. Na literatura, algumas formas de se abordar os problemas de aprendizado contínuo envolvem: alterar a topologia dos modelos; armazenar dados de tarefas já aprendidas, criar dados falsos baseados em comportamentos aprendidos sobre as tarefas; ou reutilizar soluções de tarefas antigas para acelerar o aprendizado de novas tarefas. Este trabalho apresenta o sistema de aprendizado por reforço contínuo (LRLS, do inglês Lifelong Reinforcement Learning System), um sistema de aprendizado contínuo para problemas de aprendizado por reforço que utiliza memórias complementares para resolver sequências de tarefas. Neste trabalho, memórias complementares são modelos com funções distintas: o primeiro modelo aprende a resolver a tarefa atual; o segundo modelo aprende a correlacionar as tarefas; e o terceiro modelo é responsável por armazenar os conhecimentos aprendidos sobre tarefas anteriores e reaproveitar tais conhecimentos com o objetivo de acelerar o aprendizado de novas tarefas. Cada módulo do sistema é implementado usando redes neurais com topologias que variam de acordo com a necessidade. Além disso, a forma como o sistema foi implementado anula a necessidade de se armazenar dados sobre tarefas passadas. Por fim, experimentos realizados mostram que agentes autônomos utilizando o LRLS são capazes de aprender novas tarefas, mantendo o conhecimento de tarefas passadas; eles ainda utilizam os conhecimentos armazenados para acelerar o aprendizado de novas tarefas. |
| id |
FEI_564b3c793722355d74118a2e94700fa5 |
|---|---|
| oai_identifier_str |
oai:repositorio.fei.edu.br:FEI/5748 |
| network_acronym_str |
FEI |
| network_name_str |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository_id_str |
|
| spelling |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuoagente autônomoaprendizado contínuoaprendizado por reforçointeligência artificialsistema de aprendizadoartificial intelligenceautonomous agentlearning systemlifelong learningreinforcement learningHá abstrações do aprendizado dos seres vivos aplicados ao aprendizado de máquina que são ineficazes em apresentar o comportamento de aprendizado de seres vivos. Seres vivos conseguem aprender a resolver novas tarefas sem que isso cause o esquecimento de tarefas aprendidas anteriormente, melhorando conhecimentos sobre tarefas passadas. Os agentes autônomos, principalmente aqueles baseados em modelos de redes neurais, quando expostos a uma sequência de tarefas, esquecem as soluções das primeiras tarefas aprendidas. Na literatura, algumas formas de se abordar os problemas de aprendizado contínuo envolvem: alterar a topologia dos modelos; armazenar dados de tarefas já aprendidas, criar dados falsos baseados em comportamentos aprendidos sobre as tarefas; ou reutilizar soluções de tarefas antigas para acelerar o aprendizado de novas tarefas. Este trabalho apresenta o sistema de aprendizado por reforço contínuo (LRLS, do inglês Lifelong Reinforcement Learning System), um sistema de aprendizado contínuo para problemas de aprendizado por reforço que utiliza memórias complementares para resolver sequências de tarefas. Neste trabalho, memórias complementares são modelos com funções distintas: o primeiro modelo aprende a resolver a tarefa atual; o segundo modelo aprende a correlacionar as tarefas; e o terceiro modelo é responsável por armazenar os conhecimentos aprendidos sobre tarefas anteriores e reaproveitar tais conhecimentos com o objetivo de acelerar o aprendizado de novas tarefas. Cada módulo do sistema é implementado usando redes neurais com topologias que variam de acordo com a necessidade. Além disso, a forma como o sistema foi implementado anula a necessidade de se armazenar dados sobre tarefas passadas. Por fim, experimentos realizados mostram que agentes autônomos utilizando o LRLS são capazes de aprender novas tarefas, mantendo o conhecimento de tarefas passadas; eles ainda utilizam os conhecimentos armazenados para acelerar o aprendizado de novas tarefas.There are abstractions on how living beings learn applied to the machine learning that are not able to present the behavior of learning of living beings. Living beings learns to solve new tasks, without forgetting the solutions of past tasks, also the learning of new tasks improves the solution of previously learned tasks. Autonomous agents based on artificial neural networks, when facing a sequence of tasks forget solutions of previously learned tasks. Related works presents methods to solve the lifelong supervised and reinforcement learning problems, including: the changing of the topology of the models; the storage of information about past tasks, the creation of data based on the learned behavior of the tasks; or the reuse of solution of past tasks to speed up the learning of new tasks. This work presents the Lifelong Reinforcement Learning System (LRLS), a lifelong learning system for reinforcement learning problems, it uses complementary sets of memories in order to solve a sequence of tasks. In this work, the complementary memories is a set of models, each with distinct functions: the first model learns the solution of the current task; the second model learns to correlate the tasks; the third model stores the learned solutions of past tasks and exploits this knowledge in order to speed up the learning of new tasks. All modules uses artificial neural networks with methods to change its topology. Besides, the method was implemented in order to prevent the storing of data from past tasks. Lastly, experiments show the autonomous agents that uses the LRLS are capable of learning the solution to new tasks keeping the knowledge about past tasks; they also presented the behavior of speeding up the learning of a new task using stored knowledge.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESBianchi, Reinaldo Augusto da Costahttp://lattes.cnpq.br/2305603694791405https://orcid.org/0000-0001-9097-827XAlmeida, A. C. de2025-04-30T00:33:25Z2022-08-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis85application/pdfALMEIDA, A. C. de. Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2022 Disponível em: https://doi.org/10.31414/EE.2022.T.131518.https://repositorio.fei.edu.br/handle/FEI/5748info:eu-repo/semantics/openAccessporreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEI2025-04-30T03:00:20Zoai:repositorio.fei.edu.br:FEI/5748Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2025-04-30T03:00:20Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false |
| dc.title.none.fl_str_mv |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| title |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| spellingShingle |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo Almeida, A. C. de agente autônomo aprendizado contínuo aprendizado por reforço inteligência artificial sistema de aprendizado artificial intelligence autonomous agent learning system lifelong learning reinforcement learning |
| title_short |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| title_full |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| title_fullStr |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| title_full_unstemmed |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| title_sort |
Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo |
| author |
Almeida, A. C. de |
| author_facet |
Almeida, A. C. de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Bianchi, Reinaldo Augusto da Costa http://lattes.cnpq.br/2305603694791405 https://orcid.org/0000-0001-9097-827X |
| dc.contributor.author.fl_str_mv |
Almeida, A. C. de |
| dc.subject.por.fl_str_mv |
agente autônomo aprendizado contínuo aprendizado por reforço inteligência artificial sistema de aprendizado artificial intelligence autonomous agent learning system lifelong learning reinforcement learning |
| topic |
agente autônomo aprendizado contínuo aprendizado por reforço inteligência artificial sistema de aprendizado artificial intelligence autonomous agent learning system lifelong learning reinforcement learning |
| description |
Há abstrações do aprendizado dos seres vivos aplicados ao aprendizado de máquina que são ineficazes em apresentar o comportamento de aprendizado de seres vivos. Seres vivos conseguem aprender a resolver novas tarefas sem que isso cause o esquecimento de tarefas aprendidas anteriormente, melhorando conhecimentos sobre tarefas passadas. Os agentes autônomos, principalmente aqueles baseados em modelos de redes neurais, quando expostos a uma sequência de tarefas, esquecem as soluções das primeiras tarefas aprendidas. Na literatura, algumas formas de se abordar os problemas de aprendizado contínuo envolvem: alterar a topologia dos modelos; armazenar dados de tarefas já aprendidas, criar dados falsos baseados em comportamentos aprendidos sobre as tarefas; ou reutilizar soluções de tarefas antigas para acelerar o aprendizado de novas tarefas. Este trabalho apresenta o sistema de aprendizado por reforço contínuo (LRLS, do inglês Lifelong Reinforcement Learning System), um sistema de aprendizado contínuo para problemas de aprendizado por reforço que utiliza memórias complementares para resolver sequências de tarefas. Neste trabalho, memórias complementares são modelos com funções distintas: o primeiro modelo aprende a resolver a tarefa atual; o segundo modelo aprende a correlacionar as tarefas; e o terceiro modelo é responsável por armazenar os conhecimentos aprendidos sobre tarefas anteriores e reaproveitar tais conhecimentos com o objetivo de acelerar o aprendizado de novas tarefas. Cada módulo do sistema é implementado usando redes neurais com topologias que variam de acordo com a necessidade. Além disso, a forma como o sistema foi implementado anula a necessidade de se armazenar dados sobre tarefas passadas. Por fim, experimentos realizados mostram que agentes autônomos utilizando o LRLS são capazes de aprender novas tarefas, mantendo o conhecimento de tarefas passadas; eles ainda utilizam os conhecimentos armazenados para acelerar o aprendizado de novas tarefas. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-08-08 2025-04-30T00:33:25Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
ALMEIDA, A. C. de. Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2022 Disponível em: https://doi.org/10.31414/EE.2022.T.131518. https://repositorio.fei.edu.br/handle/FEI/5748 |
| identifier_str_mv |
ALMEIDA, A. C. de. Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2022 Disponível em: https://doi.org/10.31414/EE.2022.T.131518. |
| url |
https://repositorio.fei.edu.br/handle/FEI/5748 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
85 application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) instname:Centro Universitário da Fundação Educacional Inaciana (FEI) instacron:FEI |
| instname_str |
Centro Universitário da Fundação Educacional Inaciana (FEI) |
| instacron_str |
FEI |
| institution |
FEI |
| reponame_str |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| collection |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository.name.fl_str_mv |
Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI) |
| repository.mail.fl_str_mv |
cfernandes@fei.edu.br |
| _version_ |
1853486363470462976 |