Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Almeida, A. C. de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.fei.edu.br/handle/FEI/5748
Resumo: Há abstrações do aprendizado dos seres vivos aplicados ao aprendizado de máquina que são ineficazes em apresentar o comportamento de aprendizado de seres vivos. Seres vivos conseguem aprender a resolver novas tarefas sem que isso cause o esquecimento de tarefas aprendidas anteriormente, melhorando conhecimentos sobre tarefas passadas. Os agentes autônomos, principalmente aqueles baseados em modelos de redes neurais, quando expostos a uma sequência de tarefas, esquecem as soluções das primeiras tarefas aprendidas. Na literatura, algumas formas de se abordar os problemas de aprendizado contínuo envolvem: alterar a topologia dos modelos; armazenar dados de tarefas já aprendidas, criar dados falsos baseados em comportamentos aprendidos sobre as tarefas; ou reutilizar soluções de tarefas antigas para acelerar o aprendizado de novas tarefas. Este trabalho apresenta o sistema de aprendizado por reforço contínuo (LRLS, do inglês Lifelong Reinforcement Learning System), um sistema de aprendizado contínuo para problemas de aprendizado por reforço que utiliza memórias complementares para resolver sequências de tarefas. Neste trabalho, memórias complementares são modelos com funções distintas: o primeiro modelo aprende a resolver a tarefa atual; o segundo modelo aprende a correlacionar as tarefas; e o terceiro modelo é responsável por armazenar os conhecimentos aprendidos sobre tarefas anteriores e reaproveitar tais conhecimentos com o objetivo de acelerar o aprendizado de novas tarefas. Cada módulo do sistema é implementado usando redes neurais com topologias que variam de acordo com a necessidade. Além disso, a forma como o sistema foi implementado anula a necessidade de se armazenar dados sobre tarefas passadas. Por fim, experimentos realizados mostram que agentes autônomos utilizando o LRLS são capazes de aprender novas tarefas, mantendo o conhecimento de tarefas passadas; eles ainda utilizam os conhecimentos armazenados para acelerar o aprendizado de novas tarefas.
id FEI_564b3c793722355d74118a2e94700fa5
oai_identifier_str oai:repositorio.fei.edu.br:FEI/5748
network_acronym_str FEI
network_name_str Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository_id_str
spelling Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuoagente autônomoaprendizado contínuoaprendizado por reforçointeligência artificialsistema de aprendizadoartificial intelligenceautonomous agentlearning systemlifelong learningreinforcement learningHá abstrações do aprendizado dos seres vivos aplicados ao aprendizado de máquina que são ineficazes em apresentar o comportamento de aprendizado de seres vivos. Seres vivos conseguem aprender a resolver novas tarefas sem que isso cause o esquecimento de tarefas aprendidas anteriormente, melhorando conhecimentos sobre tarefas passadas. Os agentes autônomos, principalmente aqueles baseados em modelos de redes neurais, quando expostos a uma sequência de tarefas, esquecem as soluções das primeiras tarefas aprendidas. Na literatura, algumas formas de se abordar os problemas de aprendizado contínuo envolvem: alterar a topologia dos modelos; armazenar dados de tarefas já aprendidas, criar dados falsos baseados em comportamentos aprendidos sobre as tarefas; ou reutilizar soluções de tarefas antigas para acelerar o aprendizado de novas tarefas. Este trabalho apresenta o sistema de aprendizado por reforço contínuo (LRLS, do inglês Lifelong Reinforcement Learning System), um sistema de aprendizado contínuo para problemas de aprendizado por reforço que utiliza memórias complementares para resolver sequências de tarefas. Neste trabalho, memórias complementares são modelos com funções distintas: o primeiro modelo aprende a resolver a tarefa atual; o segundo modelo aprende a correlacionar as tarefas; e o terceiro modelo é responsável por armazenar os conhecimentos aprendidos sobre tarefas anteriores e reaproveitar tais conhecimentos com o objetivo de acelerar o aprendizado de novas tarefas. Cada módulo do sistema é implementado usando redes neurais com topologias que variam de acordo com a necessidade. Além disso, a forma como o sistema foi implementado anula a necessidade de se armazenar dados sobre tarefas passadas. Por fim, experimentos realizados mostram que agentes autônomos utilizando o LRLS são capazes de aprender novas tarefas, mantendo o conhecimento de tarefas passadas; eles ainda utilizam os conhecimentos armazenados para acelerar o aprendizado de novas tarefas.There are abstractions on how living beings learn applied to the machine learning that are not able to present the behavior of learning of living beings. Living beings learns to solve new tasks, without forgetting the solutions of past tasks, also the learning of new tasks improves the solution of previously learned tasks. Autonomous agents based on artificial neural networks, when facing a sequence of tasks forget solutions of previously learned tasks. Related works presents methods to solve the lifelong supervised and reinforcement learning problems, including: the changing of the topology of the models; the storage of information about past tasks, the creation of data based on the learned behavior of the tasks; or the reuse of solution of past tasks to speed up the learning of new tasks. This work presents the Lifelong Reinforcement Learning System (LRLS), a lifelong learning system for reinforcement learning problems, it uses complementary sets of memories in order to solve a sequence of tasks. In this work, the complementary memories is a set of models, each with distinct functions: the first model learns the solution of the current task; the second model learns to correlate the tasks; the third model stores the learned solutions of past tasks and exploits this knowledge in order to speed up the learning of new tasks. All modules uses artificial neural networks with methods to change its topology. Besides, the method was implemented in order to prevent the storing of data from past tasks. Lastly, experiments show the autonomous agents that uses the LRLS are capable of learning the solution to new tasks keeping the knowledge about past tasks; they also presented the behavior of speeding up the learning of a new task using stored knowledge.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESBianchi, Reinaldo Augusto da Costahttp://lattes.cnpq.br/2305603694791405https://orcid.org/0000-0001-9097-827XAlmeida, A. C. de2025-04-30T00:33:25Z2022-08-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis85application/pdfALMEIDA, A. C. de. Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2022 Disponível em: https://doi.org/10.31414/EE.2022.T.131518.https://repositorio.fei.edu.br/handle/FEI/5748info:eu-repo/semantics/openAccessporreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEI2025-04-30T03:00:20Zoai:repositorio.fei.edu.br:FEI/5748Biblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2025-04-30T03:00:20Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.none.fl_str_mv Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
title Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
spellingShingle Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
Almeida, A. C. de
agente autônomo
aprendizado contínuo
aprendizado por reforço
inteligência artificial
sistema de aprendizado
artificial intelligence
autonomous agent
learning system
lifelong learning
reinforcement learning
title_short Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
title_full Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
title_fullStr Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
title_full_unstemmed Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
title_sort Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo
author Almeida, A. C. de
author_facet Almeida, A. C. de
author_role author
dc.contributor.none.fl_str_mv Bianchi, Reinaldo Augusto da Costa
http://lattes.cnpq.br/2305603694791405
https://orcid.org/0000-0001-9097-827X
dc.contributor.author.fl_str_mv Almeida, A. C. de
dc.subject.por.fl_str_mv agente autônomo
aprendizado contínuo
aprendizado por reforço
inteligência artificial
sistema de aprendizado
artificial intelligence
autonomous agent
learning system
lifelong learning
reinforcement learning
topic agente autônomo
aprendizado contínuo
aprendizado por reforço
inteligência artificial
sistema de aprendizado
artificial intelligence
autonomous agent
learning system
lifelong learning
reinforcement learning
description Há abstrações do aprendizado dos seres vivos aplicados ao aprendizado de máquina que são ineficazes em apresentar o comportamento de aprendizado de seres vivos. Seres vivos conseguem aprender a resolver novas tarefas sem que isso cause o esquecimento de tarefas aprendidas anteriormente, melhorando conhecimentos sobre tarefas passadas. Os agentes autônomos, principalmente aqueles baseados em modelos de redes neurais, quando expostos a uma sequência de tarefas, esquecem as soluções das primeiras tarefas aprendidas. Na literatura, algumas formas de se abordar os problemas de aprendizado contínuo envolvem: alterar a topologia dos modelos; armazenar dados de tarefas já aprendidas, criar dados falsos baseados em comportamentos aprendidos sobre as tarefas; ou reutilizar soluções de tarefas antigas para acelerar o aprendizado de novas tarefas. Este trabalho apresenta o sistema de aprendizado por reforço contínuo (LRLS, do inglês Lifelong Reinforcement Learning System), um sistema de aprendizado contínuo para problemas de aprendizado por reforço que utiliza memórias complementares para resolver sequências de tarefas. Neste trabalho, memórias complementares são modelos com funções distintas: o primeiro modelo aprende a resolver a tarefa atual; o segundo modelo aprende a correlacionar as tarefas; e o terceiro modelo é responsável por armazenar os conhecimentos aprendidos sobre tarefas anteriores e reaproveitar tais conhecimentos com o objetivo de acelerar o aprendizado de novas tarefas. Cada módulo do sistema é implementado usando redes neurais com topologias que variam de acordo com a necessidade. Além disso, a forma como o sistema foi implementado anula a necessidade de se armazenar dados sobre tarefas passadas. Por fim, experimentos realizados mostram que agentes autônomos utilizando o LRLS são capazes de aprender novas tarefas, mantendo o conhecimento de tarefas passadas; eles ainda utilizam os conhecimentos armazenados para acelerar o aprendizado de novas tarefas.
publishDate 2022
dc.date.none.fl_str_mv 2022-08-08
2025-04-30T00:33:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALMEIDA, A. C. de. Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2022 Disponível em: https://doi.org/10.31414/EE.2022.T.131518.
https://repositorio.fei.edu.br/handle/FEI/5748
identifier_str_mv ALMEIDA, A. C. de. Sistema de memórias complementares e neurogênese aplicado à problemas de aprendizado por reforço contínuo. 2022. 85 f. Tese (Doutorado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2022 Disponível em: https://doi.org/10.31414/EE.2022.T.131518.
url https://repositorio.fei.edu.br/handle/FEI/5748
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 85
application/pdf
dc.source.none.fl_str_mv reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
collection Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.name.fl_str_mv Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1853486363470462976