Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos
| Ano de defesa: | 2012 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Instituto Tecnológico de Aeronáutica
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2058 |
Resumo: | O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porem, ela não é eficiente o bastante para ser usada em aplicações com exigências do mundo real devido ao tempo que o agente precisa para o aprendizado. Este trabalho propõe um mecanismo para a aceleração do aprendizado por reforço, utilizando transferência do aprendizado com a combinação de varias técnicas distintas, como, redes neurais artificiais, aprendizado por reforço, raciocínio baseado em casos e uso de heurística para aceleração do aprendizado, utilizando a semelhança entre domínios. Com o objetivo de avaliar o mecanismo proposto, implementou-se o algoritmo Q-Learning Acelerado por Transferência de Aprendizado (Q-Learning Accelerated by Transfer Learning - Q-LATL) que estende o conhecido algoritmo Q-Learning utilizando métodos de aproveitamento de casos para extração da função heurística, métodos estes que podem ser usados para a aceleração do aprendizado por reforço. Foram realizados experimentos utilizando a transferência de aprendizado para solucionar problemas em diversos domínios. Os resultados experimentais deste trabalho permitem concluir que a transferência do aprendizado, na forma como aplicada neste trabalho, melhora o desempenho do algoritmo de aprendizado por reforço utilizado. |
| id |
ITA_36a4182ea98bb4e118dcac1e5283cd60 |
|---|---|
| oai_identifier_str |
oai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2058 |
| network_acronym_str |
ITA |
| network_name_str |
Biblioteca Digital de Teses e Dissertações do ITA |
| spelling |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casosAprendizagem (inteligência artificial)Programação heurísticaRedes neuraisAlgoritmosInteligência artificialComputaçãoO aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porem, ela não é eficiente o bastante para ser usada em aplicações com exigências do mundo real devido ao tempo que o agente precisa para o aprendizado. Este trabalho propõe um mecanismo para a aceleração do aprendizado por reforço, utilizando transferência do aprendizado com a combinação de varias técnicas distintas, como, redes neurais artificiais, aprendizado por reforço, raciocínio baseado em casos e uso de heurística para aceleração do aprendizado, utilizando a semelhança entre domínios. Com o objetivo de avaliar o mecanismo proposto, implementou-se o algoritmo Q-Learning Acelerado por Transferência de Aprendizado (Q-Learning Accelerated by Transfer Learning - Q-LATL) que estende o conhecido algoritmo Q-Learning utilizando métodos de aproveitamento de casos para extração da função heurística, métodos estes que podem ser usados para a aceleração do aprendizado por reforço. Foram realizados experimentos utilizando a transferência de aprendizado para solucionar problemas em diversos domínios. Os resultados experimentais deste trabalho permitem concluir que a transferência do aprendizado, na forma como aplicada neste trabalho, melhora o desempenho do algoritmo de aprendizado por reforço utilizado.Instituto Tecnológico de AeronáuticaJackson Paul MatsuuraReinaldo Augusto da Costa BianchiLuiz Antonio Celiberto Junior2012-06-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttp://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2058reponame:Biblioteca Digital de Teses e Dissertações do ITAinstname:Instituto Tecnológico de Aeronáuticainstacron:ITAporinfo:eu-repo/semantics/openAccessapplication/pdf2019-02-02T14:03:48Zoai:agregador.ibict.br.BDTD_ITA:oai:ita.br:2058http://oai.bdtd.ibict.br/requestopendoar:null2020-05-28 19:38:08.147Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáuticatrue |
| dc.title.none.fl_str_mv |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| title |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| spellingShingle |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos Luiz Antonio Celiberto Junior Aprendizagem (inteligência artificial) Programação heurística Redes neurais Algoritmos Inteligência artificial Computação |
| title_short |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| title_full |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| title_fullStr |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| title_full_unstemmed |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| title_sort |
Aprendizado por reforço acelerado por transferência de aprendizado baseado em casos |
| author |
Luiz Antonio Celiberto Junior |
| author_facet |
Luiz Antonio Celiberto Junior |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Jackson Paul Matsuura Reinaldo Augusto da Costa Bianchi |
| dc.contributor.author.fl_str_mv |
Luiz Antonio Celiberto Junior |
| dc.subject.por.fl_str_mv |
Aprendizagem (inteligência artificial) Programação heurística Redes neurais Algoritmos Inteligência artificial Computação |
| topic |
Aprendizagem (inteligência artificial) Programação heurística Redes neurais Algoritmos Inteligência artificial Computação |
| dc.description.none.fl_txt_mv |
O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porem, ela não é eficiente o bastante para ser usada em aplicações com exigências do mundo real devido ao tempo que o agente precisa para o aprendizado. Este trabalho propõe um mecanismo para a aceleração do aprendizado por reforço, utilizando transferência do aprendizado com a combinação de varias técnicas distintas, como, redes neurais artificiais, aprendizado por reforço, raciocínio baseado em casos e uso de heurística para aceleração do aprendizado, utilizando a semelhança entre domínios. Com o objetivo de avaliar o mecanismo proposto, implementou-se o algoritmo Q-Learning Acelerado por Transferência de Aprendizado (Q-Learning Accelerated by Transfer Learning - Q-LATL) que estende o conhecido algoritmo Q-Learning utilizando métodos de aproveitamento de casos para extração da função heurística, métodos estes que podem ser usados para a aceleração do aprendizado por reforço. Foram realizados experimentos utilizando a transferência de aprendizado para solucionar problemas em diversos domínios. Os resultados experimentais deste trabalho permitem concluir que a transferência do aprendizado, na forma como aplicada neste trabalho, melhora o desempenho do algoritmo de aprendizado por reforço utilizado. |
| description |
O aprendizado por reforço é uma técnica muito conhecida para a solução de problemas quando o agente precisa atuar com sucesso em um local desconhecido por meio de tentativa e erro. Porem, ela não é eficiente o bastante para ser usada em aplicações com exigências do mundo real devido ao tempo que o agente precisa para o aprendizado. Este trabalho propõe um mecanismo para a aceleração do aprendizado por reforço, utilizando transferência do aprendizado com a combinação de varias técnicas distintas, como, redes neurais artificiais, aprendizado por reforço, raciocínio baseado em casos e uso de heurística para aceleração do aprendizado, utilizando a semelhança entre domínios. Com o objetivo de avaliar o mecanismo proposto, implementou-se o algoritmo Q-Learning Acelerado por Transferência de Aprendizado (Q-Learning Accelerated by Transfer Learning - Q-LATL) que estende o conhecido algoritmo Q-Learning utilizando métodos de aproveitamento de casos para extração da função heurística, métodos estes que podem ser usados para a aceleração do aprendizado por reforço. Foram realizados experimentos utilizando a transferência de aprendizado para solucionar problemas em diversos domínios. Os resultados experimentais deste trabalho permitem concluir que a transferência do aprendizado, na forma como aplicada neste trabalho, melhora o desempenho do algoritmo de aprendizado por reforço utilizado. |
| publishDate |
2012 |
| dc.date.none.fl_str_mv |
2012-06-06 |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis |
| status_str |
publishedVersion |
| format |
doctoralThesis |
| dc.identifier.uri.fl_str_mv |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2058 |
| url |
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=2058 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Instituto Tecnológico de Aeronáutica |
| publisher.none.fl_str_mv |
Instituto Tecnológico de Aeronáutica |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações do ITA instname:Instituto Tecnológico de Aeronáutica instacron:ITA |
| reponame_str |
Biblioteca Digital de Teses e Dissertações do ITA |
| collection |
Biblioteca Digital de Teses e Dissertações do ITA |
| instname_str |
Instituto Tecnológico de Aeronáutica |
| instacron_str |
ITA |
| institution |
ITA |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações do ITA - Instituto Tecnológico de Aeronáutica |
| repository.mail.fl_str_mv |
|
| subject_por_txtF_mv |
Aprendizagem (inteligência artificial) Programação heurística Redes neurais Algoritmos Inteligência artificial Computação |
| _version_ |
1706804997517213696 |