Entity-learning with deep reinforcement learning : a study on different abstractions of input
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal do ABC
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Link de acesso: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985 |
Resumo: | Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior |
| id |
UFBC_5e4a2c0b83dcaafacc72d09a539d6ba4 |
|---|---|
| oai_identifier_str |
oai:BDTD:124761 |
| network_acronym_str |
UFBC |
| network_name_str |
Repositório Institucional da UFABC |
| repository_id_str |
|
| spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisEntity-learning with deep reinforcement learning : a study on different abstractions of input2022-05-06Celiberto Junior, Luiz AntonioWerneck, Henrique Ramos RissardoUniversidade Federal do ABCPrograma de Pós-Graduação em Ciência da ComputaçãoUFABCengAPRENDIZADO PROFUNDO POR REFORÇOAPRENDIZADO POR REFORÇOOTIMIZANVIZDOOMDEEP REINFORCEMENT LEARNINGREINFORCEMENT LEARNINGPROXIMAL POLICY OPTIMISATIONABSTRACTION LEVELSPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorAprendizado profundo por reforço é um método que introduziu soluções promissoras a vários bloqueios historicamente apresentados por aprendizado por reforço. Esses avanços são objetos de diversos estudos recentes. Eles consideram, por exemplo, a possibilidade de automaticamente abstrair informações relevantes do ambiente, como entidades presentes em tal ambiente, e atuar consistentemente usando dados de maior dimensão de ambientes complexos. Para este trabalho, a plataforma ViZDoom é utilizada de forma a comparar a eficiência de aprendizado para diferentes propostas de entrada: um agente aprendendo de imagens não processadas como entrada e um aprendendo de imagens editadas como entrada, com entidades destacadas na cena. Esse trabalho busca contribuir com um estudo comparativo entre a eficiência no aprendizado mostrada por agentes quando apresentados a dados em diferentes níveis de abstração, aprendendo de um ambiente dinâmico sobre habilidades fundamentais.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:03:55Zoai:BDTD:124761Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2023-08-28T15:37:25Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
| dc.title.pt.fl_str_mv |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| title |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| spellingShingle |
Entity-learning with deep reinforcement learning : a study on different abstractions of input Werneck, Henrique Ramos Rissardo |
| title_short |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| title_full |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| title_fullStr |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| title_full_unstemmed |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| title_sort |
Entity-learning with deep reinforcement learning : a study on different abstractions of input |
| author |
Werneck, Henrique Ramos Rissardo |
| author_facet |
Werneck, Henrique Ramos Rissardo |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Celiberto Junior, Luiz Antonio |
| dc.contributor.author.fl_str_mv |
Werneck, Henrique Ramos Rissardo |
| contributor_str_mv |
Celiberto Junior, Luiz Antonio |
| description |
Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior |
| publishDate |
2022 |
| dc.date.issued.fl_str_mv |
2022-05-06 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985 |
| url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do ABC |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
| dc.publisher.initials.fl_str_mv |
UFABC |
| publisher.none.fl_str_mv |
Universidade Federal do ABC |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
| instname_str |
Universidade Federal do ABC (UFABC) |
| instacron_str |
UFABC |
| institution |
UFABC |
| reponame_str |
Repositório Institucional da UFABC |
| collection |
Repositório Institucional da UFABC |
| repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
| repository.mail.fl_str_mv |
|
| _version_ |
1854475890028707840 |