Exportação concluída — 

Entity-learning with deep reinforcement learning : a study on different abstractions of input

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Werneck, Henrique Ramos Rissardo
Orientador(a): Celiberto Junior, Luiz Antonio
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal do ABC
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985
Resumo: Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
id UFBC_5e4a2c0b83dcaafacc72d09a539d6ba4
oai_identifier_str oai:BDTD:124761
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisEntity-learning with deep reinforcement learning : a study on different abstractions of input2022-05-06Celiberto Junior, Luiz AntonioWerneck, Henrique Ramos RissardoUniversidade Federal do ABCPrograma de Pós-Graduação em Ciência da ComputaçãoUFABCengAPRENDIZADO PROFUNDO POR REFORÇOAPRENDIZADO POR REFORÇOOTIMIZANVIZDOOMDEEP REINFORCEMENT LEARNINGREINFORCEMENT LEARNINGPROXIMAL POLICY OPTIMISATIONABSTRACTION LEVELSPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorAprendizado profundo por reforço é um método que introduziu soluções promissoras a vários bloqueios historicamente apresentados por aprendizado por reforço. Esses avanços são objetos de diversos estudos recentes. Eles consideram, por exemplo, a possibilidade de automaticamente abstrair informações relevantes do ambiente, como entidades presentes em tal ambiente, e atuar consistentemente usando dados de maior dimensão de ambientes complexos. Para este trabalho, a plataforma ViZDoom é utilizada de forma a comparar a eficiência de aprendizado para diferentes propostas de entrada: um agente aprendendo de imagens não processadas como entrada e um aprendendo de imagens editadas como entrada, com entidades destacadas na cena. Esse trabalho busca contribuir com um estudo comparativo entre a eficiência no aprendizado mostrada por agentes quando apresentados a dados em diferentes níveis de abstração, aprendendo de um ambiente dinâmico sobre habilidades fundamentais.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:03:55Zoai:BDTD:124761Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2023-08-28T15:37:25Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.pt.fl_str_mv Entity-learning with deep reinforcement learning : a study on different abstractions of input
title Entity-learning with deep reinforcement learning : a study on different abstractions of input
spellingShingle Entity-learning with deep reinforcement learning : a study on different abstractions of input
Werneck, Henrique Ramos Rissardo
title_short Entity-learning with deep reinforcement learning : a study on different abstractions of input
title_full Entity-learning with deep reinforcement learning : a study on different abstractions of input
title_fullStr Entity-learning with deep reinforcement learning : a study on different abstractions of input
title_full_unstemmed Entity-learning with deep reinforcement learning : a study on different abstractions of input
title_sort Entity-learning with deep reinforcement learning : a study on different abstractions of input
author Werneck, Henrique Ramos Rissardo
author_facet Werneck, Henrique Ramos Rissardo
author_role author
dc.contributor.advisor1.fl_str_mv Celiberto Junior, Luiz Antonio
dc.contributor.author.fl_str_mv Werneck, Henrique Ramos Rissardo
contributor_str_mv Celiberto Junior, Luiz Antonio
description Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
publishDate 2022
dc.date.issued.fl_str_mv 2022-05-06
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=124761&midiaext=80985
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do ABC
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFABC
publisher.none.fl_str_mv Universidade Federal do ABC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1854475890028707840