Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Silva, I. J.
Orientador(a): Bianchi, Reinaldo Augusto da Costa
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Centro Universitário FEI, São Bernardo do Campo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.fei.edu.br/handle/FEI/328
Resumo: Os atuais robôs humanoides ainda possuem instabilidade no andar dinâmico comparado com o andar humano. Apesar de existirem robôs móveis com rodas que possuem uma boa estabilidade, a busca pelo desenvolvimento dos robôs humanoides se dá pelo fato de que a locomoção com pernas é a melhor forma de locomoção em ambientes com descontinuidades no piso. Existem várias técnicas de geração de caminhada que vêm sendo desenvolvidas para robôs humanoides, porém, até o momento, nenhuma delas apresentou resultados satisfatórios se comparados com o andar humano. No entanto, sabe-se que há restrições construtivas, porque os robôs humanoides atuais, para se assemelharem aos seres humanos, precisam ser construídos com dispositivos e preceitos análogos a estrutura física do corpo humano. No robô humanoide se usa metais ao invés de ossos, motores no lugar de músculos, fios no lugar dos nervos e microprocessadores no lugar do cérebro, com isso, o resultado operacional acaba sendo diferente se comparado ao ser humano. Ao longo dos anos, várias propostas vêm sendo apresentadas para solucionar a questão da estabilidade dos robôs humanoides durante a caminhada. Algumas propostas apresentaram o aprendizado por reforço como solução, entretanto cada uma delas apresentou diferentes formas de implementação do aprendizado com diversos algoritmos. Seguindo essa linha de pesquisa, este trabalho propõe um algoritmo de aprendizado por reforço com generalizações temporais para otimizar os valores dos parâmetros do sistema de controle do andar em um robô humanoide, buscando um andar rápido e estável. Foram realizados experimentos simulado. Os resultados experimentais permitiram concluir que o algoritmo proposto foi capaz de aprender quais são os melhores valores de parâmetros do gerador de caminhada, através da observação do desempenho da caminhada executada pelo robô humanoide.
id FEI_bdaeca378c6901eec0af4591892154ae
oai_identifier_str oai:repositorio.fei.edu.br:FEI/328
network_acronym_str FEI
network_name_str Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository_id_str
spelling Silva, I. J.Bianchi, Reinaldo Augusto da Costa2019-03-15T17:49:28Z2019-03-15T17:49:28Z2015SILVA, I. J. <b> Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide. </b> 2015. 116 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2015. Disponível em: &lt;http://sofia.fei.edu.br:8080/pergamumweb/vinculos/000047/000047f5.pdf&gt;. Acesso em: 23 maio 2019.https://repositorio.fei.edu.br/handle/FEI/328Os atuais robôs humanoides ainda possuem instabilidade no andar dinâmico comparado com o andar humano. Apesar de existirem robôs móveis com rodas que possuem uma boa estabilidade, a busca pelo desenvolvimento dos robôs humanoides se dá pelo fato de que a locomoção com pernas é a melhor forma de locomoção em ambientes com descontinuidades no piso. Existem várias técnicas de geração de caminhada que vêm sendo desenvolvidas para robôs humanoides, porém, até o momento, nenhuma delas apresentou resultados satisfatórios se comparados com o andar humano. No entanto, sabe-se que há restrições construtivas, porque os robôs humanoides atuais, para se assemelharem aos seres humanos, precisam ser construídos com dispositivos e preceitos análogos a estrutura física do corpo humano. No robô humanoide se usa metais ao invés de ossos, motores no lugar de músculos, fios no lugar dos nervos e microprocessadores no lugar do cérebro, com isso, o resultado operacional acaba sendo diferente se comparado ao ser humano. Ao longo dos anos, várias propostas vêm sendo apresentadas para solucionar a questão da estabilidade dos robôs humanoides durante a caminhada. Algumas propostas apresentaram o aprendizado por reforço como solução, entretanto cada uma delas apresentou diferentes formas de implementação do aprendizado com diversos algoritmos. Seguindo essa linha de pesquisa, este trabalho propõe um algoritmo de aprendizado por reforço com generalizações temporais para otimizar os valores dos parâmetros do sistema de controle do andar em um robô humanoide, buscando um andar rápido e estável. Foram realizados experimentos simulado. Os resultados experimentais permitiram concluir que o algoritmo proposto foi capaz de aprender quais são os melhores valores de parâmetros do gerador de caminhada, através da observação do desempenho da caminhada executada pelo robô humanoide.The current humanoid robots still have instability in the dynamic walking if compared to human walking. Although there are wheeled mobile robots that have a good stability, the search for the development of humanoid robots, is given by the fact that the locomotion with legs is the best form of locomotion in environments with discontinuities on the floor. There are several gait generation techniques that have been developed for humanoid robots, but so far none of them had satisfactory results if compared to the human gait, however it is known that there is constructive restrictions, this because the current humanoid robots, in order to be similar to the humans, must be constructed of similar materials and devices to the human, such as metal instead of bones and muscles instead of engines. Over the years, several proposals have been presented to resolve the issue of stability of humanoid robots while walking. Some of the proposals presented reinforcement learning as a solution, each presenting different ways of implementing the learning with various algorithms. Following this same line of research, this work proposes a learning reinforcement algorithm with temporal generalizations to optimize the values of the parameters of the gait control system in a humanoid robot, seeking a fast and stable gait. Gait generation experiments were performed in the real robot and experiments with the algorithm proposed in a simulated environment. Experimental results allowed to conclude that the proposed algorithm can learn what are the best values of the gait generator parameters, by observing the walk performance executed by the robot humanoid.porpt_BRCentro Universitário FEI, São Bernardo do CampoInteligência artificial-EducaçãoRobôsRobô humanóideUso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóideinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)instname:Centro Universitário da Fundação Educacional Inaciana (FEI)instacron:FEIinfo:eu-repo/semantics/openAccessFEI/3282019-05-07 18:33:57.67metadata.onlyoai:repositorio.fei.edu.br:FEI/328https://repositorio-novo.fei.edu.brBiblioteca Digital de Teses e Dissertaçõeshttp://sofia.fei.edu.br/pergamum/biblioteca/PRIhttps://repositorio-api.fei.edu.br/server/oai/requestcfernandes@fei.edu.bropendoar:2019-05-07T18:33:57Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)false
dc.title.pt_BR.fl_str_mv Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
title Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
spellingShingle Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
Silva, I. J.
Inteligência artificial-Educação
Robôs
Robô humanóide
title_short Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
title_full Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
title_fullStr Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
title_full_unstemmed Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
title_sort Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide
author Silva, I. J.
author_facet Silva, I. J.
author_role author
dc.contributor.author.fl_str_mv Silva, I. J.
dc.contributor.advisor1.fl_str_mv Bianchi, Reinaldo Augusto da Costa
contributor_str_mv Bianchi, Reinaldo Augusto da Costa
dc.subject.por.fl_str_mv Inteligência artificial-Educação
Robôs
Robô humanóide
topic Inteligência artificial-Educação
Robôs
Robô humanóide
description Os atuais robôs humanoides ainda possuem instabilidade no andar dinâmico comparado com o andar humano. Apesar de existirem robôs móveis com rodas que possuem uma boa estabilidade, a busca pelo desenvolvimento dos robôs humanoides se dá pelo fato de que a locomoção com pernas é a melhor forma de locomoção em ambientes com descontinuidades no piso. Existem várias técnicas de geração de caminhada que vêm sendo desenvolvidas para robôs humanoides, porém, até o momento, nenhuma delas apresentou resultados satisfatórios se comparados com o andar humano. No entanto, sabe-se que há restrições construtivas, porque os robôs humanoides atuais, para se assemelharem aos seres humanos, precisam ser construídos com dispositivos e preceitos análogos a estrutura física do corpo humano. No robô humanoide se usa metais ao invés de ossos, motores no lugar de músculos, fios no lugar dos nervos e microprocessadores no lugar do cérebro, com isso, o resultado operacional acaba sendo diferente se comparado ao ser humano. Ao longo dos anos, várias propostas vêm sendo apresentadas para solucionar a questão da estabilidade dos robôs humanoides durante a caminhada. Algumas propostas apresentaram o aprendizado por reforço como solução, entretanto cada uma delas apresentou diferentes formas de implementação do aprendizado com diversos algoritmos. Seguindo essa linha de pesquisa, este trabalho propõe um algoritmo de aprendizado por reforço com generalizações temporais para otimizar os valores dos parâmetros do sistema de controle do andar em um robô humanoide, buscando um andar rápido e estável. Foram realizados experimentos simulado. Os resultados experimentais permitiram concluir que o algoritmo proposto foi capaz de aprender quais são os melhores valores de parâmetros do gerador de caminhada, através da observação do desempenho da caminhada executada pelo robô humanoide.
publishDate 2015
dc.date.issued.fl_str_mv 2015
dc.date.accessioned.fl_str_mv 2019-03-15T17:49:28Z
dc.date.available.fl_str_mv 2019-03-15T17:49:28Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, I. J. <b> Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide. </b> 2015. 116 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2015. Disponível em: &lt;http://sofia.fei.edu.br:8080/pergamumweb/vinculos/000047/000047f5.pdf&gt;. Acesso em: 23 maio 2019.
dc.identifier.uri.fl_str_mv https://repositorio.fei.edu.br/handle/FEI/328
identifier_str_mv SILVA, I. J. <b> Uso de aprendizado por reforço para otimização do controle de caminhada de um robô móvel humanóide. </b> 2015. 116 f. Dissertação (Mestrado em Engenharia Elétrica) - Centro Universitário FEI, São Bernardo do Campo, 2015. Disponível em: &lt;http://sofia.fei.edu.br:8080/pergamumweb/vinculos/000047/000047f5.pdf&gt;. Acesso em: 23 maio 2019.
url https://repositorio.fei.edu.br/handle/FEI/328
dc.language.iso.fl_str_mv por
pt_BR
language por
language_invalid_str_mv pt_BR
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Centro Universitário FEI, São Bernardo do Campo
publisher.none.fl_str_mv Centro Universitário FEI, São Bernardo do Campo
dc.source.none.fl_str_mv reponame:Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
instname:Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron:FEI
instname_str Centro Universitário da Fundação Educacional Inaciana (FEI)
instacron_str FEI
institution FEI
reponame_str Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
collection Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.name.fl_str_mv Repositório do Conhecimento Institucional do Centro Universitário da Fundação Educacional Inaciana (FEI) - Centro Universitário da Fundação Educacional Inaciana (FEI)
repository.mail.fl_str_mv cfernandes@fei.edu.br
_version_ 1856221263012298752