Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Silva, Eder Henrique Nunes da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Engenharia Elétrica
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/38740
Resumo: This work investigates the application of parallel computing in control systems, proposing a Reinforcement Learning-Based Model Predictive Control (RLMPC) framework. The focus lies on addressing the challenge of controlling an inverted pendulum system by integrating Reinforcement Learning (RL) and Model Predictive Control (MPC) to optimize performance and ensure real-time stability. As part of this dissertation, a physical inverted pendulum system was designed and assembled using industrial grade components that ensure robustness, reliability, and realistic operating conditions. This experimental platform played a key role in the validation of the proposed control structure in practice. The RLMPC framework employs parallelization to solve online optimization problems, enabling fast responses and effective decision-making. The parallel implementation proved to be efficient in meeting computational demands, allowing deployment in systems with real-time constraints. This study contributes to control theory by combining model-based and data-driven approaches, enhancing adaptability in uncertain industrial environments.
id UTFPR-12_b29a3f7ce03ec2065c6c913ca8dc0e11
oai_identifier_str oai:repositorio.utfpr.edu.br:1/38740
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertidoParallel computing for real-time control: reinforcement learning-based model predictive control of inverted pendulum systemsComputaçãoControle preditivoEngenharia elétricaComputer sciencePredictive controlElectric engineeringCNPQ::ENGENHARIASEngenharia ElétricaThis work investigates the application of parallel computing in control systems, proposing a Reinforcement Learning-Based Model Predictive Control (RLMPC) framework. The focus lies on addressing the challenge of controlling an inverted pendulum system by integrating Reinforcement Learning (RL) and Model Predictive Control (MPC) to optimize performance and ensure real-time stability. As part of this dissertation, a physical inverted pendulum system was designed and assembled using industrial grade components that ensure robustness, reliability, and realistic operating conditions. This experimental platform played a key role in the validation of the proposed control structure in practice. The RLMPC framework employs parallelization to solve online optimization problems, enabling fast responses and effective decision-making. The parallel implementation proved to be efficient in meeting computational demands, allowing deployment in systems with real-time constraints. This study contributes to control theory by combining model-based and data-driven approaches, enhancing adaptability in uncertain industrial environments.Este trabalho investiga a aplicação da computação paralela em sistemas de controle, propondo uma estrutura de Controle Preditivo Baseado em Aprendizado por Reforço (RLMPC). O foco está no desafio de controlar um sistema de pêndulo invertido, por meio da integração entre o Aprendizado por Reforço (RL) e o Controle Preditivo Modelado (MPC), com o objetivo de otimizar o desempenho e garantir a estabilidade em tempo real. Como parte desta dissertação, foi projetado e construído um sistema físico de pêndulo invertido utilizando componentes industriais, assegurando robustez, confiabilidade e condições realistas de operação. Essa plataforma experimental foi essencial para a validação prática da estrutura proposta. A estrutura RLMPC emprega paralelização para resolver problemas de otimização online, possibilitando respostas rápidas e decisões eficazes. A implementação paralela mostrou-se eficiente no atendimento às exigências computacionais, viabilizando a aplicação em sistemas com restrições de tempo real. Este estudo contribui para o avanço da teoria de controle ao combinar abordagens baseadas em modelos e orientadas a dados, promovendo maior adaptabilidade frente às incertezas dos ambientes industriaisUniversidade Tecnológica Federal do ParanáCornelio ProcopioBrasilPrograma de Pós-Graduação em Engenharia ElétricaUTFPRAgulhari, Cristiano Marcoshttps://lattes.cnpq.br/4935395556663775Agulhari, Cristiano Marcoshttps://lattes.cnpq.br/4935395556663775Santos, Luciano Antonio Frezzatohttp://lattes.cnpq.br/3004375048406723Castoldi, Marcelo Favorettohttps://lattes.cnpq.br/6178029384175205Souza, Wesley Angelino dehttps://lattes.cnpq.br/8594457321079718Silva, Eder Henrique Nunes da2025-10-21T13:28:25Z2025-10-21T13:28:25Z2025-08-07info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfSILVA, Eder Henrique Nunes da. Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido. 2025. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/38740porhttps://creativecommons.org/licenses/by/4.0/deed.eninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-10-22T06:15:00Zoai:repositorio.utfpr.edu.br:1/38740Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-10-22T06:15Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
Parallel computing for real-time control: reinforcement learning-based model predictive control of inverted pendulum systems
title Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
spellingShingle Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
Silva, Eder Henrique Nunes da
Computação
Controle preditivo
Engenharia elétrica
Computer science
Predictive control
Electric engineering
CNPQ::ENGENHARIAS
Engenharia Elétrica
title_short Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
title_full Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
title_fullStr Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
title_full_unstemmed Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
title_sort Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido
author Silva, Eder Henrique Nunes da
author_facet Silva, Eder Henrique Nunes da
author_role author
dc.contributor.none.fl_str_mv Agulhari, Cristiano Marcos
https://lattes.cnpq.br/4935395556663775
Agulhari, Cristiano Marcos
https://lattes.cnpq.br/4935395556663775
Santos, Luciano Antonio Frezzato
http://lattes.cnpq.br/3004375048406723
Castoldi, Marcelo Favoretto
https://lattes.cnpq.br/6178029384175205
Souza, Wesley Angelino de
https://lattes.cnpq.br/8594457321079718
dc.contributor.author.fl_str_mv Silva, Eder Henrique Nunes da
dc.subject.por.fl_str_mv Computação
Controle preditivo
Engenharia elétrica
Computer science
Predictive control
Electric engineering
CNPQ::ENGENHARIAS
Engenharia Elétrica
topic Computação
Controle preditivo
Engenharia elétrica
Computer science
Predictive control
Electric engineering
CNPQ::ENGENHARIAS
Engenharia Elétrica
description This work investigates the application of parallel computing in control systems, proposing a Reinforcement Learning-Based Model Predictive Control (RLMPC) framework. The focus lies on addressing the challenge of controlling an inverted pendulum system by integrating Reinforcement Learning (RL) and Model Predictive Control (MPC) to optimize performance and ensure real-time stability. As part of this dissertation, a physical inverted pendulum system was designed and assembled using industrial grade components that ensure robustness, reliability, and realistic operating conditions. This experimental platform played a key role in the validation of the proposed control structure in practice. The RLMPC framework employs parallelization to solve online optimization problems, enabling fast responses and effective decision-making. The parallel implementation proved to be efficient in meeting computational demands, allowing deployment in systems with real-time constraints. This study contributes to control theory by combining model-based and data-driven approaches, enhancing adaptability in uncertain industrial environments.
publishDate 2025
dc.date.none.fl_str_mv 2025-10-21T13:28:25Z
2025-10-21T13:28:25Z
2025-08-07
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv SILVA, Eder Henrique Nunes da. Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido. 2025. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.
http://repositorio.utfpr.edu.br/jspui/handle/1/38740
identifier_str_mv SILVA, Eder Henrique Nunes da. Computação paralela para controle em tempo real: controle preditivo baseado em modelos de aprendizado por reforço de sistemas de pêndulo invertido. 2025. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2025.
url http://repositorio.utfpr.edu.br/jspui/handle/1/38740
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by/4.0/deed.en
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by/4.0/deed.en
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Engenharia Elétrica
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Cornelio Procopio
Brasil
Programa de Pós-Graduação em Engenharia Elétrica
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498283875598336