CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA
| Ano de defesa: | 2012 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Maranhão
|
| Programa de Pós-Graduação: |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET
|
| Departamento: |
Engenharia
|
| País: |
BR
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | http://tedebc.ufma.br:8080/jspui/handle/tede/494 |
Resumo: | The union of methodologies for optimal control and dynamics programming has stimulated the development of algorithms for realization of discrete control systems of the type linear quadratic regulator (DLQR). The methodology is based on reinforcement learning methods based on temporal differences and approximate dynamic programming. The proposed method combines the approach of the value function by method RLS (recursive least squares) and approximate policy iteration schemes heuristic dynamic programming (HDP). The approach is directed to the assessment of convergence of the solution DLQR and the heuristic weighting matrices and of the utility function associated with DLQR. The investigation of convergence properties related to consistency, persistent excitation and polarization of the RLS estimator is performed. The methodology involved in a project achievements online DLQR controllers and is evaluated in a fourth order multivariable dynamic system. |
| id |
UFMA_ff5f0924c162ca83136cdd7dbfba3001 |
|---|---|
| oai_identifier_str |
oai:tede2:tede/494 |
| network_acronym_str |
UFMA |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
| repository_id_str |
|
| spelling |
FONSECA NETO, João Viana daCPF:2199749048http://lattes.cnpq.br/0029055473709795Serra, Ginalber Luiz de OliveiraCPF:79248934315http://lattes.cnpq.br/0831092299374520CPF:00304277380http://lattes.cnpq.br/9294927489743146Maciel, Allan James Ferreira2016-08-17T14:53:22Z2013-04-032012-09-28MACIEL, Allan James Ferreira. CONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMING. 2012. 121 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luís, 2012.http://tedebc.ufma.br:8080/jspui/handle/tede/494The union of methodologies for optimal control and dynamics programming has stimulated the development of algorithms for realization of discrete control systems of the type linear quadratic regulator (DLQR). The methodology is based on reinforcement learning methods based on temporal differences and approximate dynamic programming. The proposed method combines the approach of the value function by method RLS (recursive least squares) and approximate policy iteration schemes heuristic dynamic programming (HDP). The approach is directed to the assessment of convergence of the solution DLQR and the heuristic weighting matrices and of the utility function associated with DLQR. The investigation of convergence properties related to consistency, persistent excitation and polarization of the RLS estimator is performed. The methodology involved in a project achievements online DLQR controllers and is evaluated in a fourth order multivariable dynamic system.A união das metodologias de controle ótimo e de programação dinâmica tem impulsionado o desenvolvimento de algoritmos para realizações de sistemas de controle discreto do tipo regulador linear quadrático (DLQR). A metodologia utilizada neste trabalho é fundamentada sobre métodos de aprendizagem por reforço baseados em diferenças temporais e programação dinâmica aproximada. O método proposto combina a aproximação da função valor através do método RLS (mínimos quadrados recursivos) e iteração de política aproximada em esquemas de programação dinâmica heurística (HDP). A abordagem é orientada para a avaliação da convergência da solução DLQR e para a sintonia heurística das matrizes de ponderação e da função de utilidade associada ao DLQR. É realizada a investigação das propriedades de convergência relacionadas à consistência, excitação persistente e polarização do estimador RLS. A metodologia contempla realizações de projetos de forma online de controladores DLQR e é avaliada em um sistema dinâmico multivariável de quarta ordem.Made available in DSpace on 2016-08-17T14:53:22Z (GMT). No. of bitstreams: 1 Dissertacao Allan James.pdf: 3170694 bytes, checksum: 054a9e74e81a7c2099800246d0b6c530 (MD5) Previous issue date: 2012-09-28Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorapplication/pdfporUniversidade Federal do MaranhãoPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCETUFMABREngenhariaProgramação Dinâmica HeurísticaControle MultivariávelControle ÓtimoRegulador Quadrático Linear DiscretoMínimos Quadrados RecursivosControle DigitalHeuristic Dynamic ProgrammingMultivariable ControlOptimal ControlDiscrete Linear Quadratic RegulatorRecursive Least SquaresDigital ControlCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICACONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMINGinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFMAinstname:Universidade Federal do Maranhão (UFMA)instacron:UFMAORIGINALDissertacao Allan James.pdfapplication/pdf3170694http://tedebc.ufma.br:8080/bitstream/tede/494/1/Dissertacao+Allan+James.pdf054a9e74e81a7c2099800246d0b6c530MD51tede/4942018-01-26 18:07:07.541oai:tede2:tede/494Biblioteca Digital de Teses e Dissertaçõeshttps://tedebc.ufma.br/jspui/PUBhttp://tedebc.ufma.br:8080/oai/requestrepositorio@ufma.br||repositorio@ufma.bropendoar:21312018-01-26T21:07:07Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA)false |
| dc.title.por.fl_str_mv |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| dc.title.alternative.eng.fl_str_mv |
CONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMING |
| title |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| spellingShingle |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA Maciel, Allan James Ferreira Programação Dinâmica Heurística Controle Multivariável Controle Ótimo Regulador Quadrático Linear Discreto Mínimos Quadrados Recursivos Controle Digital Heuristic Dynamic Programming Multivariable Control Optimal Control Discrete Linear Quadratic Regulator Recursive Least Squares Digital Control CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| title_full |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| title_fullStr |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| title_full_unstemmed |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| title_sort |
CONVERGÊNCIA DO ESTIMADOR RLS PARA ALGORITMOS DE PROGRAMAÇÃO DINÂMICA HEURÍSTICA |
| author |
Maciel, Allan James Ferreira |
| author_facet |
Maciel, Allan James Ferreira |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
FONSECA NETO, João Viana da |
| dc.contributor.advisor1ID.fl_str_mv |
CPF:2199749048 |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/0029055473709795 |
| dc.contributor.referee1.fl_str_mv |
Serra, Ginalber Luiz de Oliveira |
| dc.contributor.referee1ID.fl_str_mv |
CPF:79248934315 |
| dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/0831092299374520 |
| dc.contributor.authorID.fl_str_mv |
CPF:00304277380 |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/9294927489743146 |
| dc.contributor.author.fl_str_mv |
Maciel, Allan James Ferreira |
| contributor_str_mv |
FONSECA NETO, João Viana da Serra, Ginalber Luiz de Oliveira |
| dc.subject.por.fl_str_mv |
Programação Dinâmica Heurística Controle Multivariável Controle Ótimo Regulador Quadrático Linear Discreto Mínimos Quadrados Recursivos Controle Digital |
| topic |
Programação Dinâmica Heurística Controle Multivariável Controle Ótimo Regulador Quadrático Linear Discreto Mínimos Quadrados Recursivos Controle Digital Heuristic Dynamic Programming Multivariable Control Optimal Control Discrete Linear Quadratic Regulator Recursive Least Squares Digital Control CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Heuristic Dynamic Programming Multivariable Control Optimal Control Discrete Linear Quadratic Regulator Recursive Least Squares Digital Control |
| dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
The union of methodologies for optimal control and dynamics programming has stimulated the development of algorithms for realization of discrete control systems of the type linear quadratic regulator (DLQR). The methodology is based on reinforcement learning methods based on temporal differences and approximate dynamic programming. The proposed method combines the approach of the value function by method RLS (recursive least squares) and approximate policy iteration schemes heuristic dynamic programming (HDP). The approach is directed to the assessment of convergence of the solution DLQR and the heuristic weighting matrices and of the utility function associated with DLQR. The investigation of convergence properties related to consistency, persistent excitation and polarization of the RLS estimator is performed. The methodology involved in a project achievements online DLQR controllers and is evaluated in a fourth order multivariable dynamic system. |
| publishDate |
2012 |
| dc.date.issued.fl_str_mv |
2012-09-28 |
| dc.date.available.fl_str_mv |
2013-04-03 |
| dc.date.accessioned.fl_str_mv |
2016-08-17T14:53:22Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MACIEL, Allan James Ferreira. CONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMING. 2012. 121 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luís, 2012. |
| dc.identifier.uri.fl_str_mv |
http://tedebc.ufma.br:8080/jspui/handle/tede/494 |
| identifier_str_mv |
MACIEL, Allan James Ferreira. CONVERGENCE OF ESTIMATOR RLS FOR ALGORITHMS OF HEURISTIC DYNAMIC PROGRAMMING. 2012. 121 f. Dissertação (Mestrado em Engenharia) - Universidade Federal do Maranhão, São Luís, 2012. |
| url |
http://tedebc.ufma.br:8080/jspui/handle/tede/494 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
| dc.publisher.program.fl_str_mv |
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE ELETRICIDADE/CCET |
| dc.publisher.initials.fl_str_mv |
UFMA |
| dc.publisher.country.fl_str_mv |
BR |
| dc.publisher.department.fl_str_mv |
Engenharia |
| publisher.none.fl_str_mv |
Universidade Federal do Maranhão |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFMA instname:Universidade Federal do Maranhão (UFMA) instacron:UFMA |
| instname_str |
Universidade Federal do Maranhão (UFMA) |
| instacron_str |
UFMA |
| institution |
UFMA |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFMA |
| collection |
Biblioteca Digital de Teses e Dissertações da UFMA |
| bitstream.url.fl_str_mv |
http://tedebc.ufma.br:8080/bitstream/tede/494/1/Dissertacao+Allan+James.pdf |
| bitstream.checksum.fl_str_mv |
054a9e74e81a7c2099800246d0b6c530 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFMA - Universidade Federal do Maranhão (UFMA) |
| repository.mail.fl_str_mv |
repositorio@ufma.br||repositorio@ufma.br |
| _version_ |
1853507978516234240 |