Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
| Ano de defesa: | 2000 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/ |
Resumo: | Neste trabalho apresentamos uma técnica iterativa para calcular a solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, baseada no método de diferença temporal, quando a matriz de probabilidade P é conhecida. As EARA estão relacionadas ao controle ótimo de sistemas lineares com saltos Markovianos e têm sido estudadas exaustivamente, nos últimos anos. Traçaremos um paralelo com a teoria de algoritmos de diferenças temporais para processos Markovianos de decisão (PMD), para desenvolver um algoritmo iterativo dependente de um parâmetro \'lambda\' \'pertence a\' [0,1] para a solução maximal das EARA. Para o caso especial onde \'lambda\' = 1 e \'lambda\' = 0, temos asituação na qual os algoritmos se reduzem à iteração das equações a diferenças de Riccati (iteração de valores) e o método de quasi-linearização (iteração de estratégias), respectivamente. Apresentamos ainda uma técnica iterativa, baseada emsimulações de Monte Carlo, para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade P não é conhecida. Para isso, traçamos paralelo com a teoria do algoritmo TD(\'lambda\') para PMD para desenvolver o algoritmo TD(\'lambda\') para controle ótimo associado à solução maximal de um EARA. Alguns exemplos numéricos são apresentados neste trabalho para esclarecer a teoria. |
| id |
USP_8711f9c9de15c1009fb6872c607d9d0f |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-16102024-102926 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos.Untitled in englishControle estocásticoEquações de RiccatiRiccati equationsStochastic controlNeste trabalho apresentamos uma técnica iterativa para calcular a solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, baseada no método de diferença temporal, quando a matriz de probabilidade P é conhecida. As EARA estão relacionadas ao controle ótimo de sistemas lineares com saltos Markovianos e têm sido estudadas exaustivamente, nos últimos anos. Traçaremos um paralelo com a teoria de algoritmos de diferenças temporais para processos Markovianos de decisão (PMD), para desenvolver um algoritmo iterativo dependente de um parâmetro \'lambda\' \'pertence a\' [0,1] para a solução maximal das EARA. Para o caso especial onde \'lambda\' = 1 e \'lambda\' = 0, temos asituação na qual os algoritmos se reduzem à iteração das equações a diferenças de Riccati (iteração de valores) e o método de quasi-linearização (iteração de estratégias), respectivamente. Apresentamos ainda uma técnica iterativa, baseada emsimulações de Monte Carlo, para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade P não é conhecida. Para isso, traçamos paralelo com a teoria do algoritmo TD(\'lambda\') para PMD para desenvolver o algoritmo TD(\'lambda\') para controle ótimo associado à solução maximal de um EARA. Alguns exemplos numéricos são apresentados neste trabalho para esclarecer a teoria.In this paper, we present an iterative technique for deriving the maximal solution of a set of discrete-time coupled algebraic Riccati equations (CARE), based on temporal difference methods, for the case in which the transition probability matrix P of the Markov chain is known. CARE are related to the optimal control of Markovian jump linear systems and have been extensively studied over the last few years. We drawn a parallel with the theory of temporal difference algorithms for Markovian decision processes to develop a .......Biblioteca Digitais de Teses e Dissertações da USPCosta, Oswaldo Luiz do ValleCeballos Aya, Julio César 2000-12-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-16T13:50:02Zoai:teses.usp.br:tde-16102024-102926Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-16T13:50:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. Untitled in english |
| title |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. |
| spellingShingle |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. Ceballos Aya, Julio César Controle estocástico Equações de Riccati Riccati equations Stochastic control |
| title_short |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. |
| title_full |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. |
| title_fullStr |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. |
| title_full_unstemmed |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. |
| title_sort |
Método de diferenças temporais para sistemas lineares com Saltos Markovianos. |
| author |
Ceballos Aya, Julio César |
| author_facet |
Ceballos Aya, Julio César |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Costa, Oswaldo Luiz do Valle |
| dc.contributor.author.fl_str_mv |
Ceballos Aya, Julio César |
| dc.subject.por.fl_str_mv |
Controle estocástico Equações de Riccati Riccati equations Stochastic control |
| topic |
Controle estocástico Equações de Riccati Riccati equations Stochastic control |
| description |
Neste trabalho apresentamos uma técnica iterativa para calcular a solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, baseada no método de diferença temporal, quando a matriz de probabilidade P é conhecida. As EARA estão relacionadas ao controle ótimo de sistemas lineares com saltos Markovianos e têm sido estudadas exaustivamente, nos últimos anos. Traçaremos um paralelo com a teoria de algoritmos de diferenças temporais para processos Markovianos de decisão (PMD), para desenvolver um algoritmo iterativo dependente de um parâmetro \'lambda\' \'pertence a\' [0,1] para a solução maximal das EARA. Para o caso especial onde \'lambda\' = 1 e \'lambda\' = 0, temos asituação na qual os algoritmos se reduzem à iteração das equações a diferenças de Riccati (iteração de valores) e o método de quasi-linearização (iteração de estratégias), respectivamente. Apresentamos ainda uma técnica iterativa, baseada emsimulações de Monte Carlo, para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade P não é conhecida. Para isso, traçamos paralelo com a teoria do algoritmo TD(\'lambda\') para PMD para desenvolver o algoritmo TD(\'lambda\') para controle ótimo associado à solução maximal de um EARA. Alguns exemplos numéricos são apresentados neste trabalho para esclarecer a teoria. |
| publishDate |
2000 |
| dc.date.none.fl_str_mv |
2000-12-04 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1818279201347731456 |