Exportação concluída — 

Método de diferenças temporais para sistemas lineares com Saltos Markovianos.

Detalhes bibliográficos
Ano de defesa: 2000
Autor(a) principal: Ceballos Aya, Julio César
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/
Resumo: Neste trabalho apresentamos uma técnica iterativa para calcular a solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, baseada no método de diferença temporal, quando a matriz de probabilidade P é conhecida. As EARA estão relacionadas ao controle ótimo de sistemas lineares com saltos Markovianos e têm sido estudadas exaustivamente, nos últimos anos. Traçaremos um paralelo com a teoria de algoritmos de diferenças temporais para processos Markovianos de decisão (PMD), para desenvolver um algoritmo iterativo dependente de um parâmetro \'lambda\' \'pertence a\' [0,1] para a solução maximal das EARA. Para o caso especial onde \'lambda\' = 1 e \'lambda\' = 0, temos asituação na qual os algoritmos se reduzem à iteração das equações a diferenças de Riccati (iteração de valores) e o método de quasi-linearização (iteração de estratégias), respectivamente. Apresentamos ainda uma técnica iterativa, baseada emsimulações de Monte Carlo, para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade P não é conhecida. Para isso, traçamos paralelo com a teoria do algoritmo TD(\'lambda\') para PMD para desenvolver o algoritmo TD(\'lambda\') para controle ótimo associado à solução maximal de um EARA. Alguns exemplos numéricos são apresentados neste trabalho para esclarecer a teoria.
id USP_8711f9c9de15c1009fb6872c607d9d0f
oai_identifier_str oai:teses.usp.br:tde-16102024-102926
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Método de diferenças temporais para sistemas lineares com Saltos Markovianos.Untitled in englishControle estocásticoEquações de RiccatiRiccati equationsStochastic controlNeste trabalho apresentamos uma técnica iterativa para calcular a solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, baseada no método de diferença temporal, quando a matriz de probabilidade P é conhecida. As EARA estão relacionadas ao controle ótimo de sistemas lineares com saltos Markovianos e têm sido estudadas exaustivamente, nos últimos anos. Traçaremos um paralelo com a teoria de algoritmos de diferenças temporais para processos Markovianos de decisão (PMD), para desenvolver um algoritmo iterativo dependente de um parâmetro \'lambda\' \'pertence a\' [0,1] para a solução maximal das EARA. Para o caso especial onde \'lambda\' = 1 e \'lambda\' = 0, temos asituação na qual os algoritmos se reduzem à iteração das equações a diferenças de Riccati (iteração de valores) e o método de quasi-linearização (iteração de estratégias), respectivamente. Apresentamos ainda uma técnica iterativa, baseada emsimulações de Monte Carlo, para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade P não é conhecida. Para isso, traçamos paralelo com a teoria do algoritmo TD(\'lambda\') para PMD para desenvolver o algoritmo TD(\'lambda\') para controle ótimo associado à solução maximal de um EARA. Alguns exemplos numéricos são apresentados neste trabalho para esclarecer a teoria.In this paper, we present an iterative technique for deriving the maximal solution of a set of discrete-time coupled algebraic Riccati equations (CARE), based on temporal difference methods, for the case in which the transition probability matrix P of the Markov chain is known. CARE are related to the optimal control of Markovian jump linear systems and have been extensively studied over the last few years. We drawn a parallel with the theory of temporal difference algorithms for Markovian decision processes to develop a .......Biblioteca Digitais de Teses e Dissertações da USPCosta, Oswaldo Luiz do ValleCeballos Aya, Julio César 2000-12-04info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-16T13:50:02Zoai:teses.usp.br:tde-16102024-102926Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-16T13:50:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
Untitled in english
title Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
spellingShingle Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
Ceballos Aya, Julio César
Controle estocástico
Equações de Riccati
Riccati equations
Stochastic control
title_short Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
title_full Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
title_fullStr Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
title_full_unstemmed Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
title_sort Método de diferenças temporais para sistemas lineares com Saltos Markovianos.
author Ceballos Aya, Julio César
author_facet Ceballos Aya, Julio César
author_role author
dc.contributor.none.fl_str_mv Costa, Oswaldo Luiz do Valle
dc.contributor.author.fl_str_mv Ceballos Aya, Julio César
dc.subject.por.fl_str_mv Controle estocástico
Equações de Riccati
Riccati equations
Stochastic control
topic Controle estocástico
Equações de Riccati
Riccati equations
Stochastic control
description Neste trabalho apresentamos uma técnica iterativa para calcular a solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, baseada no método de diferença temporal, quando a matriz de probabilidade P é conhecida. As EARA estão relacionadas ao controle ótimo de sistemas lineares com saltos Markovianos e têm sido estudadas exaustivamente, nos últimos anos. Traçaremos um paralelo com a teoria de algoritmos de diferenças temporais para processos Markovianos de decisão (PMD), para desenvolver um algoritmo iterativo dependente de um parâmetro \'lambda\' \'pertence a\' [0,1] para a solução maximal das EARA. Para o caso especial onde \'lambda\' = 1 e \'lambda\' = 0, temos asituação na qual os algoritmos se reduzem à iteração das equações a diferenças de Riccati (iteração de valores) e o método de quasi-linearização (iteração de estratégias), respectivamente. Apresentamos ainda uma técnica iterativa, baseada emsimulações de Monte Carlo, para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade P não é conhecida. Para isso, traçamos paralelo com a teoria do algoritmo TD(\'lambda\') para PMD para desenvolver o algoritmo TD(\'lambda\') para controle ótimo associado à solução maximal de um EARA. Alguns exemplos numéricos são apresentados neste trabalho para esclarecer a teoria.
publishDate 2000
dc.date.none.fl_str_mv 2000-12-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/
url https://www.teses.usp.br/teses/disponiveis/3/3139/tde-16102024-102926/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1818279201347731456