Solving a markov decision process multidimensional problem with tensor decomposition

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Kuinchtner, Daniela
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://tede2.pucrs.br/tede2/handle/tede/9832
Resumo: Markov Decision Process (MDP) is a model used for planning decision-making of agents in stochastic and completely observable environments. Although much research is focused on solving atomic MDP problems in tabular forms or MDP problems with factored representations, none is based on tensor decomposition methods. Solving MDPs using tensor algebra offers the prospect of leveraging advances in tensor-based calculations to increase MDP solvers’ efficiency. In this research, first, we formalize MDP multidimensional problems using tensor algebra. Second, we develop an MDP solver using the CANDECOMP-PARAFAC tensor decomposition method to compact state transition matrices. The solver uses the value iteration and policy iteration algorithms to compute the solution compactly. Then, we empirically evaluate the compact algorithms compared to tabular methods. As a result, we show that the tensor approach can compute larger problems using substantially less memory, opening up new possibilities for tensor-based methods for stochastic planning.
id P_RS_6e31e1912e1e70ec73d6cb753e0af8c3
oai_identifier_str oai:tede2.pucrs.br:tede/9832
network_acronym_str P_RS
network_name_str Biblioteca Digital de Teses e Dissertações da PUC_RS
repository_id_str
spelling Solving a markov decision process multidimensional problem with tensor decompositionSolucionando um problema multidimensional de processo de decisão de markov utilizando decomposição de tensoresArtificial IntelligenceCANDECOMP-PARAFAC DecompositionMarkov Decision ProcessTensor AlgebraTensor DecompositionInteligência ArtificialDecomposição CANDECOMP-PARAFACProcesso de ´Decisão de MarkovÁgebra TensorialDecomposição de TensoresCIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAOMarkov Decision Process (MDP) is a model used for planning decision-making of agents in stochastic and completely observable environments. Although much research is focused on solving atomic MDP problems in tabular forms or MDP problems with factored representations, none is based on tensor decomposition methods. Solving MDPs using tensor algebra offers the prospect of leveraging advances in tensor-based calculations to increase MDP solvers’ efficiency. In this research, first, we formalize MDP multidimensional problems using tensor algebra. Second, we develop an MDP solver using the CANDECOMP-PARAFAC tensor decomposition method to compact state transition matrices. The solver uses the value iteration and policy iteration algorithms to compute the solution compactly. Then, we empirically evaluate the compact algorithms compared to tabular methods. As a result, we show that the tensor approach can compute larger problems using substantially less memory, opening up new possibilities for tensor-based methods for stochastic planning.Processo de Decisão de Markov (MDP) é um modelo usado para planejamento de tomada de decisão de agentes em ambientes estocásticos e completamente observáveis. Embora, muita pesquisa se concentra na solução de problemas de MDPs atômicos em formas tabulares ou MDPs com representações fatoradas, nenhuma se baseia em métodos de decomposição de tensores. Resolver MDPs usando álgebra tensorial oferece a perspectiva de alavancar avanços em cálculos baseados em tensor para aumentar a eficiência de solucionadores de MDP. Nesta pesquisa, primeiro, é formalizado problemas multidimensionais de MDP usando álgebra tensorial. Segundo, é desenvolvido um solucionador de MDP usando o método de decomposição de tensor CANDECOMP-PARAFAC para compactar as matrizes de transição de estados. O solucionador utiliza os algoritmos de iteração de valor e iteração de política para computar a solução de forma compacta. Então, os algoritmos compactos são avaliados de forma empírica em comparação com métodos tabulares. Como resultados, é mostrado que a abordagem tensorial pode computar problemas maiores usando substancialmente menos memória, abrindo novas possibilidades para métodos baseadas em tensores para o planejamento estocástico.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESPontifícia Universidade Católica do Rio Grande do SulEscola PolitécnicaBrasilPUCRSPrograma de Pós-Graduação em Ciência da ComputaçãoSales, Afonso Henrique Correa dehttp://lattes.cnpq.br/4329466230451089Meneguzzi, Felipe Rechhttp://lattes.cnpq.br/5973550650941724Kuinchtner, Daniela2021-09-01T13:54:18Z2021-03-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://tede2.pucrs.br/tede2/handle/tede/9832enginfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da PUC_RSinstname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)instacron:PUC_RS2021-09-01T15:00:23Zoai:tede2.pucrs.br:tede/9832Biblioteca Digital de Teses e Dissertaçõeshttp://tede2.pucrs.br/tede2/PRIhttps://tede2.pucrs.br/oai/requestbiblioteca.central@pucrs.br||opendoar:2021-09-01T15:00:23Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)false
dc.title.none.fl_str_mv Solving a markov decision process multidimensional problem with tensor decomposition
Solucionando um problema multidimensional de processo de decisão de markov utilizando decomposição de tensores
title Solving a markov decision process multidimensional problem with tensor decomposition
spellingShingle Solving a markov decision process multidimensional problem with tensor decomposition
Kuinchtner, Daniela
Artificial Intelligence
CANDECOMP-PARAFAC Decomposition
Markov Decision Process
Tensor Algebra
Tensor Decomposition
Inteligência Artificial
Decomposição CANDECOMP-PARAFAC
Processo de ´Decisão de Markov
Ágebra Tensorial
Decomposição de Tensores
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
title_short Solving a markov decision process multidimensional problem with tensor decomposition
title_full Solving a markov decision process multidimensional problem with tensor decomposition
title_fullStr Solving a markov decision process multidimensional problem with tensor decomposition
title_full_unstemmed Solving a markov decision process multidimensional problem with tensor decomposition
title_sort Solving a markov decision process multidimensional problem with tensor decomposition
author Kuinchtner, Daniela
author_facet Kuinchtner, Daniela
author_role author
dc.contributor.none.fl_str_mv Sales, Afonso Henrique Correa de
http://lattes.cnpq.br/4329466230451089
Meneguzzi, Felipe Rech
http://lattes.cnpq.br/5973550650941724
dc.contributor.author.fl_str_mv Kuinchtner, Daniela
dc.subject.por.fl_str_mv Artificial Intelligence
CANDECOMP-PARAFAC Decomposition
Markov Decision Process
Tensor Algebra
Tensor Decomposition
Inteligência Artificial
Decomposição CANDECOMP-PARAFAC
Processo de ´Decisão de Markov
Ágebra Tensorial
Decomposição de Tensores
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
topic Artificial Intelligence
CANDECOMP-PARAFAC Decomposition
Markov Decision Process
Tensor Algebra
Tensor Decomposition
Inteligência Artificial
Decomposição CANDECOMP-PARAFAC
Processo de ´Decisão de Markov
Ágebra Tensorial
Decomposição de Tensores
CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO
description Markov Decision Process (MDP) is a model used for planning decision-making of agents in stochastic and completely observable environments. Although much research is focused on solving atomic MDP problems in tabular forms or MDP problems with factored representations, none is based on tensor decomposition methods. Solving MDPs using tensor algebra offers the prospect of leveraging advances in tensor-based calculations to increase MDP solvers’ efficiency. In this research, first, we formalize MDP multidimensional problems using tensor algebra. Second, we develop an MDP solver using the CANDECOMP-PARAFAC tensor decomposition method to compact state transition matrices. The solver uses the value iteration and policy iteration algorithms to compute the solution compactly. Then, we empirically evaluate the compact algorithms compared to tabular methods. As a result, we show that the tensor approach can compute larger problems using substantially less memory, opening up new possibilities for tensor-based methods for stochastic planning.
publishDate 2021
dc.date.none.fl_str_mv 2021-09-01T13:54:18Z
2021-03-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://tede2.pucrs.br/tede2/handle/tede/9832
url http://tede2.pucrs.br/tede2/handle/tede/9832
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
publisher.none.fl_str_mv Pontifícia Universidade Católica do Rio Grande do Sul
Escola Politécnica
Brasil
PUCRS
Programa de Pós-Graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da PUC_RS
instname:Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron:PUC_RS
instname_str Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
instacron_str PUC_RS
institution PUC_RS
reponame_str Biblioteca Digital de Teses e Dissertações da PUC_RS
collection Biblioteca Digital de Teses e Dissertações da PUC_RS
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da PUC_RS - Pontifícia Universidade Católica do Rio Grande do Sul (PUCRS)
repository.mail.fl_str_mv biblioteca.central@pucrs.br||
_version_ 1850041305084723200