Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial

Freitas, Elthon Manhas de

Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial

Detalhes bibliográficos
Ano de defesa:	2018
Autor(a) principal:	Freitas, Elthon Manhas de
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Aversão a risco Exponential utility Markov decision process Planejamento probabilístico Probabilistic planning Processos de decisão de Markov Risk averse Risk sensitive Sensibilidade a risco Utilidade exponencial
Link de acesso:	http://www.teses.usp.br/teses/disponiveis/100/100131/tde-17012019-092638/
Resumo:	Os processos de decisão de Markov (Markov Decision Process - MDP) têm sido usados para resolução de problemas de tomada de decisão sequencial. Existem problemas em que lidar com os riscos do ambiente para obter um resultado confiável é mais importante do que maximizar o retorno médio esperado. MDPs que lidam com esse tipo de problemas são chamados de processos de decisão de Markov sensíveis a risco (Risk-Sensitive Markov Decision Process - RSMDP). Dentre as diversas variações de RSMDP, estão os trabalhos baseados em utilidade exponencial que utilizam um fator de risco, o qual modela a atitude a risco do agente e que pode ser propensa ou aversa. Os algoritmos existentes na literatura para resolver esse tipo de RSMDPs são ineficientes se comparados a outros algoritmos de MDP. Neste projeto, é apresentada uma solução que pode ser usada em problemas maiores, tanto por executar cálculos apenas em estados relevantes para atingir um conjunto de estados meta partindo de um estado inicial, quanto por permitir processamento de números com expoentes muito elevados para os ambientes computacionais atuais. Os experimentos realizados evidenciam que (i) o algoritmo proposto é mais eficiente, se comparado aos algoritmos estado-da-arte para RSMDPs; e (ii) o uso da técnica LogSumExp permite resolver o problema de trabalhar com expoentes muito elevados em RSMDPs.

Metadados do item

id	USP_ea4858a37c05da93f8d200f1c78ed00e
oai_identifier_str	oai:teses.usp.br:tde-17012019-092638
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencialProbabilistic risk-sensitive planning with ILAO* and exponential utility functionAversão a riscoExponential utilityMarkov decision processPlanejamento probabilísticoProbabilistic planningProcessos de decisão de MarkovRisk averseRisk sensitiveSensibilidade a riscoUtilidade exponencialOs processos de decisão de Markov (Markov Decision Process - MDP) têm sido usados para resolução de problemas de tomada de decisão sequencial. Existem problemas em que lidar com os riscos do ambiente para obter um resultado confiável é mais importante do que maximizar o retorno médio esperado. MDPs que lidam com esse tipo de problemas são chamados de processos de decisão de Markov sensíveis a risco (Risk-Sensitive Markov Decision Process - RSMDP). Dentre as diversas variações de RSMDP, estão os trabalhos baseados em utilidade exponencial que utilizam um fator de risco, o qual modela a atitude a risco do agente e que pode ser propensa ou aversa. Os algoritmos existentes na literatura para resolver esse tipo de RSMDPs são ineficientes se comparados a outros algoritmos de MDP. Neste projeto, é apresentada uma solução que pode ser usada em problemas maiores, tanto por executar cálculos apenas em estados relevantes para atingir um conjunto de estados meta partindo de um estado inicial, quanto por permitir processamento de números com expoentes muito elevados para os ambientes computacionais atuais. Os experimentos realizados evidenciam que (i) o algoritmo proposto é mais eficiente, se comparado aos algoritmos estado-da-arte para RSMDPs; e (ii) o uso da técnica LogSumExp permite resolver o problema de trabalhar com expoentes muito elevados em RSMDPs.Markov Decision Process (MDP) has been used very efficiently to solve sequential decision-making problems. There are problems where dealing with environmental risks to get a reliable result is more important than maximizing the expected average return. MDPs that deal with this type of problem are called risk-sensitive Markov decision processes (RSMDP). Among the several variations of RSMDP are the works based on exponential utility that use a risk factor, which models the agent\'s risk attitude that can be prone or averse. The algorithms in the literature to solve this type of RSMDPs are inefficient when compared to other MDP algorithms. In this project, a solution is presented that can be used in larger problems, either by performing calculations only in relevant states to reach a set of meta states starting from an initial state, or by allowing the processing of numbers with very high exponents for the current computational environments. The experiments show that (i) the proposed algorithm is more efficient when compared to state-of-the-art algorithms for RSMDPs; and (ii) the LogSumExp technique solves the problem of working with very large exponents in RSMDPsBiblioteca Digitais de Teses e Dissertações da USPDelgado, Karina ValdiviaFreitas, Elthon Manhas de2018-10-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/100/100131/tde-17012019-092638/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T13:16:04Zoai:teses.usp.br:tde-17012019-092638Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212024-10-09T13:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial Probabilistic risk-sensitive planning with ILAO* and exponential utility function
title	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial
spellingShingle	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial Freitas, Elthon Manhas de Aversão a risco Exponential utility Markov decision process Planejamento probabilístico Probabilistic planning Processos de decisão de Markov Risk averse Risk sensitive Sensibilidade a risco Utilidade exponencial
title_short	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial
title_full	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial
title_fullStr	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial
title_full_unstemmed	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial
title_sort	Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial
author	Freitas, Elthon Manhas de
author_facet	Freitas, Elthon Manhas de
author_role	author
dc.contributor.none.fl_str_mv	Delgado, Karina Valdivia
dc.contributor.author.fl_str_mv	Freitas, Elthon Manhas de
dc.subject.por.fl_str_mv	Aversão a risco Exponential utility Markov decision process Planejamento probabilístico Probabilistic planning Processos de decisão de Markov Risk averse Risk sensitive Sensibilidade a risco Utilidade exponencial
topic	Aversão a risco Exponential utility Markov decision process Planejamento probabilístico Probabilistic planning Processos de decisão de Markov Risk averse Risk sensitive Sensibilidade a risco Utilidade exponencial
description	Os processos de decisão de Markov (Markov Decision Process - MDP) têm sido usados para resolução de problemas de tomada de decisão sequencial. Existem problemas em que lidar com os riscos do ambiente para obter um resultado confiável é mais importante do que maximizar o retorno médio esperado. MDPs que lidam com esse tipo de problemas são chamados de processos de decisão de Markov sensíveis a risco (Risk-Sensitive Markov Decision Process - RSMDP). Dentre as diversas variações de RSMDP, estão os trabalhos baseados em utilidade exponencial que utilizam um fator de risco, o qual modela a atitude a risco do agente e que pode ser propensa ou aversa. Os algoritmos existentes na literatura para resolver esse tipo de RSMDPs são ineficientes se comparados a outros algoritmos de MDP. Neste projeto, é apresentada uma solução que pode ser usada em problemas maiores, tanto por executar cálculos apenas em estados relevantes para atingir um conjunto de estados meta partindo de um estado inicial, quanto por permitir processamento de números com expoentes muito elevados para os ambientes computacionais atuais. Os experimentos realizados evidenciam que (i) o algoritmo proposto é mais eficiente, se comparado aos algoritmos estado-da-arte para RSMDPs; e (ii) o uso da técnica LogSumExp permite resolver o problema de trabalhar com expoentes muito elevados em RSMDPs.
publishDate	2018
dc.date.none.fl_str_mv	2018-10-18
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/100/100131/tde-17012019-092638/
url	http://www.teses.usp.br/teses/disponiveis/100/100131/tde-17012019-092638/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1865491597393657856

Planejamento probabilístico sensível a risco com ILAO* e função utilidade exponencial

Registros relacionados