FOND planning via explicit search

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Messa, Frederico
Orientador(a): Pereira, André Grahl
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/293148
Resumo: Planejamento completamente-observável não-determinístico (planejameno "FOND") está no centro da inteligência artificial com incerteza. Ele modela incerteza através de ações com resultados não-determinísticos. Existem diversos trabalhos na literatura que apresen tam técnicas para resolver tarefas de planejamento FOND. Contudo, antes dessa tese, ao que sabemos, nenhum dos trabalhos existentes apresenta um planejador FOND que explí citamente busca em um espaço de políticas para encontrar uma política solução. Nessa tese nós apresentamos uma gama de contribuições para planejamento FOND: (1) um al goritmo de busca para planejamento FOND baseado em A*, que chamamos de A* with Non-Determinism (ou AND*, abreviado), que busca em um espaço de políticas constru tivo; (2) funções heurísticas que agregram informações determinizadas para avaliar o quão longe uma política está de se tornar uma solução e que podem ser usadas pelo AND* para encontrar soluções compactas; (3) um procedimento que constrói uma solução em tempo polinomial ao seu tamanho* dado apenas o conhecimento do conjunto de estados que precisa ser mapeado nela; e (4) uma abordagem de compressão que, dada uma política solução definida através de estados completos, produz uma política de estados parciais que a representa sem ambiguidades com o menor número de estados parciais possível. Algumas dessas contribuições podem ser aplicadas a outros paradigmas. Além dessas constribuições, nós também monstramos que é possível acelerar a computação de sime trias de espaço de estados através do uso de técnicas de teoria dos grupos. Nós também estudamos diferentes possíveis conceitos de equivalências entre políticas no contexto da busca em espaço de políticas do AND, e também poda por deadlock e abordagens mais gulosas. As buscas introduzidas estabelecem busca explícita em espaço de políticas ba seada em A* como um método competitivo para tratar tarefas de planejamento FOND.
id URGS_0150a3af9a5a03b2507169a60de346e8
oai_identifier_str oai:www.lume.ufrgs.br:10183/293148
network_acronym_str URGS
network_name_str Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling Messa, FredericoPereira, André Grahl2025-06-25T07:56:44Z2025http://hdl.handle.net/10183/293148001266998Planejamento completamente-observável não-determinístico (planejameno "FOND") está no centro da inteligência artificial com incerteza. Ele modela incerteza através de ações com resultados não-determinísticos. Existem diversos trabalhos na literatura que apresen tam técnicas para resolver tarefas de planejamento FOND. Contudo, antes dessa tese, ao que sabemos, nenhum dos trabalhos existentes apresenta um planejador FOND que explí citamente busca em um espaço de políticas para encontrar uma política solução. Nessa tese nós apresentamos uma gama de contribuições para planejamento FOND: (1) um al goritmo de busca para planejamento FOND baseado em A*, que chamamos de A* with Non-Determinism (ou AND*, abreviado), que busca em um espaço de políticas constru tivo; (2) funções heurísticas que agregram informações determinizadas para avaliar o quão longe uma política está de se tornar uma solução e que podem ser usadas pelo AND* para encontrar soluções compactas; (3) um procedimento que constrói uma solução em tempo polinomial ao seu tamanho* dado apenas o conhecimento do conjunto de estados que precisa ser mapeado nela; e (4) uma abordagem de compressão que, dada uma política solução definida através de estados completos, produz uma política de estados parciais que a representa sem ambiguidades com o menor número de estados parciais possível. Algumas dessas contribuições podem ser aplicadas a outros paradigmas. Além dessas constribuições, nós também monstramos que é possível acelerar a computação de sime trias de espaço de estados através do uso de técnicas de teoria dos grupos. Nós também estudamos diferentes possíveis conceitos de equivalências entre políticas no contexto da busca em espaço de políticas do AND, e também poda por deadlock e abordagens mais gulosas. As buscas introduzidas estabelecem busca explícita em espaço de políticas ba seada em A* como um método competitivo para tratar tarefas de planejamento FOND.Fully-observable non-deterministic (FOND) planning is at the core of artificial intelli gence planning with uncertainty. It models uncertainty through actions with non-determi nistic outcomes. The goal is to find a policy that guides one to the goal regardless of the outcome of each action. There are several works in the literature that present techniques for solving FOND planning tasks. However, prior to this thesis, to our knowledge, none of the existing works presents a FOND planner that explicitly searches a space of policies to find a solution policy. In this thesis, we present a range of contributions for FOND planning: (1) an A*-based search algorithm for FOND planning, which we call A* with Non-Determinism (AND* for short) that searches a constructive space of policies; (2) heuristic functions that aggregate determinized information to evaluate how far a policy is from becoming a solution and can be used by AND∗ to find compact solutions; (3) a procedure that constructs a solution in time polynomial to its size given just the knowl edge of the set of states that should be mapped in it; and (4) a compression approach that, given a solution policy defined over complete states, produces a partial-state policy that represents it unambiguously with the fewest partial states possible. Some of these contributions can be applied for other paradigms. Besides these contributions, we also show that it is possible to accelerate the computation of state-space symmetries through the use of a group theory technique. We also study different possible concepts of equiva lences between policies in the context of AND*’s policy-space search, and also deadlock pruning and greedier approaches. The introduced techniques establish A*-based explicit policy-space search as a competitive method for addressing FOND planning tasks.application/pdfengBusca heurísticaInteligência artificialPlanejamento ótimoSimetrias estruturaisFOND planningUncertaintyNon determinismBest-first searchEquivalence pruningStructural symmetriesPolicy com pressionFOND planning via explicit searchPlanejamento FOND via busca explícita info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS2025doutoradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001266998.pdf.txt001266998.pdf.txtExtracted Texttext/plain229048http://www.lume.ufrgs.br/bitstream/10183/293148/2/001266998.pdf.txt64a45d861c16207255901b7540a9c5afMD52ORIGINAL001266998.pdfTexto completo (inglês)application/pdf914270http://www.lume.ufrgs.br/bitstream/10183/293148/1/001266998.pdf4d9f65a5b8387ddf3f3fdf49d981b2f2MD5110183/2931482025-12-17 07:57:11.903397oai:www.lume.ufrgs.br:10183/293148Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br || lume@ufrgs.bropendoar:18532025-12-17T09:57:11Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv FOND planning via explicit search
dc.title.alternative.pt.fl_str_mv Planejamento FOND via busca explícita
title FOND planning via explicit search
spellingShingle FOND planning via explicit search
Messa, Frederico
Busca heurística
Inteligência artificial
Planejamento ótimo
Simetrias estruturais
FOND planning
Uncertainty
Non determinism
Best-first search
Equivalence pruning
Structural symmetries
Policy com pression
title_short FOND planning via explicit search
title_full FOND planning via explicit search
title_fullStr FOND planning via explicit search
title_full_unstemmed FOND planning via explicit search
title_sort FOND planning via explicit search
author Messa, Frederico
author_facet Messa, Frederico
author_role author
dc.contributor.author.fl_str_mv Messa, Frederico
dc.contributor.advisor1.fl_str_mv Pereira, André Grahl
contributor_str_mv Pereira, André Grahl
dc.subject.por.fl_str_mv Busca heurística
Inteligência artificial
Planejamento ótimo
Simetrias estruturais
topic Busca heurística
Inteligência artificial
Planejamento ótimo
Simetrias estruturais
FOND planning
Uncertainty
Non determinism
Best-first search
Equivalence pruning
Structural symmetries
Policy com pression
dc.subject.eng.fl_str_mv FOND planning
Uncertainty
Non determinism
Best-first search
Equivalence pruning
Structural symmetries
Policy com pression
description Planejamento completamente-observável não-determinístico (planejameno "FOND") está no centro da inteligência artificial com incerteza. Ele modela incerteza através de ações com resultados não-determinísticos. Existem diversos trabalhos na literatura que apresen tam técnicas para resolver tarefas de planejamento FOND. Contudo, antes dessa tese, ao que sabemos, nenhum dos trabalhos existentes apresenta um planejador FOND que explí citamente busca em um espaço de políticas para encontrar uma política solução. Nessa tese nós apresentamos uma gama de contribuições para planejamento FOND: (1) um al goritmo de busca para planejamento FOND baseado em A*, que chamamos de A* with Non-Determinism (ou AND*, abreviado), que busca em um espaço de políticas constru tivo; (2) funções heurísticas que agregram informações determinizadas para avaliar o quão longe uma política está de se tornar uma solução e que podem ser usadas pelo AND* para encontrar soluções compactas; (3) um procedimento que constrói uma solução em tempo polinomial ao seu tamanho* dado apenas o conhecimento do conjunto de estados que precisa ser mapeado nela; e (4) uma abordagem de compressão que, dada uma política solução definida através de estados completos, produz uma política de estados parciais que a representa sem ambiguidades com o menor número de estados parciais possível. Algumas dessas contribuições podem ser aplicadas a outros paradigmas. Além dessas constribuições, nós também monstramos que é possível acelerar a computação de sime trias de espaço de estados através do uso de técnicas de teoria dos grupos. Nós também estudamos diferentes possíveis conceitos de equivalências entre políticas no contexto da busca em espaço de políticas do AND, e também poda por deadlock e abordagens mais gulosas. As buscas introduzidas estabelecem busca explícita em espaço de políticas ba seada em A* como um método competitivo para tratar tarefas de planejamento FOND.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-06-25T07:56:44Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/293148
dc.identifier.nrb.pt_BR.fl_str_mv 001266998
url http://hdl.handle.net/10183/293148
identifier_str_mv 001266998
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Biblioteca Digital de Teses e Dissertações da UFRGS
collection Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/293148/2/001266998.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/293148/1/001266998.pdf
bitstream.checksum.fl_str_mv 64a45d861c16207255901b7540a9c5af
4d9f65a5b8387ddf3f3fdf49d981b2f2
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br || lume@ufrgs.br
_version_ 1854319304964571136