Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Cheang, Rafael Molinari
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/
Resumo: Jogos de incentivos mistos compreendem um subconjunto de jogos em que os incentivos individuais e coletivos não estão totalmente alinhados. Esses jogos são relevantes porque ocorrem com frequência no mundo real, bem como em sistemas multiagentes, e seus resultados poderiam ser melhores para as partes envolvidas caso aspectos coletivos fossem considerados. Instituições e normas oferecem boas soluções para governar sistemas com incentivos mistos, mas na literatura, são usualmente estudadas e incorporadas de forma distribuída. Neste trabalho, propomos um framework para melhorar os resultados coletivos obtidos em ambientes de aprendizado por reforço multiagente de incentivos mistos. O framework propõe aprimorar o ambiente com um sistema normativo controlado por um agente externo de aprendizado por reforço. Ao empregá-lo, mostramos que é possível alcançar bem-estar social usando apenas arquiteturas tradicionais de agentes de aprendizado por reforço, mesmo em um sistema formado apenas por agentes egoístas.
id USP_949061f530d09a4b82e104b1085ca7f6
oai_identifier_str oai:teses.usp.br:tde-15022024-105731
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.A centralized norm synthesis and norm enforcement framework for governing mixed-motive multiagent reinforcement lear.Agentes normativosAprendizado computacionalFrameworksJogos de incentivo mistoMixed-motive gamesNormative agentsReinforcement learningJogos de incentivos mistos compreendem um subconjunto de jogos em que os incentivos individuais e coletivos não estão totalmente alinhados. Esses jogos são relevantes porque ocorrem com frequência no mundo real, bem como em sistemas multiagentes, e seus resultados poderiam ser melhores para as partes envolvidas caso aspectos coletivos fossem considerados. Instituições e normas oferecem boas soluções para governar sistemas com incentivos mistos, mas na literatura, são usualmente estudadas e incorporadas de forma distribuída. Neste trabalho, propomos um framework para melhorar os resultados coletivos obtidos em ambientes de aprendizado por reforço multiagente de incentivos mistos. O framework propõe aprimorar o ambiente com um sistema normativo controlado por um agente externo de aprendizado por reforço. Ao empregá-lo, mostramos que é possível alcançar bem-estar social usando apenas arquiteturas tradicionais de agentes de aprendizado por reforço, mesmo em um sistema formado apenas por agentes egoístas.Mixed-motive games comprise a subset of games in which individual and collective incentives are not entirely aligned. These games are relevant because they can be matched to frequently occurring events in the real-world, as well as in multiagent systems, and their outcomes could be better for the involved parties if collective aspects were considered. Institutions and norms offer good solutions for governing mixed-motive systems, but in the literature, they are usually studied and incorporated into the system in a distributed fashion. In this work, we propose a framework for reaching socially good outcomes in mixed-motive multiagent reinforcement learning environments by enhancing the environment with a normative system controlled by an external reinforcement learning agent. By employing this framework, we show that it is possible to reach social welfare using only traditional reinforcement learning agent architectures, even in a system of self-interested agents.Biblioteca Digitais de Teses e Dissertações da USPSichman, Jaime SimãoCheang, Rafael Molinari2023-11-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T12:45:10Zoai:teses.usp.br:tde-15022024-105731Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T12:45:10Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
A centralized norm synthesis and norm enforcement framework for governing mixed-motive multiagent reinforcement lear.
title Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
spellingShingle Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
Cheang, Rafael Molinari
Agentes normativos
Aprendizado computacional
Frameworks
Jogos de incentivo misto
Mixed-motive games
Normative agents
Reinforcement learning
title_short Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
title_full Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
title_fullStr Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
title_full_unstemmed Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
title_sort Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
author Cheang, Rafael Molinari
author_facet Cheang, Rafael Molinari
author_role author
dc.contributor.none.fl_str_mv Sichman, Jaime Simão
dc.contributor.author.fl_str_mv Cheang, Rafael Molinari
dc.subject.por.fl_str_mv Agentes normativos
Aprendizado computacional
Frameworks
Jogos de incentivo misto
Mixed-motive games
Normative agents
Reinforcement learning
topic Agentes normativos
Aprendizado computacional
Frameworks
Jogos de incentivo misto
Mixed-motive games
Normative agents
Reinforcement learning
description Jogos de incentivos mistos compreendem um subconjunto de jogos em que os incentivos individuais e coletivos não estão totalmente alinhados. Esses jogos são relevantes porque ocorrem com frequência no mundo real, bem como em sistemas multiagentes, e seus resultados poderiam ser melhores para as partes envolvidas caso aspectos coletivos fossem considerados. Instituições e normas oferecem boas soluções para governar sistemas com incentivos mistos, mas na literatura, são usualmente estudadas e incorporadas de forma distribuída. Neste trabalho, propomos um framework para melhorar os resultados coletivos obtidos em ambientes de aprendizado por reforço multiagente de incentivos mistos. O framework propõe aprimorar o ambiente com um sistema normativo controlado por um agente externo de aprendizado por reforço. Ao empregá-lo, mostramos que é possível alcançar bem-estar social usando apenas arquiteturas tradicionais de agentes de aprendizado por reforço, mesmo em um sistema formado apenas por agentes egoístas.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491589833424896