Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/ |
Resumo: | Jogos de incentivos mistos compreendem um subconjunto de jogos em que os incentivos individuais e coletivos não estão totalmente alinhados. Esses jogos são relevantes porque ocorrem com frequência no mundo real, bem como em sistemas multiagentes, e seus resultados poderiam ser melhores para as partes envolvidas caso aspectos coletivos fossem considerados. Instituições e normas oferecem boas soluções para governar sistemas com incentivos mistos, mas na literatura, são usualmente estudadas e incorporadas de forma distribuída. Neste trabalho, propomos um framework para melhorar os resultados coletivos obtidos em ambientes de aprendizado por reforço multiagente de incentivos mistos. O framework propõe aprimorar o ambiente com um sistema normativo controlado por um agente externo de aprendizado por reforço. Ao empregá-lo, mostramos que é possível alcançar bem-estar social usando apenas arquiteturas tradicionais de agentes de aprendizado por reforço, mesmo em um sistema formado apenas por agentes egoístas. |
| id |
USP_949061f530d09a4b82e104b1085ca7f6 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-15022024-105731 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto.A centralized norm synthesis and norm enforcement framework for governing mixed-motive multiagent reinforcement lear.Agentes normativosAprendizado computacionalFrameworksJogos de incentivo mistoMixed-motive gamesNormative agentsReinforcement learningJogos de incentivos mistos compreendem um subconjunto de jogos em que os incentivos individuais e coletivos não estão totalmente alinhados. Esses jogos são relevantes porque ocorrem com frequência no mundo real, bem como em sistemas multiagentes, e seus resultados poderiam ser melhores para as partes envolvidas caso aspectos coletivos fossem considerados. Instituições e normas oferecem boas soluções para governar sistemas com incentivos mistos, mas na literatura, são usualmente estudadas e incorporadas de forma distribuída. Neste trabalho, propomos um framework para melhorar os resultados coletivos obtidos em ambientes de aprendizado por reforço multiagente de incentivos mistos. O framework propõe aprimorar o ambiente com um sistema normativo controlado por um agente externo de aprendizado por reforço. Ao empregá-lo, mostramos que é possível alcançar bem-estar social usando apenas arquiteturas tradicionais de agentes de aprendizado por reforço, mesmo em um sistema formado apenas por agentes egoístas.Mixed-motive games comprise a subset of games in which individual and collective incentives are not entirely aligned. These games are relevant because they can be matched to frequently occurring events in the real-world, as well as in multiagent systems, and their outcomes could be better for the involved parties if collective aspects were considered. Institutions and norms offer good solutions for governing mixed-motive systems, but in the literature, they are usually studied and incorporated into the system in a distributed fashion. In this work, we propose a framework for reaching socially good outcomes in mixed-motive multiagent reinforcement learning environments by enhancing the environment with a normative system controlled by an external reinforcement learning agent. By employing this framework, we show that it is possible to reach social welfare using only traditional reinforcement learning agent architectures, even in a system of self-interested agents.Biblioteca Digitais de Teses e Dissertações da USPSichman, Jaime SimãoCheang, Rafael Molinari2023-11-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-10-09T12:45:10Zoai:teses.usp.br:tde-15022024-105731Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-10-09T12:45:10Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. A centralized norm synthesis and norm enforcement framework for governing mixed-motive multiagent reinforcement lear. |
| title |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. |
| spellingShingle |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. Cheang, Rafael Molinari Agentes normativos Aprendizado computacional Frameworks Jogos de incentivo misto Mixed-motive games Normative agents Reinforcement learning |
| title_short |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. |
| title_full |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. |
| title_fullStr |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. |
| title_full_unstemmed |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. |
| title_sort |
Um framework para concepção e aplicação de normas centralizadas para governar ambientes de aprendizado por reforço de incentivo misto. |
| author |
Cheang, Rafael Molinari |
| author_facet |
Cheang, Rafael Molinari |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Sichman, Jaime Simão |
| dc.contributor.author.fl_str_mv |
Cheang, Rafael Molinari |
| dc.subject.por.fl_str_mv |
Agentes normativos Aprendizado computacional Frameworks Jogos de incentivo misto Mixed-motive games Normative agents Reinforcement learning |
| topic |
Agentes normativos Aprendizado computacional Frameworks Jogos de incentivo misto Mixed-motive games Normative agents Reinforcement learning |
| description |
Jogos de incentivos mistos compreendem um subconjunto de jogos em que os incentivos individuais e coletivos não estão totalmente alinhados. Esses jogos são relevantes porque ocorrem com frequência no mundo real, bem como em sistemas multiagentes, e seus resultados poderiam ser melhores para as partes envolvidas caso aspectos coletivos fossem considerados. Instituições e normas oferecem boas soluções para governar sistemas com incentivos mistos, mas na literatura, são usualmente estudadas e incorporadas de forma distribuída. Neste trabalho, propomos um framework para melhorar os resultados coletivos obtidos em ambientes de aprendizado por reforço multiagente de incentivos mistos. O framework propõe aprimorar o ambiente com um sistema normativo controlado por um agente externo de aprendizado por reforço. Ao empregá-lo, mostramos que é possível alcançar bem-estar social usando apenas arquiteturas tradicionais de agentes de aprendizado por reforço, mesmo em um sistema formado apenas por agentes egoístas. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-11-30 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-15022024-105731/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865491589833424896 |