[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
MAXWELL
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=2 http://doi.org/10.17771/PUCRio.acad.48011 |
Resumo: | [pt] A ciência de dados precisa de uma grande quantidade de dados para testar e melhorar soluções. Jogos são largamente usados para abstrair situações da vida real. Rodadas de pôquer são um bom exemplo pois, por não saber as cartas dos oponentes, o jogador analisa um cenário de informação incompleta numa competição de agentes que envolve conhecimento probabilístico, análise de risco e brefe. Isso o diferencia de xadrez, damas e jogos de conhecimento perfeito e algoritmos de busca em forca bruta sobre o espaço de soluções. Usar o pôquer como um caso de teste possibilita a análise de diferentes abordagens usadas na vida real, porém num cenário mais controlado. Esta dissertação propõe um arcabouço de funcionalidades para criar e testar diferentes algorítimos de Deep Learning, que podem jogar pôquer entre sí, aprender com o histórico e maximizar suas recompensas. |
| id |
PUC_RIO-1_e316a8931d6fa862c00e54ee1d128162 |
|---|---|
| oai_identifier_str |
oai:MAXWELL.puc-rio.br:48011 |
| network_acronym_str |
PUC_RIO-1 |
| network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository_id_str |
|
| spelling |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS [pt] UM ESTUDO EM REDES NEURAIS PARA AGENTES JOGADORES DE PÔQUER [pt] REDE NEURAL[pt] SIMULACAO MULTIAGENTE[pt] POQUER[pt] APRENDIZADO PROFUNDO[pt] APRENDIZADO DE MAQUINA[en] NEURAL NETWORKS[en] MULTI AGENT SIMULATION[en] POKER[en] DEEP LEARNING[en] MACHINE LEARNING[pt] A ciência de dados precisa de uma grande quantidade de dados para testar e melhorar soluções. Jogos são largamente usados para abstrair situações da vida real. Rodadas de pôquer são um bom exemplo pois, por não saber as cartas dos oponentes, o jogador analisa um cenário de informação incompleta numa competição de agentes que envolve conhecimento probabilístico, análise de risco e brefe. Isso o diferencia de xadrez, damas e jogos de conhecimento perfeito e algoritmos de busca em forca bruta sobre o espaço de soluções. Usar o pôquer como um caso de teste possibilita a análise de diferentes abordagens usadas na vida real, porém num cenário mais controlado. Esta dissertação propõe um arcabouço de funcionalidades para criar e testar diferentes algorítimos de Deep Learning, que podem jogar pôquer entre sí, aprender com o histórico e maximizar suas recompensas.[en] Data science research needs real examples to test and improve solutions. Games are widely used to mimic those real-world examples. Poker rounds are a good example of imperfect information state with competing agents dealing with probabilistic knowledge, risk assessment, and possible deception, unlike chess, checkers and perfect information brute-force search style of games. By using poker as a test-bed we can analyze different approaches used in real-world examples, in a more controlled environment, which should give great insights on how to tackle those real-world scenarios. We propose a framework to build and test different neural networks that can play against each other, learn from a supervised experience and maximize its rewards.MAXWELLMARCUS VINICIUS SOLEDADE POGGI DE ARAGAOMARCUS VINICIUS SOLEDADE POGGI DE ARAGAOALEXANDRE MARANGONI COSTA2020-05-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesishttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=2http://doi.org/10.17771/PUCRio.acad.48011engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2024-09-04T00:00:00Zoai:MAXWELL.puc-rio.br:48011Repositório InstitucionalPRIhttps://www.maxwell.vrac.puc-rio.br/ibict.phpopendoar:5342024-09-04T00:00Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)false |
| dc.title.none.fl_str_mv |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS [pt] UM ESTUDO EM REDES NEURAIS PARA AGENTES JOGADORES DE PÔQUER |
| title |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS |
| spellingShingle |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS ALEXANDRE MARANGONI COSTA [pt] REDE NEURAL [pt] SIMULACAO MULTIAGENTE [pt] POQUER [pt] APRENDIZADO PROFUNDO [pt] APRENDIZADO DE MAQUINA [en] NEURAL NETWORKS [en] MULTI AGENT SIMULATION [en] POKER [en] DEEP LEARNING [en] MACHINE LEARNING |
| title_short |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS |
| title_full |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS |
| title_fullStr |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS |
| title_full_unstemmed |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS |
| title_sort |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS |
| author |
ALEXANDRE MARANGONI COSTA |
| author_facet |
ALEXANDRE MARANGONI COSTA |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO MARCUS VINICIUS SOLEDADE POGGI DE ARAGAO |
| dc.contributor.author.fl_str_mv |
ALEXANDRE MARANGONI COSTA |
| dc.subject.por.fl_str_mv |
[pt] REDE NEURAL [pt] SIMULACAO MULTIAGENTE [pt] POQUER [pt] APRENDIZADO PROFUNDO [pt] APRENDIZADO DE MAQUINA [en] NEURAL NETWORKS [en] MULTI AGENT SIMULATION [en] POKER [en] DEEP LEARNING [en] MACHINE LEARNING |
| topic |
[pt] REDE NEURAL [pt] SIMULACAO MULTIAGENTE [pt] POQUER [pt] APRENDIZADO PROFUNDO [pt] APRENDIZADO DE MAQUINA [en] NEURAL NETWORKS [en] MULTI AGENT SIMULATION [en] POKER [en] DEEP LEARNING [en] MACHINE LEARNING |
| description |
[pt] A ciência de dados precisa de uma grande quantidade de dados para testar e melhorar soluções. Jogos são largamente usados para abstrair situações da vida real. Rodadas de pôquer são um bom exemplo pois, por não saber as cartas dos oponentes, o jogador analisa um cenário de informação incompleta numa competição de agentes que envolve conhecimento probabilístico, análise de risco e brefe. Isso o diferencia de xadrez, damas e jogos de conhecimento perfeito e algoritmos de busca em forca bruta sobre o espaço de soluções. Usar o pôquer como um caso de teste possibilita a análise de diferentes abordagens usadas na vida real, porém num cenário mais controlado. Esta dissertação propõe um arcabouço de funcionalidades para criar e testar diferentes algorítimos de Deep Learning, que podem jogar pôquer entre sí, aprender com o histórico e maximizar suas recompensas. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-05-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=2 http://doi.org/10.17771/PUCRio.acad.48011 |
| url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=48011&idi=2 http://doi.org/10.17771/PUCRio.acad.48011 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
MAXWELL |
| publisher.none.fl_str_mv |
MAXWELL |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
| instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| instacron_str |
PUC_RIO |
| institution |
PUC_RIO |
| reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
| repository.name.fl_str_mv |
Repositório Institucional da PUC-RIO (Projeto Maxwell) - Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
| repository.mail.fl_str_mv |
|
| _version_ |
1856395945539796992 |