1 |
[en] A STUDY ON NEURAL NETWORKS FOR POKER PLAYING AGENTS / [pt] UM ESTUDO EM REDES NEURAIS PARA AGENTES JOGADORES DE PÔQUERALEXANDRE MARANGONI COSTA 12 May 2020 (has links)
[pt] A ciência de dados precisa de uma grande quantidade de dados para testar e melhorar soluções. Jogos são largamente usados para abstrair situações da vida real. Rodadas de pôquer são um bom exemplo pois, por
não saber as cartas dos oponentes, o jogador analisa um cenário de informação incompleta numa competição de agentes que envolve conhecimento probabilístico, análise de risco e brefe. Isso o diferencia de xadrez, damas e jogos de conhecimento perfeito e algoritmos de busca em forca bruta sobre o espaço de soluções. Usar o pôquer como um caso de teste possibilita a análise de diferentes abordagens usadas na vida real, porém num cenário mais controlado. Esta dissertação propõe um arcabouço de funcionalidades para criar e testar diferentes algorítimos de Deep Learning, que podem jogar pôquer entre sí, aprender com o histórico e maximizar suas recompensas. / [en] Data science research needs real examples to test and improve solutions. Games are widely used to mimic those real-world examples. Poker rounds are a good example of imperfect information state with competing
agents dealing with probabilistic knowledge, risk assessment, and possible deception, unlike chess, checkers and perfect information brute-force search style of games. By using poker as a test-bed we can analyze different approaches used in real-world examples, in a more controlled environment, which should give great insights on how to tackle those real-world scenarios. We propose a framework to build and test different neural networks that can play against each other, learn from a supervised experience and maximize
its rewards.
|
2 |
[en] GAME THEORY AND MATHEMATICS IN SECONDARY EDUCATION: INTRODUCTION TO NASH EQUILIBRIUM / [pt] TEORIA DOS JOGOS E A MATEMÁTICA NO ENSINO MÉDIO: INTRODUÇÃO AO EQUILÍBRIO DE NASHTHIAGO OLIVEIRA NASCIMENTO 03 March 2015 (has links)
[pt] O objetivo deste trabalho é investigar como os alunos do Ensino Médio da rede pública estadual de ensino do Rio de Janeiro se comportam com a aplicação da Teoria dos Jogos como elemento motivador no ensino da Matemática, uma vez que apresentam, com grande frequência, dificuldades nesta disciplina. Para atingir o objetivo proposto elaboramos uma sequência didática que consistia na realização dos jogos Barganha com Ultimato e Dilema do Prisioneiro em sala de aula, sem qualquer explicação prévia sobre os conceitos básicos da Teoria dos Jogos. Nesta sequência didática, após a realização de cada jogo explicamos os resultados previstos pela teoria, introduzindo os conceitos de matriz de ganhos, estratégia dominante e equilíbrio de Nash, e explicamos o funcionamento do jogo Pôquer Simplificado com seus resultados teóricos. Ao término da aplicação da sequência didática, realizamos um teste de auto-avaliação simples, para que pudéssemos verificar o nível de aprendizado dos alunos envolvidos. Por fim, comparamos os resultados obtidos pelos pares de alunos que participaram do jogo Barganha com Ultimato (realizado quando ainda não possuíam qualquer experiência em Teoria dos Jogos) com aqueles obtidos por Bianchi, Carter e Irons e Castro e Ribeiro. / [en] The objective of this work is to investigate the effect of game theory as a motivator for mathematics education on those second year high school students in the state public schools of Rio de Janeiro who have already shown frequent difficulties with the discipline. In order to achieve the proposed goal, we develop a didactic sequence involving the application in the classroom of the games the Ultimatum Game and the Prisoner s Dilema without any prior introduction to the basic concepts of game theory. After the completion of each game, we explain the results predicted by the theory, introducing the concepts of the payoff matrix, the dominant strategy and the Nash Equilibrium. In addition, we explain the operation of the game of Simplified Poker along which its theoretical results. Upon completion of the application of this didactic sequence, we apply a simple self-evaluation test in order to verify the academic level of the students involved. Finally, we compare the results obtained by the pairs of students who participated in the game the Ultimatum Game (performed when the students still had no experience of Game Theory) with the results obtained by Bianchi, Carter e Irons and Castro e Ribeiro.
|
Page generated in 0.0443 seconds