Spelling suggestions: "subject:"deux combinatoire"" "subject:"deux combinatorial""
1 |
Des récréations arithmétiques au corps des nombres surréels et à la victoire d’un programme aux échecs : une histoire de la théorie des jeux combinatoires au XXème siècle / From arithmetical recreations to the ordered field of surreal numbers and the victory of a chess program : a (his)story of combinatorial game theory in the twentieth centuryRougetet, Lisa 22 September 2014 (has links)
Le thème principal de ce travail de thèse est de montrer l’interaction existant entre les jeux et les mathématiques au travers d’une catégorie de jeux bien particuliers : les jeux combinatoires. Ces jeux se font sans hasard, sans information cachée et pour chacun des deux joueurs il existe une façon optimale de jouer. Les premiers exemples rencontrés se trouvent dans des écrits de la Renaissance. Les jeux se diffusent aux 17ème et 18ème siècles dans le cadre des récréations mathématiques, genre littéraire et éditorial nouveau qui propose une pratique ludique des sciences fondée sur le défi à l’entendement. L’analyse des jeux combinatoires intéresse ensuite les mathématiciens du début du 20ème siècle, notamment pour les jeux de type Nim. La thèse s’attache à retracer le développement de la théorie mathématique qui se construit autour des jeux combinatoires et aboutit au corps des nombres surréels de John Conway en 1976. En parallèle, elle montre qu’un autre résultat fondamental, attribué à Zermelo (1912), sur la détermination du jeu d’Échecs permet aux jeux combinatoires de s’implanter sur un plan technologique et culturel. Nous voyons les premières machines électromécaniques destinées à jouer au Nim apparaître vers 1940 et se confronter au public lors d’expositions et de salons scientifiques. La naissance des ordinateurs dans les années 1950 ouvre de nouvelles voies pour la programmation du jeu d’Échecs, jeu combinatoire par excellence. La thèse fait revivre les moments forts, faits d’espoirs et de déceptions, qu’a traversés la recherche en programmation d’Échecs, depuis ses débuts jusqu’à la victoire du programme Deep Blue sur le champion du monde Garry Kasparov en 1997. / The main theme of this thesis is to point out the interaction between games and mathematics by means of a category of very specific games, the combinatorial games. These games are no chance games of perfect information and either player (Arthur or Bertha) can force a win, or both players can force at least a draw. The first examples of combinatorial games can be found in Renaissance works. Throughout the seventeenth and eighteenth centuries, games spread as part of recreational mathematics, a new literary and editorial genre that offered an entertaining practice of science based on a challenge to understanding. Then, the analysis of combinatorial games, especially Nim games, aroused the interest of the early-twentieth-century mathematicians. This thesis is devoted to trace the development of the mathematical theory that was formulated around combinatorial games and that led to John Conway’s Field of Surreal Numbers in 1976. In parallel, it shows that another fundamental result on Chess determination, attributed to Zermelo (1912), enabled combinatorial games to become established on a cultural and technological level. Around 1940 appeared the first electromechanical machines, designed to play Nim and to meet the challenges of the audience during scientific exhibitions. The emergence of computers during the 1950s opened new paths for programming Chess, the ultimate combinatorial game. This work brings the highlights, made of hopes and disappointments, which the Chess programming research went through, since its very beginning up to the victory for Deep Blue program over the world champion Garry Kasparov in 1997.
|
2 |
Jeux combinatoires sur les graphesDuchene, Eric 11 September 2006 (has links) (PDF)
Chacun d'entre nous s'est déjà essayé à un jeu combinatoire, tel que les dames ou les échecs. Les jeux les plus connus présentent le double avantage de mêler plaisir ludique et réflexion. L'intérêt que les mathématiciens leur porte réside souvent autour de la recherche d'une stratégie gagnante pour l'un des deux joueurs. Du jeu de Nim jusqu'aux échecs, la complexité de cette recherche est très variable. Dans cette thèse, nous donnons tout d'abord un aperçu des principales étapes du développement de ce domaine, qui a commencé au début des années 1900, et soulignons son étroite corrélation avec des domaines connexes tels que la théorie des nombres, des codes correcteurs d'erreur ou des graphes. Nous nous intéressons ensuite à des variantes de jeux bien connus : le Wythoff's game et le Dots and Boxes. Nous présentons et expliquons les stratégies et positions de jeu favorables au premier et au second joueur. Enfin, nous regardons une version solitaire d'un jeu récent à deux joueurs : le Clobber. Il s'agit d'un casse-tête qui se joue en posant des pierres sur les sommets d'un graphe, et dont le but est de détruire le plus de pierres possibles. Nous donnons des résultats structurels et algorithmiques sur les grilles, les arbres, ou encore les hypercubes.
|
3 |
Reconfiguration and combinatorial games / Reconfiguration et jeux combinatoiresHeinrich, Marc 09 July 2019 (has links)
Cette thèse explore des problématiques liées aux jeux. Les jeux qui nous intéressent sont ceux pour lesquels il n'y a pas d'information cachée: tout les joueurs ont accès à toute l'information relative au jeu; il n'y a pas non plus d'aléa. Certains jeux de société (comme les échecs ou le go) satisfont ces propriétés et sont représentatifs des jeux que nous considérons ici. La notion de stratégie est au centre de l'étude de ces jeux. En termes simples, une stratégie est une façon de jouer qui permet de s'assurer un certain résultat. La question centrale, à la fois quand on joue à un jeu et quand on l'étudie, est le problème de trouver la 'meilleure' stratégie, qui assure la victoire du joueur qui l'applique. Dans cette thèse, nous considérons à la fois des jeux à un joueurs, appelés puzzles combinatoires, et des jeux à deux joueurs. Le Rubik's cube, Rush-Hour, et le taquin sont des exemples biens connus de puzzles combinatoires. Récemment, un certain nombre de jeux -- des jeux à un joueur notamment -- ont connu un regain d'intérêt en tant qu'objets d'étude dans un domaine plus grand appelé reconfiguration. Les puzzles que l'on vient de mentionner peuvent tous être décrit de la façon suivante: il y a un ensemble de configurations, qui représente tous les états possibles du jeu; et le joueur est autorisé à transformer une configuration en une autre à via un certain nombre de règles. Le but est d'atteindre une certaine configuration cible à partir d'une configuration initiale. Le domaine de la reconfiguration étend cette définition à des problèmes de recherche: l'ensemble des configurations devient l'ensemble des solutions à une instance d'un problème donné, et l'on se demande si l'on peut transformer une solution donnée en une autre en utilisant uniquement un ensemble de règles de transformation précises. La recherche sur ce type de problèmes a été guidée par des motivations algorithmiques: ce processus peut être vu comme un moyen d'adapter une solution déjà en place en une nouvelle solution à l'aide de petits changements locaux; et des connections avec d'autres problèmes comme la génération aléatoire, ainsi que des problèmes de physique statistique. Les jeux à deux joueurs, qui sont aussi appelés jeux combinatoires, ont été étudiés depuis le début du XXème siècle avec les travaux de Bouton, continués par Berlekamp, Conway et Guy avec le développement d'une théorie unifiant un certain nombre de jeux classiques. Ce travail se focalise sur des joueurs parfaits, c'est à dire qui choisissent toujours le coup optimal. Notre but est de caractériser lequel des deux joueurs possède une stratégie qui lui assure la victoire, quelque soient les coups de son adversaire. Cette approche est au coeur de ce qui est appelé la Théorie des Jeux Combinatoires. Une grande parties des recherche est focalisée sur des 'jeux mathématiques', qui sont des jeux inventés par des mathématiciens, souvent avec des règles très simples, et rarement connus en dehors de la recherche. La motivation principale pour étudier ces jeux est la présence de liens parfois surprenant entre ces jeux et d'autres domaines des mathématiques comme entre autre la théorie des nombres, les automates ou les systèmes dynamiques. Dans cette thèse, nous étudions ainsi des jeux à un et deux joueurs. Nous nous intéressons tout particulièrement à la complexité de ces jeux, c'est à dire évaluer à quel point il est difficile (d'un point de vue algorithmique) de calculer une stratégie gagnante. Nous nous intéressons aussi à leur structure et à certaines propriétés qu'ils peuve satisfaire. Finalement, un des outils principaux dans cette étude est la notion de graphe, et nous utilisons notamment des méthodes et des techniques provenant de théorie des graphes pour résoudre ces problèmes / This thesis explores problems related to games. The games that we consider in this study are games for which there is no hidden information: all the players have access to all the information related to the game; there is also no randomness and everything is deterministic. A few well-known board games (such as chess or go) fall in this category and are representative of the kinds of games that we consider here. Central to the study of these games is the notion of strategy, which roughly speaking, is a way of playing which ensures a certain objective. The main question of interest, when both playing and studying a game, is the problem of finding the 'best' strategy, which secures the victory for the player following it. In this thesis, we consider both one-player games, also called combinatorial puzzles, and two-player games. Examples of combinatorial puzzles include Rubik's cube, Rush-Hour, Sokoban, the 15 puzzle, or peg solitaire. Recently, some types of one-player games in particular have received a strong regain of interest as part of the larger area of reconfiguration problems. The puzzles we described above can all be described in the following way: there is a set of configurations, which represents all the possible states of the game; and the player is allowed to transform a configuration using a prescribed set of moves. Starting from an initial configuration, the goal is to reach a target configuration by a succession of valid moves. Reconfiguration extends this definition to any search problem: the set of configuration becomes the set of solutions to an instance of a given problem, and we ask whether we can transform one given solution to another using only a prescribed set of moves. Hence, in addition to the combinatorial puzzles, reconfiguration problems also include many `games' which are not played by humans anymore but are instead mathematical problems sharing a lot of similarities with combinatorial puzzles. The study of reconfiguration problems has been driven by many different motivations. It has algorithmic applications: it can be seen as a way to adapt a current solution already in place to reach a new one by only making small local changes. It is also connected to other problems such as random sampling, approximate counting or problems coming from statistical physics. It can also be used as a tool for understanding the performance of some heuristic algorithms based on local modifications of solutions such as local search. Two-player games, which are also called combinatorial games, have been studied since the beginning of the twentieth century, with the works of Bouton which were continued with the development of a nice theory by Berlekamp, Conway, and Guy, unifying a certain number of classical games. We focus in this study on perfect strategies (i.e., players always choosing the best possible move), and try to characterize who wins under perfect play for various games. This approach is at the heart of what is called Combinatorial Game Theory. Most of the research in this area is focused on `math games' which are games invented by mathematicians, often with simple rules and almost never played by humans. The main motivation for studying these games comes from the nice, and sometimes unexpected connections these games have with other areas of mathematics, such as for example number theory, automatons, or dynamical systems. In this thesis, we study one- and two-player games. The questions we consider are often related to complexity. Complexity theory consists in trying to classify problems depending on their hardness. By hardness we mean to quantify how much time it would take for a computer to solve the problem. An other aspect of this research consists in investigating structural properties that these games can satisfy. Finally, one of our main tools is the notion of graph, and we use in particular methods and techniques from graph theory to answer the different questions we just mentioned
|
4 |
Jeux, graphes et propagationDorbec, Paul 01 July 2013 (has links) (PDF)
Ce manuscrit d'Habilitation à diriger des recherches décrit mes travaux de recherche récents en théorie des graphes et en théorie des jeux combinatoires. Une première partie est consacrée à l'étude de paramètres de graphes en s'intéressant particulièrement aux contraintes structurelles qui permettent d'améliorer les bornes connues. Dans cette partie, nous traitons notamment la paire-domination, la domination indépendante mais aussi les partitions en cographes et les colorations quasi propres. Une deuxième partie traite de la domination de puissance, une forme itérative de la domination au sujet de laquelle nous proposons un début de synthèse des résultats existants. Enfin, une troisème partie parle de jeux. Nous y traitons d'abord le travail réalisé sur quelques conjectures portant sur un jeu de domino, puis au sujet des jeux en version misère. Nous y parlons enfin du jeu de domination, qui est à l'interface entre le paramètre de graphe et le jeu combinatoire.
|
5 |
Jeux à objectif compétitif sur les graphes / Commpetitive optimization graph gamesSchmidt, Simon 15 December 2016 (has links)
Dans cette thèse nous étudions trois jeux à objectif compétitif sur les graphes. Les jeux à objectif compétitif proposent une approche dynamique des problèmes d'optimisation discrètes. L'idée générale consiste à associer à un problème d'optimisation (coloration, domination, etc.) un jeu combinatoire partisan de la façon suivante. Deux joueurs construisent tour à tour la structure reliée au problème d'optimisation. L'un d'eux cherche à ce que cette structure soit le plus optimale possible, tandis que l'autre essaye de l'en empêcher. Sous l'hypothèse que les deux joueurs jouent optimalement, la taille de la structure obtenue définit un invariant ludique.Nous commençons par étudier une variante 1-impropre du jeu de coloration, qui est le premier et le plus étudié des jeux à objectif compétitif. Dans ce jeu, les joueurs colorient les sommets d'un graphe de sorte que deux sommets adjacents ne partagent jamais la même couleur. Dans la version 1-impropre, un sommet peut avoir au plus un voisin ayant la même couleur que lui. Nous considérons ensuite le jeu de domination, dans lequel les deux joueurs doivent construire un ensemble dominant, c'est-à-dire un ensemble de sommets du graphe tel que tout autre sommet est adjacent à l'un des membres de cet ensemble. Finalement, nous définissons un nouveau jeu à objectif compétitif, relié au problème de coloration distinguante. Dans ce jeu, il s'agit de construire une coloration qui n'est invariante par aucun des automorphismes du graphe. Nous soulevons plusieurs interrogations stimulantes concernant ce nouveau jeu, notamment sur la caractérisation des graphes ayant un invariant ludique infini, par l'existence d'automorphismes d'ordre deux. / In this thesis, we study three competitive optimization graph games. These games allow a dynamic approach to discrete optimization problems, which is an advantageous alternative way to consider these questions. The global idea consists in defining a combinatorial partisan game, associated to the original optimization problem, like coloring, domination, etc. Two players alternatively build the structure related to the optimization problem. One of them tries to obtain a structure as optimal as possible, whereas his opponent wants to prevent him from doing it. Under the hypothesis that both players play optimally, the size of the obtained structure defines a game invariant of the graph.We start by studying a 1-improper variation of the coloring game, which is the first and the most studied competitive optimization graph game. In this game, the players colors the vertices of a graph, such that two adjacent vertices do not share the same color. In the 1-improper version, we allow a vertex to have at most one neighbor with the same color as it. Then, we study the domination game, in which the players have to build a domination set, that is a sub-set of vertices such that any other vertex is adjacent to one of the vertex in this set. Finally, we define a new game, related to the distinguishing coloring problem. This game is about building a vertex-coloring which is preserved by none of the graph automorphisms. We raise some challenging open questions about this new game, especially concerning the characterization of graphs with infinite game invariant, by the existence of order two automorphisms.
|
6 |
Etude didactique des situations de recherche pour la classe concernant des jeux combinatoires de type Nim / Didactical study of research situations for the classroom concerning combinatorial gamesColipan, Ximena 16 January 2014 (has links)
La recherche que nous avons menée s'inscrit dans les projets de l'équipe de recherche Maths à Modeler. En particulier dans celui portant sur les situations de recherche pour la classe (SiRC). Cette recherche est centrée sur l'étude du rôle, pour l'apprentissage des savoir-faire fondamentaux, de l'activité mathématique, des jeux combinatoires et plus particulièrement des jeux de type Nim. Nous mettons sous l'expression « savoir-faire fondamentaux » les savoirs, méthodes et techniques qui sont à la base de toute activité mathématique : l'expérimentation, l'étude de cas particuliers, l'énoncé et l'étude de conjectures, la construction d'exemples et contre-exemples, la modélisation, l'élaboration et l'écriture de preuves, la définition d'objets, etc. (Grenier et Payan, 2002). Le sujet est la construction, l'expérimentation et l'analyse de SiRC basées sur des jeux combinatoires de type Nim pour des élèves, afin de leur faire construire et développer les savoir- faire indispensables à la mise en œuvre d'une « démarche mathématique ». Notre problématique porte donc sur l'identification des savoirs notionnels et des savoir-faire fondamentaux de l'activité mathématique qui sont mis en œuvre dans les jeux combinatoires de type Nim et la détermination des conditions et contraintes épistémologiques et didactiques favorisant l'apprentissage en classe de ces savoirs. Pour mener à bien notre étude, nous nous sommes appuyés d'une part sur certains éléments de la théorie des situations didactiques de Brousseau (Brousseau, 2004) et de la théorie des champs conceptuels de Vergnaud (Vergnaud, 1994) et, d'autre part, sur le modèle SiRC, contribuant à préciser ce modèle. Nous nous sommes servis de l'étude épistémologique et didactique des jeux de type Nim, pour mener les analyses mathématique et didactique de deux SiRC : la première, nommée « jeu d'Euclide géométrique », situation de jeu de type Nim, construite spécifiquement pour cette recherche, basée sur un jeu d'Euclide classique. La seconde, nommée le « jeu du chocolat », situation expérimentée régulièrement dans l'équipe Maths à Modeler, mais dont l'étude didactique n'avait pas vraiment été faite. Les analyses et expérimentations que nous avons menées montrent que les situations basées sur des jeux de type Nim, peuvent induire une activité mathématique qui va au-delà du développement et de la pratique de techniques mathématiques : Elles peuvent ouvrir l'accès à des savoir-faire plus généraux propres de l'activité mathématique. / This research is included in the project of the research group "Maths à modeler". In particular, in the part that corresponds to the study of "situations de recherche pour la classe" (SiRC). This research is focused in the study of the role played by the mathematical activity, the combinatorial games and particularly the games of Nim-type in learning the fundamental know-hows. We put under the term "fundamental know-hows" all the knowledge, methods and techniques found in all mathematical activity: experimenting, studying particular cases, conjecturing, building examples and counter-examples, modeling, proving, defining, etc. (Grenier et Payan, 2002). The main aim of this research is the construction, the experimentation and the analysis of SiRC based on combinatorial games of Nim-type for students designed to make them build and develop the know-hows required for the implementation of a "mathematical process". Our main problem is then identifying the fundamental and notional know-hows of the mathematical activity that are used in combinatorial games of Nim-type and establishing the epistemological and didactical conditions and constrains that favor the learning of these know-hows in the classroom. To achieve our aim, our research is supported, on one hand, by some aspects of the theory of didactical situation by Brousseau (Brousseau, 2004) and the theory of conceptual fields by Vergnaud (Vergnaud, 1994) and, on the other hand, by the SiRC model, where we also contribute to precise it. We based our research in the epistemological and didactical study of Nim-type games to conduct mathematical and didactical analysis of two SiRC: the first one, called "the geometrical Euclid game", is a situation of Nim-type created specifically for this research and based on the classical Euclid game. The second one, called "the chocolate game", is a situation frequently experimented by the research group math à modeler whose didactical analysis had not been done yet. The analysis and experimentations we have conducted show that the situations based on Nim-type games can lead to a mathematical activity that goes beyond developing and practicing mathematical techniques. They can open access to more general know-hows specific to the mathematical activity.
|
7 |
Jeux combinatoires dans les graphes / Combinatorial games on graphsRenault, Gabriel 29 November 2013 (has links)
Dans cette thèse, nous étudions les jeux combinatoires sousdifférentes contraintes. Un jeu combinatoire est un jeu à deux joueurs, sanshasard, avec information complète et fini acyclique. D’abord, nous regardonsles jeux impartiaux en version normale, en particulier les jeux VertexNimet Timber. Puis nous considérons les jeux partisans en version normale, oùnous prouvons des résultats sur les jeux Timbush, Toppling Dominoeset Col. Ensuite, nous examinons ces jeux en version misère, et étudionsles jeux misères modulo l’univers des jeux dicots et modulo l’univers desjeux dead-endings. Enfin, nous parlons du jeu de domination qui, s’il n’estpas combinatoire, peut être étudié en utilisant des outils de théorie des jeuxcombinatoires. / In this thesis, we study combinatorial games under differentconventions. A combinatorial game is a finite acyclic two-player game withcomplete information and no chance. First, we look at impartial gamesin normal play and in particular at the games VertexNim and Timber.Then, we consider partizan games in normal play, with results on the gamesTimbush, Toppling Dominoes and Col. Next, we look at all these gamesin misère play, and study misère games modulo the dicot universe and modulothe dead-ending universe. Finally, we talk about the domination game which,despite not being a combinatorial game, may be studied with combinatorialgames theory tools.
|
8 |
Jeux combinatoires dans les graphesRenault, Gabriel 29 November 2013 (has links) (PDF)
Dans cette thèse, nous étudions les jeux combinatoires sousdifférentes contraintes. Un jeu combinatoire est un jeu à deux joueurs, sanshasard, avec information complète et fini acyclique. D'abord, nous regardonsles jeux impartiaux en version normale, en particulier les jeux VertexNimet Timber. Puis nous considérons les jeux partisans en version normale, oùnous prouvons des résultats sur les jeux Timbush, Toppling Dominoeset Col. Ensuite, nous examinons ces jeux en version misère, et étudionsles jeux misères modulo l'univers des jeux dicots et modulo l'univers desjeux dead-endings. Enfin, nous parlons du jeu de domination qui, s'il n'estpas combinatoire, peut être étudié en utilisant des outils de théorie des jeuxcombinatoires.
|
9 |
Jeux de coloration de graphes / Graphs coloring gamesGuignard, Adrien 06 December 2011 (has links)
La thèse porte sur les deux thèmes des Jeux combinatoires et de la théorie des graphes. Elle est divisée en deux parties.1) Le jeu de Domination et ses variantes: Il s'agit d'un jeu combinatoire qui consiste à marquer les sommets d'un graphe de telle sorte qu'un sommet marqué n'ait aucun voisin marqué. Le joueur marquant le dernier sommet est déclaré gagnant. Le calcul des stratégies gagnantes étant NP-difficile pour un graphe quelconque, nous avons étudié des familles particulières de graphes comme les chemins, les scies ou les chenilles. Pour ces familles on peut savoir en temps polynomial si un graphe est perdant. Nous avons également étudié 28 variantes du jeu de domination, dont les 12 variantes définies par J. Conway sur un jeu combinatoire quelconque. 2) Le nombre chromatique ludique des arbres: Ce paramètre est calculé à partir d'un jeu de coloration où Alice et Bob colorient alternativement et proprement un sommet d'un graphe G avec l'une des k couleurs. L'objectif d'Alice est de colorier complètement le graphe alors que Bob doit l'en empêcher. Nous nous sommes intéressés au jeu avec 3 couleurs sur un arbre T. Nous souhaitons déterminer les arbres ayant un nombre chromatique ludique 3, soit ceux pour lesquels Alice a une stratégie gagnante avec 3 couleurs. Ce problème semblant difficile à résoudre sur les arbres, nous avons résolu des sous-familles: les 1-chenilles puis les chenilles sans trous. / Part 1: Domination Game and its variantsDomination game is a combinatorial game that consists in marking vertices of a graph so that a marked vertex has no marked neighbors. The first player unable to mark a vertex loses the game.Since the computing of winning strategies is an NP-hard problem for any graphs, we examine some specific families of graphs such as complete k-partite graphs, paths or saws. For these families, we establish the set of losing elements. For other families, such as caterpillars, we prove that exists a polynomial algorithm for the computation of outcome and winning strategies. No polynomial algorithm has been found to date for more general families, such as trees.We also study 28 variants of Domination game, including the 12 variants defined by J. Conway for any combinatorial game. Using game functions, we find the set of losing paths for 10 of these 12 variants. We also investigate 16 variants called diameter, for instance when rules require to play on the component that has the largest diameter.Part 2: The game chromatic number of treesThis parameter is computed from a coloring game: Alice and Bob alternatively color the vertices of a graph G, using one of the k colors in the color set. Alice has to achieve the coloring of the entire graph whereas Bob has to prevent this. Faigle and al. proved that the game chromatic number of a tree is at most 4. We undertake characterization of trees with a game chromatic number of 3. Since this problem seems difficult for general trees, we focus on sub-families: 1-caterpillars and caterpillars without holes.For these families we provide the characterization and also compute winning strategies for Alice and Bob. In order to do so, we are led to define a new notion, the bitype, that for a partially-colored graph G associates two letters indicating who has a winning strategy respectively on G and G with an isolated vertex. Bitypes allow us to demonstrate several properties, in particular to compute the game chromatic number of a graph from the bitypes of its connected components.
|
10 |
Dynamique d'apprentissage pour Monte Carlo Tree Search : applications aux jeux de Go et du Clobber solitaire impartial / Learning dynamics for Monte Carlo Tree Search : application to combinatorial gamesFabbri, André 22 October 2015 (has links)
Depuis son introduction pour le jeu de Go, Monte Carlo Tree Search (MCTS) a été appliqué avec succès à d'autres jeux et a ouvert la voie à une famille de nouvelles méthodes comme Mutilple-MCTS ou Nested Monte Carlo. MCTS évalue un ensemble de situations de jeu à partir de milliers de fins de parties générées aléatoirement. À mesure que les simulations sont produites, le programme oriente dynamiquement sa recherche vers les coups les plus prometteurs. En particulier, MCTS a suscité l'intérêt de la communauté car elle obtient de remarquables performances sans avoir pour autant recours à de nombreuses connaissances expertes a priori. Dans cette thèse, nous avons choisi d'aborder MCTS comme un système apprenant à part entière. Les simulations sont alors autant d'expériences vécues par le système et les résultats sont autant de renforcements. L'apprentissage du système résulte alors de la complexe interaction entre deux composantes : l'acquisition progressive de représentations et la mobilisation de celles-ci lors des futures simulations. Dans cette optique, nous proposons deux approches indépendantes agissant sur chacune de ces composantes. La première approche accumule des représentations complémentaires pour améliorer la vraisemblance des simulations. La deuxième approche concentre la recherche autour d'objectifs intermédiaires afin de renforcer la qualité des représentations acquises. Les méthodes proposées ont été appliquées aux jeu de Go et du Clobber solitaire impartial. La dynamique acquise par le système lors des expérimentations illustre la relation entre ces deux composantes-clés de l'apprentissage / Monte Carlo Tree Search (MCTS) has been initially introduced for the game of Go but has now been applied successfully to other games and opens the way to a range of new methods such as Multiple-MCTS or Nested Monte Carlo. MCTS evaluates game states through thousands of random simulations. As the simulations are carried out, the program guides the search towards the most promising moves. MCTS achieves impressive results by this dynamic, without an extensive need for prior knowledge. In this thesis, we choose to tackle MCTS as a full learning system. As a consequence, each random simulation turns into a simulated experience and its outcome corresponds to the resulting reinforcement observed. Following this perspective, the learning of the system results from the complex interaction of two processes : the incremental acquisition of new representations and their exploitation in the consecutive simulations. From this point of view, we propose two different approaches to enhance both processes. The first approach gathers complementary representations in order to enhance the relevance of the simulations. The second approach focuses the search on local sub-goals in order to improve the quality of the representations acquired. The methods presented in this work have been applied to the games of Go and Impartial Solitaire Clobber. The results obtained in our experiments highlight the significance of these processes in the learning dynamic and draw up new perspectives to enhance further learning systems such as MCTS
|
Page generated in 0.0841 seconds