Spelling suggestions: "subject:"deux een champ moyen"" "subject:"deux enn champ moyen""
11 |
Apprentissage dans les jeux à champ moyen / Learning in Mean Field GamesHadikhanloo, Saeed 29 January 2018 (has links)
Les jeux à champ moyen (MFG) sont une classe de jeux différentiels dans lequel chaque agent est infinitésimal et interagit avec une énorme population d'agents. Dans cette thèse, nous soulevons la question de la formation effective de l'équilibre MFG. En effet, le jeu étant très complexe, il est irréaliste de supposer que les agents peuvent réellement calculer la configuration d'équilibre. Cela semble indiquer que si la configuration d'équilibre se présente, c'est parce que les agents ont appris à jouer au jeu. Donc, la question principale est de trouver des procédures d'apprentissage dans les jeux à champ moyen et d'analyser leurs convergences vers un équilibre. Nous nous sommes inspirés par des schémas d'apprentissage dans les jeux statiques et avons essayé de les appliquer à notre modèle dynamique de MFG. Nous nous concentrons particulièrement sur les applications de fictitious play et online mirror descent sur différents types de jeux de champs moyens : Potentiel, Monotone ou Discret. / Mean Field Games (MFG) are a class of differential games in which each agent is infinitesimal and interacts with a huge population of other agents. In this thesis, we raise the question of the actual formation of the MFG equilibrium. Indeed, the game being quite involved, it is unrealistic to assume that the agents can compute the equilibrium configuration. This seems to indicate that, if the equilibrium configuration arises, it is because the agents have learned how to play the game. Hence the main question is to find learning procedures in mean field games and investigating if they converge to an equilibrium. We have inspired from the learning schemes in static games and tried to apply them to our dynamical model of MFG. We especially focus on fictitious play and online mirror descent applications on different types of mean field games; those are either Potential, Monotone or Discrete.
|
12 |
Resource utilization techniques in distributed networks with limited information / Utilisation et optimisation de ressources radio distribuées avec un retour d'information limitéHanif, Ahmed Farhan 07 May 2014 (has links)
Dans ce travail, notre contribution est double. Nous développons un cadre d’apprentissage stochastique distribué pour la recherche des équilibres de Nash dans le cas de fonctions de paiement dépendantes d’un état. La plupart des travaux existants supposent qu’une expression analytique de la récompense est disponible au niveau des noeuds. Nous considérons ici une hypothèse réaliste où les noeuds ont seulement une réalisation quantifiée de la récompense à chaque instant et développons un modèle stochastique d’apprentissage à temps discret utilisant une perturbation en sinus. Nous examinons la convergence de notre algorithme en temps discret pour une trajectoire limite définie par une équation différentielle ordinaire (ODE). Ensuite, nous effectuons une analyse de la stabilité et appliquons le schéma proposé dans un problème de commande de puissance générique dans les réseaux sans fil. Nous avons également élaboré un cadre de partage de ressources distribuées pour les réseaux –cloud– en nuage. Nous étudions la stabilité de l’évolution de l’équilibre de Nash en fonction du nombre d’utilisateurs. Dans ce scénario, nous considérons également le comportement des utilisateurs sociaux. Enfin nous avons également examiné un problème de satisfaction de la demande où chaque utilisateur a une demande propre à lui qui doit être satisfaite / As systems are becoming larger, it is becoming difficult to optimize them in a centralized manner due to insufficient backhaul connectivity and dynamical systems behavior. In this thesis, we tackle the above problem by developing a distributed strategic learning framework for seeking Nash equilibria under state dependent payoff functions. We develop a discrete time stochastic learning using sinus perturbation with the realistic assumption, that each node only has a numerical realization of the payoff at each time. We examine the convergence of our discrete time algorithm to a limiting trajectory defined by an ordinary differential equation (ODE). Finally, we conduct a stability analysis and apply the proposed scheme in a generic wireless networks. We also provide the application of these algorithms to real world resource utilization problems in wireless. Our proposed algorithm is applied to the following distributed optimization problems in wireless domain. Power control, beamforming and Bayesian density tracking in the interference channel. We also consider resource sharing problems in large scale networks (e.g. cloud networks) with a generalized fair payoff function. We formulate the problem as a strategic decision-making problem (i.e. a game). We examine the resource sharing game with finite and infinite number of players. Exploiting the aggregate structure of the payoff functions, we show that, the Nash equilibrium is not an evolutionarily stable strategy in the finite regime. Then, we introduce a myopic mean-field response where each player implements a mean-field-taking strategy. We show that such a mean-field-taking strategy is evolutionarily stable in both finite and infinite regime. We provide closed form expression of the optimal pricing that gives an efficient resource sharing policy. As the number of active players grows without bound, we show that the equilibrium strategy converges to a mean-field equilibrium and the optimal prices for resources converge to the optimal price of the mean-field game. Then, we address the demand satisfaction problem for which a necessary and sufficiency condition for satisfactory solutions is provided
|
13 |
Modélisation mathématique et numérique des comportements sociaux en milieu incertain. Application à l'épidémiologie / Mathematical and numerical modeling of social behavior in an uncertain environmentLaguzet, Laetitia 20 November 2015 (has links)
Cette thèse propose une étude mathématique des stratégies de vaccination.La partie I présente le cadre mathématique, notamment le modèle à compartiments Susceptible - Infected – Recovered.La partie II aborde les techniques mathématiques de type contrôle optimal employées afin de trouver une stratégie optimale de vaccination au niveau de la société. Ceci se fait en minimisant le coût de la société. Nous montrons que la fonction valeur associée peut avoir une régularité plus faible que celle attendue dans la littérature. Enfin, nous appliquons les résultats à la vaccination contre la coqueluche.La partie III présente un modèle où le coût est défini au niveau de l'individu. Nous reformulons le problème comme un équilibre de Nash et comparons le coût obtenu avec celui de la stratégie sociétale. Une application à la grippe A(H1N1) indique la présence de perceptions différentes liées à la vaccination.La partie IV propose une implémentation numérique directe des stratégies présentées. / This thesis propose a mathematical analysis of the vaccination strategies.The first part introduces the mathematical framework, in particular the Susceptible – Infected – Recovered compartmental model.The second part introduces the optimal control tools used to find an optimal vaccination strategy from the societal point of view, which is a minimizer of the societal cost. We show that the associated value function can have a less regularity than what was assumed in the literature. These results are then applied to the vaccination against the whooping cough.The third part defines a model where the cost is defined at the level of the individual. We rephrase this problem as a Nash equilibrium and compare this results with the societal strategy. An application to the Influenza A(H1N1) 2009-10 indicates the presence of inhomogeneous perceptions concerning the vaccination risks.The fourth and last part proposes a direct numerical implementation of the different strategies.
|
Page generated in 0.0683 seconds