Global ETD Search

Return to search

Contributions à la résolution des processus décisionnels de Markov centralisés et décentralisés : algorithmes et théorie

Cette thèse porte sur les problèmes de prise de décisions séquentielles sous incertitudes dans un système mono ou multi-agents. Les processus décisionnels de Markov offrent un modèle mathématique permettant à la fois de formaliser et de résoudre de tels problèmes. Il existe de multiple travaux proposant des techniques efficaces pour la résolution des processus décisionnels de Markov. Néanmoins, trois facteurs, dits malédictions, limitent grandement le passage à l'échelle de ces techniques. Le premier facteur, la malédiction de la dimension, est le plus connu. Il lie la complexité des algorithmes au nombre d'états du système dont la croissance est exponentielle en fonction des attributs des états. Le second facteur, la malédiction de l'historique, a été identifié plus récemment. Il lie la complexité des algorithmes à la dimension exponentielle de l'espace des historiques à prendre en compte afin de résoudre le problème. Enfin, le dernier facteur, là malédiction de la distributivité, est identifié dans cette thèse. Il lie la complexité des algorithmes à la contrainte du contrôle distribué d'un système, résultant sur une complexité doublement exponentielle. À travers nos contributions, nous proposons une réponse à chacune des trois malédictions. Nous atténuons à la fois la malédiction de la dimension et la malédiction de l'historique en exploitant les dépendances causales soit entre états soit entre historiques. Suivant cette idée, nous proposons une famille d'algorithmes exacts et approximatifs, nommée programmation dynamique topologique, visant à résoudre les processus décisionnels de Markov complètement ou partiellement observables. Ces algorithmes permettent de réduire considérablement le nombre de mises à jour d'un état ou d'un historique. Ainsi, lorsque les problèmes sont munis d'une structure topologique, la programmation dynamique topologique offre une solution efficace. Pour pallier aux effets de la malédiction de la distributivité, nous avons proposé d'étendre la planification centralisée au cadre du contrôle distribué. Nous proposons une analyse formelle des problèmes de contrôle distribué des processus décisionnels de Markov sous le regard de la planification centralisée. De cette analyse, de nombreux algorithmes de planification centralisée ont vu le jour. Parmi eux, figure point-based incremental pruning (PBIP), l'algorithme approximatif pour la résolution des processus de Markov décentralisés, le plus efficace à ce jour.

QA 76.05 UL 2010 D543

Processus de Markov

Algorithmes

Identifer	oai:union.ndltd.org:LAVAL/oai:corpus.ulaval.ca:20.500.11794/21752
Date	17 April 2018
Creators	Dibangoye, Jilles Steeve
Contributors	Chaib-Draa, Brahim, Mouaddib, Abdel-Illah
Source Sets	Université Laval
Language	French
Detected Language	French
Type	thèse de doctorat, COAR1_1::Texte::Thèse::Thèse de doctorat
Format	xv, 309 f., application/pdf
Rights	http://purl.org/coar/access_right/c_abf2

Page generated in 0.0022 seconds

Contributions à la résolution des processus décisionnels de Markov centralisés et décentralisés : algorithmes et théorie

Description

Links & Downloads

Tags

Additional Fields