Ces travaux de thèse se placent dans le contexte des systèmes multi-agents distribués. L'objectif est l'étude de méthodes d'auto-apprentissage appliquées à des ensembles de robots réactifs. Ces travaux se focalisent sur l'apprentissage de comportements sensorimoteurs de bas niveaux. Il nous semble important que les méthodes proposées puissent être appliquées sur des systèmes réels, dont les contraintes sont parfois loin de celles de la simulation. C'est pour cette raison que nous avons imaginé et conçu une plate-forme expérimentale composée de 4 robots mobiles, un manipulateur mobile miniature et un système de vision stéréoscopique. Cette étude se décompose en deux parties. La première, appliquée aux systèmes homogènes, présente l'étude de méthodes évolutionnistes appliquées aux systèmes multirobots. La seconde, appliquée aux systèmes hétérogènes, s'intéresse à la possibilité d'utiliser la technique du recuit simulé pour optimiser les poids d'un contrôleur neuronal. Toujours dans ce contexte d'hétérogénéité, une seconde méthode basée sur l'apprentissage par renforcement est expérimentée.
Identifer | oai:union.ndltd.org:CCSD/oai:tel.archives-ouvertes.fr:tel-00641563 |
Date | 07 November 2003 |
Creators | Lucidarme, Philippe |
Publisher | Université Montpellier II - Sciences et Techniques du Languedoc |
Source Sets | CCSD theses-EN-ligne, France |
Language | fra |
Detected Language | French |
Type | PhD thesis |
Page generated in 0.0022 seconds