Global ETD Search

11	Architecture de contrôle hybride pour systèmes multi-robots mobiles Benzerrouk, Ahmed 18 April 2011 (has links) (PDF) La complexité inhérente à la coordination des mouvements d'un groupe de robots mobiles est traitée en investiguant plus avant les potentialités des architectures de contrôle comportementales dont le but est de briser la complexité des tâches à exécuter. En effet, les robots mobiles peuvent évoluer dans des environnements très complexes et nécessite de surcroît une coopération précise et sécurisée des véhicules pouvant rapidement devenir inextricable. Ainsi, pour maîtriser cette complexité, le contrôleur dédié à la réalisation de la tâche est décomposé en un ensemble de comportements/contrôleurs élémentaires (évitement d'obstacles et de collision entre les robots, attraction vers une cible, etc.) qui lient les informations capteurs (provenant de caméras, des capteurs locaux du robot, etc.) aux actionneurs des différentes entités robotiques. La tâche considérée est la navigation en formation en présence d'obstacles (statiques et dynamiques). La spécificité de l'approche théorique consiste à allier les avantages des architectures de contrôle comportementales à la méthode de la structure virtuelle où le groupe de robots mobiles suit un corps virtuel avec une dynamique (vitesse, direction) donnée. Ainsi, l'activation d'un comportement élémentaire en faveur d'un autre se fait en respectant les contraintes structurelles des robots (e.g. vitesses et accélérations maximales, etc.) en vue d'assurer le maximum de précision et de sécurité des mouvements coordonnés entre les différentes entités mobiles. La coopération consiste à se partager les places dans la structure virtuelle de manière distribuée et de façon à atteindre plus rapidement la formation désirée. Pour garantir les critères de performances visés par l'architecture de contrôle, les systèmes hybrides qui permettent de commander des systèmes continus en présence d'évènements discrets sont exploités. En effet, ces contrôleurs (partie discrète) permettent de coordonner l'activité des différents comportements (partie continue) disponibles au niveau de l'architecture, tout en offrant une analyse automaticienne rigoureuse de la stabilité de celle-ci au sens de Lyapunov. Chaque contribution est illustrée par des résultats de simulation. Le dernier chapitre est dédié à l'implémentation de l'architecture de contrôle proposée sur un groupe de robots mobiles Khepera III. [SPI:OTHER] Engineering Sciences/Other Systèmes multi-robots mobiles Navigation en formation Evitement d'obstacles Architecture de contrôle Systèmes hybrides Stabilité au sens de Lyapunov
12	Des comportements flexibles aux comportements habituels : meta-apprentissage neuro-inspiré pour la robotique autonome / From flexible to habitual behaviors : neuro-inspired meta-learning for autonomous robots Renaudo, Erwan 06 June 2016 (has links) Dans cette thèse, nous proposons d'intégrer la notion d'habitude comportementale au sein d'une architecture de contrôle robotique, et d'étudier son interaction avec les mécanismes générant le comportement planifié. Les architectures de contrôle robotiques permettent à ce dernier d'être utilisé efficacement dans le monde réel et au robot de rester réactif aux changements dans son environnement, tout en étant capable de prendre des décisions pour accomplir des buts à long terme (Kortenkamp et Simmons, 2008). Or, ces architectures sont rarement dotées de capacités d'apprentissage leur permettant d'intégrer les expériences précédentes du robot. En neurosciences et en psychologie, l'étude des différents types d'apprentissage montre pour que ces derniers sont une capacité essentielle pour adapter le comportement des mammifères à des contextes changeants, mais également pour exploiter au mieux les contextes stables (Dickinson, 1985). Ces apprentissages sont modélisés par des algorithmes d'apprentissage par renforcement direct et indirect (Sutton et Barto, 1998), combinés pour exploiter leurs propriétés au mieux en fonction du contexte (Daw et al., 2005). Nous montrons que l'architecture proposée, qui s'inspire de ces modèles du comportement, améliore la robustesse de la performance lors d'un changement de contexte dans une tâche simulée. Si aucune des méthodes de combinaison évaluées ne se démarque des autres, elles permettent d'identifier les contraintes sur le processus de planification. Enfin, l'extension de l'étude de notre architecture à deux tâches (dont l'une sur robot réel) confirme que la combinaison permet l'amélioration de l'apprentissage du robot. / In this work, we study how the notion of behavioral habit, inspired from the study of biology, can benefit to robots. Robot control architectures allow the robot to be able to plan to reach long term goals while staying reactive to events happening in the environment (Kortenkamp et Simmons, 2008). However, these architectures are rarely provided with learning capabilities that would allow them to acquire knowledge from experience. On the other hand, learning has been shown as an essential abiilty for behavioral adaptation in mammals. It permits flexible adaptation to new contexts but also efficient behavior in known contexts (Dickinson, 1985). The learning mechanisms are modeled as model-based (planning) and model-free (habitual) reinforcement learning algorithms (Sutton et Barto, 1998) which are combined into a global model of behavior (Daw et al., 2005). We proposed a robotic control architecture that take inspiration from this model of behavior and embed the two kinds of algorithms, and studied its performance in a robotic simulated task. None of the several methods for combining the algorithm we studied gave satisfying results, however, it allowed to identify some properties required for the planning process in a robotic task. We extended our study to two other tasks (one being on a real robot) and confirmed that combining the algorithms improves learning of the robot's behavior. Robotique autonome Architecture de contrôle robotique Robotique bio-Inspirée Apprentissage par renforcement Comportement instrumental Sélection de l'action Reinforcement learning Autonomous robots Robot control architectures 629.89
13	Développement d’un algorithme de faisceau non convexe avec contrôle de proximité pour l’optimisation de lois de commande structurées / Development of a non convex bundle method with proximity control for the optimization of structured control laws Gabarrou, Marion 26 November 2012 (has links) Cette thèse développe une méthode de faisceau non convexe pour la minimisation de fonctions localement lipschitziennes lower C1 puis l’applique à des problèmes de synthèse de lois de commande structurées issus de l’industrie aéronautique. Ici loi de commande structurée fait référence à une architecture de contrôle, qui se compose d’éléments comme les PIDs, combinés avec des filtres variés, et comprenant beaucoup moins de paramètres de réglage qu’un contrôleur d’ordre plein. Ce type de problème peut se formuler dans le cadre théorique et général de la programmation non convexe et non lisse. Parmi les techniques numériques efficaces pour résoudre ces problèmes non lisses, nous avons dans ce travail, opté pour les méthodes de faisceau, convenablement étendues au cas non convexe. Celles-ci utilisent un oracle qui, en chaque itéré x, retourne la valeur de la fonction et un sous-gradient de Clarke arbitraire. Afin de générer un pas de descente satisfaisant à partir de l’itéré sérieux courant, ces techniques stockent et accumulent de l’information, dans ce que l’on appelle le faisceau, obtenu à partir d’évaluations successives de l’oracle à chaque pas d’essai insatisfaisant. Dans cette thèse, on propose de construire le faisceau en décalant vers le bas une tangente de l’objectif en un pas d’essai ne constituant pas un pas de descente satisfaisant. Le décalage est indispensable dans le cas non convexe pour préserver la consistance, on dit encore l’exactitude, du modèle vis à vis de l’objectif. L’algorithme développé est validé sur un problème de synthèse conjointe du pilote automatique et de la loi des commandes de vol d’un avion civil en un point de vol donné et sur un problème de synthèse de loi de commande par séquencement de gain pour le contrôle longitudinal dans une enveloppe de vol. / This thesis develops a non convex bundle method for the minimization of lower C1 locally Lipschitz functions which it then applies to the synthesis of structured control laws for problems arising in aerospace control. Here a structured control law refers to a control architecture preferred by practitioners, which consist of elements like PIDs, combined with various filters, featuring significantly less tunable parameters than a full-order controller. This type of problem can be formulated under the theoretical and general framework of non convex and non smooth programming. Among the efficient numerical techniques to solve such non smooth problems, we have in this work opted for bundle methods, suitably extended to address non-convex optimization programs. Bundle methods use oracles which at every iterate x return the function value and one unspecified Clarke subgradient. In order to generate descent steps away from a current serious iterate, these techniques hinge on storing and accumulating information, called the bundle, obtained from successive evaluations of the oracle along the unsuccessful trial steps. In this thesis, we propose to build the bundle by shifting down a tangent of the objective at a trial step which is not a satisfactory descent step. The shift is essential in the non convex case in order to preserve the consistency, named also the exactitude, of the model with regard to the objective. The developed algorithm is validated on a synthesis problem combining the automatic pilot and the flight control law of a civil aircraft at a given flying point ; and a gain scheduled control law synthesis for the longitudinal control in a flight envelope. Optimisation non lisse Méthode de faisceau non convexe Contrôle par retour de sortie Contrôle H-infini multi-objectifs Non-smooth optimization Non-convex bundle method Feedback control Multi-objective H-infini control Flight control architecture 510
14	Architecture de contrôle hybride pour systèmes multi-robots mobiles / Hybrid control architecture for mobile multi-robot systems Benzerrouk, Ahmed 18 April 2011 (has links) La complexité inhérente à la coordination des mouvements d'un groupe de robots mobiles est traitée en investiguant plus avant les potentialités des architectures de contrôle comportementales dont le but est de briser la complexité des tâches à exécuter. En effet, les robots mobiles peuvent évoluer dans des environnements très complexes et nécessite de surcroît une coopération précise et sécurisée des véhicules pouvant rapidement devenir inextricable. Ainsi, pour maîtriser cette complexité, le contrôleur dédié à la réalisation de la tâche est décomposé en un ensemble de comportements/contrôleurs élémentaires (évitement d'obstacles et de collision entre les robots, attraction vers une cible, etc.) qui lient les informations capteurs (provenant de caméras, des capteurs locaux du robot, etc.) aux actionneurs des différentes entités robotiques. La tâche considérée est la navigation en formation en présence d'obstacles (statiques et dynamiques). La spécificité de l'approche théorique consiste à allier les avantages des architectures de contrôle comportementales à la méthode de la structure virtuelle où le groupe de robots mobiles suit un corps virtuel avec une dynamique (vitesse, direction) donnée. Ainsi, l'activation d'un comportement élémentaire en faveur d'un autre se fait en respectant les contraintes structurelles des robots (e.g. vitesses et accélérations maximales, etc.) en vue d'assurer le maximum de précision et de sécurité des mouvements coordonnés entre les différentes entités mobiles. La coopération consiste à se partager les places dans la structure virtuelle de manière distribuée et de façon à atteindre plus rapidement la formation désirée. Pour garantir les critères de performances visés par l'architecture de contrôle, les systèmes hybrides qui permettent de commander des systèmes continus en présence d'évènements discrets sont exploités. En effet, ces contrôleurs (partie discrète) permettent de coordonner l'activité des différents comportements (partie continue) disponibles au niveau de l'architecture, tout en offrant une analyse automaticienne rigoureuse de la stabilité de celle-ci au sens de Lyapunov. Chaque contribution est illustrée par des résultats de simulation. Le dernier chapitre est dédié à l'implémentation de l'architecture de contrôle proposée sur un groupe de robots mobiles Khepera III. / Inherent difficulty of coordinating a group of mobile robots is treated by investigating behavior-based architectures which aim to break task complexity. In fact, multi-robot navigation may become rapidly inextricable, specifically if it is made in hazardous and dynamical environment. The considered task is the navigation in formation in presence of (static and dynamic) obstacles. To overcome its complexity, it is proposed to divide the overall task into two basic behaviors/controllers (obstacle avoidance, attraction to a dynamical target). Applied control is chosen among these controllers according to sensors information (camera, local sensors, etc.). Theoretic approach combines behavior-based and the virtual structure strategy which considers the formation as a virtual body with a given dynamic (velocity, direction). Thus, activating a controller or another is accomplished while respecting structural robots constraints (e.g. maximal velocities and accelerations). The objective is to insure the highest precision and safety of the coordinated motion between the robots. These ones cooperate by optimizing the way of sharing their places in the formation in order to form it in a faster manner. To guarantee performance criteria of the control architecture, hybrid systems tolerating the control of continuous systems in presence of discrete events are explored. In fact, this control allows coordinating (by discrete part) the different behaviors (continuous part) of the architecture. A complete analysis of this architecture stability is also given thanks to Lyapunov-based theory. Every contribution is illustrated through simulation results. The last chapter is devoted to the implementation of the proposed control architecture on a group of Khepera III robots. Systèmes multi-robots mobiles Navigation en formation Evitement d'obstacles Architecture de contrôle Systèmes hybrides Stabilité au sens de Lyapunov Multi-mobile robots system Formation navigation Obstacle avoidance Control architecture Hybrid systems Lyapunov-based stability
15	Architecture de COntrôle/COmmande dédiée aux systèmes Distribués Autonomes (ACO²DA) : application à une plate-forme multi-véhicules / Control and management architecture for distributed autonomous systems : application to multi-vehicles based platform Mouad, Mehdi 31 January 2014 (has links) La complexité associée à la coordination d’un groupe de robots mobiles est traitée dans cette thèse en investiguant plus avant les potentialités des architectures de commande multi-contrôleurs dont le but est de briser la complexité des tâches à exécuter. En effet, les robots mobiles peuvent évoluer dans des environnements très complexes et nécessitent de surcroît une coopération précise et sécurisée pouvant rapidement devenir inextricable. Ainsi, pour maîtriser cette complexité, le contrôleur dédié à la réalisation d’une tâche est décomposé en un ensemble de comportements/contrôleurs élémentaires (évitement d’obstacles et de collision entre les robots, attraction vers une cible, planification, etc.) qui lient les informations capteurs (provenant des capteurs locaux du robot, etc.) aux actionneurs des différentes entités robotiques. La tâche considérée dans cette thèse correspond à la navigation d’un groupe de robots mobiles dans des environnements peu ou pas connus en présence d’obstacles (statiques et dynamiques). La spécificité de l’approche théorique consiste à allier les avantages des architectures multi-contrôleurs à ceux des systèmes multi-agents et spécialement les modèles organisationnels afin d’apporter un haut niveau de coordination entre les agents/robots mobiles. Le groupe de robots mobiles est alors coordonné suivant les différentes normes et spécifications du modèle organisationnel. Ainsi, l’activation d’un comportement élémentaire en faveur d’un autre se fait en respectant les contraintes structurelles des robots en vue d’assurer le maximum de précision et de sécurité des mouvements coordonnés entre les différentes entités mobiles. La coopération se fait à travers un agent superviseur (centralisé) de façon à atteindre plus rapidement la destination désirée, les événements inattendus sont gérés quant à eux individuellement par les agents/robots mobiles de façon distribuée. L’élaboration du simulateur ROBOTOPIA nous a permis d’illustrer chacune des contributions de la thèse par un nombre important de simulations. / The difficulty of coordinating a group of mobile robots is adressed in this thesis by investigating control architectures which aim to break task complexity. In fact, multi-robot navigation may become rapidly inextricable, specifically if it is made in hazardous and dynamical environment requiring precise and secure cooperation. The considered task is the navigation of a group of mobile robots in unknown environments in presence of (static and dynamic) obstacles. To overcome its complexity, it is proposed to divide the overall task into a set of basic behaviors/controllers (obstacle avoidance, attraction to a dynamical target, planning, etc.). Applied control is chosen among these controllers according to sensors information (camera, local sensors, etc.). The specificity of the theoretical approach is to combine the benefits of multi-controller control architectures to those of multi-agent organizational models to provide a high level of coordination between mobile agents-robots systems. The group of mobile robots is then coordinated according to different norms and specifications of the organizational model. Thus, activating a basic behavior in favor of another is done in accordance with the structural constraints of the robots in order to ensure maximum safety and precision of the coordinated movements between robots. Cooperation takes place through a supervisor agent (centralized) to reach the desired destination faster ; unexpected events are individually managed by the mobile agents/robots in a distributed way. To guarantee performance criteria of the control architecture, hybrid systems tolerating the control of continuous systems in presence of discrete events are explored. In fact, this control allows coordinating (by discrete part) the different behaviors (continuous part) of the architecture. The development of ROBOTOPIA simulator allowed us to illustrate each contribution by many results of simulations. Systèmes multi-robots mobiles Systèmes multi-agents Évitement d’obstacles Architecture de contrôle/commande Modèles organisationnels multi-agents Simulateur ROBOTOPIA Multi-mobile robots systems Multi-agent systems Obstacle avoidance Control and Management Architecture Multi-agent organizationnal models ROBOTOPIA simulator
16	Design and control of collaborative, cross and carry mobile robots : C3Bots / Conception et commande des robots mobiles, manipulateurs, collaboratifs et tous terrains Hichri, Bassem 05 October 2015 (has links) L'objectif du travail proposé est de concevoir et commander un groupe des robots mobiles similaires et d'architecture simple appelés m-bots (mono-robots). Plusieurs m-bots ont la capacité de saisir ensemble un objet afin d'assurer sa co-manipulation et son transport quelle que soit sa forme et sa masse. Le robot résultant est appelé p-bot (poly-robot) et est capable d'effectuer des tâches de déménageur pour le transport d'objets génériques. La reconfigurabilité du p-bot par l'ajustement du nombre des m-bots utilisés permet de manipuler des objets lourds et des objets de formes quelconques (particulièrement s'ils sont plus larges qu'un seul m-bot). Sont considérés dans ce travail l'évitement d'obstacle ainsi que la stabilité du p-bot incluant la charge à transporter. Une cinématique pour un mécanisme de manipulation a été proposée et étudiée. Ce dernier assure le levage de la charge et son dépôt sur le corps des robots pour la transporter. Plusieurs variantes d'actionnement ont été étudiées : passif, avec compliance et actionné. Un algorithme de positionnement optimal des m-bots autour de l'objet à manipuler a été proposé afin d'assurer la réussite de la tâche à effectuer par les robots. Cet algorithme respecte le critère de "Force Closure Grasping" qui assure la stabilité de la charge durant la phase de manipulation. Il maintient aussi une marge de stabilité statique qui assure la stabilité de l'objet durant la phase de transport. Enfin, l'algorithme respecte le critère des zones inaccessibles qui ne peuvent pas être atteintes par les m-bots. Une loi de commande a été utilisée afin d'atteindre les positions désirées pour les m-bots et d'assurer la navigation en formation, durant la phase du transport, durant laquelle chaque robot élémentaire doit maintenir une position désirée par rapport à l'objet transporté. Des résultats de simulation pour un objet de forme quelconque, décrite par une courbe paramétrique, sont présentés. Des simulations 3D en dynamique multi-corps ainsi que des expériences menées sur les prototypes réalisés ont permis de valider nos propositions. / Our goal in the proposed work is to design and control a group of similar mobile robots with a simple architecture, called m-bot. Several m-bots can grip a payload, in order to co-manipulate and transport it, whatever its shape and mass. The resulting robot is called a p-bot andis capable to solve the so-called "removal-man task" to transport a payload. Reconfiguring the p-bot by adjusting the number of m-bots allows to manipulate heavy objects and to manage objects with anyshape, particularly if they are larger than a single m-bot. Obstacle avoidance is addressed and mechanical stability of the p-bot and its payload is permanently guaranteed. A proposed kinematic architecture for a manipulation mechanism is studied. This mechanism allows to lift a payload and put it on them-bot body in order to be transported. The mobile platform has a free steering motion allowing the system maneuver in any direction. An optimal positioning of the m-bots around the payload ensures a successful task achievement without loss of stability for the overall system. The positioning algorithm respects the Force Closure Grasping (FCG) criterion which ensures the payload stability during the manipulation phase. It respects also the Static Stability Margin (SSM) criterion which guarantees the payload stability during the transport. Finally, it considers also the Restricted Areas (RA) that could not be reached by the robots to grab the payload. A predefined control law is then used to ensure the Target Reaching (TR) phase of each m-bot to its desired position around the payload and to track a Virtual Structure (VS), during the transportation phase, in which each elementary robot has to keep the desired position relative to the payload. Simulation results for an object of any shape, described by aparametric curve, are presented. Additional 3D simulation results with a multi-body dynamic software and experiments by manufactured prototypes validate our proposal. Robots mobiles coopératifs Architecture de contrôle/commande Co-manipulation et transport de charge Mécanisme de levage Synthèse dimensionnelle Force Closure Grasping Marge de stabilité statique Évitement d'obstacles Atteinte des cibles Navigation en formation Cooperative mobile robots Control architecture Payload transport and co- manipulation Lifting mechanism Force closure grasping Static stability margin Restricted areas Obstacle avoidance Target reaching Virtual structure navigation
17	The RHIZOME architecture : a hybrid neurobehavioral control architecture for autonomous vision-based indoor robot navigation / L’architecture RHIZOME : une architecture de contrôle neurocomportementale hybride pour la navigation autonome indoor des robots mobiles reposant sur la perception visuelle Rojas Castro, Dalia Marcela 11 January 2017 (has links) Les travaux décrits dans cette thèse apportent une contribution au problème de la navigation autonome de robots mobiles dans un contexte de vision indoor. Il s’agit de chercher à concilier les avantages des différents paradigmes d’architecture de contrôle et des stratégies de navigation. Ainsi, nous proposons l’architecture RHIZOME (Robotic Hybrid Indoor-Zone Operational ModulE) : une architecture unique de contrôle robotique mettant en synergie ces différentes approches en s’appuyant sur un système neuronal. Les interactions du robot avec son environnement ainsi que les multiples connexions neuronales permettent à l’ensemble du système de s’adapter aux conditions de navigation. L’architecture RHIZOME proposée combine les avantages des approches comportementales (e.g. rapidité de réaction face à des problèmes imprévus dans un contexte d’environnement dynamique), et ceux des approches délibératives qui tirent profit d’une connaissance a priori de l’environnement. Cependant, cette connaissance est uniquement exploitée pour corroborer les informations perçues visuellement avec celles embarquées. Elle est représentée par une séquence de symboles artificiels de navigation guidant le robot vers sa destination finale. Cette séquence est présentée au robot soit sous la forme d’une liste de paramètres, soit sous la forme d’un plan. Dans ce dernier cas, le robot doit extraire lui-même la séquence de symboles à suivre grâce à une chaine de traitements d’images. Ainsi, afin de prendre la bonne décision lors de sa navigation, le robot traite l’ensemble de l’information perçue, la compare en temps réel avec l’information a priori apportée ou extraite, et réagit en conséquence. Lorsque certains symboles de navigation ne sont plus présents dans l’environnement de navigation, l’architecture RHIZOME construit de nouveaux lieux de référence à partir des panoramas extraits de ces lieux. Ainsi, le robot, lors de phases exploratoires, peut s’appuyer sur ces nouvelles informations pour atteindre sa destination finale, et surmonter des situations imprévues. Nous avons mis en place notre architecture sur le robot humanoïde NAO. Les résultats expérimentaux obtenus lors d’une navigation indoor, dans des scenarios à la fois déterministes et stochastiques, montrent la faisabilité et la robustesse de cette approche unifiée. / The work described in this dissertation is a contribution to the problem of autonomous indoor vision-based mobile robot navigation, which is still a vast ongoing research topic. It addresses it by trying to conciliate all differences found among the state-of-the-art control architecture paradigms and navigation strategies. Hence, the author proposes the RHIZOME architecture (Robotic Hybrid Indoor-Zone Operational ModulE) : a unique robotic control architecture capable of creating a synergy of different approaches by merging them into a neural system. The interactions of the robot with its environment and the multiple neural connections allow the whole system to adapt to navigation conditions. The RHIZOME architecture preserves all the advantages of behavior-based architectures such as rapid responses to unforeseen problems in dynamic environments while combining it with the a priori knowledge of the world used indeliberative architectures. However, this knowledge is used to only corroborate the dynamic visual perception information and embedded knowledge, instead of directly controlling the actions of the robot as most hybrid architectures do. The information is represented by a sequence of artificial navigation signs leading to the final destination that are expected to be found in the navigation path. Such sequence is provided to the robot either by means of a program command or by enabling it to extract itself the sequence from a floor plan. This latter implies the execution of a floor plan analysis process. Consequently, in order to take the right decision during navigation, the robot processes both set of information, compares them in real time and reacts accordingly. When navigation signs are not present in the navigation environment as expected, the RHIZOME architecture builds new reference places from landmark constellations, which are extracted from these places and learns them. Thus, during navigation, the robot can use this new information to achieve its final destination by overcoming unforeseen situations.The overall architecture has been implemented on the NAO humanoid robot. Real-time experimental results during indoor navigation under both, deterministic and stochastic scenarios show the feasibility and robustness of the proposed unified approach. Perception visuelle Fusion de données Analyse d’un plan du bâtiment Reconnaissance de symboles Approche hybride comportementale Visual perception Data merging Floor plan analysis Pattern recognition Hybrid behavior-based approach
18	Apprentissage de nouveaux comportements: vers le développement épigénétique d'un robot autonome. Lagarde, Matthieu, Gaussier, Philippe, Andry, Pierre 13 July 2010 (has links) (PDF) La problématique de l'apprentissage de comportements sur un robot autonome soulève de nombreuses questions liées au contrôle moteur, à l'encodage du comportement, aux stratégies comportementales et à la sélection de l'action. Utiliser une approche développementale présente un intérêt tout particulier dans le cadre de la robotique autonome. Le comportement du robot repose sur des mécanismes de bas niveau dont les interactions permettent de faire émerger des comportements plus complexes. Le robot ne possède pas d'informations a priori sur ses caractéristiques physiques ou sur l'environnement, il doit apprendre sa propre dynamique sensori-motrice. J'ai débuté ma thèse par l'étude d'un modèle d'imitation bas niveau. Du point de vue du développement, l'imitation est présente dès la naissance et accompagne, sous de multiples formes, le développement du jeune enfant. Elle présente une fonction d'apprentissage et se révèle alors être un atout en terme de temps d'acquisition de comportements, ainsi qu'une fonction de communication participant à l'amorce et au maintien d'interactions non verbales et naturelles. De plus, même s'il n'y a pas de réelle intention d'imiter, l'observation d'un autre agent permet d'extraire suffisamment d'informations pour être capable de reproduire la tâche. Mon travail a donc dans un premier temps consisté à appliquer et tester un modèle développemental qui permet l'émergence de comportements d'imitation de bas niveau sur un robot autonome. Ce modèle est construit comme un homéostat qui tend à équilibrer par l'action ses informations perceptives frustres (détection du mouvement, détection de couleur, informations sur les angles des articulations d'un bras de robot). Ainsi, lorsqu'un humain bouge sa main dans le champ visuel du robot, l'ambigüité de la perception de ce dernier lui fait confondre la main de l'humain avec l'extrémité de son bras. De l'erreur qui en résulte émerge un comportement d'imitation immédiate des gestes de l'humain par action de l'homéostat. Bien sûr, un tel modèle implique que le robot soit capable d'associer au préalable les positions visuelles de son effecteur avec les informations proprioceptives de ses moteurs. Grace au comportement d'imitation, le robot réalise des mouvements qu'il peut ensuite apprendre pour construire des comportements plus complexes. Comment alors passer d'un simple mouvement à un geste plus complexe pouvant impliquer un objet ou un lieu ? Je propose une architecture qui permet à un robot d'apprendre un comportement sous forme de séquences temporelles complexes (avec répétition d'éléments) de mouvements. Deux modèles différents permettant l'apprentissage de séquences ont été développés et testés. Le premier apprend en ligne le timing de séquences temporelles simples. Ce modèle ne permettant pas d'apprendre des séquences complexes, le second modèle testé repose sur les propriétés d'un réservoir de dynamiques, il apprend en ligne des séquences complexes. A l'issue de ces travaux, une architecture apprenant le timing d'une séquence complexe a été proposée. Les tests en simulation et sur robot ont montré la nécessité d'ajouter un mécanisme de resynchronisation permettant de retrouver les bons états cachés pour permettre d'amorcer une séquence complexe par un état intermédiaire. Dans un troisième temps, mes travaux ont consisté à étudier comment deux stratégies sensorimotrices peuvent cohabiter dans le cadre d'une tâche de navigation. La première stratégie encode le comportement à partir d'informations spatiales alors que la seconde utilise des informations temporelles. Les deux architectures ont été testées indépendamment sur une même tâche. Ces deux stratégies ont ensuite été fusionnées et exécutées en parallèle. La fusion des réponses délivrées par les deux stratégies a été réalisée avec l'utilisation de champs de neurones dynamiques. Un mécanisme de "chunking" représentant l'état instantané du robot (le lieu courant avec l'action courante) permet de resynchroniser les dynamiques des séquences temporelles. En parallèle, un certain nombre de problème de programmation et de conception des réseaux de neurones sont apparus. En effet, nos réseaux peuvent compter plusieurs centaines de milliers de neurones. Il devient alors difficile de les exécuter sur une seule unité de calcul. Comment concevoir des architectures neuronales avec des contraintes de répartition de calcul, de communications réseau et de temps réel ? Une autre partie de mon travail a consisté à apporter des outils permettant la modélisation, la communication et l'exécution en temps réel d'architecture distribuées. Pour finir, dans le cadre du projet européen Feelix Growing, j'ai également participé à l'intégration de mes travaux avec ceux du laboratoire LASA de l'EPFL pour l'apprentissage de comportements complexes mêlant la navigation, le geste et l'objet. En conclusion, cette thèse m'a permis de développer à la fois de nouveaux modèles pour l'apprentissage de comportements - dans le temps et dans l'espace, de nouveaux outils pour maîtriser des réseaux de neurones de très grande taille et de discuter à travers les limitations du système actuel, les éléments importants pour un système de sélection de l'action. [INFO:INFO_LG] Computer Science/Learning [INFO:INFO_RB] Computer Science/Robotics [STAT:ML] Statistics/Machine Learning Intelligence artificiel robotique robot autonome neurosciences réseaux de neurones architecture de contrôle architecture distribuée architecture temps réelle apprentissage de comportement

Search results