1 |
Programmation et apprentissage bayésien de comportements pour personnages synthétiques -- application aux personnages de jeux vidéosLe Hy, Ronan 06 April 2007 (has links) (PDF)
Nous nous intéressons à l'acquisition de comportements par des personnages autonomes (bots) évoluant dans des mondes virtuels, en prenant comme exemple les jeux vidéos. Deux objectifs essentiels sont poursuivis :<br>- réduire le temps et la difficulté de programmation pour le développeur, qui doit peupler un monde virtuel de nombreux personnages autonomes ;<br>- offrir au joueur une nouvelle possibilité : apprendre à des bots comment jouer. Alors que les environnements virtuels sont complexes, et que les comportements des bots doivent être riches, le défi est d'offrir des méthodes simples de programmation et d'apprentissage. Celles- ci doivent de plus se plier à des contraintes importantes sur la mémoire et le temps de calcul disponibles. Nous commençons par présenter les méthodes actuelles de programmation de tels personnages par une étude de cas avec Unreal Tournament, un jeu de combat à la première personne. Dans ce jeu, les comportements s'appuient sur un langage de programmation spécialisé pour la description de machines d'états finis. Cette méthodologie est caractérisée par une grande flexibilité, une faible formalisation et une grande complexité. Elle se prête difficilement à l'apprentissage. Nous proposons une méthode alternative de construction de comportements basée sur la programmation bayésienne, un formalisme de description de modèles probabilistes. D'une part, cette méthode permet de maîtriser la complexité de programmation de comportements composés. D'autre, part elle sépare clairement le travail de programmation de celui d'ajustement d'un comportement : ce dernier peut être fait par un non-informaticien. Techniquement cette méthode repose essentiellement sur deux innovations :<br>- Une technique générique de définition de tâches élémentaires, appelée fusion par cohé- rence améliorée. Elle permet de fusionner un nombre important de consignes exprimées comme des tableaux de valeurs définissant des distributions de probabilités. Chacune de ces consignes peut être soit prescriptive (que faire) soit proscriptive (que ne pas faire).<br>- Une technique de mise en séquence de ces tâches élémentaires, qui permet de construire le comportement complet du personnage à partir des tâches élémentaires précédentes, appelée programmation inverse. Elle repose sur un modèle de Markov caché spécialisé, qui peut lui aussi être vu comme une machine d'états finis mais dont la spécification est plus condensée qu'avec un langage de programmation classique. 4 Contrairement à l'approche classique, cette méthode de construction de comportement permet facilement l'apprentissage par démonstration. Un bot apprend son comportement en observant un humain qui joue. Les tâches élémentaires, comme les séquences, peuvent ainsi être apprises. Pour les tâches élémentaires, l'identification des paramètres se fait directement. Pour les séquences, il est nécessaire reconnaître les « intentions » du joueur (les tâches élémentaires) à partir des actions de son avatar. Cela est rendu possible en utilisant soit une méthode de reconnaissance à base d'heuristiques spécifiques, soit une méthode de reconnaissance bayésienne basée sur l'algorithme de Baum-Welch incrémental.
|
2 |
Modèle probabiliste hérarchique de la locomotion bipède / Probabilistic hierarchical model of biped locomotionRose-Andrieux, Raphaël 09 December 2016 (has links)
Les robots humanoïdes ont toujours fasciné car leur potentiel d’application est considérable. En effet, si un robot avait les mêmes caractéristiques sensori-motrices et morphologiques qu’un homme, il pourrait théoriquement réaliser les mêmes tâches. Cependant, un premier obstacle au développement de ces robots est la stabilité d’une posture bipède. Lors d’une marche bipède, la marge d’erreur est très faible et les décisions doivent être prises rapidement avec une information souvent incomplète et incertaine. L’incertitude a de multiples sources comme des capteurs imparfaits, un modèle simplifié du monde ou encore une mécanique imprécise.Dans cette thèse, nous partons d’un contrôle de la marche par gestion des points d’appuis. L’idée est d’affiner le choix des points d’appuis en intégrant dans notre modèle les incertitudes que l’on vient d’évoquer. Pour cela, nous allons utiliser un modèle probabiliste Bayésien. A l’aide d’une distribution de probabilité, on peut exprimer simultanément une estimation, et l’incertitude associée à celle-ci. Le cadre théorique des probabilités Bayésiennes permet de définir les variables, et de les intégrer de manière rigoureuse dans un modèle global.Un autre avantage de ce modèle probabiliste est que notre objectif est aussi décrit sous la forme d’une distribution de probabilité. Il est donc possible de s’en servir pour exprimer à la fois un objectif déterministe, et une tolérance autour de celui-ci. Cela va nous permettre de fusionner facilement plusieurs objectifs et de les adapter automatiquement en fonction des contraintes extérieures. De plus, la sortie du modèle étant elle aussi une distribution de probabilité, ce type de modèle s’intègre parfaitement dans un cadre hiérarchique : l’entrée du modèle vient du niveau au-dessus et sa sortie est donnée en objectif niveau en dessous.Dans ce travail, nous allons d’abord explorer une technique de maintien de l’équilibre et la comparer aux résultats d’une expérience préliminaire sur l’homme. Nous allons ensuite étendre cette technique pour créer une stratégie de marche. Autour de cette stratégie, nous allons construire un modèle probabiliste Bayésien. Ce modèle sera finalement implémenté en simulation pour pouvoir quantifier son intérêt dans les différentes situations évoquées plus haut : intégration des incertitudes, fusion d’objectifs et hiérarchie. / Humanoid robots have always fascinated due to the vast possibilities they encompass.Indeed, a robot with the same sensorimotor features as a human could theoretically carry out the same tasks. However, a first obstacle in the development of these robots is the stability of a bipedal gait. Bipedal walkers are inherently unstable systems experiencing highly dynamic and uncertain situations. Uncertainty arises from many sources, including intrinsic limitations of a particular model of the world, the noise and perceptual limitations in a robot's sensor measurements, and the internal mechanical imperfection of the system.In this thesis, we focus on foot placement to control the position and velocity of the body's center of mass. We start from a deterministic strategy, and develop a probabilistic strategy around it that includes uncertainties. A probability distribution can express simultaneously an estimation of a variable, and the uncertainty associated. We use a Bayesian model to define relevant variables and integrate them in the global frame.Another benefit of this model is that our objective is also represented as a probability distribution. It can be used to express both a deterministic objective and the tolerance around it. Using this representation one can easily combine multiple objectives and adapt them to external constraints. Moreover, the output of the model is also a probabilistic distribution which fits well in a hierarchical context: the input comes from the level above and the output is given as objective to the lower level.In this work, we will review multiple ways to keep balance and compare them to the results of a preliminary experiment done with humans. We will then extend one strategy to walking using foot placement to keep balance. Finally, we will develop a probabilistic model around that strategy and test it in simulation to measure its benefits in different contexts : integrating uncertainties, fusing multiple objectives and hierarchy.
|
3 |
COSMO : un modèle bayésien des interactions sensori-motrices dans la perception de la parole / COSMO : a Bayesian model of sensori-motor interactions in speech perceptionLaurent, Raphael 08 October 2014 (has links)
Si la parole est une faculté dont l'usage nous semble parfaitement naturel,il reste toutefois beaucoup à comprendre sur la nature des représentations et des processus cognitifs qui la gouvernent. Au cœur de cette thèse se trouve la question des interactions entre perception et action dans la production et la perception de syllabes. Nous adoptons le cadre rigoureux de la programmation bayésienne au sein duquel nous définissons mathématiquement le modèle COSMO (pour "Communicating Objects using Sensori-Motor Operations"), qui permet de formaliser les théories motrice, auditive et perceptuo-motrice de la communication parlée et de les étudier quantitativement. Cette approche conduit à un premier résultat théorique fort : nous démontrons un théorème d'indistinguabilité d'après lequel, lorsque l'on pose certaines hypothèses de conditions idéales d'apprentissage, les théories auditive et motrice font des prédictions identiques pour des tâches de perception, et sont de ce fait indistinguables. Pour s'éloigner de ces conditions, nous proposons un algorithme original d'apprentissage sensori-moteur “par accommodation”, qui permet de s'adapter au bain acoustique ambiant tout en développant des idiosyncrasies. Cet algorithme d'apprentissage par imitation de ciblesacoustiques permet l'apprentissage de compétences motrices à partir d'entrées perceptives uniquement, avec la propriété remarquable de se focaliser sur les régions d'intérêt pour l'apprentissage. Nous utilisons des syllabes synthétisées grâce au modèle de conduit vocal VLAM pour analyser les dynamiques d'évolution des modèles appris ainsi que leur robustesse aux dégradations. / While speech communication is a faculty that seems natural, a lot remainsto be understood about the nature of the cognitive representations and processes that are involved. Central to this PhD research is the study of interactions between perception and action during production or perception of syllables. We choose Bayesian Programming as a rigorous framework within which we provide a mathematical definition of the COSMO model ("Communicating Objects using Sensori-Motor Operations"), which allows to formalize motor, auditory and perceptuo-motor theories of speech communication and to study them quantitatively. This approach first leads to a strong theoretical result:we prove an indistinguishability theorem, according to which, given some ideal learning conditions, motor and auditory theories make identical predictions for perception tasks, and therefore cannot be distinguished empirically. To depart from these conditions, we introduce an original “learning by accommodation” algorithm, which enables to adapt to the ambient acoustic environment as well as to develop idiosyncrasies. This algorithm, which learns by mimicking acoustic targets, allows to acquire motor skills from acoustic inputs only, with the remarkable property of focusing its learning on the adequate regions. We use syllables synthesized by a vocal tract model (VLAM ) to analyse how thedifferent models evolve through learning and how robust they are to degradations.
|
Page generated in 0.1416 seconds