221 |
Contribution to study and design of intelligent virtual agents : application to negotiation strategies and sequences simulation / Contribution à l’étude et à la conception d’agents virtuels intelligents : application à la simulation de stratégies de séquences de négociationBahrammirzaee, Arash 14 December 2010 (has links)
Dans cette thèse, conjointement au développement d'un modèle de négociation bilatérale automatisée entre agents, dans un contexte à informations incomplètes, intégrant les effets de la personnalité du comportement humain sur le processus et sur les résultats de la négociation, nous proposons une architecture de tels agents (″vendeur ″ ou ″acheteur″). Pour cela, une nouvelle approche de génération d'offres a été présentée en proposant notamment trois familles de tactiques adaptatives (par rapport aux intervalles de réservation et aux dates limites), à savoir : les tactiques dépendantes du temps (supposé continu), les tactiques dépendantes du comportement et les tactiques indépendantes du temps. Cette thèse s'intéresse aussi à la prise en considération des effets de la personnalité (de l'agent négociateur) sur les issues de la négociation. En fait, en recourant à modèle appelé ‘‘cinq grands facteurs de la personnalité'' et en introduisant des orientations cognitives, nous avons développé une architecture d'agent négociant basé sur la personnalité. Notre architecture s'inspire principalement de la théorie des jeux. En effet, la connaissance de l'agent artificiel en termes de la négociation est considérée comme une certaine orientation mentale du négociateur favorisant les concessions de ce dernier vers l'un des trois équilibres (au sens de la théorie des jeux) suivants : Gagnant-Perdant, Perdant-Gagnant, ou Gagnant-Gagnant. Selon l'orientation privilégiée et la personnalité du négociateur, un tel agent négociateur décide de la combinaison adéquate des tactiques (modèles etc.) afin de moduler, en conséquence, les issues escomptées de la négociation / In this thesis, besides the developing a bilateral automated negotiation model between agents, in incomplete information state, integrating the personality effects of human on the negotiation process and outcomes, we proposed an architecture of such agents (“buyer” or “seller”). To do so, a new offer generation approach of three adaptive families of tactics has been proposed as follows : the time dependent tactics (time supposed as continuous), behavior dependent tactics, and time independent tactics.This thesis takes into consideration also the personality effects (of negotiator agent) on negotiation process and outcome. In fact, with regard to “Big five” personality model and introducing the cognitive orientations, we have developed a negotiator agent's architecture based on personality. This architecture is, mainly, inspired from the game theory. In fact, the artificial agent's cognition in terms of negotiation is considered as a certain negotiator's mental orientation favorising the concession of the negotiator agent towards one of following three equilibria (based on game theory) : Win-Lose, Lose-Win, and Win-Win According to the privileged orientation and the personality of negotiator, such a negotiator agent decides the adequate combination of tactics (models, etc) in order to modulate, consequently, the expected outcomes of negotiation
|
222 |
Contagion des anticipations des investisseurs sur le marché financier : une approche par les réseaux et les modèles multi-agents / Contagion of investors' behaviors in financial markets : a network and agent-based approachMasmoudi, Souhir 02 December 2016 (has links)
Dans le cadre d’une approche comportementale et compte tenu de la complexité des marchés financiers, cette thèse examine dans quelle mesure les réseaux orientés régissant l’interaction entre les investisseurs ainsi que leur comportement mimétique influencent leurs anticipations et la dynamique des prix. Nous proposons un marché artificiel d’actifs dans lequel des chartistes et des fondamentalistes opèrent et passent d’une stratégie d’investissement à une autre en fonction de leurs performances. Tout d’abord, nous étudions un réseau complet où l’interaction se fait de manière globale. Nous constatons que notre modèle révèle l’émergence de la volatilité excessive des prix lorsque les chartistes dominent le marché. Ensuite, nous portons notre attention sur des réseaux locaux où les agents se trouvent liés qu’à une partie des individus opérant dans le marché. Nous distinguons trois types de réseaux : le réseau régulier, le réseau petit monde et le réseau aléatoire. Puis, nous introduisons un nouveau modèle qui permet de contrôler (1) la direction du processus de « rewiring » des liens; (2) le caractère aléatoire du réseau et (3) l'asymétrie dans sa distribution des degrés en distinguant les stars des non-stars. Nous montrons que contrairement au degré du caractère aléatoire du réseau, l’asymétrie dans la distribution des degrés produit des effets opposés selon qu’il s’agit de « in-degree » ou de « out-degree ». Enfin, nous montrons comment ces analyses peuvent être utilisées pour produire des dynamiques de marché réalistes. Nous constatons que la présence d’un seuil d’imitation avec un coefficient de réaction élevé permet à notre modèle de reproduire les faits stylisés les plus importants / Within a behavioral approach and given the complexity of financial markets, the aim of this thesis is to examine the extent to which directed networks that governs the interaction among investors as well as their mimicking behavior influence their anticipations and the price dynamics. We propose an artificial asset market populated by chartists and fundamentalists who are allowed to switch from one trading strategy to the other according to their relative performances. Firstly, we study a fully connected network to test for a global interaction. We find that our benchmark model accounts for the emergence of excess volatility of asset prices when chartists dominate the market. Secondly, we restrict our focus to local interactions between investors. We generate a family of network structures that spans regular network, small world network and random network. Thirdly, we introduce a new model that allows us to control (1) the direction of the rewiring process of the links; (2) the randomness of the network; and (3) the asymmetry in its degree distribution by assuming that there are two classes of agents: stars and non-stars. We show that unlike the degree of the randomness of the network, the asymmetry in the degree distribution produces opposite effects depending on whether the network is outward or inward rewired. Finally, we address the question as to how this analysis can be used to produce realistic market dynamics. We find that the presence of a mimicking threshold with a high reaction coefficient provides a better approximation to the characteristics of the distribution of real returns and reproduces the most important stylized facts observed in financial time series
|
223 |
Aplicação de técnicas de Inteligência Artificial para o gerenciamento dinâmico de dispositivos de um PABX distribuído, desenvolvido com a tecnologia LonWorks. / Application of Artificial Intelligence techniques for devices dinamic management of a distributed PBX system developed with LonWorks technology.Cunha, Rafael de Aquino 09 May 2008 (has links)
O presente trabalho teve como objetivo propor e testar uma metodologia para a realização de bindings dinâmicos na tecnologia LonWorks®, com a finalidade de permitir que um Sistema Distribuído de Comunicação Telefônica Privada (SDCTP), também desenvolvido com a tecnologia LonWorks®, realizasse seus enlaces telefônicos. Para tal, utilizou-se uma metodologia voltada para equipamentos embarcados e a visão de agentes reativos no desenvolvimento de cada dispositivo de rede, oferecendo uma solução única, prática e totalmente inédita na tecnologia LonWorks® e nos dispositivos de PABX. Essa visão resultou no desenvolvimento de dispositivos inteligentes e totalmente autônomos, no que diz respeito aos seus processos internos, gerando resultados satisfatórios e mais eficientes do que se esperava com base nos requisitos levantados para o sistema SDCTP. Este trabalho é o ponto de partida e oferece uma base para o desenvolvimento de novas funcionalidades, tanto nos sistemas de telefonia atuais, quanto nas redes de controle. / This presentation has the goal to propose and test a new method to implement dynamic bindings in LonWorks® technology, allowing a new Private Telephony Comunication Distributed System (SDCTP), also developed with LonWorks® technology, to make their telephone links. In order to do this, a method for developping embedded systems and the reactive agent view was applied for each different devices in this new system, thus offering a unique, practical and innovative solution for both, LonWorks® and PBX systems. This view allowed the implementation of intelligent and autonomous devices, specially in their internal process, thus granting satisfactory and more efficient results based on the SDCTP requirements. This work is the kick-off and the basis for developing new functions for telephone systems and control networks.
|
224 |
Les risques hydrologiques dans les bassins versants sous contrôle anthropique : modélisation de l'aléa, de la vulnérabilité et des conséquences sur les sociétés. : Cas de la région Sud-ouest de Madagascar / Hydrological risks in anthropized watersheds : modeling of hazard, vulnerability and impacts on population from south-west of MadagascarRakotoarisoa, Mahefa 11 December 2017 (has links)
La ville de Toliara qui se trouve à l’exutoire du bassin de Fiherenana (Madagascar) est soumise chaque année aux aléas inondations. Les enjeux sont donc d'une importance majeure dans cette région. Cette étude débute par l’analyse de l’aléa avec les données hydro climatiques existantes. On cherche alors à déterminer les tendances en utilisant des modèles statistiques basés sur les séries temporelles. Une méthode de reconstitution des données manquantes est alors proposée. Ensuite, deux approches sont menées afin d’évaluer la vulnérabilité de la ville de Toliara et des villages alentours : une approche statique, à partir de relevés de terrain et de l’utilisation d’un système d’information géographique (SIG) ; et une autre avec l'utilisation d'un modèle multi-agents (SMA). La première étape est la cartographie d’un indicateur de vulnérabilité qui est l’agencement de plusieurs critères statiques propre à chaque maison comme la hauteur d’eau potentielle ou la typologie architecturale. La deuxième partie mettra en scène des agents afin de simuler un évènement catastrophique (montée des eaux et évacuation en simultanée). On cherche à savoir quelles sont les chances pour que les occupants d’une habitation puissent sortir indemne d’une inondation, en comparant divers paramètres et scénarios afin d’évaluer le degré de vulnérabilité de chaque ménage. Certains scénarios prennent en compte l’effet de certaines prises de décisions (Informations, sensibilisations etc.). Les indicateurs et les simulations permettent alors de mieux appréhender les risques inondations afin d’être une aide à la gestion des crises. / Hydrological risks are recurrent on the Fiherenana watershed - Madagascar. The city of Toliara, which is located at the outlet of the river basin, is subject each year to hurricane hazards and floods. The stakes are of major importance in this part of the island. This study begins with the analysis of hazard by collecting all existing hydro-climatic data on the catchment. It then seeks to determine trends, despite the significant lack of data, using statistical models (time series). Then, two approaches are used to assess the vulnerability of the city of Toliara and its surrounding villages. First, a static approach, from surveys of land and the use of GIS are conducted. Then, the second method is based on a multi-agent model. The first step is the mapping of a microscale vulnerability index which is an arrangement of several static criteria. For each House, there are several criteria of vulnerability such as potential water depth or architectural typology. As for the second part, scenes of agents are simulated in order to evaluate the degree of housing vulnerability to flooding. The model aims to estimate the chances of the occupants to escape from a catastrophic flood. For this purpose, we compare various settings and scenarios, some of which are conducted to take into account the effect of various decisions made by the responsible entities (awareness campaign etc.). The simulation consists of two essential parts: the simulation of the rise of water and the simulation of the behaviour of the people facing the occurence of hazard. Indicators and simulations allow to better understand the risks in order to help crisis management. Key Words: Hy
|
225 |
Analyse et contrôle de systèmes de dynamiques d'opinions / Analysis and control of opinion dynamicsDietrich, Florian 22 November 2017 (has links)
Les dynamiques d'opinions suscitent un regain d'intérêt de la part des communautés d'Automatique et de Mathématiques Appliquées. Cela peut s'expliquer par l'émergence des réseaux sociaux en ligne et de la possibilité d'exploiter et comprendre les comportements et données associés. Les modèles de dynamiques d'opinions sont des cas particuliers de systèmes multi-agents. Ces systèmes ont des applications diverses comme par exemple le contrôle du comportement d'une flotte de robots collaboratifs. Un système de dynamique d'opinions est ainsi constitué de plusieurs agents. L'état de chaque agent est alors modélisé par un réel qui représente l'opinion de celui-ci à propos d'un certain sujet. Les modèles mathématiques de dynamiques d'opinions décrivent alors l'évolution des opinions des agents dans le temps. De nombreux résultats ont été obtenus sur le régime asymptotique de ces systèmes, notamment sur la convergence vers le consensus, lorsque les opinions de tous les agents du système tendent vers la même valeur. Le régime transitoire, moins bien connu, présente également des phénomènes intéressants comme la formation d'accords locaux transitoires mais qui sont plus délicats à définir. Une étude de ces phénomènes est présentée pour des systèmes de dynamiques d'opinions à temps discret avec fonctions d'influence génériques dépendant de l'état. La contribution principale propose un critère de détection de la formation de ces accords locaux, ainsi que la prédiction de la durée pendant laquelle ce critère est vérifié. La seconde partie de cette thèse se concentre sur les dynamiques d'opinions en temps continu dont un des agents, appelé leader, a un rôle particulier : l'évolution de son opinion est contrôlable. Le leader est utilisé pour rassembler tous les agents dans son voisinage en temps fini, puis pour les amener vers une valeur de consensus désirée. La loi de commande proposée est valide pour des systèmes à fonctions d'influence dépendant du temps et de l'état et sous certaines conditions. De plus, le problème de contrôle en temps optimal consistant à rassembler tous les agents dans le voisinage du leader en temps minimal est examiné. Ceci est effectué dans le cas particulier de fonctions d'influence dépendant uniquement de l'état. Afin de déterminer la classe des commandes optimales admissible, le Principe du Maximum de Pontryagin est utilisé. Dans un cadre général, la commande optimale est précisée sous la forme de relations implicites. Pour le cas particulier où il n'y a pas d'interaction entre les agents, la loi de commande en temps optimal a été obtenue en pratique pour toute condition initiale / Opinion dynamics systems aroused renewed interest in the Control System Theory and Applied Mathematics communities. This can be explained by the emergence of online social networks and the possibility of exploiting and understanding associated behaviours and data. Opinion dynamic models are special cases of multi-agent systems. These systems have various applications such as controlling the behaviour of a fleet of collaborative robots. A system of opinion dynamics is thus composed of several agents. The state of each agent is then modeled by a real number, which represents the agent's opinion on a certain subject. The mathematical models of opinion dynamics then describe the evolution of agents' opinions over time. Many results have been obtained on the asymptotic behaviour of these systems, notably on convergence towards consensus, when the opinion of all agents of the system tend towards the same value. The less well known transient state also presents interesting phenomena such as the formation of local transient agreements, which are more tricky to define. A study of these phenomena is presented for discrete-time opinion dynamics systems with generic state dependent influence functions. The main contribution proposes a criterion for detecting the formation of these local agreements, as well as a prediction of the duration during which this criterion is verified. The second part of this thesis focuses on opinion dynamics in continuous time in which one of the agents, called leader, has a particular role: the evolution of its opinion is controllable. For systems with time and state-dependent influence functions and under certain conditions, a control law is presented that allows the leader to gather all agents in its neighbourhood in finite time and then steer them to a desired consensus value. In addition, the problem of time optimal control which consists in bringing all agents together in the neighborhood of the leader in minimal time is also examined for the case of only state-dependent influence functions. The Pontryagin Maximum Principle specifies the class of admissible optimal controls with implicit expressions within a general framework. For the particular case where there is no interaction between agents, the time-optimal control law has been obtained in practice for any initial conditions
|
226 |
Méthodes d’optimisation distribuée pour l’exploitation sécurisée des réseaux électriques interconnectés / Distributed optimization methods for the management of the security of interconnected power systemsVelay, Maxime 25 September 2018 (has links)
Notre société étant plus dépendante que jamais au vecteur électrique, la moindre perturbation du transport ou de l’acheminement de l’électricité a un impact social et économique important. La fiabilité et la sécurité des réseaux électriques sont donc cruciales pour les gestionnaires de réseaux, en plus des aspects économiques. De plus, les réseaux de transport sont interconnectés pour réduire les coûts des opérations et pour améliorer la sécurité. Un des plus grand défis des gestionnaires des réseaux de transport est ainsi de se coordonner avec les réseaux voisins, ce qui soulève des problèmes liés à la taille du problème, à l’interopérabilité et à la confidentialité des données.Cette thèse se focalise principalement sur la sécurité des opérations sur les réseaux électriques, c’est pourquoi l’évolution des principales caractéristiques des blackouts, qui sont des échecs de la sécurité des réseaux, sont étudiés sur la période 2005-2016. L’approche de cette étude consiste à déterminer quelles sont les principales caractéristiques des incidents de ces 10 dernières années, afin d’identifier ce qui devrait être intégré pour réduire le risque que ces incidents se reproduisent. L’évolution a été étudiée et comparé avec les caractéristiques des blackouts qui se sont produit avant 2005. L’étude se focalise sur les préconditions qui ont mené à ces blackouts et sur les cascades, et particulièrement sur le rôle de la vitesse des cascades. Les caractéristiques importante sont extraites et intégrées dans la suite de notre travail.Un algorithme résolvant un problème préventif d’Optimal Power Flow avec contraintes de sécurité (SCOPF) de manière distribuée est ainsi développé. Ce problème consiste en l’ajout de contraintes qui assure qu’après la perte de n’importe quel appareil d’importance, le nouveau point d’équilibre, atteint suite au réglage primaire en fréquence, respecte les contraintes du système. L’algorithme développé utilise une décomposition fine du problème et est implémenté sous le paradigme multi-agent, basé sur deux catégories d’agents : les appareils et les bus. Les agents sont coordonnés grâce à l’ « Alternating Direction Method of Multipliers (ADMM)» et grâce à un problème de consensus. Cette décomposition procure l’autonomie et la confidentialité nécessaire aux différents acteurs du système, mais aussi, un bon passage à l’échelle par rapport à la taille du problème. Cet algorithme a aussi pour avantage d’être robuste à n’importe quelle perturbation, incluant la séparation du système en plusieurs régions.Puis, pour prendre en compte l’incertitude sur la production créée par les erreurs de prédiction des fermes éoliennes, une approche distribuée à deux étapes est développée pour résoudre un problème d’Optimal Power Flow avec contraintes probabilistes (CCOPF), d’une manière complétement distribuée. Les erreurs de prédiction des fermes éoliennes sont modélisées par des lois normales indépendantes et les écarts par rapport aux plannings de production sont considérés compensés par le réglage primaire en fréquence. La première étape de l’algorithme a pour but de déterminer des paramètres de sensibilités nécessaires pour formuler le problème. Les résultats de cette étape sont ensuite des paramètres d’entrée de la seconde étape qui, elle, résout le problème de CCOPF. Une extension de cette formulation permet d’ajouter de la flexibilité au problème en permettant la réduction de la production éolienne. Cet algorithme est basé sur la même décomposition fine que précédemment où les agents sont également coordonnés par l’ADMM et grâce à un problème de consensus. En conclusion, cet algorithme en deux étapes garantit la confidentialité et l’autonomie des différents acteurs, et est parallèle et adaptée aux plateformes hautes performances. / Our societies are more dependent on electricity than ever, thus any disturbance in the power transmission and delivery has major economic and social impact. The reliability and security of power systems are then crucial to keep, for power system operators, in addition to minimizing the system operating cost. Moreover, transmission systems are interconnected to decrease the cost of operation and improve the system security. One of the main challenges for transmission system operators is therefore to coordinate with interconnected power systems, which raises scalability, interoperability and privacy issues. Hence, this thesis is concerned with how TSOs can operate their networks in a decentralized way but coordinating their operation with other neighboring TSOs to find a cost-effective scheduling that is globally secure.The main focus of this thesis is the security of power systems, this is why the evolution of the main characteristics of the blackouts that are failures in power system security, of the period 2005-2016 is studied. The approach consists in determining what the major characteristics of the incidents of the past 10 years are, to identify what should be taken into account to mitigate the risk of incidents. The evolution have been studied and compared with the characteristics of the blackouts before 2005. The study focuses on the pre-conditions that led to those blackouts and on the cascades, and especially the role of the cascade speed. Some important features are extracted and later integrated in our work.An algorithm that solve the preventive Security Constrained Optimal Power Flow (SCOPF) problem in a fully distributed manner, is thus developed. The preventive SCOPF problem consists in adding constraints that ensure that, after the loss of any major device of the system, the new steady-state reached, as a result of the primary frequency control, does not violate any constraint. The developed algorithm uses a fine-grained decomposition and is implemented under the multi-agent system paradigm based on two categories of agents: devices and buses. The agents are coordinated with the Alternating Direction method of multipliers in conjunction with a consensus problem. This decomposition provides the autonomy and privacy to the different actors of the system and the fine-grained decomposition allows to take the most of the decomposition and provides a good scalability regarding the size of the problem. This algorithm also have the advantage of being robust to any disturbance of the system, including the separation of the system into regions.Then, to account for the uncertainty of production brought by wind farms forecast error, a two-step distributed approach is developed to solve the Chance-Constrained Optimal Power Flow problem, in a fully distributed manner. The wind farms forecast errors are modeled by independent Gaussian distributions and the mismatches with the initials are assumed to be compensated by the primary frequency response of generators. The first step of this algorithm aims at determining the sensitivity factors of the system, needed to formulate the problem. The results of this first step are inputs of the second step that is the CCOPF. An extension of this formulation provides more flexibility to the problem and consists in including the possibility to curtail the wind farms. This algorithm relies on the same fine-grained decomposition where the agents are again coordinated by the ADMM and a consensus problem. In conclusion, this two-step algorithm ensures the privacy and autonomy of the different system actors and it is de facto parallel and adapted to high performance platforms.
|
227 |
Utilização de um sistema multi-agentes em redes de comunicação para a proteção digital de distância adaptativa / Using a multi-agent system in communication networks for an adaptive digital distance protection systemSilva, Breno Caetano da 06 April 2009 (has links)
Esta pesquisa apresenta a implementação de um sistema de proteção digital de distância adaptativo dispondo de um sistema multi-agentes (SMA). Tal SMA trabalhará de forma distribuída, possuindo entidades especialistas (Agentes) inseridas em locais específicos e agindo de forma eficiente na solução de problemas locais. Espera-se pela aplicação deste SMA, atribuir aos relés de distância características desejáveis e difíceis de serem alcançadas pelas técnicas convencionais. Dentre as deficiências observadas nos sistemas de proteção convencionais, tem-se a não sensibilidade à dinâmica dos sistemas elétricos de potência em função das alterações nas condições operacionais. Logo, tem-se então a necessidade de um sistema de proteção mais flexível, seletivo e eficaz para assegurar a confiabilidade e a continuidade no suprimento da energia elétrica. Para desenvolver tal proposição, foram realizadas diversas e distintas simulações computacionais dispondo do software ATP (Alternative Transients Program) para a geração das prováveis curvas de operação adaptativa. Estas, quando inseridas em um banco de dados, serão representativas das esperadas alterações nas condições operacionais de um sistema elétrico em especifico. Para a implementação e validação desta abordagem, diversos testes foram realizados, tendo como finalidade a comparação desta abordagem dispondo de SMA com a filosofia tradicional de proteção de distância. Os resultados obtidos são promissores e demonstram o alto grau de precisão e confiabilidade do método proposto. / This research presents the development of an adaptive digital distance protection system by a multi-agent system (MAS). This MAS will work in a distributed way, with expert entities (agents) inserted in specific places and acting efficiently in the solution of local problems. With the application of the MAS, the distance relays will have desirable characteristics, which are difficult to be reached by conventional techniques. Among the deficiencies observed in conventional protection systems, there is the insensitivity to the dynamics of the electrical power system due to changes in operating conditions. So, there is the necessity of a protection system which is more flexible, selective and effcient to assure reliability and continuity in the electricity supply. To improve these characteristics, several computational simulations were done using alternative transients program (ATP) to generate the desirable adaptive operation curves. These curves, when inserted into a database, will represent the expected changes in the operating conditions of an electrical system. For the implementation and validation of this approach, several tests were done with the purpose of comparison of this approach (using MAS) to the traditional philosophy of distance protection. The results obtained are promising and demonstrate a highly satisfactory degree of accuracy and reliability of the proposed method.
|
228 |
CHRYSAOR : un Système Tutoriel Intelligent pour les Environnements Virtuels d'Apprentissage Humain. Application à la formation au matériel de laboratoire en hémostase : application à la formation au matériel de laboratoire en hémostase / CHRYSAOR : a smart tutorial system for virtual learning environments. Application to training in laboratory equipment in hemostasisLe Corre, Frédéric 12 July 2013 (has links)
Ce travail de recherche s'inscrit dans le cadre des environnements virtuels pour la formation aux instruments de diagnostic biomédical. La simulation de la situation réelle seule ne suffisant pas, il convient d'incorporer un scénario pédagogique pour construire l'apprentissage. Le scénario s'applique pour tous les apprenants, il est donc important d'intégrer des possibilités d'individualisation. Pour cela, nous proposons de coupler l'environnement virtuel à un Système Tutoriel Intelligent (STI). Notre étude débute par une identification des systèmes existants qui nous semblent les mieux adaptés, sur lesquels baser notre proposition : le STI Pégase, le modèle de scénario pédagogique Poseïdon et le méta-modèle Mascaret. Ceci nous permet également d'identifier les limites de Pégase qui sont : le manque de lien avec le scénario pédagogique, le manque de modularité et le manque d'individualisation. Notre proposition, appelée Chrysaor, vise à combler ces faiblesses. Nous proposons ainsi qu'un scénario pédagogique soit une connaissance explicite et par conséquent exploitable par un STI. Les concepts proposés dans notre modèle permettent également au formateur de facilement modifier les comportements, les rôles et les affectations (humain ou agent autonome) : notre système devient ainsi modulaire. Nous illustrons ensuite l'utilisation de Chrysaor dans une application de formation par la réalité virtuelle à un instrument de diagnostic en hémostase utilisé en milieu hospitalier. Sur cette application, des expérimentations comparant les deux types de formation (traditionnelle et virtuelle) permettent de vérifier la qualité de l'apprentissage obtenu par une formation en réalité virtuelle, et de vérifier que ces connaissances sont transférables en environnement réel. / This research focuses on the virtual environments for training in biomedical diagnostic devices. The simulation of the real situation only is not enough, we needs to incorporate a pedagogical scenario to build the learning. The scenario applies to all learners, so it is important to integrate individualization. For this we propose to couple the virtual environment with an Intelligent Tutoring System (ITS). Our study begins with an identification of existing systems that seem best suited, on which to base our proposal: the ITS Pegase, the pedagogical scenario model Poseidon and the meta-model Mascaret. This also allows us to identify the limits of Pegase : the lack of connection with the pedagogical scenario, the lack of modularity and lack of individualization. Our proposal, called Chrysaor, aims to provide the most complete ITS. Thus we propose that a pedagogical scenario is an explicit knowledge and therefore exploitable by an STI. The concepts proposed in our model also allow the instructor to easily modify the behavior, roles and assignments (human or autonomous agent): our system becomes modular. Then we illustrate the use of Chrysaor in an application of virtual reality training in a biomedical device used in hemostasis in hospital. We lead two experiments in order to compare the two types of training (traditional and virtual) to verify the quality of learning achieved by a virtual reality training, and to ensure that this knowledge are transferable in a real environment.
|
229 |
Systèmes multi-agents, auto-organisation et contrôle par apprentissage constructiviste pour la modélisation et la régulation dans les systèmes coopératifs de trafic / Multi-agent systems, self-organization and constructivist learning for Cooperative Intelligent Transportation Systems modeling and controlGuériau, Maxime 12 December 2016 (has links)
Dans un proche futur, les véhicules connectés et autonomes remplaceront nos véhicules actuels, et il sera nécessaire de repenser intégralement la mobilité. Le conducteur, avec ses lacunes, sera de plus en plus assisté, et un jour détrôné par un système embarqué, capable d'agir plus rapidement, tout en ayant une représentation plus précise et fiable de son environnement de navigation. Pourtant, il reste encore du chemin à parcourir avant d'arriver à un tel stade de maturité : l'environnement du véhicule est complexe, imprévisible et conflictuel, car partagé avec d'autres acteurs de la mobilité. Ce travail de thèse vise à anticiper l'arrivée de ces nouveaux véhicules afin de proposer des comportements coopératifs au niveau des véhicules et de l'infrastructure tout en permettant un contrôle décentralisé de ce type de système complexe. Dans le cadre d'une approche multi-agents et d'une architecture distribuée, nous proposons d'abord une modélisation par couplage des dynamiques physique et communicationnelle, auxquelles s'ajoute une intégration de la fiabilité de l'information (confiance). L'étape suivante a été de développer un cadre de simulation propice à l'implémentation de nos modèles dans le cas des véhicules connectés. Nous introduisons un nouveau simulateur de trafic, construit comme une extension d'une plateforme existante, au sein duquel les flux d'informations entre les véhicules et avec l'infrastructure prennent la forme d'échanges de messages. Toutes les informations du système proviennent de capteurs, et toutes les entités, modélisées comme des agents, sont autonomes dans leur prise de décision. De nouvelles formes de contrôle sont désormais envisageables en utilisant des consignes transmises par l'infrastructure communicante. Le couplage des dynamiques assure la cohérence et l'inter-dépendance des différents modèles dans le simulateur. Nous montrons en simulation que, grâce à l'intégration d'informations supplémentaires via la communication, les véhicules, modélisés par un modèle microscopique multi-anticipatif bilatéral, sont capables de réduire l'effet de perturbations propagées au sein d'un flux. En termes de stratégies de contrôle, une des problématiques principales est de garantir une forme de contrôle qui s'adaptera aux différentes phases de déploiement des systèmes coopératifs. L'analogie avec des problèmes de l'IA (problème de cognition) nous a mené à traiter le problème de manière plus abstraite : comment permettre à un système autonome de contrôler son environnement. Les approches constructivistes, que nous avons retenues, modélisent le processus de cognition comme un phénomène de construction itératif. Pour le trafic coopératif, l'avantage est de disposer d'un système capable de générer ses propres stratégies, en utilisant ou non des connaissances expertes, et de les faire évoluer au cours du temps pour s'adapter aux véhicules composant le flux. Les résultats de notre approche sont présentés dans deux cadres de simulation. Le premier est un prototype visant à illustrer les comportements de bas niveau dans un environnement simplifié. Nous montrons que le modèle est capable dans ce cadre de combiner différentes représentations individuelles pour construire une représentation et de s'adapter à différents contextes en les recombinant dynamiquement. Puis, dans le cadre de simulation du trafic coopératif, les résultats laissent entrevoir le potentiel de notre approche dans des applications réelles / In a near future, connected and automated vehicles will progressively replace current vehicles, leading to deep changes in transportation. The driver will be soon assisted and then replaced by an embedded system, able to act quicker, relying on a more robust and precise representation of its surrounding environment. However, some steps are still needed before coming up with such a level of automation since the vehicle environment is complex and unpredictable. This work intends to anticipate the introduction of these new kinds of vehicles by providing cooperative behaviors at both infrastructure and vehicle levels, at the same time allowing a decentralized control of these systems. We propose a distributed modeling framework, using multi-agent systems, relying on the coupling of the system dynamics: information, communication and reliability (modeled through the concept of trust). The next step was to develop a simulation framework enabling the implementation of our models for connected vehicles applications. We present a new microscopic traffic simulator, built as an extension of an existing platform, and able to model information exchanges using messages between vehicles and with the infrastructure. All data are provided by sensors and all entities, modeled as agents, are autonomous regarding their decision process. Thanks to the simulator, it is possible to imagine new control strategies relying on recommendations disseminated by the connected infrastructure. Consistency and interdependence of the simulator components are ensured by the dynamic coupling. As for the vehicles’ dynamics, we propose a bilateral multi-anticipative model that integrates additional information from communications in the vehicle decision process. Results in simulation confirm that the model is able to reduce the propagation of perturbation through the flow, leading to a more homogeneous and stable traffic. One of the major issues regarding traffic control strategies will be to dynamically adapt the action policy to the several deployment stages of cooperative transportation systems. The similarities with Artificial Intelligence problems like cognition motivate a more abstract study: how to model an autonomous system able to control its environment. We choose the constructivist approaches, that propose to model the cognition process as an iterative building process. For cooperative traffic, the benefits lie in the ability of the system to generate its own strategies, relying or not on domain specific knowledge, and then make them evolve to be adapted to vehicles in the flow. The results from our approach are presented in two distinct simulation frameworks. The first one is an experimentation prototype aiming at highlighting the low-level behaviors in a simplified environment. In this context, we show that the model is able to combine efficiently several individual concurrent representations in order to build a high-level representation that can be adapted to several contexts. The second framework is the traffic simulator where the results lead to some insights about the potential of our approach for such realistic applications
|
230 |
Control of Multi-Agent Dynamical Systems in the Presence of Constraints / Commande sous contraintes de systèmes dynamiques multi-agentsProdan, Ionela 03 December 2012 (has links)
L'objectif de cette thèse est de proposer des solutions aux problèmes liés à la commande optimale de systèmes dynamiques multi-agents en présence de contraintes. Des éléments de la théorie de commande et d'optimisation sont appliqués à différents problèmes impliquant des formations de systèmes multi-agents. La thèse examine le cas d'agents soumis à des contraintes dynamiques. Pour faire face à ces problèmes, les concepts bien établis tels que la théorie des ensembles, la platitude différentielle, la commande prédictive (Model Predictive Control - MPC), la programmation mixte en nombres entiers (Mixed-Integer Programming - MIP) sont adaptés et améliorés. En utilisant ces notions théoriques, ce travail de thèse a porté sur les propriétés géométriques de la formation d'un groupe multi-agents et propose un cadre de synthèse original qui exploite cette structure. En particulier, le problème de conception de formation et les conditions d'évitement des collisions sont formulés comme des problèmes géométriques et d'optimisation pour lesquels il existe des procédures de résolution. En outre, des progrès considérables dans ce sens ont été obtenus en utilisant de façon efficace les techniques MIP (dans le but d'en déduire une description efficace des propriétés de non convexité et de non connexion d'une région de faisabilité résultant d'une collision de type multi-agents avec des contraintes d'évitement d'obstacles) et des propriétés de stabilité (afin d'analyser l'unicité et l'existence de configurations de formation de systèmes multi-agents). Enfin, certains résultats théoriques obtenus ont été appliqués dans un cas pratique très intéressant. On utilise une nouvelle combinaison de la commande prédictive et de platitude différentielle (pour la génération de référence) dans la commande et la navigation de véhicules aériens sans pilote (UAVs). / The goal of this thesis is to propose solutions for the optimal control of multi-agent dynamical systems under constraints. Elements from control theory and optimization are merged together in order to provide useful tools which are further applied to different problems involving multi-agent formations. The thesis considers the challenging case of agents subject to dynamical constraints. To deal with these issues, well established concepts like set-theory, differential flatness, Model Predictive Control (MPC), Mixed-Integer Programming (MIP) are adapted and enhanced. Using these theoretical notions, the thesis concentrates on understanding the geometrical properties of the multi-agent group formation and on providing a novel synthesis framework which exploits the group structure. In particular, the formation design and the collision avoidance conditions are casted as geometrical problems and optimization-based procedures are developed to solve them. Moreover, considerable advances in this direction are obtained by efficiently using MIP techniques (in order to derive an efficient description of the non-convex, non-connected feasible region which results from multi-agent collision and obstacle avoidance constraints) and stability properties (in order to analyze the uniqueness and existence of formation configurations). Lastly, some of the obtained theoretical results are applied on a challenging practical application. A novel combination of MPC and differential flatness (for reference generation) is used for the flight control of Unmanned Aerial Vehicles (UAVs).
|
Page generated in 0.0863 seconds