Uma tendência crescente entre os pesquisadores da Robótica Móvel é a elaboração de sistemas robóticos descentralizados denominados enxames de robôs, nos quais a ação conjunta de cada agente leva à execução de tarefas de maneira mais robusta que quando realizada por um único robô. Um acréscimo adicional à robustez é conveniente em tais sistemas para que eles sejam de maior confiabilidade no mundo real. Neste trabalho, uma rede neural hierárquica desenvolvida para o aprendizado em tempo real inicialmente elaborada para o aprendizado de navegação de um único robô será estendida para controlar um enxame de robôs. O sistema realiza um balanceamento da influência de comportamentos implementados previamente em um robô de acordo com conhecimentos obtidos através da interação do mesmo com o ambiente. Cada robô possui sua própria rede neural, adquirindo seu conhecimento tanto independentemente quanto com o compartilhamento de informações com outros robôs. Espera-se que o uso de tal arquitetura permita uma adaptação mais rápida dos robôs ao ambiente, permitindo uma mudança em tempo real de seus parâmetros de acordo com as peculiaridades do ambiente no qual os robôs estão inseridos. A tarefa de escolta de um robô pelos demais é adotada para a avaliação de desempenho do modelo de rede neural proposto. Dois comportamentos são ponderados pela rede neural hierárquica: o de manutenção de uma distância preestabelecida a um agente e um outro de cobertura de área baseado em Diagramas Centroidais de Voronoi. Os testes foram feitos nos ambientes Player/Stage e indicam que a rede neural hierárquica torna os robôs capazes não apenas de aprender à medida que interagem com ambiente como de utilizar este conhecimento em tempo real para realizar a escolta de forma bem sucedida / A growing trend among Mobile Robotics researchers is developing robot swarms, in which a decentralized robot team solves tasks by combining simple behaviors. It is convenient to have mechanisms to increase a robot systems robustness. In this work, a neural network inspired in behavioral analysis is used to make robots from a swarm to learn how to act propoerly. This network combines two innate behaviors and, according to its experience, learns with the robots mistakes how to make this combination. Each robot has access to its own independent neural network, and can share its knowledge with neighboring robots. It is expected that such architecture learns by itself when to stimulate or supress each behaviors influence as it interacts with the environment. The task chosen to evaluate the proposed system is the escorting of a mobile agent. Two behaviors are balanced to achieve an escorting behavior: maintenance of a minimum distance between a robot and the escort target and an area coverage method based on Centroidal Voronoi Tessellations. Tests were meade using the Player/Stage simulator, and they show that the robots not only are capable of adapting themselves but also are able to use the stored knowledge to improve their effectiveness in doing the desired task
Identifer | oai:union.ndltd.org:IBICT/oai:teses.usp.br:tde-16072014-163543 |
Date | 28 April 2014 |
Creators | Murillo Rehder Batista |
Contributors | Roseli Aparecida Francelin Romero, Heloisa de Arruda Camargo, Denis Fernando Wolf |
Publisher | Universidade de São Paulo, Ciências da Computação e Matemática Computacional, USP, BR |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Biblioteca Digital de Teses e Dissertações da USP, instname:Universidade de São Paulo, instacron:USP |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.0021 seconds