Spelling suggestions: "subject:"amobile robots."" "subject:"0mobile robots.""
421 |
[en] EXPLORATION AND VISUAL MAPPING ALGORITHMS DEVELOPMENT FOR LOW COST MOBILE ROBOTS / [pt] DESENVOLVIMENTO DE ALGORITMOS DE EXPLORAÇÃO E MAPEAMENTO VISUAL PARA ROBÔS MÓVEIS DE BAIXO CUSTOFELIPE AUGUSTO WEILEMANN BELO 16 October 2006 (has links)
[pt] Ao mesmo tempo em que a autonomia de robôs pessoais e
domésticos
aumenta, cresce a necessidade de interação dos mesmos com
o ambiente. A
interação mais básica de um robô com o ambiente é feita
pela percepção deste e
sua navegação. Para uma série de aplicações não é prático
prover modelos
geométricos válidos do ambiente a um robô antes de seu
uso. O robô necessita,
então, criar estes modelos enquanto se movimenta e percebe
o meio em que está
inserido através de sensores. Ao mesmo tempo é necessário
minimizar a
complexidade requerida quanto a hardware e sensores
utilizados. No presente
trabalho, um algoritmo iterativo baseado em entropia é
proposto para planejar
uma estratégia de exploração visual, permitindo a
construção eficaz de um modelo
em grafo do ambiente. O algoritmo se baseia na
determinação da informação
presente em sub-regiões de uma imagem panorâmica 2-D da
localização atual do
robô obtida com uma câmera fixa sobre o mesmo. Utilizando
a métrica de
entropia baseada na Teoria da Informação de Shannon, o
algoritmo determina nós
potenciais para os quais deve se prosseguir a exploração.
Através de procedimento
de Visual Tracking, em conjunto com a técnica SIFT (Scale
Invariant Feature
Transform), o algoritmo auxilia a navegação do robô para
cada nó novo, onde o
processo é repetido. Um procedimento baseado em
transformações invariáveis a
determinadas variações espaciais (desenvolvidas a partir
de Fourier e Mellin) é
utilizado para auxiliar o processo de guiar o robô para
nós já conhecidos. Também
é proposto um método baseado na técnica SIFT. Os processos
relativos à obtenção
de imagens, avaliação, criação do grafo, e prosseguimento
dos passos citados
continua até que o robô tenha mapeado o ambiente com nível
pré-especificado de
detalhes. O conjunto de nós e imagens obtidos são
combinados de modo a se criar
um modelo em grafo do ambiente. Seguindo os caminhos, nó a
nó, um robô pode
navegar pelo ambiente já explorado. O método é
particularmente adequado para
ambientes planos. As componentes do algoritmo proposto
foram desenvolvidas e
testadas no presente trabalho. Resultados experimentais
mostrando a eficácia dos
métodos propostos são apresentados. / [en] As the autonomy of personal service robotic systems
increases so has their
need to interact with their environment. The most basic
interaction a robotic agent
may have with its environment is to sense and navigate
through it. For many
applications it is not usually practical to provide robots
in advance with valid
geometric models of their environment. The robot will need
to create these models
by moving around and sensing the environment, while
minimizing the complexity
of the required sensing hardware. This work proposes an
entropy-based iterative
algorithm to plan the robot´s visual exploration strategy,
enabling it to most
efficiently build a graph model of its environment. The
algorithm is based on
determining the information present in sub-regions of a 2-
D panoramic image of
the environment from the robot´s current location using a
single camera fixed on
the mobile robot. Using a metric based on Shannon s
information theory, the
algorithm determines potential locations of nodes from
which to further image the
environment. Using a Visual Tracking process based on SIFT
(Scale Invariant
Feature Transform), the algorithm helps navigate the robot
to each new node,
where the imaging process is repeated. An invariant
transform (based on Fourier
and Mellin) and tracking process is used to guide the
robot back to a previous
node. Also, an SIFT based method is proposed to accomplish
such task. This
imaging, evaluation, branching and retracing its steps
continues until the robot has
mapped the environment to a pre-specified level of detail.
The set of nodes and
the images taken at each node are combined into a graph to
model the
environment. By tracing its path from node to node, a
service robot can navigate
around its environment. This method is particularly well
suited for flat-floored
environments. The components of the proposed algorithm
were developed and
tested. Experimental results show the effectiveness of the
proposed methods.
|
422 |
Fusão de informações obtidas a partir de múltiplas imagens visando à navegação autônoma de veículos inteligentes em abiente agrícola / Data fusion obtained from multiple images aiming the navigation of autonomous intelligent vehicles in agricultural environmentUtino, Vítor Manha 08 April 2015 (has links)
Este trabalho apresenta um sistema de auxilio à navegação autônoma para veículos terrestres com foco em ambientes estruturados em um cenário agrícola. É gerada a estimativa das posições dos obstáculos baseado na fusão das detecções provenientes do processamento dos dados de duas câmeras, uma estéreo e outra térmica. Foram desenvolvidos três módulos de detecção de obstáculos. O primeiro módulo utiliza imagens monoculares da câmera estéreo para detectar novidades no ambiente através da comparação do estado atual com o estado anterior. O segundo módulo utiliza a técnica Stixel para delimitar os obstáculos acima do plano do chão. Por fim, o terceiro módulo utiliza as imagens térmicas para encontrar assinaturas que evidenciem a presença de obstáculo. Os módulos de detecção são fundidos utilizando a Teoria de Dempster-Shafer que fornece a estimativa da presença de obstáculos no ambiente. Os experimentos foram executados em ambiente agrícola real. Foi executada a validação do sistema em cenários bem iluminados, com terreno irregular e com obstáculos diversos. O sistema apresentou um desempenho satisfatório tendo em vista a utilização de uma abordagem baseada em apenas três módulos de detecção com metodologias que não tem por objetivo priorizar a confirmação de obstáculos, mas sim a busca de novos obstáculos. Nesta dissertação são apresentados os principais componentes de um sistema de detecção de obstáculos e as etapas necessárias para a sua concepção, assim como resultados de experimentos com o uso de um veículo real. / This work presents a support system to the autonomous navigation for ground vehicles with focus on structured environments in an agricultural scenario. The estimated obstacle positions are generated based on the fusion of the detections from the processing of data from two cameras, one stereo and other thermal. Three modules obstacle detection have been developed. The first module uses monocular images of the stereo camera to detect novelties in the environment by comparing the current state with the previous state. The second module uses Stixel technique to delimit the obstacles above the ground plane. Finally, the third module uses thermal images to find signatures that reveal the presence of obstacle. The detection modules are fused using the Dempster-Shafer theory that provides an estimate of the presence of obstacles in the environment. The experiments were executed in real agricultural environment. System validation was performed in well-lit scenarios, with uneven terrain and different obstacles. The system showed satisfactory performance considering the use of an approach based on only three detection modules with methods that do not prioritize obstacle confirmation, but the search for new ones. This dissertation presents the main components of an obstacle detection system and the necessary steps for its design as well as results of experiments with the use of a real vehicle.
|
423 |
Arquitetura híbrida para robôs móveis baseada em funções de navegação com interação humana. / Mobile robot architecture based on navigation function with human interaction.Grassi Júnior, Valdir 19 May 2006 (has links)
Existem aplicações na área da robótica móvel em que, além da navegação autônoma do robô, é necessário que um usuário humano interaja no controle de navegação do robô. Neste caso, considerado como controle semi-autônomo, o usuário humano têm a possibilidade de alterar localmente a trajetória autônoma previamente planejada para o robô. Entretanto, o sistema de controle inteligente do robô, por meio de um módulo independente do usuário, continuamente evita colisões, mesmo que para isso os comandos do usuário precisem ser modificados. Esta abordagem cria um ambiente seguro para navegação que pode ser usado em cadeiras de rodas robotizadas e veículos robóticos tripulados onde a segurança do ser humano deve ser garantida. Um sistema de controle que possua estas características deve ser baseado numa arquitetura para robôs móveis adequada. Esta arquitetura deve integrar a entrada de comandos de um ser humano com a camada de controle autônomo do sistema que evita colisões com obstáculos estáticos e dinâmicos, e que conduz o robô em direção ao seu objetivo de navegação. Neste trabalho é proposta uma arquitetura de controle híbrida (deliberativa/reativa) para um robô móvel com interação humana. Esta arquitetura, desenvolvida principalmente para tarefas de navegação, permite que o robô seja operado em diferentes níveis de autonomia, possibilitando que um usuário humano compartilhe o controle do robô de forma segura enquanto o sistema de controle evita colisões. Nesta arquitetura, o plano de movimento do robô é representado por uma função de navegação. É proposto um método para combinar um comportamento deliberativo que executa o plano de movimento, com comportamentos reativos definidos no contexto de navegação, e com entradas contínuas de controle provenientes do usuário. O sistema de controle inteligente definido por meio da arquitetura foi implementado em uma cadeira de rodas robotizada. São apresentados alguns dos resultados obtidos por meio de experimentos realizados com o sistema de controle implementado operando em diferentes modos de autonomia. / There are some applications in mobile robotics that require human user interaction besides the autonomous navigation control of the robot. For these applications, in a semi-autonomous control mode, the human user can locally modify the autonomous pre-planned robot trajectory by sending continuous commands to the robot. In this case, independently from the user\'s commands, the intelligent control system must continuously avoid collisions, modifying the user\'s commands if necessary. This approach creates a safety navigation system that can be used in robotic wheelchairs and manned robotic vehicles where the human safety must be guaranteed. A control system with those characteristics should be based on a suitable mobile robot architecture. This architecture must integrate the human user\'s commands with the autonomous control layer of the system which is responsible for avoiding static and dynamic obstacles and for driving the robot to its navigation goal. In this work we propose a hybrid (deliberative/reactive) mobile robot architecture with human interaction. This architecture was developed mainly for navigation tasks and allows the robot to be operated on different levels of autonomy. The user can share the robot control with the system while the system ensures the user and robot\'s safety. In this architecture, a navigation function is used for representing the robot\'s navigation plan. We propose a method for combining the deliberative behavior responsible for executing the navigation plan, with the reactive behaviors defined to be used while navigating, and with the continuous human user\'s inputs. The intelligent control system defined by the proposed architecture was implemented in a robotic wheelchair, and we present some experimental results of the chair operating on different autonomy modes.
|
424 |
Sistema de controle híbrido para robôs móveis autônomosHeinen, Farlei José 28 June 2002 (has links)
Made available in DSpace on 2015-03-05T13:53:43Z (GMT). No. of bitstreams: 0
Previous issue date: 28 / Nenhuma / Neste trabalho foi desenvolvido um sistema de controle robusto para robôs
móveis autônomos que é capaz de operar e de se adaptar a diferentes ambientes e
condições. Para isso foi proposta uma arquitetura de controle híbrida (COHBRA),
integrando as duas principais técnicas de controle robótico (controle deliberativo e
controle reativo). Esta arquitetura de controle utiliza uma abordagem de três camadas
para integrar uma camada vital (controle reativo), uma camada funcional (seqüenciador)
e uma camada deliberativa (controle deliberativo). A comunicação entre as diversas
camadas é realizada através de uma área de memória compartilhada, inspirada na
abordagem Blackboard. A arquitetura de controle possui um esquema de múltiplas
representações internas do ambiente: representação poligonal, representação matricial e
representação topológica / semântica.
O sistema de controle desenvolvido tem a capacidade de navegar em um
ambiente dinâmico, desviando tanto de obstáculos estáticos como de obstáculos móveis / In this work we developed a robust control system for autonomous mobile robots
capable of operating and adapting in various environments and conditions. In order to
accomplish this objective an hybrid control architecture (COHBRA) was proposed,
integrating the two main techniques of robotic control: deliberative control and reactive
control. This control architecture uses a three layers approach to integrate a vital layer
(reactive control), a functional layer (sequencer) and a deliberative layer (deliberative
control). The communication between the three layers uses a shared memory approach,
inspired in the Blackboard approach. The control architecture has a structure of multiple
internal representations of the environment: polygonal representation, matricial
representation and topological/semantic representation.
The control system has the ability to navigate in a dynamic environment,
avoiding static obstacles and unexpected mobile obstacles. The deliberative layer uses
the A* algorithm to calcu
|
425 |
Evolução de estratégias e controle inteligente em sistemas multi-robóticos robustosPessin, Gustavo 22 February 2008 (has links)
Made available in DSpace on 2015-03-05T13:59:42Z (GMT). No. of bitstreams: 0
Previous issue date: 22 / Nenhuma / Este trabalho está relacionado com a aplicação de técnicas de Inteligência Artificial no desenvolvimento de um Sistema Multi-Agente robótico aplicado ao problema da monitoração
e combate a incêndios em áreas florestais. O objetivo macro é
evoluir estratrégias de formação de equipes de combate a incêndio (unidade de controle) e criar métodos robustos de navegação em agentes robóticos (unidades de combate), considerando um ambiente virtual de simulação realística.No sistema proposto, uma equipe de agentes autônomos trabalha cooperativamente a fim de realizar com sucesso a identificação e o combate a incêndios em áreas florestais, sem
intervenção humana. O ambiente virtual 3D suporta uma série de características fundamentais para a simulação realística da operação, como terrenos irregulares, processos naturais e
restrições físicas na criação e uso de robôs móveis. Este ambiente foi implementado através do uso das bibliotecas OSG, ODE e Demeter. A operacão multi-agente depende essencialmente de duas etapas: p / This work is related to the application of Artificial Intelligence techniques to develop a Multi-Agent Robotic System applied to the problem of monitoring wild forest fires and to the
execution of fire fighting actions. Our main goal was to evolve strategies (control unit) in order to define the positioning of the fire-fighting autonomous robotic team and to create robust navigation methods used to control robotic agents (combat units). This work was developed based on simulations accomplished using a realistic 3D virtual environment, specially implemented for this purpose, using the software libraries OSG, Demeter and ODE. In the proposed system, a team of autonomous agents work cooperatively in order to successfully perform the identification and fighting of forest fires, without any human intervention. The 3D virtual environment includes several features for realistic simulation of this task, as for example, adoption of irregular terrains, natural processes simulation (e.g. fire propagation), and simulati
|
426 |
Arquitetura híbrida para robôs móveis baseada em funções de navegação com interação humana. / Mobile robot architecture based on navigation function with human interaction.Valdir Grassi Júnior 19 May 2006 (has links)
Existem aplicações na área da robótica móvel em que, além da navegação autônoma do robô, é necessário que um usuário humano interaja no controle de navegação do robô. Neste caso, considerado como controle semi-autônomo, o usuário humano têm a possibilidade de alterar localmente a trajetória autônoma previamente planejada para o robô. Entretanto, o sistema de controle inteligente do robô, por meio de um módulo independente do usuário, continuamente evita colisões, mesmo que para isso os comandos do usuário precisem ser modificados. Esta abordagem cria um ambiente seguro para navegação que pode ser usado em cadeiras de rodas robotizadas e veículos robóticos tripulados onde a segurança do ser humano deve ser garantida. Um sistema de controle que possua estas características deve ser baseado numa arquitetura para robôs móveis adequada. Esta arquitetura deve integrar a entrada de comandos de um ser humano com a camada de controle autônomo do sistema que evita colisões com obstáculos estáticos e dinâmicos, e que conduz o robô em direção ao seu objetivo de navegação. Neste trabalho é proposta uma arquitetura de controle híbrida (deliberativa/reativa) para um robô móvel com interação humana. Esta arquitetura, desenvolvida principalmente para tarefas de navegação, permite que o robô seja operado em diferentes níveis de autonomia, possibilitando que um usuário humano compartilhe o controle do robô de forma segura enquanto o sistema de controle evita colisões. Nesta arquitetura, o plano de movimento do robô é representado por uma função de navegação. É proposto um método para combinar um comportamento deliberativo que executa o plano de movimento, com comportamentos reativos definidos no contexto de navegação, e com entradas contínuas de controle provenientes do usuário. O sistema de controle inteligente definido por meio da arquitetura foi implementado em uma cadeira de rodas robotizada. São apresentados alguns dos resultados obtidos por meio de experimentos realizados com o sistema de controle implementado operando em diferentes modos de autonomia. / There are some applications in mobile robotics that require human user interaction besides the autonomous navigation control of the robot. For these applications, in a semi-autonomous control mode, the human user can locally modify the autonomous pre-planned robot trajectory by sending continuous commands to the robot. In this case, independently from the user\'s commands, the intelligent control system must continuously avoid collisions, modifying the user\'s commands if necessary. This approach creates a safety navigation system that can be used in robotic wheelchairs and manned robotic vehicles where the human safety must be guaranteed. A control system with those characteristics should be based on a suitable mobile robot architecture. This architecture must integrate the human user\'s commands with the autonomous control layer of the system which is responsible for avoiding static and dynamic obstacles and for driving the robot to its navigation goal. In this work we propose a hybrid (deliberative/reactive) mobile robot architecture with human interaction. This architecture was developed mainly for navigation tasks and allows the robot to be operated on different levels of autonomy. The user can share the robot control with the system while the system ensures the user and robot\'s safety. In this architecture, a navigation function is used for representing the robot\'s navigation plan. We propose a method for combining the deliberative behavior responsible for executing the navigation plan, with the reactive behaviors defined to be used while navigating, and with the continuous human user\'s inputs. The intelligent control system defined by the proposed architecture was implemented in a robotic wheelchair, and we present some experimental results of the chair operating on different autonomy modes.
|
427 |
Apprentissage Intelligent des Robots Mobiles dans la Navigation Autonome / Intelligent Mobile Robot Learning in Autonomous NavigationXia, Chen 24 November 2015 (has links)
Les robots modernes sont appelés à effectuer des opérations ou tâches complexes et la capacité de navigation autonome dans un environnement dynamique est un besoin essentiel pour les robots mobiles. Dans l’objectif de soulager de la fastidieuse tâche de préprogrammer un robot manuellement, cette thèse contribue à la conception de commande intelligente afin de réaliser l’apprentissage des robots mobiles durant la navigation autonome. D’abord, nous considérons l’apprentissage des robots via des démonstrations d’experts. Nous proposons d’utiliser un réseau de neurones pour apprendre hors-ligne une politique de commande à partir de données utiles extraites d’expertises. Ensuite, nous nous intéressons à l’apprentissage sans démonstrations d’experts. Nous utilisons l’apprentissage par renforcement afin que le robot puisse optimiser une stratégie de commande pendant le processus d’interaction avec l’environnement inconnu. Un réseau de neurones est également incorporé et une généralisation rapide permet à l’apprentissage de converger en un certain nombre d’épisodes inférieur à la littérature. Enfin, nous étudions l’apprentissage par fonction de récompenses potentielles compte rendu des démonstrations d’experts optimaux ou non-optimaux. Nous proposons un algorithme basé sur l’apprentissage inverse par renforcement. Une représentation non-linéaire de la politique est désignée et la méthode du max-margin est appliquée permettant d’affiner les récompenses et de générer la politique de commande. Les trois méthodes proposées sont évaluées sur des robots mobiles afin de leurs permettre d’acquérir les compétences de navigation autonome dans des environnements dynamiques et inconnus / Modern robots are designed for assisting or replacing human beings to perform complicated planning and control operations, and the capability of autonomous navigation in a dynamic environment is an essential requirement for mobile robots. In order to alleviate the tedious task of manually programming a robot, this dissertation contributes to the design of intelligent robot control to endow mobile robots with a learning ability in autonomous navigation tasks. First, we consider the robot learning from expert demonstrations. A neural network framework is proposed as the inference mechanism to learn a policy offline from the dataset extracted from experts. Then we are interested in the robot self-learning ability without expert demonstrations. We apply reinforcement learning techniques to acquire and optimize a control strategy during the interaction process between the learning robot and the unknown environment. A neural network is also incorporated to allow a fast generalization, and it helps the learning to converge in a number of episodes that is greatly smaller than the traditional methods. Finally, we study the robot learning of the potential rewards underneath the states from optimal or suboptimal expert demonstrations. We propose an algorithm based on inverse reinforcement learning. A nonlinear policy representation is designed and the max-margin method is applied to refine the rewards and generate an optimal control policy. The three proposed methods have been successfully implemented on the autonomous navigation tasks for mobile robots in unknown and dynamic environments.
|
428 |
Decentralized control of multi-agent systems : a hybrid formalism / Commande décentralisée de systèmes multi agents : un formalisme hybrideBorzone, Tommaso 09 September 2019 (has links)
Au cours des dernières années, les problèmes multi-agents ont été étudiés de manière intensive par la communauté de la théorie du contrôle. L'un des sujets les plus populaires est le problème de consensus où un groupe d'agents parvient à un accord sur la valeur d'un certain paramètre ou d’une variable. Dans ce travail, nous nous concentrons sur le consensus des réseaux d'agents avec une dynamique non linéaire de poursuite de référence. Nous utilisons des interactions sporadiques modélisées par la détection relative, pour traiter le consensus décentralisé des références. La référence est donc utilisée pour alimenter la dynamique de poursuite de chaque agent. L'analyse de stabilité du système globale a nécessitée l'utilisation d'outils théoriques propre de la théorie des systèmes hybrides, en raison de la double nature de l'approche en deux étapes. L'analyse est effectuée en tenant compte de différents scénarios de topologie et interactions. Pour chaque cas, une condition suffisante de stabilité est fournie, en termes de temps minimum autorisé entre deux mises à jour de référence consécutives. Le cadre proposé est appliqué aux missions de rendez-vous et de réalisation de formation pour les robots mobiles non-holonomes. Le même problème est abordé dans le contexte d'une application réelle sur le terrain, à savoir un système de gestion de flotte pour un groupe de véhicules robotisés déployés dans un environnement industriel à des fins de surveillance et de collecte de données. Le développement d'une telle application a été motivé par le fait que cette thèse s'inscrit dans le cadre du projet FFLOR, développé par le département de recherche technologique du CEA tech. / Over the last years, multi-agents problems have been extensively studied from the control theory community. One of the most popular multi-agents control topics is the consensus problem where a group of agents reaches an agreement over the value of a certain parameter or variable. In this work we focus our attention on the consensus problem of networks of non-linear reference tracking agents. In first place, we use sporadic interactions modeled by relative sensing to deal with the decentralized consensus of the references. The reference is therefore feeded the tracking dynamics of each agent. Differently from existent works, the stability analysis of the overall system required the usage of hybrid systems theory tools, due to dual nature of the two stages approach. The analysis is carried out considering different scenarios of network topology and interactions. For each case a stability sufficient condition in terms of the minimum allowed time between two consecutive reference updates is provided. The proposed framework is applied to the rendez-vous and formation realisation tasks for non-holonomic mobile robots, which appear among the richest research topics in recent years. The same problem is addressed in the context of a real field application, namely a fleet management system for a group of robotic vehicles deployable in an industrial environment for monitoring and data collection purpose. The development of such application was motivated by the fact that this thesis is part of the Future of Factory Lorraine (FFLOR) project, developed by the technological research department of the Commissariat à l'énergie atomique et aux énergies alternatives (CEA tech).
|
429 |
A study of human-robot interaction with an assistive robot to help people with severe motor impairmentsChoi, Young Sang 06 July 2009 (has links)
The thesis research aims to further the study of human-robot interaction (HRI) issues, especially regarding the development of an assistive robot designed to help individuals possessing motor impairments. In particular, individuals with amyotrophic lateral sclerosis (ALS), represent a potential user population that possess an array of motor impairment due to the progressive nature of the disease. Through review of the literature, an initial target for robotic assistance was determined to be object retrieval and delivery tasks to aid with dropped or otherwise unreachable objects, which represent a common and significant difficulty for individuals with limited motor capabilities. This thesis research has been conducted as part of a larger, collaborative project between the Georgia Institute of Technology and Emory University. To this end, we developed and evaluated a semi-autonomous mobile healthcare service robot named EL-E. I conducted four human studies involving patients with ALS with the following objectives: 1) to investigate and better understand the practical, everyday needs and limitations of people with severe motor impairments; 2) to translate these needs into pragmatic tasks or goals to be achieved through an assistive robot and reflect these needs and limitations into the robot's design; 3) to develop practical, usable, and effective interaction mechanisms by which the impaired users can control the robot; and 4) and to evaluate the performance of the robot and improve its usability. I anticipate that the findings from this research will contribute to the ongoing research in the development and evaluation of effective and affordable assistive manipulation robots, which can help to mitigate the difficulties, frustration, and lost independence experienced by individuals with significant motor impairments and improve their quality of life.
|
430 |
A proposal of a behavior-based control architecture with reinforcement learning for an autonomous underwater robotCarreras Pérez, Marc 16 September 2003 (has links)
Aquesta tesi proposa l'ús d'un seguit de tècniques pel control a alt nivell d'un robot autònom i també per l'aprenentatge automàtic de comportaments. L'objectiu principal de la tesis fou el de dotar d'intel·ligència als robots autònoms que han d'acomplir unes missions determinades en entorns desconeguts i no estructurats. Una de les premisses tingudes en compte en tots els passos d'aquesta tesis va ser la selecció d'aquelles tècniques que poguessin ésser aplicades en temps real, i demostrar-ne el seu funcionament amb experiments reals. El camp d'aplicació de tots els experiments es la robòtica submarina.En una primera part, la tesis es centra en el disseny d'una arquitectura de control que ha de permetre l'assoliment d'una missió prèviament definida. En particular, la tesis proposa l'ús de les arquitectures de control basades en comportaments per a l'assoliment de cada una de les tasques que composen la totalitat de la missió. Una arquitectura d'aquest tipus està formada per un conjunt independent de comportaments, els quals representen diferents intencions del robot (ex.: "anar a una posició", "evitar obstacles",...). Es presenta una recerca bibliogràfica sobre aquest camp i alhora es mostren els resultats d'aplicar quatre de les arquitectures basades en comportaments més representatives a una tasca concreta. De l'anàlisi dels resultats se'n deriva que un dels factors que més influeixen en el rendiment d'aquestes arquitectures, és la metodologia emprada per coordinar les respostes dels comportaments. Per una banda, la coordinació competitiva és aquella en que només un dels comportaments controla el robot. Per altra banda, en la coordinació cooperativa el control del robot és realitza a partir d'una fusió de totes les respostes dels comportaments actius. La tesis, proposa un esquema híbrid d'arquitectura capaç de beneficiar-se dels principals avantatges d'ambdues metodologies.En una segona part, la tesis proposa la utilització de l'aprenentatge per reforç per aprendre l'estructura interna dels comportaments. Aquest tipus d'aprenentatge és adequat per entorns desconeguts i el procés d'aprenentatge es realitza al mateix temps que el robot està explorant l'entorn. La tesis presenta també un estat de l'art d'aquest camp, en el que es detallen els principals problemes que apareixen en utilitzar els algoritmes d'aprenentatge per reforç en aplicacions reals, com la robòtica. El problema de la generalització és un dels que més influeix i consisteix en permetre l'ús de variables continues sense augmentar substancialment el temps de convergència. Després de descriure breument les principals metodologies per generalitzar, la tesis proposa l'ús d'una xarxa neural combinada amb l'algoritme d'aprenentatge per reforç Q_learning. Aquesta combinació proporciona una gran capacitat de generalització i una molt bona disposició per aprendre en tasques de robòtica amb exigències de temps real. No obstant, les xarxes neurals són aproximadors de funcions no-locals, el que significa que en treballar amb un conjunt de dades no homogeni es produeix una interferència: aprendre en un subconjunt de l'espai significa desaprendre en la resta de l'espai. El problema de la interferència afecta de manera directa en robòtica, ja que l'exploració de l'espai es realitza sempre localment. L'algoritme proposat en la tesi té en compte aquest problema i manté una base de dades representativa de totes les zones explorades. Així doncs, totes les mostres de la base de dades s'utilitzen per actualitzar la xarxa neural, i per tant, l'aprenentatge és homogeni.Finalment, la tesi presenta els resultats obtinguts amb la arquitectura de control basada en comportaments i l'algoritme d'aprenentatge per reforç. Els experiments es realitzen amb el robot URIS, desenvolupat a la Universitat de Girona, i el comportament après és el seguiment d'un objecte mitjançant visió per computador. La tesi detalla tots els dispositius desenvolupats pels experiments així com les característiques del propi robot submarí. Els resultats obtinguts demostren la idoneïtat de les propostes en permetre l'aprenentatge del comportament en temps real. En un segon apartat de resultats es demostra la capacitat de generalització de l'algoritme d'aprenentatge mitjançant el "benchmark" del "cotxe i la muntanya". Els resultats obtinguts en aquest problema milloren els resultats d'altres metodologies, demostrant la millor capacitat de generalització de les xarxes neurals.
|
Page generated in 0.0403 seconds