Spelling suggestions: "subject:"robin""
401 |
Uma arquitetura híbrida aplicada em problemas de aprendizagem por reforço / A hybrid architecture to address reinforcement learning problemsArruda, Rodrigo Lopes Setti de 02 July 2012 (has links)
Orientador: Fernando José Von Zuben / Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação / Made available in DSpace on 2018-08-20T00:09:41Z (GMT). No. of bitstreams: 1
Arruda_RodrigoLopesSettide_M.pdf: 2295891 bytes, checksum: 4f5f4bc8f219b0c3c27239520027d496 (MD5)
Previous issue date: 2012 / Resumo: Com o uso de sistemas cognitivos em uma crescente gama de aplicações, criou-se uma grande expectativa e elevada demanda por máquinas cada vez mais autônomas, inteligentes e criativas na solução de problemas reais. Em diversos casos, os desafios demandam capacidade de aprendizado e adaptação. Este trabalho lida com conceitos de aprendizagem por reforço e discorre sobre as principais abordagens de solução e variações de problemas. Em seguida, constrói uma proposta híbrida incorporando outras ideias em aprendizagem de máquina, validando-a com experimentos simulados. Os experimentos permitem apontar as principais vantagens da metodologia proposta, a qual está fundamentada em sua capacidade de lidar com cenários de espaços contínuos e, também, de aprender uma política ótima enquanto segue outra, exploratória. A arquitetura proposta é híbrida, baseada em uma rede neural perceptron multi-camadas acoplada a um aproximador de funções denominado wirefitting. Esta arquitetura é coordenada por um algoritmo adaptativo e dinâmico que une conceitos de programação dinâmica, análise de Monte Carlo, aprendizado por diferença temporal e elegibilidade. O modelo proposto é utilizado para resolver problemas de controle ótimo, por meio de aprendizagem por reforço, em cenários com variáveis contínuas e desenvolvimento não-linear. Duas instâncias diferentes de problemas de controle, reconhecidas na literatura pertinente, são apresentadas e testadas com a mesma arquitetura / Abstract: With the evergrowing use of cognitive systems in various applications, it has been created a high expectation and a large demand for machines more and more autonomous, intelligent and creative in real world problem solving. In several cases, the challenges ask for high adaptive and learning capability. This work deals with the concepts of reinforcement learning, and reasons on the main solution approaches and problem variations. Subsequently, it builds a hybrid proposal incorporating other machine learning ideas, so that the proposal is validated with simulated experiments. The experiments allow to point out the main advantages of the proposed methodology, founded on its capability to handle continuous space environments, and also to learn an optimal policy while following an exploratory policy. The proposed architecture is hybrid in the sense that it is based on a multi-layer perceptron neural network coupled with a function approximator called wire-fitting. The referred architecture is coordinated by a dynamic and adaptive algorithm which merges concepts from dynamic programming, Monte Carlo analysis, temporal difference learning, and eligibility. The proposed model is used to solve optimal control problems, by means of reinforcement learning, in scenarios endowed with continuous variables and nonlinear development. Two different instances of control problems, well discussed in the pertinent literature, are presented and tested with the same architecture / Mestrado / Engenharia de Computação / Mestre em Engenharia Elétrica
|
402 |
Odometria visual e fusão de sensores no problema de localização e mapeamento simultâneo de ambientes exteriores / Visual odometry and sensor fusion in simultaneous localization and mapping problem of outdoors environmentsDelgado Vargas, Jaime Armando, 1986- 28 August 2018 (has links)
Orientador: Paulo Roberto Gardel Kurka / Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Mecânica / Made available in DSpace on 2018-08-28T12:48:00Z (GMT). No. of bitstreams: 1
DelgadoVargas_JaimeArmando_D.pdf: 6984853 bytes, checksum: 4647b847de6d3abb110923a021a6f376 (MD5)
Previous issue date: 2015 / Resumo: A localização de robôs móveis é foco de estudo em diferentes grupos de pesquisa ao redor do mundo. Robôs móveis são equipados com diferentes sensores, utilizando uma variedade de métodos de localização para as tarefas de exploração de ambientes desconhecidos ou para seguir uma trajetória predefinida. Este trabalho apresenta a investigação e implementação de um método robusto e eficiente da estimativa de movimento utilizando visão computacional, conhecido como odometria visual. Também, é estudada a fusão de estimativas de movimento de diferentes sensores através da técnica do filtro de Kalman. Neste trabalho utilizam-se câmeras estereoscópicas com lentes fixas de 9mm e simulações do movimento de uma câmera no ambiente 3D-Max. A validação experimental dos algoritmos é feita em uma plataforma robótica tipo Seekur Jr equipada com Lasers, GPS, encoders e câmeras estereoscópicas. O movimento do robô é estimado pelos diferentes sensores gerando redundância de localização Os algoritmos de odometria visual são validados em ambientes de interiores e exteriores. A velocidade de processamento dos métodos é comparada usando em diferentes processadores de tipo CPU e GPU, indicando a possibilidade um sistema de realização de odometria visual em tempo real / Abstract: The localization of mobile robots problem is addressed to a number of research groups around the world. Mobile robots are equipped with different sensors, using a variety of methods of localization in the exploration of unknown environments or following a pre-defined trajectory. The present work investigates and implements a robust method of estimation of movement using computer vision, known as visual odometry. The work investigates also the results of fusion of the estimates of movement obtained from different sensors, using the Kalman filter technique. Visual odometry uses stereoscopic vision techniques with real time computing in graphic processing units (GPU). Stereoscopic cameras with fixed 9mm lens and movement simulations in the 3d-Max computer environment are used in the present work. Experimental validation of the visual odometry algorithms is made in a Sekur Jr mobile robot platform, equipped with lasers, GPS, wheel encoders and stereoscopic cameras. Movements of the robot are estimated from the different sensors, yielding redundant localization information. The information from such sensors are fused together through the Kalman filter. Visual odometry algorithms are tested in indoors and outdoors navigation experiments. Processing speed of the methods is compared using different processing units: CPU and GPU, indicating the possibility of performing real time visual odometry / Doutorado / Mecanica dos Sólidos e Projeto Mecanico / Doutor em Engenharia Mecânica
|
403 |
Coordenação ótima de múltiplos robôs de serviço em tarefas persistentesTeixeira, Alexandre Menezes 23 February 2015 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2015-12-16T17:29:20Z
No. of bitstreams: 1
alexandremenezesteixeira.pdf: 8409444 bytes, checksum: df76f8cbe4e829db629062da1fd25bc7 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2015-12-17T11:07:03Z (GMT) No. of bitstreams: 1
alexandremenezesteixeira.pdf: 8409444 bytes, checksum: df76f8cbe4e829db629062da1fd25bc7 (MD5) / Made available in DSpace on 2015-12-17T11:07:03Z (GMT). No. of bitstreams: 1
alexandremenezesteixeira.pdf: 8409444 bytes, checksum: df76f8cbe4e829db629062da1fd25bc7 (MD5)
Previous issue date: 2015-02-23 / FAPEMIG - Fundação de Amparo à Pesquisa do Estado de Minas Gerais / Monitorar um ambiente através de múltiplos robôs autônomos em um espaço compartilhado
sem que haja colisões é um grande desafio nos dias atuais. Várias pesquisas na área de
robótica tem sido feitas para desenvolver essa tarefa. Sendo assim, este trabalho atua na
coordenação de movimento de múltiplos robôs de serviço percorrendo de forma cíclica
caminhos que se interceptam.
É desejável que os robôs sigam pelos caminhos inicialmente planejados sem mudá-los
durante a missão. Para evitar possíveis colisões, um controlador central foi desenvolvido
para planejar as velocidades médias que os robôs deverão efetuar em cada trecho do
circuito, maximizando o menor intervalo de tempo t que eles cruzam por um mesmo
ponto de colisão.
A solução centralizada utilizada neste trabalho foi modelada como um problema Mixed
Interger Linear Programming (MILP) sendo usado o software Linear Interactive and
General Optimizer (LINGO) para maximizar t e encontrar para cada robô os tempos de
percurso para cada parte do caminho.
Foi desenvolvida uma aplicação em C++ capaz de iniciar o processo de otimização e
receber os tempos otimizados de percurso de cada robô, usados para determinar as suas
respectivas velocidades médias. Além disso, esta rotina de programação teve como objetivo
realizar o controle dos robôs, navegando-os com o auxílio do framework Robot Operating
System (ROS) integrado ao LINGO.
Para localizá-los no espaço utilizou-se um pacote de visão computacional do ROS denominado
ARPOSE, com o intuito de descobrir suas respectivas posições e orientações em
relação à um eixo de referência global.
Por fim, simulações e testes reais foram realizados sobre um grupo de robôs para demonstrar
a eficácia da abordagem. Os resultados obtidos foram satisfatórios, o que possibilitou
atingir os objetivos propostos. / Monitoring an environment using multi-autonomous robots operating in a shared workspace
without collisions with each other is a great challenge nowadays. Many researchs have been
done to develop this important task in robotics. Thus, this thesis deals with coordinating
the motions of multiple working robots traversing periodic intersecting paths.
It is desired that mobile robots following the initially designed paths without change them
during the mission. To avoid any collision a centralized controller was developed to planner
the velocity profile of the robots over the predefined paths, maximizing the smallest time
margin t that the robots cross over a same collision point.
The centralized solution used in this work was modeled as a Mixed Integer Linear Programming
(MILP) problem using the Linear Interactive and General Optimizer (LINGO)
software to maximize t and to find for each robot the sub-path traversal time.
It was developed a C++ code capable to start the optimization process and receive for
each robot the optimized traversal times, used to calculate their respectives average speeds.
Besides, this code was used to control the robots, which was done through the Robot
Operating System (ROS) framework integrated with LINGO.
A computer vision ROS package named ARPOSE was used to localize the robots during
the task, calculating their poses relative the global reference frame.
Finally, to demonstrate the effectiveness of the approach, simulantions and real tests was
performed on mobile robots group. The results obtained were satisfactory, which allowed
to achieve the goals.
|
404 |
Coordenação ótima de múltiplos robôs de serviço e de recarga em tarefas persistentesJosé, Cláudio Maia Alves 20 February 2015 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2016-01-07T17:45:41Z
No. of bitstreams: 1
claudiomaiaalvesjose.pdf: 3912964 bytes, checksum: 205414dab15935347aeda610f25295b9 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2016-01-25T16:53:03Z (GMT) No. of bitstreams: 1
claudiomaiaalvesjose.pdf: 3912964 bytes, checksum: 205414dab15935347aeda610f25295b9 (MD5) / Made available in DSpace on 2016-01-25T16:53:03Z (GMT). No. of bitstreams: 1
claudiomaiaalvesjose.pdf: 3912964 bytes, checksum: 205414dab15935347aeda610f25295b9 (MD5)
Previous issue date: 2015-02-20 / Múltiplos robôs autônomos executam tarefas que necessitam de uma cooperação entre
os mesmos. Este trabalho trata um problema de coordenação de robôs móveis terrestres,
os quais estão divididos em dois grupos: os robôs de serviço e os robôs de recarga. Os
múltiplos robôs de serviço devem percorrer caminhos fechados que se interceptam em
determinados pontos. Um controlador de alto nível atua diretamente nas velocidades
médias destes veículos, evitando possíveis colisões e garantindo a segurança em suas tarefas.
Os caminhos são percorridos em ciclos, os quais devem ser comensuráveis e de caráter
persistente, ou seja, executados num horizonte de planejamento “infinito”, o que ultrapassa
as limitações de cargas de suas baterias. Para isso, é introduzido um grupo de robôs
dedicados que atua no processo de troca das baterias, tarefa esta designada aos robôs
de recarga. A estratégia utilizada para que todos os robôs de serviço sejam recarregados
é baseada em grafo. A coordenação dos múltiplos robôs (serviço e recarga) é resolvida
por meio de dois otimizadores, ambos implementados com o solver LINGO, integrados
ao ROS (Robot Operating System) utilizando a linguagem C++. Um dos otimizadores
coordena o movimento dos robôs de serviço com o objetivo de evitar colisões entre os
mesmos. Os resultados gerados nesta primeira etapa de otimização, são utilizados para que
os dois grupos robóticos estejam em sintonia durante o processo de recarga. Os caminhos
percorridos pelos robôs de serviço são constituídos de pontos nos quais podem ocorrer o
contato destes com os robôs de recarga. Desta maneira, a segunda parte da otimização
consiste em determinar os caminhos ótimos a serem traçados pelos robôs de recarga. Este
problema é resolvido por meio de um programa linear inteiro misto (MILP), o qual tem
por objetivo minimizar o tempo global para a tarefa de recarga. / Autonomous multi-robots can be used to perform tasks that require cooperation between
them. This work consists at the coordination problem of land mobile robots, divided
into two groups: working robots and recharge robots. The working multi-robots must
travel by closed paths that intersect each other. A high-level controller acts directly
on average speeds of these vehicles, avoiding possible collisions and ensuring security
in their tasks. The paths are traversed in cycles, which should be commensurate and
persistents, executed on a infinite planning horizon, which overcomes the limitations of
charges your batteries. For this is added one dedicated group of robots that operates in
the battery exchange process. This group is called recharge robots. The strategy used to
recharge all working robots is based on graph. The coordination of multiples robots is
resolved through two optimizers, both implemented with LINGO solver, integrated with
ROS (Robot Operating System) using the C++ language. One of optmizers coordinates
the movement of working robots in order to avoid collisions between them. The results
obtained in this first optimization step are used for the two robotic groups, became they
must remain in line during the charging process. Thus, the second part of the optimization
is to determine the optimum paths to be traced by the recharge robots. This problem is
solved by a mixed integer linear program (MILP), with the objective of minimizing the
overall time for recharging task.
|
405 |
Análise de risco de colisão usando redes bayesianas / Colision risk assessment using Bayesian networksAndré Carmona Hernandes 23 August 2012 (has links)
A segurança no tráfego de carros é um assunto em foco nos dias de hoje e, dentro dele, podem-se citar os sistemas de auxílio ao motorista que vêm sendo desenvolvidos com a finalidade de reduzir o grande número de fatalidades em acidentes de trânsito. Tais sistemas de auxílio buscam mitigar falhas humanas como falta de atenção e imprudência. Visto isso, o projeto SENA, desenvolvido pelo Laboratório de Robótica Móvel da Escola de Engenharia de São Carlos, busca contribuir com a evolução dessa assistência ao motorista. O presente trabalho realiza um estudo sobre uma técnica de inteligência artificial chamada de Redes Bayesianas. Essa técnica merece atenção em virtude de sua capacidade de tratar dados incertos em forma de probabilidades. A rede desenvolvida por esse trabalho utiliza, como dados de entrada, os classificadores em desenvolvimento no projeto SENA e tem como resposta um comportamento que o veículo deve executar, por um ser humano ou por um planejador de trajetórias. Em função da alta dimensionalidade do problema abordado, foram realizados dois experimentos em ambiente simulado de duas situações distintas. A primeira, um teste de frenagem próximo a um ponto de intersecção e a segunda, um cenário de entroncamento. Os testes feitos com a rede indicam que classificadores pouco discriminantes deixam o sistema mais propenso a erros e que erros na localização do ego-veículo afetam mais o sistema se comparado a erros na localização dos outros veículos. Os experimentos realizados mostram a necessidade de um sistema de tempo real e um hardware mais adequado para tratar as informações mais rapidamente / The safety of cars in traffic scenarios is being addressed on the past few years. One of its topics is the Advanced Driver-Assistance Systems which have been developed to reduce the fatality numbers of traffic accidents. These systems try to decrease human failures, such as imprudence and lack of attention while driving. For these reasons, the SENA project, in progress on the Mobile Robotics Laboratory at the Sao Carlos School of Engineering (EESC), aims to contribute for the evolution of these assistance systems. This work studies an artificial intelligence technique called Bayesian Networks. It deserves our attention due to its capability of handling uncertainties with probability distributions. The network developed in this Masters Thesis has, as input, the result of the classifiers used on SENA project and has, as output, a behavior which has to be performed by the vehicle with a driver or autonomously by the means of a path planner. Due to the high dimensionality of this issue, two different tests have been carried out. The first one was a braking experiment near a intersection point and the other one was a T-junction scenario. The tests made indicate that weak classifiers leaves the system more instable and error-prone and localization errors of the ego-vehicle have a stronger effect than just localization errors of other traffic participants. The experiments have shown that there is a necessity for a real-time system and a hardware more suitable to deal quickly with the information
|
406 |
Controle de fixação atentivo para uma cabeça robótica com visão binocular / Attentive gaze control for a binocular robot headRoos, André Filipe 29 August 2016 (has links)
A pesquisa em visão computacional ainda está distante de replicar a adaptabilidade e o desempenho do Sistema Visual Humano. Grande parte das técnicas consolidadas são válidas apenas em cenas estáticas e condições restritivas. Cabeças robóticas representam um avanço em flexibilidade, pois carregam câmeras que podem ser movimentadas livremente para a exploração dos arredores. A observação artificial de um ambiente dinâmico exige a solução de pelo menos dois problemas: determinar quais informações perceptuais relevantes extrair dos sensores e como controlar seu movimento para mudar e manter a fixação de alvos com forma e movimento arbitrários. Neste trabalho, um sistema de controle de fixação binocular geral é proposto, e o subsistema responsável pela seleção de alvos e fixação de deslocamentos laterais é projetado, experimentado e avaliado em uma cabeça robótica com quatro graus de liberdade. O subsistema emprega um popular modelo de atenção visual de baixo nível para detectar o ponto mais saliente da cena e um controlador proporcional-integral gera um movimento conjuntivo das duas câmeras para centralizá-lo na imagem da câmera esquerda, assumida como dominante. O desenvolvimento do sistema envolveu primeiramente a modelagem física detalhada do mecanismo de pan e tilt das câmeras. Então, a estrutura linearizada obtida foi ajustada por mínimos quadrados aos dados experimentais de entrada-saída. Por fim, os ganhos do controlador foram sintonizados por otimização e ajuste manual. A implementação em C++ com a biblioteca OpenCV permitiu operação em tempo real a 30 Hz. Experimentos demonstram que o sistema é capaz de fixar alvos estáticos e altamente salientes sem conhecimento prévio ou fortes suposições. Alvos em movimento harmônico são perseguidos naturalmente, embora com defasamento. Em cenas visualmente densas, onde múltiplos alvos em potencial competem pela atenção, o sistema pode apresentar comportamento oscilatório, exigindo o ajuste fino dos pesos do algoritmo para operação suave. A adição de um controlador para o pescoço e de um controlador de vergência para a compensação de deslocamentos em profundidade são os próximos passos rumo a um observador artificial genérico. / Computer vision research is still far from replicating the adaptability and performance of the Human Visual System. Most of its consolidated techniques are valid only over static scenes and restrictive conditions. Robot heads represent an advance in terms of flexibility by carrying cameras that can be freely moved to explore the surroundings. Artificial observation of dynamic environments requires the solution of at least two problems: to determine what is the relevant perceptual information to be extracted from the sensors and how to control their movement in order to shift and hold gaze on targets featuring arbitrary shapes and motions. In this work, a general binocular gaze control system is proposed, and the subsystem responsible for targeting and following lateral displacements is designed, tested and assessed in a four degrees-of-freedom robot head. The subsystem employs a popular low-level visual attention model to detect the most salient point in the scene, and a proportional-integral controller generates a conjunctive movement of the cameras to center it in the left camera image, assumed to be dominant. The development started with a detailed physical modeling of the pan and tilt mechanism that drives the cameras. Then, the linearized structure obtained was fitted via least squares estimation to experimental input-output data. Finally, the controller gains were tuned by optimization and manual adjustment. The OpenCV-based implementation in C++ allowed real-time execution at 30 Hz. Experiments demonstrate that the system is capable of fixating highly salient and static targets without any prior knowledge or strong assumptions. Targets describing harmonic motion are naturally pursued, albeit with a phase shift. In cluttered scenes, where multiple potential targets compete for attention, the system may present oscillatory behavior, requiring fine adjustment of algorithm weights for smooth operation. The addition of a controller for the neck and a vergence controller to compensate for depth displacements are the next steps towards a generic artificial observer.
|
407 |
Alocação de tarefas para a coordenação de robôs heterogêneos aplicados a agricultura de precisão / Task allocation for the coordination heterogeneous robots applied to precision agricultureFraccaroli, Eduardo Sacogne 05 December 2017 (has links)
O Brasil é uma referência mundial na produção e exportação de citros, entretanto esse cultivo pode sofrer diversos problemas e perdas de produtividade por motivos diversos, como por exemplo, pragas. Para reduzir os riscos e perdas, torna-se interessante o uso de sistemas automatizados de monitoramento, justificando a necessidade de realizar a coleta de dados para determinar diversos fatores. Determinadas plantações, como a de citros, não podem ser monitoradas somente via solo ou somente via imagens aéreas, tornando necessário mesclar ambas as abordagens de acordo com o parâmetro a ser monitorado. Para a realização desse monitoramento devem ser utilizados robôs com habilidades distintas, robôs aéreos e robôs terrestres. Assim, é preciso designar as tarefas que cada robô realizará e também coordenar todos os robôs durante a execução do sistema como um todo, visando otimizar o processo de coleta de dados. Esse problema pode ser analisado e modelado como um problema de alocação de tarefas para robôs (Multi-Robot Task Allocation (MRTA)). Para resolver esse problema propõe-se um framework baseado em técnicas de cobertura de conjuntos e em mecanismo de mercado baseado em leilão. Teste simulados são realizados e demonstram que a presente proposta cumpre o papel na alocação das tarefas aos robôs. Além disso, visando a aplicação da solução proposta é projetado e desenvolvido uma plataforma robótica aérea (quadrirotor) de baixo custo utilizando peças prototipadas. Para o controle de estabilidade dessa plataforma, propõe-se um modelo matemático de acordo com os parâmetros inerciais do quadrirotor. Esse quadrirotor é utilizado em diversas aplicações reais, mostrando que o projeto desenvolvido pode ser reproduzido e destinado a execução de tarefas reais, como por exemplo a coleta de dados na agricultura de precisão. / Brazil is a world reference in the production and export of citrus, although this crop can suffer several problems and losses of productivity for diverse reasons, as for example, pests. In order to reduce risks and losses, it is interesting to use automated monitoring systems, justifying the need to perform data collection to determine several factors. Certain plantations, such as citrus plantations, can not be monitored only via soil or only via aerial images, making it necessary to merge both approaches according to the parameter to be monitored. To perform this monitoring, robots with different abilities, such asunmanned aerial vehicle (UAV) and unmanned ground vehicle (UCV) should be used. Therefore, it is necessary to assign the tasks that each robot will perform and also to coordinate all the robots during the execution of the system as a whole, in order to optimize the process of data collection. The problem can be studied and modeled as a task allocation problem for robots (MRTA). To solve this problem we propose a framework based set covering techniques and auction-based market mechanism. Simulated tests are performed and demonstrate that the present proposal fulfills the role in assigning tasks to robots. In addition, aiming at the application of the proposed solution is designed and developed a low cost aerial robotic platform (quadrirotor) which use prototyped parts. This quadrirotor is used in several real applications, showing that the developed project can be reproduced and destined to perform real tasks, such as data collection in precision agriculture.
|
408 |
Uso de heurísticas para a aceleração do aprendizado por reforço. / Heuristically acelerated reinforcement learning.Bianchi, Reinaldo Augusto da Costa 05 April 2004 (has links)
Este trabalho propõe uma nova classe de algoritmos que permite o uso de heurísticas para aceleração do aprendizado por reforço. Esta classe de algoritmos, denominada \"Aprendizado Acelerado por Heurísticas\" (\"Heuristically Accelerated Learning\" - HAL), é formalizada por Processos Markovianos de Decisão, introduzindo uma função heurística H para influenciar o agente na escolha de suas ações, durante o aprendizado. A heurística é usada somente para a escolha da ação a ser tomada, não modificando o funcionamento do algoritmo de aprendizado por reforço e preservando muitas de suas propriedades. As heurísticas utilizadas nos HALs podem ser definidas a partir de conhecimento prévio sobre o domínio ou extraídas, em tempo de execução, de indícios que existem no próprio processo de aprendizagem. No primeiro caso, a heurística é definida a partir de casos previamente aprendidos ou definida ad hoc. No segundo caso são utilizados métodos automáticos de extração da função heurística H chamados \"Heurística a partir de X\" (\"Heuristic from X\"). Para validar este trabalho são propostos diversos algoritmos, entre os quais, o \"Q-Learning Acelerado por Heurísticas\" (Heuristically Accelerated Q-Learning - HAQL), que implementa um HAL estendendo o conhecido algoritmo Q-Learning, e métodos de extração da função heurística que podem ser usados por ele. São apresentados experimentos utilizando os algoritmos acelerados por heurísticas para solucionar problemas em diversos domínios - sendo o mais importante o de navegação robótica - e as heurísticas (pré-definidas ou extraídas) que foram usadas. Os resultados experimentais permitem concluir que mesmo uma heurística muito simples resulta em um aumento significativo do desempenho do algoritmo de aprendizado de reforço utilizado. / This work presents a new class of algorithms that allows the use of heuristics to speed up Reinforcement Learning (RL) algorithms. This class of algorithms, called \"Heuristically Accelerated Learning\" (HAL) is modeled using a convenient mathematical formalism known as Markov Decision Processes. To model the HALs a heuristic function that influences the choice of the actions by the agent during its learning is defined. As the heuristic is used only when choosing the action to be taken, the RL algorithm operation is not modified and many proprieties of the RL algorithms are preserved. The heuristic used in the HALs can be defined from previous knowledge about the domain or be extracted from clues that exist in the learning process itself. In the first case, the heuristic is defined from previously learned cases or is defined ad hoc. In the second case, automatic methods for the extraction of the heuristic function H called \"Heuristic from X\" are used. A new algorithm called Heuristically Accelerated Q-Learning is proposed, among others, to validate this work. It implements a HAL by extending the well-known RL algorithm Q-Learning. Experiments that use the heuristically accelerated algorithms to solve problems in a number of domains - including robotic navigation - are presented. The experimental results allow to conclude that even a very simple heuristic results in a significant performance increase in the used reinforcement learning algorithm.
|
409 |
Técnicas de visão computacional aplicadas ao reconhecimento de cenas naturais e locomoção autônoma em robôs agrícolas móveis / Computer vision techniques applied to natural scenes recognition and autonomous locomotion of agricultural mobile robotsLulio, Luciano Cássio 09 August 2011 (has links)
O emprego de sistemas computacionais na Agricultura de Precisão (AP) fomenta a automação de processos e tarefas aplicadas nesta área, precisamente voltadas à inspeção e análise de culturas agrícolas, e locomoção guiada/autônoma de robôs móveis. Neste contexto, no presente trabalho foi proposta a aplicação de técnicas de visão computacional nas tarefas citadas, desenvolvidas em abordagens distintas, a serem aplicadas em uma plataforma de robô móvel agrícola, em desenvolvimento no NEPAS/EESC/USP. Para o problema de locomoção do robô (primeira abordagem), foi desenvolvida uma arquitetura de aquisição, processamento e análise de imagens com o objetivo de segmentar, classificar e reconhecer padrões de navegação das linhas de plantio, como referências de guiagem do robô móvel, entre plantações de laranja, milho e cana. Na segunda abordagem, tais técnicas de processamento de imagens são aplicadas também na inspeção e localização das culturas laranja (primário) e milho (secundário), para análise de suas características naturais, localização e quantificação. Para as duas abordagens, a estratégia adotada nas etapas de processamento de imagens abrange: filtragem no domínio espacial das imagens adquiridas; pré-processamento nos espaços de cores RGB e HSV; segmentação não supervisionada JSEG customizada à quantização de cores em regiões não homogêneas nestes espaços de cores; normalização e extração de características dos histogramas das imagens pré-processadas para os conjuntos de treinamento e teste através da análise das componentes principais; reconhecimento de padrões e classificação cognitiva e estatística. A metodologia desenvolvida contemplou bases de dados para cada abordagem entre 700 e 900 imagens de cenas naturais sob condições distintas de aquisição, apresentando resultados significativos quanto ao algoritmo de segmentação nas duas abordagens, mas em menor grau em relação à localização de gramíneas, sendo que os milhos requerem outras técnicas de segmentação, que não aplicadas apenas em quantização de regiões não homogêneas. A classificação estatística, Bayes e Bayes Ingênuo, mostrou-se superior à cognitiva RNA e Fuzzy nas duas abordagens, e posterior construção dos mapas de classe no espaço de cores HSV. Neste mesmo espaço de cores, a quantificação e localização de frutos apresentaram melhores resultados que em RGB. Com isso, as cenas naturais nas duas abordagens foram devidamente processadas, de acordo com os materiais e métodos empregados na segmentação, classificação e reconhecimento de padrões, fornecendo características intrínsecas e distintas das técnicas de visão computacional propostas a cada abordagem. / The use of computer systems in Precision Agriculture (PA) promotes the processes automation and its applied tasks, specifically the inspection and analysis of agricultural crops, and guided/autonomous locomotion of mobile robots. In this context, it was proposed in the present work the application of computer vision techniques on such mentioned tasks, developed in different approaches, to be applied in an agricultural mobile robot platform, under development at NEPAS/EESC/USP. For agricultural mobile robot locomotion, an architecture for the acquisition, image processing and analysis was built, in order to segment, classify and recognize patterns of planting rows, as references way points for guiding the mobile robot. In the second approach, such image processing techniques were applied also in the inspection and location of the orange crop (primary) and maize crop (secondary) aiming its natural features, location and quantification. For both mentioned approaches, the adopted image processing steps include: filtering in the spatial domain for acquired images; pre-processing in RGB and HSV color spaces; JSEG unsupervised segmentation algorithm, applied to color quantization in non-homogeneous regions; normalization and histograms feature extraction of preprocessed images for training and test sets, fulfilled by the principal components analysis (PCA); pattern recognition and cognitive and statistical classification. The developed methodology includes sets of 700 and 900 images databases for each approach of natural scenes under different conditions of acquisition, providing great results on the segmentation algorithm, but not as appropriate as in the location of maize grass, considering other segmentation techniques, applied not only in the quantization of non-homogeneous regions. Statistical classification, Bayes and Naive Bayes, outperforms the cognitives Fuzzy and ANN on two approaches and subsequent class maps construction in HSV color space. Quantification and localization of fruits had more accurate results in HSV than RGB. Thus, natural scenes in two approaches were properly processed, according to the materials and methods employed in segmentation, classification and pattern recognition, providing intrinsic and different features of the proposed computer vision techniques to each approach.
|
410 |
Controle robusto de robôs móveis com rodas / Robust control applied to a wheeled mobile robotInoue, Roberto Santos 30 July 2007 (has links)
Nesta dissertação é apresentado um estudo comparativo entre seis controladores H \'infinito\' não lineares aplicados em um robô móvel com rodas. Três estratégias de controle são avaliadas. Na primeira, o modelo do robô é considerado completamente conhecido. Na segunda, o modelo matemático é considerado desconhecido e é realizada uma estimativa baseada em métodos inteligentes. E finalmente, na terceira estratégia, o modelo nominal é conhecido e técnicas inteligentes são usadas para estimar somente incertezas paramétricas do robô. As técnicas inteligentes usadas são baseadas em redes neurais e em lógica fuzzy. Esses controladores são resolvidos através de desigualdades matriciais lineares (DMLs) e equações algébricas de Riccati. Todos os resultados obtidos são baseados em dados experimentais. / This dissertation is present a comparative study between six nonlinear H \'infinity\' controllers applied to a wheeled mobile robot. Three control strategies are adopted. In the first, the model of the robot is considered completely known. In the second, the mathematical model is considered unknown and is accomplished an estimate based on intelligent methods. And finally, in the third strategy, the nominal model is known and intelligent techniques are used only to estimate parametric uncertainties of the robot. The intelligent techniques used are based in neural networks and in fuzzy logic. These controllers are solved via linear matrix inequalities (LMIs) and algebraic Riccati equations. All results obtained are based in experimental data.
|
Page generated in 0.0439 seconds