Return to search

Aprendizado Bayesiano aplicado ao controle de veículos autônomos de grande porte / Bayesian learning applied to the control of heavy-duty autonomous vehicles

O tópico de identificação de sistemas aparece em vários ramos da ciência, com especial importância ao campo de Controle Automático. Entretanto, os problemas encontrados na construção de uma representação precisa de um sistema, como a falta de informações prévias, e as diversas decisões de projeto que devem ser tomadas para a resolução de problemas de identificação de sistemas por meios mais tradicionais, podem ser solucionados através da análise empírica do sistema. Nesse sentido, os processos Gaussianos apresentam-se como uma alternativa viável para a modelagem não-paramétrica de sistemas, trazendo a vantagem da estimação da incerteza do modelo. Para verificar o potencial dos processos Gaussianos em problemas de identificação de sistemas, foi realizada a identificação do modelo longitudinal de um veículo de grande porte, tendo alcançado um desempenho satisfatório, mesmo quando se utilizou poucos dados de treinamento. A partir do modelo aprendido, foi projetado um controlador preditivo baseado em modelo para controlar a velocidade do veículo. O controlador levou em consideração a variância da predição do modelo GP (Gaussian Process - Processos Gaussianos) em consideração durante o processo de otimização do sinal de controle. O controlador proposto alcançou um baixo erro no seguimento da referência, mesmo em situações extremas, como estradas íngremes. Entretanto, em alguns tipos de problemas, o resultado só pode ser mensurado a partir da combinação de uma sequência de ações, ou sinais de controle, aplicados ao longo da execução do processo, como é o caso do problema de direção ecológica (eco-driving). Nesses casos, estratégias que otimizem sinais de controle instantâneos podem não ser viáveis, sendo necessária a utilização de estratégias em que toda a política de controle seja otimizada de uma vez. Além disso, a avaliação do custo, ou execução de todo um episódio do processo, pode ser dispendiosa, é desejável que uma solução seja encontrada com a menor quantidade de interações possíveis com o sistema real. Uma técnica apropriada para essa situação é a Otimização Bayesiana, um algoritmo de otimização caixa-preta bastante eficiente. Porém, um dos problemas dessa solução é a incapacidade de lidar com um grande número de dimensões. Sendo assim, nesse trabalho, foi proposto o Coordinate Descent Bayesian Optimisation, um algoritmo baseado na Otimização Bayesiana, que busca o ótimo em espaços de alta dmensionalidade de maneira mais eficiente pois otimiza cada dimensão individualmente, em um esquema de descida coordenada. / The system identification topic appears in various branches of science, with particular emphasis on Automatic Control field. However, problems encountered in building an accurate representation of a system, such as lack of prior information, and the various design decisions which have to be taken to deal with system identification problems by more traditional means, can be solved through the empirical analysis of the system. In this sense, the Gaussian processes are presented as a viable alternative for non-parametric modelling systems, bringing the advantage of estimating the uncertainty of the model. To investigate the potential of Gaussian processes of system identification problems, identifying the longitudinal model of a large vehicle was performed, achieving reasonable performance even when used little training data. From the obtained model, a Model Predictive Controller was designed to control the vehicle speed. The controller took into account the variance of the GP model prediction on the control signal optimization and achieved low reference tracking error, even on hard conditions, like steep roads. However, in some kinds of problems, the observable outcome can often be described as the combined effect of an entire sequence of actions, or controls, applied throughout its execution. In these cases, strategies to optimise control policies for individual stages of the process might not be applicable, and instead the whole policy might have to be optimised at once. Also, the cost to evaluate the policy\'s performance might also be high, being desirable that a solution can be found with as few interactions with the real system as possible. One appropriate candidate is Bayesian Optimization, a very efficient black-box optimization algorithm. But one of the main problems of this solution is the inability of dealing with a large number of dimensions. For that reason, in this work it was proposed Coordinate Descent Bayesian Optimisation, an algorithm to search more efficiently over high-dimensional policy-parameter spaces with BO, by searching over each dimension individually, in a sequential coordinate descent-like scheme.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-06072018-112445
Date21 February 2018
CreatorsRocha, Fernando Henrique Morais da
ContributorsGrassi Junior, Valdir
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeTese de Doutorado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.0023 seconds