Spelling suggestions: "subject:"aximum margin bplanning"" "subject:"aximum margin deplanning""
1 |
Predição de dados estruturados utilizando a formulação Perceptron com aplicação em planejamento de caminhosCoelho, Maurício Archanjo Nunes 18 June 2010 (has links)
Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-03-07T15:27:21Z
No. of bitstreams: 1
mauricioarchanjonunescoelho.pdf: 2468130 bytes, checksum: 3f05daa8428e367942c4ad560b6375f2 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-03-10T12:19:13Z (GMT) No. of bitstreams: 1
mauricioarchanjonunescoelho.pdf: 2468130 bytes, checksum: 3f05daa8428e367942c4ad560b6375f2 (MD5) / Made available in DSpace on 2017-03-10T12:19:13Z (GMT). No. of bitstreams: 1
mauricioarchanjonunescoelho.pdf: 2468130 bytes, checksum: 3f05daa8428e367942c4ad560b6375f2 (MD5)
Previous issue date: 2010-06-18 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / O problema de planejamento de caminhos apresenta diversas subáreas, muitas das
quais já extensamente abordadas na literatura. Uma dessas áreas em especial é a de determinação
de caminhos, os algoritmos empregados para a solução deste problema dependem
que os custos estipulados para os ambientes ou mapas sejam confiáveis. A dificuldade está
justamente na definição dos custos referentes a cada tipo de área ou terreno nos mapas
a serem examinados. Como se pode observar, o problema mencionado inclui a dificuldade
em se determinar qual o custo de cada característica relevante presente no mapa,
bem como os custos de suas possíveis combinações. A proposta deste trabalho é mostrar
como é feita a predição desses custos em novos ambientes tendo como base a predição
de dados estruturados definindo um aprendizado funcional entre domínios de entrada e
saída, estruturados e arbitrários. O problema de aprendizado em questão é normalmente
formulado como um problema de otimização convexa de máxima margem bastante similar
a formulação de máquinas de vetores suporte multi-classe. Como técnica de solução
realizou-se a implementação do algoritmo MMP (Maximum Margin Planning) (RATLIFF;
BAGNELL; ZINKEVICH, 2006). Como contribuição, desenvolveu-se e implementou-se dois
algoritmos alternativos, o primeiro denominado Perceptron Estruturado e o segundo Perceptron
Estruturado com Margem, ambos os métodos de relaxação baseados na formulação do Perceptron. Os mesmos foram analisados e comparados. Posteriormente temos a exploração
dos ambientes por um agente inteligente utilizando técnicas de aprendizado por
reforço. Tornando todo o processo, desde a análise do ambiente e descoberta de custos,
até sua exploração e planejamento do caminho, um completo processo de aprendizado. / The problem of path planning has several sub-areas, many of which are widely discussed
in the literature. One of these areas in particular is the determination of paths,
the algorithms used to solve this problem depend on the reliability of the estimated costs
in the environments and maps. The difficulty is precisely the definition of costs for each
type of area or land on the maps to be examined. As you can see, the problem mentioned
includes the difficulty in determining what the cost of each relevant characteristic on the
map, and the costs of their possible combinations. The purpose of this study is to show
how the prediction of these costs is made into new environments based on the prediction
of structured data by defining functional learning areas between input and output,
structured and arbitrary. The problem of learning in question is usually formulated as a
convex optimization problem of maximum margin very similar to the formulation of multiclass
support vector machines. A solution technic was performed through implementation
of the algorithm MMP (Maximum Margin Planning) (RATLIFF; BAGNELL; ZINKEVICH,
2006). As a contribution, two alternative algorithms were developed and implemented,
the first named Structured Perceptron, and the second Structured Perceptron with Margin
both methods of relaxation based formulation of the Perceptron. They were analyzed and
compared. Posteriorly we have the exploitation of the environment by an intelligent agent
using reinforcement learning techniques. This makes the whole process, from the environment
analysis and discovery of cost to the exploitation and path planning, a complete
learning process.
|
Page generated in 0.0571 seconds