Global ETD Search

Return to search

Evolution of reward functions for reinforcement learning applied to stealth games

Submitted by Renata Lopes (renatasil82@gmail.com) on 2017-05-31T11:40:17Z
No. of bitstreams: 1
matheusribeirofurtadodemendonca.pdf: 1083096 bytes, checksum: bb42372f22411bc93823b92e7361a490 (MD5) / Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2017-05-31T12:42:30Z (GMT) No. of bitstreams: 1
matheusribeirofurtadodemendonca.pdf: 1083096 bytes, checksum: bb42372f22411bc93823b92e7361a490 (MD5) / Made available in DSpace on 2017-05-31T12:42:30Z (GMT). No. of bitstreams: 1
matheusribeirofurtadodemendonca.pdf: 1083096 bytes, checksum: bb42372f22411bc93823b92e7361a490 (MD5)
Previous issue date: 2016 / CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior / Muitos jogos modernos apresentam elementos que permitem que o jogador complete
certos objetivos sem ser visto pelos inimigos. Isso culminou no surgimento de um novo
gênero chamado de jogos furtivos, onde a furtividade é essencial. Embora elementos de
furtividade sejam muito comuns em jogos modernos, este tema não tem sido estudado
extensivamente. Este trabalho aborda três problemas distintos: (i) como utilizar uma
abordagem por aprendizado de máquinas de forma a permitir que o agente furtivo aprenda
como se comportar adequadamente em qualquer ambiente, (ii) criar um método eﬁciente
para planejamento de caminhos furtivos que possa ser acoplado à nossa formulação por
aprendizado de máquinas e (iii) como usar computação evolutiva de forma a deﬁnir certos parâmetros para nossa abordagem por aprendizado de máquinas. É utilizado aprendizado
por reforço para aprender bons comportamentos que sejam capazes de atingir uma alta
taxa de sucesso em testes aleatórios de um jogo furtivo. Também é proposto uma abor
dagem evolucionária capaz de deﬁnir automaticamente uma boa função de reforço para a
abordagem por aprendizado por reforço. / Many modern games present stealth elements that allow the player to accomplish a
certain objective without being spotted by enemy patrols. This gave rise to a new genre
called stealth games, where covertness plays a major role. Although quite popular in
modern games, stealthy behaviors has not been extensively studied. In this work, we tackle
three diﬀerent problems: (i) how to use a machine learning approach in order to allow the
stealthy agent to learn good behaviors for any environment, (ii) create an eﬃcient stealthy
path planning method that can be coupled with our machine learning formulation, and (iii)
how to use evolutionary computing in order to deﬁne speciﬁc parameters for our machine
learning approach without any prior knowledge of the problem. We use Reinforcement
Learning in order to learn good covert behavior capable of achieving a high success rate
in random trials of a stealth game. We also propose an evolutionary approach that is
capable of automatically deﬁning a good reward function for our reinforcement learning
approach.

https://repositorio.ufjf.br/jspui/handle/ufjf/4771

Planejamento de caminhos furtivos

Aprendizado por reforço

Algoritmos genéticos

Evolução de funções de reforço

Stealthy Path Planning

Reinforcement Leaning

Genetic Algorithms

Evolution of Reward Functions

Identifer	oai:union.ndltd.org:IBICT/oai:hermes.cpd.ufjf.br:ufjf/4771
Date	January 2016
Creators	Mendonça, Matheus Ribeiro Furtado de
Contributors	Fonseca Neto, Raul, Bernardino, Heder Soares, Oliveira, Rafael Sachetto, Leite, Saul de Castro
Publisher	Universidade Federal de Juiz de Fora (UFJF), Programa de Pós-graduação em Ciência da Computação, UFJF, Brasil, ICE – Instituto de Ciências Exatas
Source Sets	IBICT Brazilian ETDs
Language	Portuguese
Detected Language	English
Type	info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Source	reponame:Repositório Institucional da UFJF, instname:Universidade Federal de Juiz de Fora, instacron:UFJF
Rights	info:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds

Evolution of reward functions for reinforcement learning applied to stealth games

Description

Links & Downloads

Tags

Additional Fields