Return to search

Avaliação de Aprendizagem de Agentes Baseados em Sistemas Classificadores Para Jogos Digitais

Submitted by Lucelia Lucena (lucelia.lucena@ufpe.br) on 2015-03-06T19:46:46Z
No. of bitstreams: 2
DISSERTAÇÃO Denys Lins de Farias.pdf: 1587908 bytes, checksum: 56b81933533aed8f8d9f5f11c66976e1 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5) / Made available in DSpace on 2015-03-06T19:46:47Z (GMT). No. of bitstreams: 2
DISSERTAÇÃO Denys Lins de Farias.pdf: 1587908 bytes, checksum: 56b81933533aed8f8d9f5f11c66976e1 (MD5)
license_rdf: 1232 bytes, checksum: 66e71c371cc565284e70f40736c94386 (MD5)
Previous issue date: 2014-09-04 / A diversão dos jogos digitais está relacionada com a proposição de níveis adequados
de desafios, para que o jogador não se frustre com desafios muito difíceis, nem fique entediado
com desafios muito fáceis. As soluções propostas na literatura para este problema, chamado
de Ajuste Dinâmico de Dificuldade (Dynamic Difficulty Adjustment, DDA), utilizam agentes
adaptativos que buscam adequar seu comportamento às capacidades do jogador humano contra
quem jogam. Algumas técnicas (aprendizagem por reforço, algoritmos genéticos, Dynamic
Scripting) podem ser adaptadas para que o agente atue de forma sub-ótima, isto é, que ele
jogue menos bem diante de um jogador humano pouco experiente ou pouco habilidoso. Porém,
quando se enfrenta jogadores muito experientes ou habilidosos, tais agentes não conseguem
atuar no nível do jogador. Estas técnicas podem ser vistas, simplificadamente, como sistemas
de regras condição-ação em que se pode aprender os pesos de tais regras ou criar novas regras.
Nessa estrutura, existe uma classe de algoritmos de aprendizagem online, os chamados Sistemas
Classificadores (SCs), que permite tanto aprender pesos de regras quanto criar novas regras, mas
que, até onde sabemos, ainda não foi utilizada em DDA.
Diante deste cenário, o objetivo deste trabalho foi de avaliar a aplicabilidade de SC a DDA.
Como sabemos que SC, a exemplo de Dynamic Scripting, pode ser facilmente adaptada para
ter um desempenho subótimo, nós nos focamos em avaliar se SC poderia ter uma competência
melhor do que os outros, em particular do que aprendizagem por reforço, a melhor das técnicas
em avaliação anterior. Para tanto, tivemos de enfrentar o conhecido problema da parametrização
dos SCs, e o fizemos utilizando a técnica de otimização F-Race, o que gerou dois agentes
baseados em SCs com parâmetros diferentes.
Como caso de estudo, adotamos o jogo de luta em tempo real Knock’em, utilizado em
outros trabalhos. Conduzimos um experimento para avaliar a competência entre os agentes
baseados em SCs e um baseado em Q-Learning, contra agentes de comportamento aleatório
e previsível. Os resultados indicaram que o agente parametrizado pelo F-Race obteve melhor
desempenho que o agente de referência contra oponente previsível, perdendo contra o agente
de comportamento aleatório. Verificamos a viabilidade do uso de SCs em DDA, em uma série
de partidas, na qual o agente operou no nível dos oponentes, mas apresentou razoável variação
nos resultados. Realizamos mais um experimento entre o agente proposto parametrizado pelo
F-Race e o baseado em Q-Learning, contando com avaliação quantitativa e qualitativa. Ambos
agentes apresentaram bons resultados, com o agente de referência obtendo maior vantagem
inicial, porém os jogadores foram capazes de reverter a situação ao longo do experimento.

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/11335
Date04 September 2014
CreatorsFARIAS, Denys Lins de
ContributorsRAMALHO, Geber Lisboa, SILVA, Ricardo Martins de Abreu
PublisherUniversidade Federal de Pernambuco
Source SetsIBICT Brazilian ETDs
LanguageBreton
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
RightsAttribution-NonCommercial-NoDerivs 3.0 Brazil, http://creativecommons.org/licenses/by-nc-nd/3.0/br/, info:eu-repo/semantics/openAccess

Page generated in 0.0023 seconds