Return to search

Patrulha multi-agente com aprendizagem por reforço

Made available in DSpace on 2014-06-12T16:01:13Z (GMT). No. of bitstreams: 2
arquivo7179_1.pdf: 868288 bytes, checksum: df107b96148023142bed070723decd67 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2005 / A tarefa de patrulha pode ser encontrada em diferentes domínios, desde administração
de redes de computadores a simulações de jogos de guerra. Esta é uma tarefa multi-agente
complexa, que requer que os agentes participantes coordenem as suas tomadas de decisão de
modo a obter um bom desempenho para o grupo como um todo.
Neste trabalho, é mostrado de que maneira a tarefa da patrulha pode ser modelada
como um problema de aprendizagem por reforço (AR), permitindo uma adaptação contínua e
automática das estratégias dos agentes ao ambiente. Nós demonstramos que um
comportamento cooperativo eficiente pode ser obtido utilizando técnicas padrão de AR, como
Q-Learning, para treinar os agentes individualmente.
É feita uma análise detalhada da optimalidade das soluções propostas e os resultados
obtidos constituem um caso de estudo positivo no uso de técnicas de aprendizagem por
reforço em sistemas multi-agentes. As reflexões e técnicas apresentadas são igualmente
valiosas para outros problemas que compartilham propriedades similares.
Além disto, a abordagem proposta é totalmente distribuída, o que a torna
computacionalmente eficiente. A avaliação empírica comprova a eficácia da mesma, e torna
este trabalho uma primeira abordagem de sucesso na obtenção de uma estratégia adaptativa
para tal tarefa

Identiferoai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/2789
Date January 2005
CreatorsPimentel de Santana, Hugo
ContributorsLisboa Ramalho, Geber
PublisherUniversidade Federal de Pernambuco
Source SetsIBICT Brazilian ETDs
LanguagePortuguese
Detected LanguagePortuguese
Typeinfo:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis
Sourcereponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE
Rightsinfo:eu-repo/semantics/openAccess

Page generated in 0.0024 seconds