Made available in DSpace on 2014-06-12T16:01:13Z (GMT). No. of bitstreams: 2
arquivo7179_1.pdf: 868288 bytes, checksum: df107b96148023142bed070723decd67 (MD5)
license.txt: 1748 bytes, checksum: 8a4605be74aa9ea9d79846c1fba20a33 (MD5)
Previous issue date: 2005 / A tarefa de patrulha pode ser encontrada em diferentes domínios, desde administração
de redes de computadores a simulações de jogos de guerra. Esta é uma tarefa multi-agente
complexa, que requer que os agentes participantes coordenem as suas tomadas de decisão de
modo a obter um bom desempenho para o grupo como um todo.
Neste trabalho, é mostrado de que maneira a tarefa da patrulha pode ser modelada
como um problema de aprendizagem por reforço (AR), permitindo uma adaptação contínua e
automática das estratégias dos agentes ao ambiente. Nós demonstramos que um
comportamento cooperativo eficiente pode ser obtido utilizando técnicas padrão de AR, como
Q-Learning, para treinar os agentes individualmente.
É feita uma análise detalhada da optimalidade das soluções propostas e os resultados
obtidos constituem um caso de estudo positivo no uso de técnicas de aprendizagem por
reforço em sistemas multi-agentes. As reflexões e técnicas apresentadas são igualmente
valiosas para outros problemas que compartilham propriedades similares.
Além disto, a abordagem proposta é totalmente distribuída, o que a torna
computacionalmente eficiente. A avaliação empírica comprova a eficácia da mesma, e torna
este trabalho uma primeira abordagem de sucesso na obtenção de uma estratégia adaptativa
para tal tarefa
Identifer | oai:union.ndltd.org:IBICT/oai:repositorio.ufpe.br:123456789/2789 |
Date | January 2005 |
Creators | Pimentel de Santana, Hugo |
Contributors | Lisboa Ramalho, Geber |
Publisher | Universidade Federal de Pernambuco |
Source Sets | IBICT Brazilian ETDs |
Language | Portuguese |
Detected Language | Portuguese |
Type | info:eu-repo/semantics/publishedVersion, info:eu-repo/semantics/masterThesis |
Source | reponame:Repositório Institucional da UFPE, instname:Universidade Federal de Pernambuco, instacron:UFPE |
Rights | info:eu-repo/semantics/openAccess |
Page generated in 0.002 seconds