Return to search

Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação / Continuous prisoners dilemma with rational agents and cooperation classifiers.

O dilema do prisioneiro (DP) é um dos principais jogos da teoria dos jogos. No dilema do prisioneiro discreto (DPD), dois prisioneiros têm as opções de cooperar ou desertar. Um jogador cooperador não delata seu comparsa, já um desertor delata. Se um cooperar e o outro desertar, o cooperador fica preso por cinco anos e o desertor fica livre. Se ambos cooperarem, ficam presos por um ano e, se ambos desertarem, ficam presos por três anos. Quando o DP é repetido, a cooperação pode emergir entre agentes egoístas. Realizamos um estudo analítico para o DPD, que produziu uma formulação da evolução do nível médio de cooperação e da tentação crítica (valor de tentação que causa mudança abrupta do nível de cooperação). No dilema do prisioneiro contínuo (DPC), cada jogador apresenta um nível de cooperação que define o grau de cooperação. Utilizamos o DPC para estudar o efeito da personalidade dos jogadores sobre a emergência da cooperação. Para isso, propusemos novas estratégias: uma baseada na personalidade dos jogadores e outras duas baseadas na comparação entre o ganho obtido e a aspiração do jogador. Todas as estratégias apresentavam algum mecanismo de cópia do estado do vizinho com maior ganho na vizinhança, mecanismo este, herdado da estratégia darwiniana. Os resultados mostraram que o DPC aumenta o nível médio de cooperação do sistema, quando comparado ao DPD. No entanto, as diferentes estratégias não aumentaram a cooperação comparado à cooperação obtida com a estratégia darwiniana. Então propusemos o uso do coeficiente de agrupamentos, coeficiente de Gini e entropias de Shannon, Tsallis e Kullback-Leibler para classificar os sistemas, em que os agentes jogam o DPD com a estratégia darwiniana, quanto ao nível de cooperação. Como analisamos valores de médias configuracionais, tais classificadores não foram eficientes ao classificar os sistemas. Isso é consequência da existência de distribuições de extremos nos resultados que compõem as médias. As distribuições de extremos suscitaram uma discussão acerca da definição do regime de cooperação no dilema do prisioneiro. Discutimos também as consequências de utilizar apenas valores médios nos resultados ignorando seus desvios e as distribuições. / Prisoner\'s dilemma (PD) is one of the main games of game theory. In discrete prisoner\'s dilemma (DPD), two prisoners have the options to cooperate or to defect. A cooperator player does not defect his accomplice, while a defector does. If one player cooperates and the other defects, the cooperator gets jailed for five years and the defector goes free. If both cooperate, they get jailed during one year and if both defect, they get jailed during three years. When this game is repeated, cooperation may emerge among selfish individuals. We perform an analytical study for the DPD, that produced a formulation for the evolution of the mean cooperation level and for the critical temptation values (temptation values that promote abrupt modifications in the cooperation level). In continuous prisoner\'s dilemma (CPD), each player has a level of cooperation that defines his/her degree of cooperation. We used the CPD to study the effect of the players\' personality on the emergence of cooperation. For this, we propose new strategies: one based on the players\' personality and two others based on the comparison between the player\'s obtained payoff and the desire one. All strategies present some mechanism that copies the state of the neighbor with the highest payoff in the neighborhood, mechanism inherited from the Darwinian strategy. The results showed that the CPD increases the average cooperation level of the system when compared to DPD. However, different strategies do not increased the cooperation compared to cooperation obtained with the Darwinian strategy. So, we propose the use of cluster coefficient, Gini coefficient and entropy of Shannon, Tsallis and Kullback-Leibler as classifiers to classify systems, in which the individuals play DPD with Darwinian strategy, by the cooperation level. As configurational averages were analyzed, such classifiers were not efficient in classifying the systems. This is due to the existence of distributions with extreme values of the results that compose the means. Distributions with extremes values emerged a discussion about the definition of the cooperation state in the prisoner\'s dilemma. We also discussed the consequences of using only average results in the analysis ignoring their deviations and distributions.

Identiferoai:union.ndltd.org:usp.br/oai:teses.usp.br:tde-08012013-222525
Date23 November 2012
CreatorsPereira, Marcelo Alves
ContributorsMartinez, Alexandre Souto
PublisherBiblioteca Digitais de Teses e Dissertações da USP
Source SetsUniversidade de São Paulo
LanguagePortuguese
Detected LanguagePortuguese
TypeTese de Doutorado
Formatapplication/pdf
RightsLiberar o conteúdo para acesso público.

Page generated in 0.003 seconds