• Refine Query
  • Source
  • Publication year
  • to
  • Language
  • 4
  • Tagged with
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 4
  • 2
  • 2
  • 2
  • 2
  • About
  • The Global ETD Search service is a free service for researchers to find electronic theses and dissertations. This service is provided by the Networked Digital Library of Theses and Dissertations.
    Our metadata is collected from universities around the world. If you manage a university/consortium/country archive and want to be added, details can be found on the NDLTD website.
1

Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação / Continuous prisoners dilemma with rational agents and cooperation classifiers.

Pereira, Marcelo Alves 23 November 2012 (has links)
O dilema do prisioneiro (DP) é um dos principais jogos da teoria dos jogos. No dilema do prisioneiro discreto (DPD), dois prisioneiros têm as opções de cooperar ou desertar. Um jogador cooperador não delata seu comparsa, já um desertor delata. Se um cooperar e o outro desertar, o cooperador fica preso por cinco anos e o desertor fica livre. Se ambos cooperarem, ficam presos por um ano e, se ambos desertarem, ficam presos por três anos. Quando o DP é repetido, a cooperação pode emergir entre agentes egoístas. Realizamos um estudo analítico para o DPD, que produziu uma formulação da evolução do nível médio de cooperação e da tentação crítica (valor de tentação que causa mudança abrupta do nível de cooperação). No dilema do prisioneiro contínuo (DPC), cada jogador apresenta um nível de cooperação que define o grau de cooperação. Utilizamos o DPC para estudar o efeito da personalidade dos jogadores sobre a emergência da cooperação. Para isso, propusemos novas estratégias: uma baseada na personalidade dos jogadores e outras duas baseadas na comparação entre o ganho obtido e a aspiração do jogador. Todas as estratégias apresentavam algum mecanismo de cópia do estado do vizinho com maior ganho na vizinhança, mecanismo este, herdado da estratégia darwiniana. Os resultados mostraram que o DPC aumenta o nível médio de cooperação do sistema, quando comparado ao DPD. No entanto, as diferentes estratégias não aumentaram a cooperação comparado à cooperação obtida com a estratégia darwiniana. Então propusemos o uso do coeficiente de agrupamentos, coeficiente de Gini e entropias de Shannon, Tsallis e Kullback-Leibler para classificar os sistemas, em que os agentes jogam o DPD com a estratégia darwiniana, quanto ao nível de cooperação. Como analisamos valores de médias configuracionais, tais classificadores não foram eficientes ao classificar os sistemas. Isso é consequência da existência de distribuições de extremos nos resultados que compõem as médias. As distribuições de extremos suscitaram uma discussão acerca da definição do regime de cooperação no dilema do prisioneiro. Discutimos também as consequências de utilizar apenas valores médios nos resultados ignorando seus desvios e as distribuições. / Prisoner\'s dilemma (PD) is one of the main games of game theory. In discrete prisoner\'s dilemma (DPD), two prisoners have the options to cooperate or to defect. A cooperator player does not defect his accomplice, while a defector does. If one player cooperates and the other defects, the cooperator gets jailed for five years and the defector goes free. If both cooperate, they get jailed during one year and if both defect, they get jailed during three years. When this game is repeated, cooperation may emerge among selfish individuals. We perform an analytical study for the DPD, that produced a formulation for the evolution of the mean cooperation level and for the critical temptation values (temptation values that promote abrupt modifications in the cooperation level). In continuous prisoner\'s dilemma (CPD), each player has a level of cooperation that defines his/her degree of cooperation. We used the CPD to study the effect of the players\' personality on the emergence of cooperation. For this, we propose new strategies: one based on the players\' personality and two others based on the comparison between the player\'s obtained payoff and the desire one. All strategies present some mechanism that copies the state of the neighbor with the highest payoff in the neighborhood, mechanism inherited from the Darwinian strategy. The results showed that the CPD increases the average cooperation level of the system when compared to DPD. However, different strategies do not increased the cooperation compared to cooperation obtained with the Darwinian strategy. So, we propose the use of cluster coefficient, Gini coefficient and entropy of Shannon, Tsallis and Kullback-Leibler as classifiers to classify systems, in which the individuals play DPD with Darwinian strategy, by the cooperation level. As configurational averages were analyzed, such classifiers were not efficient in classifying the systems. This is due to the existence of distributions with extreme values of the results that compose the means. Distributions with extremes values emerged a discussion about the definition of the cooperation state in the prisoner\'s dilemma. We also discussed the consequences of using only average results in the analysis ignoring their deviations and distributions.
2

Dilema do prisioneiro contínuo com agentes racionais e classificadores de cooperação / Continuous prisoners dilemma with rational agents and cooperation classifiers.

Marcelo Alves Pereira 23 November 2012 (has links)
O dilema do prisioneiro (DP) é um dos principais jogos da teoria dos jogos. No dilema do prisioneiro discreto (DPD), dois prisioneiros têm as opções de cooperar ou desertar. Um jogador cooperador não delata seu comparsa, já um desertor delata. Se um cooperar e o outro desertar, o cooperador fica preso por cinco anos e o desertor fica livre. Se ambos cooperarem, ficam presos por um ano e, se ambos desertarem, ficam presos por três anos. Quando o DP é repetido, a cooperação pode emergir entre agentes egoístas. Realizamos um estudo analítico para o DPD, que produziu uma formulação da evolução do nível médio de cooperação e da tentação crítica (valor de tentação que causa mudança abrupta do nível de cooperação). No dilema do prisioneiro contínuo (DPC), cada jogador apresenta um nível de cooperação que define o grau de cooperação. Utilizamos o DPC para estudar o efeito da personalidade dos jogadores sobre a emergência da cooperação. Para isso, propusemos novas estratégias: uma baseada na personalidade dos jogadores e outras duas baseadas na comparação entre o ganho obtido e a aspiração do jogador. Todas as estratégias apresentavam algum mecanismo de cópia do estado do vizinho com maior ganho na vizinhança, mecanismo este, herdado da estratégia darwiniana. Os resultados mostraram que o DPC aumenta o nível médio de cooperação do sistema, quando comparado ao DPD. No entanto, as diferentes estratégias não aumentaram a cooperação comparado à cooperação obtida com a estratégia darwiniana. Então propusemos o uso do coeficiente de agrupamentos, coeficiente de Gini e entropias de Shannon, Tsallis e Kullback-Leibler para classificar os sistemas, em que os agentes jogam o DPD com a estratégia darwiniana, quanto ao nível de cooperação. Como analisamos valores de médias configuracionais, tais classificadores não foram eficientes ao classificar os sistemas. Isso é consequência da existência de distribuições de extremos nos resultados que compõem as médias. As distribuições de extremos suscitaram uma discussão acerca da definição do regime de cooperação no dilema do prisioneiro. Discutimos também as consequências de utilizar apenas valores médios nos resultados ignorando seus desvios e as distribuições. / Prisoner\'s dilemma (PD) is one of the main games of game theory. In discrete prisoner\'s dilemma (DPD), two prisoners have the options to cooperate or to defect. A cooperator player does not defect his accomplice, while a defector does. If one player cooperates and the other defects, the cooperator gets jailed for five years and the defector goes free. If both cooperate, they get jailed during one year and if both defect, they get jailed during three years. When this game is repeated, cooperation may emerge among selfish individuals. We perform an analytical study for the DPD, that produced a formulation for the evolution of the mean cooperation level and for the critical temptation values (temptation values that promote abrupt modifications in the cooperation level). In continuous prisoner\'s dilemma (CPD), each player has a level of cooperation that defines his/her degree of cooperation. We used the CPD to study the effect of the players\' personality on the emergence of cooperation. For this, we propose new strategies: one based on the players\' personality and two others based on the comparison between the player\'s obtained payoff and the desire one. All strategies present some mechanism that copies the state of the neighbor with the highest payoff in the neighborhood, mechanism inherited from the Darwinian strategy. The results showed that the CPD increases the average cooperation level of the system when compared to DPD. However, different strategies do not increased the cooperation compared to cooperation obtained with the Darwinian strategy. So, we propose the use of cluster coefficient, Gini coefficient and entropy of Shannon, Tsallis and Kullback-Leibler as classifiers to classify systems, in which the individuals play DPD with Darwinian strategy, by the cooperation level. As configurational averages were analyzed, such classifiers were not efficient in classifying the systems. This is due to the existence of distributions with extreme values of the results that compose the means. Distributions with extremes values emerged a discussion about the definition of the cooperation state in the prisoner\'s dilemma. We also discussed the consequences of using only average results in the analysis ignoring their deviations and distributions.
3

Análise do efeito do investimento inicial no dilema do prisioneiro contínuo iterado simultâneo e alternado na presença e ausência de ruído em diferentes cenários de incerteza: contrapondo as estratégias RTS e LRS por meio da simulação bas / Analysis of the effect of the initial investment in the continuous iterated prisoners dilema with simultaneous and alternating moves in the presence and absence of noise in different scenarios of uncertainty: opposing the RTS and LRS strategies through agent-based simulation

Wu, Marcio Jolhben 11 September 2015 (has links)
O dilema do prisioneiro é geralmente visto como o ponto de partida para entender o problema da cooperação. Em comparação com o dilema do prisioneiro discreto e iterado, poucos estudos existem sobre o dilema do prisioneiro contínuo e iterado. A maioria dos trabalhos que investigaram o dilema do prisioneiro contínuo e iterado concentrou-se no período de 1990 a 2000, não obtendo resultados conclusivos sobre a melhor estratégia a ser adotada neste tipo de jogo. Duas estratégias diferentes se destacam neste tipo de dilema. A primeira é a estratégia RTS (Raise-the-Stakes) de Roberts e Sherrat (1998) que testa o terreno antes de aumentar os investimentos na relação. A segunda deriva do modelo LRS (Linear Reactive Strategies) de Wahl e Nowak (1999a). Esta última estratégia estando em equilíbrio de Nash cooperativo apresenta três características: (i) generosidade, i.e., investir o máximo possível no início da relação de cooperação; (ii) otimismo, i.e., contar com o melhor cenário para as próximas rodadas, e (iii) intransigência. Esta pesquisa tem como objetivo principal contrapor as estratégias RTS e LRS num dilema do prisioneiro contínuo e iterado, na presença e ausência de ruído, com jogadas simultâneas e alternadas e para diferentes valores do parâmetro w (probabilidade de interagir novamente). Restringimos a nossa análise a um conjunto de seis estratégias: ALLC, ALLD, TFT, RTS, LRS e RTSM. O método utilizado foi o da simulação baseada em agente (ABM) no formato de torneios, semelhante ao de Axelrod (2006), Roberts & Sherratt (1998), Nowak & Sigmund (1992) e Nowak & Sigmund (1993). Utilizamos o software Netlogo e documentamos todo o processo da concepção e construção do modelo por meio da ferramenta TRACE (TRAnsparent and Comprehensive model Evaludation). Os resultados mostram que as estratégias mais cooperativas são mais favorecidas quando o jogo consiste em jogadas alternadas ao invés de simultâneas. A estratégia RTS teve melhor desempenho em jogos simultâneos para valores intermediários de w, na presença ou ausência de ruído. Por sua vez, a estratégia LRS teve melhor desempenho nos jogos simultâneos, na presença ou ausência de ruído, ou alternados e na presença de ruído, em ambos os casos para valores grandes de w / The prisoner\'s dilemma is generally seen as the starting point for understanding the problem of cooperation. In comparison with the discreet and iterated prisoner\'s dilemma, few studies exist on the continuous iterated prisoner\'s dilemma. Most of the works that have investigated the continuous iterated prisoner\'s dilemma has concentrated in the period from 1990 to 2000, not getting conclusive results on the best strategy to be adopted in this type of game. Two different strategies stand out in this kind of dilemma. The first is the RTS strategy (Raise-the-Stakes) of Roberts and Sherrat (1998) that tests the ground before increasing investment in the relationship. The second is the model deriva LRS (Linear Reactive Strategies) de Wahl and Nowak (1999a). This last strategy being in Nash equilibrium cooperative presents three characteristics: (i) generosity, i.e., investing as much as possible at the beginning of the cooperation relationship; (ii) optimism, i.e., rely on the best scenario for the next rounds, and (iii) intransigence. This research has as main goal to reconcile opposing RTS strategies and LRS in a continuous iterated prisoner\'s dilemma, in the presence and absence of noise, with simultaneous moves and alternate and for different values of the parameter w (probability of interacting again). We restrict our analysis to a set of six strategies: ALLC, ALLD, TFT, RTS, LRS and RTSM (halfway between RTS and LRS). The method used was the agent-based simulation (ABM) in tournament format, similar to that of Axelrod (2006), Roberts (1998), Sherratt & Nowak & Sigmund (1992) and Nowak & Sigmund (1993). We use the NetLogo software and document the whole process of design and construction of the tool model TRACE (TRAnsparent and Comprehensive model Evaludation). The results show that most strategies are more favoured unions when the game consists of alternating plays rather than simultaneous. The RTS strategy had better performance in simultaneous games for intermediate values of w, in the presence or absence of noise. In turn, the IRS strategy had better performance when simultaneous games, in the presence or absence of noise, or switched, and in the presence of noise, in both cases, for large values of w
4

Análise do efeito do investimento inicial no dilema do prisioneiro contínuo iterado simultâneo e alternado na presença e ausência de ruído em diferentes cenários de incerteza: contrapondo as estratégias RTS e LRS por meio da simulação bas / Analysis of the effect of the initial investment in the continuous iterated prisoners dilema with simultaneous and alternating moves in the presence and absence of noise in different scenarios of uncertainty: opposing the RTS and LRS strategies through agent-based simulation

Marcio Jolhben Wu 11 September 2015 (has links)
O dilema do prisioneiro é geralmente visto como o ponto de partida para entender o problema da cooperação. Em comparação com o dilema do prisioneiro discreto e iterado, poucos estudos existem sobre o dilema do prisioneiro contínuo e iterado. A maioria dos trabalhos que investigaram o dilema do prisioneiro contínuo e iterado concentrou-se no período de 1990 a 2000, não obtendo resultados conclusivos sobre a melhor estratégia a ser adotada neste tipo de jogo. Duas estratégias diferentes se destacam neste tipo de dilema. A primeira é a estratégia RTS (Raise-the-Stakes) de Roberts e Sherrat (1998) que testa o terreno antes de aumentar os investimentos na relação. A segunda deriva do modelo LRS (Linear Reactive Strategies) de Wahl e Nowak (1999a). Esta última estratégia estando em equilíbrio de Nash cooperativo apresenta três características: (i) generosidade, i.e., investir o máximo possível no início da relação de cooperação; (ii) otimismo, i.e., contar com o melhor cenário para as próximas rodadas, e (iii) intransigência. Esta pesquisa tem como objetivo principal contrapor as estratégias RTS e LRS num dilema do prisioneiro contínuo e iterado, na presença e ausência de ruído, com jogadas simultâneas e alternadas e para diferentes valores do parâmetro w (probabilidade de interagir novamente). Restringimos a nossa análise a um conjunto de seis estratégias: ALLC, ALLD, TFT, RTS, LRS e RTSM. O método utilizado foi o da simulação baseada em agente (ABM) no formato de torneios, semelhante ao de Axelrod (2006), Roberts & Sherratt (1998), Nowak & Sigmund (1992) e Nowak & Sigmund (1993). Utilizamos o software Netlogo e documentamos todo o processo da concepção e construção do modelo por meio da ferramenta TRACE (TRAnsparent and Comprehensive model Evaludation). Os resultados mostram que as estratégias mais cooperativas são mais favorecidas quando o jogo consiste em jogadas alternadas ao invés de simultâneas. A estratégia RTS teve melhor desempenho em jogos simultâneos para valores intermediários de w, na presença ou ausência de ruído. Por sua vez, a estratégia LRS teve melhor desempenho nos jogos simultâneos, na presença ou ausência de ruído, ou alternados e na presença de ruído, em ambos os casos para valores grandes de w / The prisoner\'s dilemma is generally seen as the starting point for understanding the problem of cooperation. In comparison with the discreet and iterated prisoner\'s dilemma, few studies exist on the continuous iterated prisoner\'s dilemma. Most of the works that have investigated the continuous iterated prisoner\'s dilemma has concentrated in the period from 1990 to 2000, not getting conclusive results on the best strategy to be adopted in this type of game. Two different strategies stand out in this kind of dilemma. The first is the RTS strategy (Raise-the-Stakes) of Roberts and Sherrat (1998) that tests the ground before increasing investment in the relationship. The second is the model deriva LRS (Linear Reactive Strategies) de Wahl and Nowak (1999a). This last strategy being in Nash equilibrium cooperative presents three characteristics: (i) generosity, i.e., investing as much as possible at the beginning of the cooperation relationship; (ii) optimism, i.e., rely on the best scenario for the next rounds, and (iii) intransigence. This research has as main goal to reconcile opposing RTS strategies and LRS in a continuous iterated prisoner\'s dilemma, in the presence and absence of noise, with simultaneous moves and alternate and for different values of the parameter w (probability of interacting again). We restrict our analysis to a set of six strategies: ALLC, ALLD, TFT, RTS, LRS and RTSM (halfway between RTS and LRS). The method used was the agent-based simulation (ABM) in tournament format, similar to that of Axelrod (2006), Roberts (1998), Sherratt & Nowak & Sigmund (1992) and Nowak & Sigmund (1993). We use the NetLogo software and document the whole process of design and construction of the tool model TRACE (TRAnsparent and Comprehensive model Evaludation). The results show that most strategies are more favoured unions when the game consists of alternating plays rather than simultaneous. The RTS strategy had better performance in simultaneous games for intermediate values of w, in the presence or absence of noise. In turn, the IRS strategy had better performance when simultaneous games, in the presence or absence of noise, or switched, and in the presence of noise, in both cases, for large values of w

Page generated in 0.1389 seconds