Spelling suggestions: "subject:"teoría dde los juegos"" "subject:"teoría dee los juegos""
1 |
Aplicación de un modelo de aprendizaje basado en la experiencia a juegos de clasificación de adversariosMuñoz Oliveros, Juan Andrés January 2018 (has links)
Tesis para optar al grado de magíster en economía Aplicada / Memoria para optar al título de Ingeniero Civil Industrial / Un juego de clasificación de adversarios típico considera un clasificador y un adversario, que
puede ser de tipo regular o malicioso. El clasificador debe intentar clasificar bien al adversario,
sin conocer su tipo; mientras que el adversario conoce las preferencias del clasificador, y puede
adaptar sus jugadas (tipo de mensaje enviado) para burlar la clasificación.
La literatura se ha centrado en modelar este juego desde distintos enfoques, siempre bus-
cando encontrar la estrategia óptima del adversario. Luego, con ella, se deduce la estrategia
óptima que debe seguir el clasificador. Las pruebas con datos reales han arrojado resultados
muy superiores a los algoritmos típicos de clasificación, que no incorporan técnicas de la
teoría de juegos.
En esta investigación se plantea un modelo basado en la estructura de los juegos de
señalización, que deja completamente de lado los supuestos de información pública sobre el
clasificador, y la capacidad de los jugadores de observar las acciones del otro.
Para ello, se introduce un algoritmo de aprendizaje mediante la regla de elección aleatoria
Logit, que los induce a adaptarse desde el ensayo y error. De esta manera los jugadores
son capaces de adaptar sus estrategias turno a turno, observando únicamente sus propias
estrategias y las utilidades obtenidas en el pasado.
Utilizando este modelo, los jugadores son capaces de converger rápidamente al equilibrio
bayesiano perfecto del juego, de manera mixta: los adversarios de tipo regular juegan estra-
tegias puras sobre su mensaje preferido, mientras que los de tipo malicioso juegan estrategias
mixtas entre los distintos mensajes disponibles. Por su parte, en el equilibrio las estrategias
del clasificador se han ajustado a la proporción de adversarios maliciosos que envía cada
mensaje en el equilibrio.
En el equilibrio de este juego, los adversarios maliciosos se mueven dinámicamente entre
los mensajes que escogen enviar, buscando burlar la clasificación. El error de clasificación
asociado a ellos oscila constantemente, incluso en el equilibrio; lo que demuestra un compor-
tamiento de gato y ratón constante entre el clasificador y los adversarios maliciosos.
La mayor contribución del modelo, es que logra capturar la evolución hacia el equilibrio,
las estrategias, el dinamismo del juego y la persecución constante entre los jugadores; sin que
estos se puedan observar directa o indirectamente en todo el juego.
|
2 |
Agreements in a decentralized matching partyGómez Rivera, Bastián Andrés January 2018 (has links)
Magíster en Economía Aplicada.
Ingeniero Civil Industrial / El presente trabajo estudia la infinita interacción descentralizada de un mercado two-sided, el cual se comporta de manera análoga a una fiesta, donde hombres y mujeres se emparejan a partir de propuestas de baile. En cada instante, cualquiera de los dos podría abandonar al otro para obtener una mejor asignación, teniendo todos un factor de descuento común $\delta$. Utilizando como refinamiento al equilibrio Markoviano perfecto (restringido en cuanto a la formación de nuevas parejas), se analiza la relación entre el conjunto de matchings estables $\Matchingset^*$ y el conjunto de asignaciones $\Agreeset_{\delta}$ ante el cual ya no se generen más ``cambios'' dentro de la fiesta, entendiendo a estos últimos como ``acuerdos''. Los resultados son que: (1) todo acuerdo debe ser estable, es decir, $\Agreeset_{\delta} \subseteq \Matchingset^*$; (2) en caso de existir más de un \textit{matching} estable, existe un $\hat{\delta}$ fijo tal que $\Agreeset_{\delta \geq \hat{\delta}} \subset \Matchingset^*$; (3) los incentivos opuestos del mercado son los generan que matchings estables puedan no ser acuerdos en la fiesta. La contribución de esta investigación viene dada por mostrar que los incentivos opuestos entre los dos lados del mercado, no permiten a los agentes alcanzar o mantener asignaciones estables de manera perpetua a lo largo del tiempo.
|
3 |
Cooperación y tiempo en Juegos Markovianos con información incompletaZanocco Lemp, Piero Francisco January 2019 (has links)
Tesis para optar al grado de Magíster en Economía Aplicada / Memoria para optar al título de Ingeniero Civil Matemático / La presente tesis estudia la factibilidad de cooperación en una situación de \textit{hold up} repetida. Para ello, se propone un modelo de Juego Markoviano con Información Incompleta, compuesto por dos jugadores, y en cuyo juego base no existen incentivos a la inversión. Se buscan condiciones bajo las cuales los jugadores obtienen pagos positivos en el largo plazo.
El análisis se centra en el efecto de dos variables: la capacidad de los agentes de valorar sus retornos futuros, representado por una tasa de descuento intertemporal; y la frecuencia con que los agentes toman decisiones, que está dada por el largo del intervalo entre periodos de interacción. Para ello, se proponen dos tipos de estrategias que faciliten el análisis de incentivos, obteniendo que tanto la reducción de la tasa de interés, como la disminución del tiempo entre interacciones aumentan la posibilidad de cooperación. Específicamente, los dos efectos permiten que ambas estrategias den lugar a \textit{Equilibrios Bayesianos Perfectos Públicos} que reportan pagos positivos en el largo plazo.
La relevancia de este enfoque nace del resultado de D. Abreu, P. Milgrom y D. Pearce (1991), quienes demuestran que en juegos repetidos con \textit{Información Imperfecta} la reducción de la tasa de interés aumenta la posibilidad de cooperación, mientras que disminuir el largo del intervalo de tiempo entre periodos puede provocar el efecto contrario, pues cambia el flujo de información. En esta línea, se analizan ambos efectos cuando la información privada del juego depende de la frecuencia de las interacciones.
A pesar del resultado anterior, se obtiene que en el caso de las dos estrategias propuestas, tanto la reducción de la tasa de interés, como la disminución del tiempo entre un periodo y otro, posibilitan la cooperación. Esto ocurre cuando ambos valores son cercanos a cero. Más aún, en un escenario de tiempo discreto, si los jugadores son infinitamente pacientes, las estrategias resultan ser \textit{EBP públicos} siempre y cuando la frecuencia de interacción sea alta. El mismo resultado es obtenido si las decisiones son tomadas en tiempo contínuo, cuando los jugadores son suficientemente pacientes. En este sentido, se presume una condición de \textit{continuidad} del modelo.
Para abordar el análisis general de los Equilibrios, se propone una metodología que caracteriza el problema de eficiencia sobre el conjunto de pagos alcanzados por \textit{EBP Públicos}. En particular, utilizando programación dinámica es posible obtener resultados numéricos que sean insumo para la resolución teórica del modelo. Si bien, los alcances de este trabajo se reducen al estudio de dos estrategia particulares, se revelan dinámicas relevantes sobre los incentivos que posibilitan la cooperación, contribuyendo a la comprensión de esta situación estratégica. / FONDECYT proyecto 1180723
|
4 |
Expansión de las interconexiones internacionales considerando incentivos económicos conflictivos entre paísesZimmermann Rodriguez-Peña, Iván January 2019 (has links)
Memoria para optar al título de Ingeniero Civil Eléctrico / En Sudamérica existe gran potencial de diversas tecnologías de generación, incluyendo hidroelectricidad, gas natural y tecnologías renovables no convencionales como la solar y la eólica. Una interconexión eléctrica multilateral entre los países Argentina, Bolivia, Chile y Perú resulta atractiva para aprovechar los beneficios económicos que traen estas oportunidades. El potencial de un plan regional de desarrollo e interconexión eléctrica podría generar réditos económicos para los países participantes. Sin embargo, la distribución de estos beneficios puede ser muy dispar que podría crear dificultades para lograr desarrollar interconexiones socialmente óptimas para la región.
En este estudio se analizan los incentivos económicos para una interconexión eléctrica multilateral entre Argentina, Bolivia, Chile y Perú. Para ello, se construyó un modelo que simula la operación económica de los sistemas eléctricos de estos cuatro países y que cuantifica los costos y beneficios de distintas configuraciones de interconexión. Para esto, se propone la construcción de cinco líneas que conectan a dichos países y la evaluación del impacto de ellas en los beneficios económicos de cada país. El estudio considera 32 casos de interconexión (2$^5$ dado que se ha considerado la construcción de la interconexión como una alternativa binaria de expansión) que presentan un impacto diferente según la operación de los sistemas en su conjunto. De esta manera, se analiza y propone una serie de estrategias para asignar los costos y beneficios generados de la interconexión según los casos de estudio. Así, mediante conceptos de teoría de juegos, se calcularán los incentivos competitivos y cooperativos de los países para lograr una interconexión óptima. Con el fin de obtener un indicador del comportamiento de los agentes, al enfrentarse a un escenario de esta naturaleza y la pérdida de eficiencia que trae, se calcularon los precios de la anarquía para cada equilibrio competitivo.
Finalmente, el estudio revela que el precio de la anarquía es estrictamente mayor que cero, ya que bajo ningún esquema de distribución de costos y beneficios se alcanza el plan de interconexiones socialmente óptimo cuando no hay cooperación entre países. No obstante, sí existen incentivos cooperativos para lograr un plan óptimo de interconexión concluyendo así la necesidad de promover la cooperación entre países. Además, la metodología utilizada podría ser aprovechada para investigar otros elementos de los sistemas de potencia y ayudar en la toma de decisiones al implementar políticas.
|
5 |
Campañas electorales bajo los ojos de la teoría de juegos: modelos de comportamiento y equilibriosMorales Arueste, Sebastián Igal January 2019 (has links)
Tesis para optar al grado de Magíster en Gestión de Operaciones / Memoria para optar al título de Ingeniero Civil Industrial / Existen casi 100 países en el mundo con sistemas catalogados como democráticos, en los cuales se celebran periódicamente elecciones populares para elegir a sus líderes políticos. Una parte importante de las elecciones son las campañas previas, donde los candidatos se dan a conocer al pa s, haciendo propaganda electoral y asistiendo a diferentes eventos. En este trabajo se estudia un modelo de optimización de campa´as pol ticas para elecciones entre dos candidatos dentro de un país subdividido en regiones. De cara a esta elección, cada candidato debe decidir cuánto tiempo de campaña invertir en las diferentes regiones, con el objetivo de obtener el mejor resultado posible en la elección a nivel país.
De esta forma, se consideraron dos tipos de elecciones: sistema mayoritario, donde el candidato con mayor número de votos a nivel pa s es elegido, y sistema bajo colegio electoral, donde el ganador dentro de cada región del país gana un cierto número de votos electorales, los que en de finitiva de finirán al ganador. El primer sistema emula a sistemas como el presidencial chileno. El segundo en cambio corresponde al sistema utilizado en los Estados Unidos.
Para el sistema mayoritario se estudiaron modelos tanto determinista como estocásticos.
Para el caso determinsita del sistema mayoritario se demostró la existencia y unicidad del Equilibrio de Nash en estrategias puras. Es más, suprimiendo ciertas restricciones, tal equilibrio es computable a fórmula cerrada, y su resultado no var a en absoluto al introducir la opción de la abstención a los votantes. Para el caso estocástico del sistema mayoritario, en cambio, no se tiene certeza de la existencia ni unicidad del equilibrio, pero la evidencia empírica apunta a favor de ambas conclusiones. Para el caso del sistema bajo colegio electoral, la evidencia empírica demuestra que es posible encontrar instancias donde no existe un equilibrio de Nash en estrategias puras. Con el fin de encontrar un equilibrio en estrategias mixtas, se presenta un algoritmo que discretiza las estrategias para facilitar el cálculo, reduciendo así la complejidad
del problema a una escala m as abordable.
Los resultados muestran que mientras en una elección bajo sistema mayoritario los votantes deberían mostrar una tendencia a concentrarse con gran énfasis en regiones del país con alta representación demográfi ca, para el sistema bajo colegio electoral el criterio demográfi co es relevante, pero sólo cuando se habla de un swing state, un estado del país donde el candidato ganador a priori no es tan predecible.
|
6 |
Addressing problem size in Stackelberg security gamesBucarey López, Víctor Daniel Simón January 2017 (has links)
Doctor en Sistemas de Ingeniería / En esta tesis presentamos contribuciones algorítmicas y de modelación para Juegos de Stackelberg para problemas de gran tamaño. Juegos de Stackelberg es un tipo de juego en el que un jugador, llamado líder, utiliza una estrategia y luego el otro jugador, llamado seguidor, observa esta estrategia y juega una mejor respuesta. En el contexto de seguridad, el lider se le denomina defensor, y al seguidor se le denomina atacante.
En el Capítulo 1, presentamos una situación en donde el defensor tiene que emparejar recursos para poder desarrollar labores de patrullaje. En este caso, el conjunto de estrategias puras es de tamaño exponencial. Presentamos una formulación en programación lineal entera mixta con un número polinomial de variables y un número exponencial de restricciones que pueden ser separadas en tiempo polinomial. Además, se diseñó un método de sampleo para recuperar estrategias implementables para el defensor. Por otra parte, mostramos un caso de estudio basado en el patrullaje fronterizo de Carabineros de Chile. Finalmente mostramos que nuestro modelo con el generación de cortes funciona considerablemente mejor que cualquier modelo en la literatura.
En el Capítulo 2, se muestra una manera de escalar un algoritmo basado en Aprendizaje de M\'aquinas, realizando multiples capas de clusters de territorios en donde en cada cluster el algoritmo resuelve en tiempos razonables.
En el Capítulo 3 se realiza un estudio sobre existencia de estrategias estacionarias que formen equilibrios de estrategias fuertes. Se detecta una familia de instancias en las cuales algoritmos de programación dinámica pueden encuentran el único equilibrio de Stackelberg fuerte. En este caso, se demuestra que Iteración de políticas y de valores convergen a los únicos valores de equilibrio. Se muestra vía contraejemplo que no siempre programación dinámica puede encontrar equilibrios de Stackelberg en estrategias estacionarias. Computacionalmente se encuentra que la estructura de juegos de seguridad presentara características que hace aplicable la teoría de operadores para encontrar equilibrios de Stackelberg. Finalmente se estudian formulaciones basadas en programación matemática para calcular equilibrios de Stackelberg.
Finalmente, en el Capítulo 4 mostramos un juego dinámico, en donde un agente central tiene como objetivo la sobreexplotación de agua en el contexto agrícola, controlando los costos marginales de extracción que enfrentan los agricultores. Modelamos esta situación como un juego estocástico en donde se busca un equilibrio de Stackelberg en donde el líder es la agencia central, y los seguidores son los agricultores. Computacionalmente se encuentra que se pueden alcanzar mejores niveles de agua en el estado estacionario controlando los costos marginales a través de las tasas de descuento del líder, aunque los agricultures sean miopes. Finalmente, nosotros proponemos una formulación de programación robusta para incluir incertidumbre en nuestros modelos. / Este trabajo ha sido parcialmente financiado por CONICYT
|
Page generated in 0.0991 seconds