El juego de la gallina , también conocido como el juego del halcón y la paloma o el juego de la ventisca , [1] es un modelo de conflicto para dos jugadores en la teoría de juegos . El principio del juego es que, si bien el resultado ideal es que un jugador ceda (para evitar el peor resultado si ninguno cede), los individuos tratan de evitarlo por orgullo, para no parecer "gallinas". Cada jugador se burla del otro para aumentar el riesgo de vergüenza por ceder. Sin embargo, cuando un jugador cede, se evita el conflicto y el juego esencialmente termina.
El nombre "pollo" tiene su origen en un juego en el que dos conductores se dirigen uno hacia el otro en una trayectoria de colisión: uno debe desviarse, o ambos pueden morir en el choque, pero si un conductor se desvía y el otro no, el que se desvió será llamado "pollo", es decir, cobarde; esta terminología es más frecuente en la ciencia política y la economía . El nombre "halcón-paloma" se refiere a una situación en la que hay una competencia por un recurso compartido y los contendientes pueden elegir entre la conciliación o el conflicto; esta terminología se utiliza más comúnmente en biología y teoría de juegos evolutivos . Desde un punto de vista de la teoría de juegos, "pollo" y "halcón-paloma" son idénticos. [1] El juego también se ha utilizado para describir la destrucción mutua asegurada de la guerra nuclear , especialmente el tipo de política arriesgada involucrada en la Crisis de los Misiles de Cuba . [2]
El juego de la gallina presenta a dos conductores que se dirigen hacia un puente de un solo carril desde direcciones opuestas. El primero que se desvía cede el puente al otro. Si ninguno de los jugadores se desvía, el resultado es un costoso punto muerto en medio del puente o una colisión frontal potencialmente fatal. Se supone que lo mejor para cada conductor es seguir recto mientras el otro se desvía (ya que el otro es la "gallina" mientras se evita un choque). Además, se supone que un choque es el peor resultado para ambos jugadores. Esto da lugar a una situación en la que cada jugador, al intentar asegurar su mejor resultado, se arriesga a lo peor.
La frase “juego de la gallina” también se utiliza como metáfora de una situación en la que dos partes se enfrentan en un enfrentamiento en el que no tienen nada que ganar y solo el orgullo les impide dar marcha atrás. Bertrand Russell comparó el juego de la gallina con una política de riesgo nuclear :
Desde que se hizo evidente el estancamiento nuclear, los gobiernos de Oriente y Occidente han adoptado la política que el señor Dulles llama "política de riesgo". Se trata de una política adaptada de un deporte que, según me han dicho, practican algunos jóvenes degenerados. Este deporte se llama "Chicken!". Se juega eligiendo una carretera larga y recta con una línea blanca en el medio y haciendo que dos coches muy rápidos se dirijan uno hacia el otro desde extremos opuestos. Se espera que cada coche mantenga las ruedas de un lado de la línea blanca. A medida que se acercan, la destrucción mutua se hace cada vez más inminente. Si uno de ellos se desvía de la línea blanca antes que el otro, el otro, al pasar, grita "¡Chicken!", y el que se ha desviado se convierte en objeto de desprecio. Tal como lo juegan los muchachos irresponsables, este juego se considera decadente e inmoral, aunque lo único que se arriesga son las vidas de los jugadores. Pero cuando el juego lo juegan estadistas eminentes que arriesgan no sólo sus propias vidas sino las de muchos cientos de millones de seres humanos, ambos bandos piensan que los estadistas de un bando están demostrando un alto grado de sabiduría y coraje, y que sólo los estadistas del otro bando son reprochables. Esto, por supuesto, es absurdo. Ambos son culpables de jugar a un juego tan increíblemente peligroso. El juego puede jugarse sin desgracias unas cuantas veces, pero tarde o temprano se llegará a la conclusión de que la pérdida de prestigio es más terrible que la aniquilación nuclear. Llegará el momento en que ninguno de los dos bandos pueda hacer frente al grito despectivo de “¡gallina!” del otro bando. Cuando llegue ese momento, los estadistas de ambos bandos hundirán al mundo en la destrucción. [2]
Brinkmanship implica la introducción de un elemento de riesgo incontrolable: incluso si todos los jugadores actúan racionalmente ante el riesgo, los eventos incontrolables aún pueden desencadenar el resultado catastrófico. [3] En la escena de la "carrera de pollitos" de la película Rebel Without a Cause , esto sucede cuando Buzz no puede escapar del auto y muere en el accidente. El escenario opuesto ocurre en Footloose , donde Ren McCormack está atrapado en su tractor y, por lo tanto, gana el juego porque no pueden jugar a la "gallina". Un evento similar ocurre en dos juegos diferentes en la película The Heavenly Kid , cuando primero Bobby y luego Lenny quedan atrapados en sus autos y se caen por un acantilado. La formulación básica de la teoría de juegos de Chicken no tiene ningún elemento de riesgo variable, potencialmente catastrófico, y también es la contracción de una situación dinámica en una interacción de una sola toma.
La versión halcón-paloma del juego imagina a dos jugadores (animales) que se disputan un recurso indivisible y que pueden elegir entre dos estrategias, una más intensa que la otra. [4] Pueden utilizar exhibiciones de amenaza (jugar paloma) o atacarse físicamente (jugar halcón). Si ambos jugadores eligen la estrategia del halcón, luchan hasta que uno resulta herido y el otro gana. Si solo un jugador elige halcón, este jugador derrota al jugador paloma. Si ambos jugadores juegan paloma, hay un empate y cada jugador recibe una recompensa menor que la ganancia de un halcón derrotando a una paloma.
Viraje | Derecho | |
Viraje | Corbata, corbata | Perder, ganar |
Derecho | Ganar, perder | Choque, choque |
Fig. 1: Matriz de pagos de Chicken |
Viraje | Derecho | |
Viraje | 0, 0 | -1, +1 |
Derecho | +1, -1 | -1000, -1000 |
Fig. 2: Pollo con pagos numéricos |
Una versión formal del juego de la gallina ha sido objeto de una investigación seria en la teoría de juegos . [5] Aquí se presentan dos versiones de la matriz de pagos para este juego (Figuras 1 y 2). En la Figura 1, los resultados se representan en palabras, donde cada jugador preferiría ganar en lugar de empatar, preferiría empatar en lugar de perder y preferiría perder en lugar de estrellarse. La Figura 2 presenta pagos numéricos establecidos arbitrariamente que teóricamente se ajustan a esta situación. Aquí, el beneficio de ganar es 1, el costo de perder es -1 y el costo de estrellarse es -1000.
Tanto el juego de la gallina como el de la paloma y el halcón son juegos de anticoordinación , en los que es mutuamente beneficioso para los jugadores jugar con diferentes estrategias. De esta manera, se puede pensar como lo opuesto a un juego de coordinación , donde jugar con la misma estrategia domina en el sentido de Pareto jugar con diferentes estrategias. El concepto subyacente es que los jugadores utilizan un recurso compartido. En los juegos de coordinación, compartir el recurso crea un beneficio para todos: el recurso no es rival y el uso compartido crea externalidades positivas . En los juegos de anticoordinación, el recurso es rival pero no excluible y compartir tiene un costo (o externalidad negativa).
Como la pérdida de la maniobra de desvío es tan trivial en comparación con el choque que ocurre si nadie se desvía, la estrategia razonable parecería ser desviar la jugada antes de que sea probable que se produzca un choque. Sin embargo, sabiendo esto, si uno cree que su oponente es razonable, puede decidir no desviarse en absoluto, creyendo que el oponente será razonable y decidirá desviarse, dejando al primer jugador como ganador. Esta situación inestable se puede formalizar diciendo que hay más de un equilibrio de Nash , que es un par de estrategias para las cuales ningún jugador gana al cambiar su propia estrategia mientras el otro permanece igual. (En este caso, los equilibrios de estrategia pura son las dos situaciones en las que un jugador se desvía mientras que el otro no lo hace).
Halcón | Paloma | |
Halcón | (V−C)/2, (V−C)/2 | V, 0 |
Paloma | 0, V | Dos veces, dos veces |
Fig. 3: Juego del halcón y la paloma |
Halcón | Paloma | |
Halcón | X, X | Miercoles, Viernes |
Paloma | Largo, Ancho | Yo, yo |
Fig. 4: Juego general halcón-paloma |
En la literatura biológica , este juego se conoce como Halcón-Paloma. La primera presentación de una forma del juego Halcón-Paloma fue por John Maynard Smith y George Price en su artículo, "La lógica del conflicto animal". [6] La matriz de pagos tradicional [4] [7] para el juego Halcón-Paloma se da en la Figura 3, donde V es el valor del recurso en disputa y C es el costo de una pelea intensificada. Se supone (casi siempre) que el valor del recurso es menor que el costo de una pelea, es decir, C > V > 0. Si C ≤ V, el juego resultante no es un juego de gallina sino un dilema del prisionero .
El valor exacto de la recompensa de Dove vs. Dove varía entre las formulaciones del modelo. A veces se supone que los jugadores se dividen la recompensa en partes iguales (V/2 cada uno), otras veces se supone que la recompensa es cero (ya que esta es la recompensa esperada para un juego de guerra de desgaste , que es el modelo presunto para una contienda decidida por la duración de la exhibición).
Si bien el juego del Halcón y la Paloma generalmente se enseña y se analiza con los pagos en términos de V y C, las soluciones son válidas para cualquier matriz con los pagos de la Figura 4, donde W > T > L > X. [7]
Los biólogos han explorado versiones modificadas del clásico juego del halcón y la paloma para investigar una serie de factores biológicamente relevantes. Entre ellos, se incluyen la variación en el potencial de retención de recursos y las diferencias en el valor de ganar para los diferentes jugadores [8] , lo que permite a los jugadores amenazarse entre sí antes de elegir movimientos en el juego [9] y la extensión de la interacción a dos jugadas del juego [10] .
Una táctica del juego es que una de las partes señale sus intenciones de manera convincente antes de que comience el juego. Por ejemplo, si una de las partes desactivara ostentosamente su volante justo antes del partido, la otra parte se vería obligada a desviarse. [11] Esto demuestra que, en algunas circunstancias, reducir las propias opciones puede ser una buena estrategia. Un ejemplo del mundo real es el de un manifestante que se esposa a un objeto, de modo que no se pueda hacer ninguna amenaza que lo obligue a moverse (ya que no puede moverse). Otro ejemplo, tomado de la ficción, se encuentra en Dr. Strangelove de Stanley Kubrick . En esa película, los rusos intentaron disuadir el ataque estadounidense construyendo una "máquina del fin del mundo", un dispositivo que desencadenaría la aniquilación mundial si Rusia fuera atacada por armas nucleares o si se hiciera cualquier intento por desarmarla. Sin embargo, los rusos habían planeado señalar el despliegue de la máquina unos días después de haberla instalado, lo que, debido a un desafortunado curso de los acontecimientos, resultó ser demasiado tarde.
Los jugadores también pueden hacer amenazas no vinculantes de no desviarse, como se ha modelado explícitamente en el juego Hawk-Dove. Estas amenazas funcionan, pero deben ser excesivamente costosas si la amenaza es una de dos señales posibles ("No me desviaré" o "Me desviaré"), o no tendrán costo si hay tres o más señales (en cuyo caso las señales funcionarán como un juego de " piedra, papel o tijera "). [9]
Todos los juegos de anticoordinación tienen tres equilibrios de Nash . Dos de ellos son perfiles de estrategia puramente contingentes, en los que cada jugador juega una de las dos estrategias y el otro jugador elige la estrategia opuesta. El tercero es un equilibrio mixto , en el que cada jugador elige probabilísticamente entre las dos estrategias puras. Tanto el equilibrio de Nash puro como el mixto serán estrategias evolutivamente estables dependiendo de si existen asimetrías no correlacionadas .
La mejor respuesta para todos los juegos de anti-coordinación 2x2 se muestra en la Figura 5. Las variables x e y en la Figura 5 son las probabilidades de jugar la estrategia escalada ("Halcón" o "No desviarse") para los jugadores X e Y respectivamente. La línea en el gráfico de la izquierda muestra la probabilidad óptima de jugar la estrategia escalada para el jugador Y como una función de x . La línea en el segundo gráfico muestra la probabilidad óptima de jugar la estrategia escalada para el jugador X como una función de y (los ejes no se han rotado, por lo que la variable dependiente se traza en la abscisa , y la variable independiente se traza en la ordenada ). Los equilibrios de Nash son donde las correspondencias de los jugadores concuerdan, es decir, se cruzan. Estos se muestran con puntos en el gráfico de la derecha. Las mejores respuestas concuerdan (es decir, se cruzan) en tres puntos. Los primeros dos equilibrios de Nash están en las esquinas superior izquierda e inferior derecha, donde un jugador elige una estrategia, el otro jugador elige la estrategia opuesta. El tercer equilibrio de Nash es una estrategia mixta que se encuentra a lo largo de la diagonal que va desde la esquina inferior izquierda hasta la esquina superior derecha. Si los jugadores no saben cuál de ellos es cuál, entonces el equilibrio de Nash mixto es una estrategia evolutivamente estable (ESS), ya que el juego se limita a la línea diagonal que va desde la esquina inferior izquierda hasta la esquina superior derecha. De lo contrario, se dice que existe una asimetría no correlacionada y los equilibrios de Nash de las esquinas son ESS.
La ESS del juego Hawk-Dove es una estrategia mixta. La teoría formal de juegos es indiferente a si esta mezcla se debe a que todos los jugadores de una población eligen aleatoriamente entre las dos estrategias puras (una gama de posibles reacciones instintivas para una única situación) o si la población es una mezcla polimórfica de jugadores dedicados a elegir una estrategia pura particular (una única reacción que difiere de un individuo a otro). Biológicamente, estas dos opciones son ideas sorprendentemente diferentes. El juego Hawk-Dove se ha utilizado como base para simulaciones evolutivas para explorar cuál de estos dos modos de mezcla debería predominar en la realidad. [12]
Tanto en "Chicken" como en "Hawk-Dove", el único equilibrio de Nash simétrico es el equilibrio de Nash de estrategia mixta , en el que ambos jugadores eligen aleatoriamente entre jugar Hawk/Straight o Dove/Swerve. Este equilibrio de estrategia mixta suele ser subóptimo: ambos jugadores obtendrían mejores resultados si pudieran coordinar sus acciones de alguna manera. Esta observación se ha realizado de forma independiente en dos contextos diferentes, con resultados casi idénticos. [13]
Atrevimiento | Pollo | |
Atrevimiento | 0,0 | 7,2 |
Pollo | 2,7 | 6,6 |
Fig. 6: Una versión de Pollo |
Considere la versión de "Chicken" que se muestra en la Figura 6. Como todas las formas del juego, hay tres equilibrios de Nash . Los dos equilibrios de Nash de estrategia pura son ( D , C ) y ( C , D ). También hay un equilibrio de estrategia mixta donde cada jugador se atreve con una probabilidad de 1/3. Esto da como resultado pagos esperados de 14/3 = 4,667 para cada jugador.
Ahora considere un tercero (o algún evento natural) que saca una de tres cartas etiquetadas: ( C , C ), ( D , C ), y ( C , D ). Se supone que este evento de robo exógeno es uniformemente aleatorio en los 3 resultados. Después de sacar la carta, el tercero informa a los jugadores la estrategia que se les asignó en la carta (pero no la estrategia asignada a su oponente). Suponga que a un jugador se le asigna D , no querría desviarse suponiendo que el otro jugador jugó su estrategia asignada ya que obtendrá 7 (la recompensa más alta posible). Suponga que a un jugador se le asigna C . Entonces al otro jugador se le ha asignado C con probabilidad 1/2 y D con probabilidad 1/2 (debido a la naturaleza del robo exógeno). La utilidad esperada de atreverse es 0(1/2) + 7(1/2) = 3,5 y la utilidad esperada de acobardarse es 2(1/2) + 6(1/2) = 4. Por lo tanto, el jugador preferiría acobardarse.
Dado que ningún jugador tiene incentivos para desviarse de las asignaciones sorteadas, esta distribución de probabilidad sobre las estrategias se conoce como equilibrio correlacionado del juego. En particular, el resultado esperado para este equilibrio es 7(1/3) + 2(1/3) + 6(1/3) = 5, que es mayor que el resultado esperado del equilibrio de Nash de estrategia mixta.
Aunque existen tres equilibrios de Nash en el juego Halcón-Paloma, el que surge como la estrategia evolutivamente estable (ESS) depende de la existencia de cualquier asimetría no correlacionada en el juego (en el sentido de los juegos de anticoordinación ). Para que los jugadores de fila elijan una estrategia y los jugadores de columna la otra, los jugadores deben ser capaces de distinguir qué rol (jugador de columna o de fila) tienen. Si no existe tal asimetría no correlacionada, entonces ambos jugadores deben elegir la misma estrategia, y la ESS será el equilibrio de Nash mixto. Si hay una asimetría no correlacionada, entonces el Nash mixto no es un ESS, pero los dos equilibrios de Nash puros, contingentes al rol, sí lo son.
La interpretación biológica estándar de esta asimetría no correlacionada es que un jugador es el dueño del territorio, mientras que el otro es un intruso en el territorio. En la mayoría de los casos, el dueño del territorio juega como el Halcón mientras que el intruso juega como la Paloma. En este sentido, la evolución de las estrategias en el caso del Halcón-Paloma puede verse como la evolución de una especie de versión prototípica de la propiedad. Sin embargo, desde el punto de vista de la teoría de juegos, no hay nada especial en esta solución. La solución opuesta (donde el dueño juega como la paloma y el intruso juega como el Halcón) es igualmente estable. De hecho, esta solución está presente en una cierta especie de araña: cuando aparece un invasor, la araña ocupante se va. Para explicar la prevalencia de los derechos de propiedad sobre los "derechos anti-propiedad", uno debe descubrir una manera de romper esta simetría adicional. [13]
La dinámica de replicadores es un modelo simple de cambio de estrategia que se utiliza comúnmente en la teoría de juegos evolutiva . En este modelo, una estrategia que funciona mejor que el promedio aumenta en frecuencia a expensas de las estrategias que funcionan peor que el promedio. Hay dos versiones de la dinámica de replicadores. En una versión, hay una sola población que juega contra sí misma. En otra, hay dos modelos de población donde cada población solo juega contra la otra población (y no contra sí misma).
En el modelo de una población, el único estado estable es el equilibrio de Nash de estrategia mixta. Cada proporción inicial de la población (excepto todos los Hawk y todos los Dove ) converge al equilibrio de Nash de estrategia mixta donde una parte de la población juega Hawk y otra parte juega Dove . (Esto ocurre porque el único ESS es el equilibrio de estrategia mixta). En el modelo de dos poblaciones, este punto mixto se vuelve inestable. De hecho, los únicos estados estables en el modelo de dos poblaciones corresponden a los equilibrios de estrategia pura, donde una población está compuesta por todos los Hawks y la otra por todos los Dove . En este modelo, una población se convierte en la población agresiva mientras que la otra se vuelve pasiva. Este modelo se ilustra mediante el campo vectorial representado en la Figura 7a. El campo vectorial unidimensional del modelo de población única (Figura 7b) corresponde a la diagonal inferior izquierda a superior derecha del modelo de dos poblaciones.
El modelo de población única presenta una situación en la que no existen asimetrías no correlacionadas, por lo que lo mejor que pueden hacer los jugadores es aleatorizar sus estrategias. Los dos modelos de población proporcionan esa asimetría y los miembros de cada población la utilizarán para correlacionar sus estrategias. En el modelo de dos poblaciones, una población gana a expensas de otra. Hawk-Dove y Chicken ilustran así un caso interesante en el que los resultados cualitativos para las dos versiones diferentes de la dinámica del replicador difieren enormemente. [14]
En el contexto de un conflicto, a menudo se utilizan como sinónimos "pollito" y " política de riesgo ", pero en el sentido estricto de la teoría de juegos, "política de riesgo" se refiere a una jugada estratégica diseñada para evitar la posibilidad de que el oponente adopte un comportamiento agresivo. La jugada implica una amenaza creíble de riesgo de comportamiento irracional ante una agresión. Si el jugador 1 se mueve unilateralmente hacia A, un jugador racional 2 no puede tomar represalias ya que (A, C) es preferible a (A, A). Sólo si el jugador 1 tiene motivos para creer que existe un riesgo suficiente de que el jugador 2 responda irracionalmente (normalmente cediendo el control sobre la respuesta, de modo que exista un riesgo suficiente de que el jugador 2 responda con A), el jugador 1 se retractará y aceptará el compromiso.
Al igual que "Chicken", el juego "War of attrition" modela la escalada del conflicto, pero difieren en la forma en que el conflicto puede escalar. Chicken modela una situación en la que el resultado catastrófico difiere en naturaleza del resultado agradable, por ejemplo, si el conflicto es sobre la vida o la muerte. War of attrition modela una situación en la que los resultados difieren solo en grados, como un combate de boxeo en el que los contendientes tienen que decidir si el premio final de la victoria vale el costo continuo del deterioro de la salud y la resistencia.
El juego del Halcón-Paloma es el modelo teórico de juegos más utilizado en biología para las interacciones agresivas. [15] La guerra de desgaste es otro modelo muy influyente de agresión en biología. Los dos modelos investigan cuestiones ligeramente diferentes. El juego del Halcón-Paloma es un modelo de escalada y aborda la cuestión de cuándo un individuo debe escalar a un combate físico peligrosamente costoso. La guerra de desgaste busca responder a la pregunta de cómo se pueden resolver las contiendas cuando no hay posibilidad de combate físico. La guerra de desgaste es una subasta en la que ambos jugadores pagan la oferta más baja (una subasta de segundo precio con pago total). Se supone que las ofertas son la duración que el jugador está dispuesto a persistir en hacer una exhibición de amenaza costosa . Ambos jugadores acumulan costos mientras se exhiben el uno al otro, la contienda termina cuando el individuo que hace la oferta más baja se retira. Ambos jugadores habrán pagado entonces la oferta más baja.
El dilema del prisionero es un juego simétrico de 2x2 con intereses en conflicto, el resultado preferido es jugar Straight mientras el oponente juega Swerve . De manera similar, el dilema del prisionero es un juego simétrico de 2x2 con intereses en conflicto: el resultado preferido es Defect mientras el oponente juega Cooperate . PD trata sobre la imposibilidad de cooperación mientras que Chicken trata sobre la inevitabilidad del conflicto. El juego iterado puede resolver PD pero no Chicken. [16]
Defecto | Cooperar | |
Defecto | norte | yo |
Cooperar | PAG | do |
Dilema del prisionero. Los rangos de recompensa (para el jugador de fila) son: T emptación > Coordinación > Neutral > Castigo . |
Ambos juegos tienen un resultado cooperativo deseable en el que ambos jugadores eligen la estrategia menos escalada, Swerve-Swerve en el juego Chicken, y Cooperate-Cooperate en el dilema del prisionero, de modo que los jugadores reciben el pago de Coordinación C (ver las tablas a continuación). La tentación de alejarse de este resultado sensato es hacia un movimiento Straight en Chicken y un movimiento de Defect en el dilema del prisionero (generando el pago de Tentación , si el otro jugador usa el movimiento menos escalado). La diferencia esencial entre estos dos juegos es que en el dilema del prisionero, la estrategia Cooperar es dominada, mientras que en Chicken el movimiento equivalente no es dominado ya que los pagos de resultados cuando el oponente juega el movimiento más escalado ( Straight en lugar de Defect ) se invierten.
Derecho | Viraje | |
Derecho | PAG | yo |
Viraje | norte | do |
Pollo/Halcón–Paloma. Los rangos de recompensa (para el jugador de Fila) son: T emptación > Coordinación > Neutral > Castigo . |
El término " cronograma de pollo " [17] se utiliza en los círculos de gestión de proyectos y desarrollo de software . La condición se produce cuando dos o más áreas de un equipo de producto afirman que pueden entregar características en una fecha poco realista porque cada una supone que los otros equipos están estirando las predicciones aún más de lo que lo hacen. Esta pretensión avanza continuamente de un punto de control del proyecto al siguiente hasta que comienza la integración de la característica o justo antes de que la funcionalidad esté realmente lista.
La práctica de “reglamentar el calendario” [18] suele dar lugar a deslices contagiosos de los horarios debido a las dependencias entre equipos y es difícil de identificar y resolver, ya que lo mejor para cada equipo es no ser el primero en dar malas noticias. Los factores psicológicos que subyacen a la conducta de “reglamentar el calendario” imitan en muchos sentidos el modelo de conflicto del halcón-paloma o del ventisquero . [19]