Tit for tat es un dicho inglés que significa " represalia equivalente ". Es una alteración de tip for tap (golpe por golpe), [1] registrado por primera vez en 1558. [2]
También es una estrategia muy eficaz en la teoría de juegos . Un agente que utilice esta estrategia primero cooperará y luego replicará la acción anterior de un oponente. Si el oponente cooperó anteriormente, el agente coopera. Si no, el agente no lo hace. Esto es similar al altruismo recíproco en biología.
El dilema del prisionero iterado se ha utilizado con mucho éxito como estrategia . La estrategia fue introducida por primera vez por Anatol Rapoport en los dos torneos de Robert Axelrod , [3] celebrados alrededor de 1980. Cabe destacar que (en ambas ocasiones) fue la estrategia más sencilla y la más exitosa en la competencia directa.
El éxito de la estrategia del tit-por-tat, que es en gran medida cooperativa a pesar de que su nombre enfatiza una naturaleza adversaria, tomó a muchos por sorpresa. Al compararla con estrategias elaboradas por varios equipos, ganó en dos competiciones. Después de la primera competición, las nuevas estrategias formuladas específicamente para combatir el tit-por-tat fracasaron debido a sus interacciones negativas entre sí; una estrategia exitosa que no fuera el tit-por-tat habría tenido que formularse teniendo en mente tanto el tit-por-tat como a sí misma.
Este resultado puede dar una idea de cómo los grupos de animales (y en particular las sociedades humanas) han llegado a vivir en sociedades en gran medida (o totalmente) cooperativas, en lugar de la forma individualista de " garras y dientes rojos " que podría esperarse de individuos que participan en un estado de naturaleza hobbesiano . Este tema, y en particular su aplicación a la sociedad y la política humanas, es el tema del libro de Robert Axelrod La evolución de la cooperación .
Además, la estrategia del ojo por ojo ha sido de utilidad para los psicólogos sociales y sociólogos en el estudio de técnicas eficaces para reducir los conflictos. Las investigaciones han indicado que cuando los individuos que han estado compitiendo durante un período de tiempo ya no confían entre sí, el método más eficaz para invertir la competencia es el uso de la estrategia del ojo por ojo. Los individuos suelen participar en la asimilación conductual, un proceso en el que tienden a adaptar sus propios comportamientos a los de los miembros del grupo que cooperan o compiten. Por lo tanto, si la estrategia del ojo por ojo comienza con la cooperación, la cooperación sigue. Por otro lado, si la otra parte compite, la estrategia del ojo por ojo llevará a la otra parte a competir también. En última instancia, cada acción del otro miembro se contrarresta con una respuesta correspondiente, competencia con competencia y cooperación con cooperación.
En el caso de la resolución de conflictos, la estrategia del ojo por ojo es eficaz por varias razones: la técnica se reconoce como clara , agradable , provocable y tolerante . En primer lugar, es una estrategia clara y reconocible. Quienes la utilizan reconocen rápidamente sus contingencias y ajustan su comportamiento en consecuencia. Además, se considera agradable porque comienza con la cooperación y solo falla en respuesta a la competencia. La estrategia también es provocable porque proporciona una represalia inmediata para quienes compiten. Por último, es indulgente porque produce inmediatamente cooperación si el competidor realiza un movimiento cooperativo.
Las implicaciones de la estrategia del ojo por ojo han sido relevantes para la investigación y la resolución de conflictos y para muchos aspectos de la ciencia social aplicada. [4]
Tomemos como ejemplo el siguiente juego de dilema del prisionero que se repite infinitamente:
do | D | |
---|---|---|
do | 6, 6 | 2, 9 |
D | 9, 2 | 3, 3 |
La estrategia de ojo por ojo copia lo que el otro jugador eligió previamente. Si los jugadores cooperan jugando la estrategia (C,C), cooperan para siempre.
1 | 2 | 3 | 4 | ... | |
---|---|---|---|---|---|
pág. 1 | do | do | do | do | ... |
pág. 2 | do | do | do | do | ... |
La cooperación da el siguiente resultado (donde es el factor de descuento):
una serie geométrica que suma
Si un jugador se desvía y deserta (D), en la siguiente ronda será castigado. Se alternan los resultados en los que p1 coopera y p2 se desvía, y viceversa.
1 | 2 | 3 | 4 | ... | |
---|---|---|---|---|---|
pág. 1 | do | D | do | D | ... |
pág. 2 | D | do | D | do | ... |
La desviación da el siguiente resultado:
una suma de dos series geométricas que da como resultado
Espere colaboración si la recompensa de la desviación no es mejor que la cooperación.
Continuar cooperando si,
Continúe desertando si,
Aunque Axelrod ha demostrado empíricamente que la estrategia es óptima en algunos casos de competencia directa, dos agentes que juegan al tit por tat siguen siendo vulnerables. Un error puntual, de un solo bit, en la interpretación de los acontecimientos por parte de cualquiera de los jugadores puede conducir a una "espiral de muerte" interminable: si un agente deserta y el oponente coopera, entonces ambos agentes terminarán alternando entre cooperar y desertar, lo que producirá una recompensa menor que si ambos agentes cooperaran continuamente. Esta situación surge con frecuencia en conflictos del mundo real, que van desde peleas en el patio de la escuela hasta guerras civiles y regionales. La razón de estos problemas es que el tit por tat no es un equilibrio perfecto en subjuegos , excepto en condiciones de extrema dificultad en la tasa de descuento . [5] Si bien este subjuego no es directamente alcanzable por dos agentes que juegan estrategias tit por tat, una estrategia debe ser un equilibrio de Nash en todos los subjuegos para ser perfecta en subjuegos. Además, este subjuego puede alcanzarse si se permite algún ruido en la señalización de los agentes. Se puede crear una variante perfecta de subjuego de tit for tat conocida como "tit for tat contrito" empleando un mecanismo de reputación básico. [6]
El equilibrio de filo de cuchillo es "un equilibrio que existe sólo para valores exactos de las variables exógenas. Si se varían las variables incluso en la forma más mínima, el equilibrio de filo de cuchillo desaparece". [7]
Puede ser tanto un equilibrio de Nash como un equilibrio de filo de cuchillo. Se lo conoce como equilibrio de filo de cuchillo porque el equilibrio "se apoya precariamente" en el valor exacto.
Ejemplo:
Izquierda | Bien | |
---|---|---|
Arriba | (X, X) | (0, 0) |
Abajo | (0, 0) | (-X, -X) |
Supongamos que X = 0. No hay desviación rentable de (Abajo, Izquierda) o de (Arriba, Derecha). Sin embargo, si el valor de X se desvía en cualquier cantidad, sin importar cuán pequeña sea, entonces el equilibrio ya no se mantiene. Se vuelve rentable desviarse hacia arriba, por ejemplo, si X tiene un valor de 0,000001 en lugar de 0. Por lo tanto, el equilibrio es muy precario. En su uso en el artículo de Wikipedia, las condiciones de borde de cuchillo se refieren al hecho de que muy raramente, solo cuando se cumple una condición específica y, por ejemplo, X, es igual a un valor específico, hay equilibrio.
El "ojo por ojo con perdón" podría ser una estrategia para mitigar este problema; véase la descripción a continuación. [8] "El ojo por ojo con perdón" es un intento similar de escapar de la espiral de la muerte. Cuando el oponente se rinde, un jugador que emplee esta estrategia ocasionalmente cooperará en el siguiente movimiento de todos modos. La probabilidad exacta de que un jugador responda con cooperación depende de la alineación de oponentes.
Además, la estrategia de ojo por ojo no ha demostrado ser óptima en situaciones en las que no hay competencia total. Por ejemplo, cuando las partes son amigas, puede ser mejor para la amistad que un jugador coopere en cada paso a pesar de las ocasionales desviaciones del otro jugador. La mayoría de las situaciones en el mundo real son menos competitivas que la competencia total en la que la estrategia de ojo por ojo ganó su competencia.
El tit for tat es muy diferente del grim trigger , en el sentido de que es indulgente por naturaleza, ya que produce inmediatamente cooperación, si el competidor decide cooperar. El grim trigger, por otro lado, es la estrategia más implacable, en el sentido de que incluso un solo defecto haría que el jugador que use el grim trigger se quedara con el defecto por el resto del juego. [9]
El juego de dos manos es similar al juego de dos manos, pero permite al oponente abandonar la estrategia acordada dos veces antes de que el jugador tome represalias. Este aspecto hace que el jugador que utiliza la estrategia de dos manos parezca más “indulgente” ante el oponente.
En una estrategia de toma y daca, una vez que un oponente deserta, el jugador de toma y daca responde inmediatamente desertando en el siguiente movimiento. Esto tiene la desafortunada consecuencia de que dos estrategias de represalia se enfrenten continuamente entre sí, lo que resulta en un mal resultado para ambos jugadores. Un jugador de toma y daca dejará que la primera deserción pase inadvertida como un medio para evitar la "espiral de la muerte" del ejemplo anterior. Si el oponente deserta dos veces seguidas, el jugador de toma y daca responderá desertando.
Esta estrategia fue propuesta por Robert Axelrod durante su segunda ronda de simulaciones por computadora en RAND . Después de analizar los resultados del primer experimento, determinó que si un participante hubiera introducido la estrategia de tit for two tats, habría surgido con una puntuación acumulada más alta que cualquier otro programa. Como resultado, él mismo la introdujo con grandes expectativas en el segundo torneo. Desafortunadamente, debido a la naturaleza más agresiva de los programas introducidos en la segunda ronda, que pudieron aprovechar su naturaleza altamente indulgente, tit for two tats tuvo un rendimiento significativamente peor (en el sentido de la teoría de juegos) que tit for tat. [10]
Los pares de BitTorrent utilizan la estrategia tit-for-tat para optimizar su velocidad de descarga. [11] Más específicamente, la mayoría de los pares de BitTorrent utilizan una variante de tit for two tats que se llama desbloqueo regular en la terminología de BitTorrent. Los pares de BitTorrent tienen un número limitado de ranuras de carga para asignar a otros pares. En consecuencia, cuando el ancho de banda de carga de un par está saturado, utilizará una estrategia tit-for-tat. La cooperación se logra cuando el ancho de banda de carga se intercambia por ancho de banda de descarga. Por lo tanto, cuando un par no está cargando a cambio de la carga de nuestro propio par, el programa BitTorrent estrangulará la conexión con el par no cooperativo y asignará esta ranura de carga a un par que se espera que coopere más. El desbloqueo regular se correlaciona con cooperar siempre en el primer movimiento en el dilema del prisionero. Periódicamente, un par asignará una ranura de carga a un par no cooperativo elegido al azar ( desbloqueo ). Esto se llama desbloqueo optimista . Este comportamiento permite buscar pares más cooperativos y da una segunda oportunidad a los pares que no cooperaron anteriormente. Los valores umbral óptimos de esta estrategia aún son objeto de investigación.
Los estudios sobre el comportamiento prosocial de los animales han llevado a muchos etólogos y psicólogos evolucionistas a aplicar estrategias de ojo por ojo para explicar por qué el altruismo evoluciona en muchas comunidades animales. La teoría de juegos evolutiva, derivada de las teorías matemáticas formalizadas por von Neumann y Morgenstern (1953), fue ideada por primera vez por Maynard Smith (1972) y explorada más a fondo en el comportamiento de las aves por Robert Hinde . Su aplicación de la teoría de juegos a la evolución de las estrategias animales dio inicio a una forma completamente nueva de analizar el comportamiento animal.
El altruismo recíproco funciona en comunidades animales donde el costo para el benefactor en cualquier transacción de alimento, derechos de apareamiento, anidación o territorio es menor que las ganancias para el beneficiario. La teoría también sostiene que el acto de altruismo debe ser recíproco si el equilibrio de necesidades se invierte. Los mecanismos para identificar y castigar a los "tramposos" que no responden, en efecto una forma de ojo por ojo, son importantes para regular el altruismo recíproco. Por ejemplo, se sugiere que el ojo por ojo es el mecanismo de la conducta cooperativa de inspección de depredadores en los guppies .
La incapacidad de cualquiera de las partes para dar marcha atrás en el conflicto, por miedo a ser percibidas como débiles o como cooperadoras del enemigo, ha sido la causa de muchos conflictos prolongados a lo largo de la historia.
Sin embargo, los analistas también han detectado la estrategia del ojo por ojo en el comportamiento no violento espontáneo, llamado " vive y deja vivir ", que surgió durante la guerra de trincheras en la Primera Guerra Mundial . Las tropas atrincheradas a sólo unos cientos de metros unas de otras desarrollaban un entendimiento tácito. Si un francotirador mataba a un soldado de un bando, el otro esperaba una represalia equivalente. Por el contrario, si nadie moría durante un tiempo, el otro bando reconocía esta "tregua" implícita y actuaba en consecuencia. Esto creaba una "paz separada" entre las trincheras. [12]
Durante los disturbios, el término se utilizó para describir el comportamiento cada vez más frecuente de ojo por ojo entre los republicanos irlandeses y los unionistas del Ulster . [13] Esto se puede ver con el atentado con bomba en el pub Red Lion por parte del IRA, seguido por el atentado en el bar McGurk's , ambos dirigidos contra civiles. En concreto, los ataques de masacres se estructurarían en torno a los asesinatos mutuos de las comunidades unionistas y republicanas , ya que ambas comunidades generalmente no estaban interesadas en la violencia. [14] Esta mentalidad sectaria llevó a que el término "bombardeos de ojo por ojo" entrara en el léxico común de la sociedad norirlandesa . [15] [16]