La teoría de juegos explica por qué dos personas racionales…

Dos personas son detenidas como sospechosas de un crimen. Son separadas y a cada una se le ofrece el mismo trato: si delatás a tu cómplice y él no te delata, vos quedás libre y él va preso 10 años. Si ambos se delatan, cada uno va preso 5 años. Si ninguno delata, ambos van presos 2 años por un cargo menor.

¿Qué hace cada uno?

Si los dos razonan individualmente y con lógica perfecta, los dos se delatan mutuamente —y los dos terminan 5 años presos, cuando podrían haber estado solo 2.

Esto es el dilema del prisionero, y es el ejemplo central de la teoría de juegos: la rama de las matemáticas que estudia cómo personas racionales toman decisiones cuando el resultado no depende solo de lo que vos hacés sino de lo que hacen los demás.

Tablero de ajedrez. La teoría de juegos estudia situaciones estratégicas donde el resultado depende de las decisiones de múltiples personas — de la misma manera que en un juego cada jugador debe anticipar los movimientos del otro.

Por qué los dos se delatan (aunque sea peor para ambos)

Analizemos la lógica del prisionero A:

Si B no me delata: si yo lo delato, quedo libre; si no lo delato, voy preso 2 años. Mejor delatarlo.
Si B me delata: si yo lo delato, voy 5 años; si no lo delato, voy 10 años. Mejor delatarlo.

En cualquier escenario, A tiene más que ganar delatando. Lo mismo razona B. Por lo tanto, ambos se delatan.

Esta es la lógica de lo que se llama un equilibrio de Nash —en honor al matemático John Nash, cuya historia fue popularizada por la película Una mente brillante. Un equilibrio de Nash es una situación donde ningún jugador puede mejorar su resultado cambiando unilateralmente su estrategia, dado lo que hacen los demás.

En el dilema del prisionero, ambos delatándose es un equilibrio de Nash —aunque sea peor para ambos que si los dos cooperaran. Ninguno de los dos tiene incentivo individual para cambiar de estrategia si el otro no cambia la suya.

La paradoja de la racionalidad

El dilema del prisionero ilustra una paradoja central de la teoría de juegos: la racionalidad individual puede llevar a resultados colectivamente irracionales.

Los dos prisioneros son perfectamente racionales. Cada uno maximiza su propio beneficio dado lo que el otro puede hacer. El resultado es peor para ambos que si hubieran cooperado.

Este patrón se repite en decenas de contextos reales:

Carrera armamentista: cada país tiene incentivo de armarse más, porque si el otro se arma y vos no, estás en desventaja. El resultado es que todos gastan enormes recursos en armamentos que no usan.

Pesca de recursos comunes: cada empresa pesquera tiene incentivo de pescar más antes de que lo haga la competencia. El resultado es la sobreexplotación y el colapso del recurso.

Publicidad competitiva: cada empresa tiene incentivo de gastar más en publicidad que la competencia. El resultado es que todos gastan más y las participaciones de mercado no cambian.

Cambio climático: cada país tiene incentivo de no reducir emisiones porque el costo recae sobre él pero el beneficio se distribuye globalmente. El resultado es que todos contaminan más de lo óptimo colectivo.

Cómo se rompe el dilema: la repetición

El dilema del prisionero asume que el juego se juega una sola vez y los jugadores no tienen historia ni futuro juntos. Cuando el juego se repite muchas veces, la lógica cambia.

Robert Axelrod, politólogo de Michigan, realizó en 1980 un torneo computacional donde diferentes estrategias competían en el dilema del prisionero repetido. La estrategia ganadora fue la más simple de todas: Tit for Tat (ojo por ojo). Empieza cooperando. Después, hace lo que el otro hizo en la ronda anterior.

Tit for Tat tiene cuatro propiedades que resultaron ser ganadoras:
1. Nunca defecciona primero — es amigable
2. Responde a la defección con defección — es recíproca, no se deja explotar
3. Perdona rápido — si el otro vuelve a cooperar, vuelve a cooperar
4. Es simple — su comportamiento es predecible

La conclusión de Axelrod es que la cooperación puede emerger espontáneamente en una población de agentes que juegan repetidamente, sin que nadie la imponga desde afuera —siempre que los jugadores interactúen suficientemente seguido y tengan memoria de las interacciones pasadas.

John Nash y el equilibrio

John Nash, matemático de Princeton que publicó su teorema del equilibrio en 1950, generalizó el concepto más allá del dilema del prisionero. El equilibrio de Nash existe en cualquier juego finito de dos o más jugadores —y a veces en más de uno.

Nash pasó años luchando con esquizofrenia paranoide antes de recuperarse y recibir el Premio Nobel de Economía en 1994. Murió en 2015 en un accidente de taxi en Nueva Jersey junto a su esposa, horas después de recoger el Abel Prize en Noruega.

Teoría de juegos más allá del dilema del prisionero

El dilema del prisionero es el ejemplo más famoso pero no el único tipo de juego.

Juegos de suma cero: lo que uno gana, el otro lo pierde. El ajedrez es el ejemplo más limpio. En estos juegos no hay beneficio en cooperar — la ganancia de uno es la pérdida del otro.

Juego del gallina (chicken): dos conductores van a toda velocidad uno hacia el otro. El que gira pierde. Si ninguno gira, chocan. Este modelo se usó para analizar la crisis de los misiles de Cuba.

Juegos de coordinación: el beneficio viene de coordinarse con el otro, no de ganarle. ¿Por qué todos manejan por el mismo lado de la ruta? Porque coordinarse con los demás es lo que importa.

La teoría de juegos es hoy una herramienta central en economía, ciencias políticas, biología evolutiva (la competencia entre organismos sigue su lógica), y en el diseño de inteligencia artificial.

Fuente: Stanford Encyclopedia of Philosophy — Game Theory

Por qué los dos se delatan (aunque sea peor para ambos)

La paradoja de la racionalidad

Cómo se rompe el dilema: la repetición

John Nash y el equilibrio

Teoría de juegos más allá del dilema del prisionero

Si esta nota te sirvió, la próxima te conviene por mail

Seguir leyendo

Qué pasó en los primeros segundos del universo. La respuesta es más concreta de lo que pensás.

Los perros bostezan cuando estás estresado. No es coincidencia.

Miles de personas recuerdan que Mandela murió en prisión en los 80. Murió en 2013. ¿Qué está pasando?

Marco Aurelio escribió las Meditaciones para sí mismo. Nunca pensó que nadie las iba a leer.

Un esclavo, el asesor más poderoso de Roma y un emperador escribieron lo mismo sobre el trabajo. Sin conocerse.

6 personas habían visto esa foto. Entonces Barbra Streisand contrató abogados.