Dos personas son detenidas como sospechosas de un crimen. Son separadas y a cada una se le ofrece el mismo trato: si delatás a tu cómplice y él no te delata, vos quedás libre y él va preso 10 años. Si ambos se delatan, cada uno va preso 5 años. Si ninguno delata, ambos van presos 2 años por un cargo menor.
¿Qué hace cada uno?
Si los dos razonan individualmente y con lógica perfecta, los dos se delatan mutuamente —y los dos terminan 5 años presos, cuando podrían haber estado solo 2.
Esto es el dilema del prisionero, y es el ejemplo central de la teoría de juegos: la rama de las matemáticas que estudia cómo personas racionales toman decisiones cuando el resultado no depende solo de lo que vos hacés sino de lo que hacen los demás.

Por qué los dos se delatan (aunque sea peor para ambos)
Analizemos la lógica del prisionero A:
- Si B no me delata: si yo lo delato, quedo libre; si no lo delato, voy preso 2 años. Mejor delatarlo.
- Si B me delata: si yo lo delato, voy 5 años; si no lo delato, voy 10 años. Mejor delatarlo.
En cualquier escenario, A tiene más que ganar delatando. Lo mismo razona B. Por lo tanto, ambos se delatan.
Esta es la lógica de lo que se llama un equilibrio de Nash —en honor al matemático John Nash, cuya historia fue popularizada por la película Una mente brillante. Un equilibrio de Nash es una situación donde ningún jugador puede mejorar su resultado cambiando unilateralmente su estrategia, dado lo que hacen los demás.
En el dilema del prisionero, ambos delatándose es un equilibrio de Nash —aunque sea peor para ambos que si los dos cooperaran. Ninguno de los dos tiene incentivo individual para cambiar de estrategia si el otro no cambia la suya.
La paradoja de la racionalidad
El dilema del prisionero ilustra una paradoja central de la teoría de juegos: la racionalidad individual puede llevar a resultados colectivamente irracionales.
Los dos prisioneros son perfectamente racionales. Cada uno maximiza su propio beneficio dado lo que el otro puede hacer. El resultado es peor para ambos que si hubieran cooperado.
Este patrón se repite en decenas de contextos reales:
Carrera armamentista: cada país tiene incentivo de armarse más, porque si el otro se arma y vos no, estás en desventaja. El resultado es que todos gastan enormes recursos en armamentos que no usan.
Pesca de recursos comunes: cada empresa pesquera tiene incentivo de pescar más antes de que lo haga la competencia. El resultado es la sobreexplotación y el colapso del recurso.
Publicidad competitiva: cada empresa tiene incentivo de gastar más en publicidad que la competencia. El resultado es que todos gastan más y las participaciones de mercado no cambian.
Cambio climático: cada país tiene incentivo de no reducir emisiones porque el costo recae sobre él pero el beneficio se distribuye globalmente. El resultado es que todos contaminan más de lo óptimo colectivo.
Cómo se rompe el dilema: la repetición
El dilema del prisionero asume que el juego se juega una sola vez y los jugadores no tienen historia ni futuro juntos. Cuando el juego se repite muchas veces, la lógica cambia.
Robert Axelrod, politólogo de Michigan, realizó en 1980 un torneo computacional donde diferentes estrategias competían en el dilema del prisionero repetido. La estrategia ganadora fue la más simple de todas: Tit for Tat (ojo por ojo). Empieza cooperando. Después, hace lo que el otro hizo en la ronda anterior.
Tit for Tat tiene cuatro propiedades que resultaron ser ganadoras:
1. Nunca defecciona primero — es amigable
2. Responde a la defección con defección — es recíproca, no se deja explotar
3. Perdona rápido — si el otro vuelve a cooperar, vuelve a cooperar
4. Es simple — su comportamiento es predecible
La conclusión de Axelrod es que la cooperación puede emerger espontáneamente en una población de agentes que juegan repetidamente, sin que nadie la imponga desde afuera —siempre que los jugadores interactúen suficientemente seguido y tengan memoria de las interacciones pasadas.
John Nash y el equilibrio
John Nash, matemático de Princeton que publicó su teorema del equilibrio en 1950, generalizó el concepto más allá del dilema del prisionero. El equilibrio de Nash existe en cualquier juego finito de dos o más jugadores —y a veces en más de uno.
Nash pasó años luchando con esquizofrenia paranoide antes de recuperarse y recibir el Premio Nobel de Economía en 1994. Murió en 2015 en un accidente de taxi en Nueva Jersey junto a su esposa, horas después de recoger el Abel Prize en Noruega.
Teoría de juegos más allá del dilema del prisionero
El dilema del prisionero es el ejemplo más famoso pero no el único tipo de juego.
Juegos de suma cero: lo que uno gana, el otro lo pierde. El ajedrez es el ejemplo más limpio. En estos juegos no hay beneficio en cooperar — la ganancia de uno es la pérdida del otro.
Juego del gallina (chicken): dos conductores van a toda velocidad uno hacia el otro. El que gira pierde. Si ninguno gira, chocan. Este modelo se usó para analizar la crisis de los misiles de Cuba.
Juegos de coordinación: el beneficio viene de coordinarse con el otro, no de ganarle. ¿Por qué todos manejan por el mismo lado de la ruta? Porque coordinarse con los demás es lo que importa.
La teoría de juegos es hoy una herramienta central en economía, ciencias políticas, biología evolutiva (la competencia entre organismos sigue su lógica), y en el diseño de inteligencia artificial.