Un Mundo Loco ●

La IA que ganó al póker no tenía acceso a las cartas del rival. Ganó igual.

La IA que ganó al póker no tenía acceso a las cartas del rival. Ganó igual.

En 1997, Deep Blue de IBM venció a Garry Kasparov en ajedrez. El hito fue enorme. También fue, desde cierto punto de vista, el problema más fácil. En ajedrez ambos jugadores ven el tablero completo. La IA con suficiente poder de cómputo puede calcular más posiciones que un humano. Era cuestión de tiempo.

El póker es diferente. En el póker no ves las cartas del otro. Tomás decisiones con información incompleta. Blofeas. Lees al rival. Gestionás la incertidumbre.

Durante décadas, los especialistas en IA dijeron que el póker representaba un desafío cualitativamente distinto al ajedrez, precisamente porque no era un juego de información perfecta.

En 2017, Libratus, un sistema de Carnegie Mellon, venció a los cuatro mejores jugadores de Texas Hold'em del mundo en un torneo de veinte días. No fue cercano.

Cómo la IA juega sin ver las cartas

Libratus no intentó adivinar las cartas del rival. Construyó una estrategia basada en rangos de probabilidad: dado lo que sé de mis cartas, del historial de apuestas y de las cartas comunitarias visibles, ¿cuál es la distribución de manos posibles que tiene el rival? ¿Cómo apuesto de manera que sea imposible de explotar independientemente de cuál sea su mano?

El concepto técnico se llama equilibrio de Nash aplicado a juegos de información imperfecta. La IA encuentra estrategias que no pueden ser explotadas sistemáticamente por ningún rival, sin importar lo que ese rival haga.

Los jugadores humanos dijeron que Libratus los hacía sentir que apostaba aleatoriamente. Después entendieron que la "aleatoriedad" era calculada para que no pudieran encontrar patrones explotables.

Por qué esto importa más allá del póker

Los juegos de información imperfecta son la norma en el mundo real. Las negociaciones, las decisiones médicas con diagnósticos incompletos, la estrategia empresarial, la política, las operaciones militares: todos comparten la estructura del póker, no la del ajedrez.

Una IA que maneja la incertidumbre estratégica mejor que los mejores humanos en un dominio de juego tiene implicaciones que van mucho más allá de los torneos de cartas.

El equipo de Carnegie Mellon recibió contratos del Departamento de Defensa de Estados Unidos después de publicar los resultados de Libratus.

El detalle que más incomodó a los jugadores

Uno de los cuatro jugadores que perdió contra Libratus contó después que lo más perturbador no fue perder. Fue que el sistema mejoraba durante el torneo. Cada noche, mientras los jugadores dormían, Libratus analizaba los patrones de la jornada y ajustaba su estrategia.

Los jugadores intentaban explotar sus debilidades. Para cuando habían identificado algo que parecía una debilidad, el sistema ya lo había corregido.

Fuente original: Science

Fuente: Science