La IA no puede escribir en lunfardo y lo que eso revela sobre cómo funciona el lenguaje

Probalo. Abrí cualquier modelo de inteligencia artificial y pedile que escriba un párrafo en lunfardo porteño. No el lunfardo académico de diccionario. El lunfardo real: el que mezcla el vesre con el tono rioplatense, con las inflexiones que cambian según el barrio, con las palabras que entraron hace diez años y las que quedaron de los cincuenta.

Lo que vas a recibir es algo que parece lunfardo visto desde afuera. Tiene algunas palabras correctas. Tiene el ritmo aproximado. Pero le falta algo que es difícil de nombrar y muy fácil de detectar para cualquier porteño que lo lea.

Qué es el lunfardo y por qué es difícil

El lunfardo es un sistema de transformación del lenguaje, no un vocabulario alternativo. que opera por capas: el vesre invierte sílabas (hotel → telo, café → feca, tango → gotán), la germanía criminal del siglo XIX aportó términos de origen italiano y genovés, el habla de los conventillos de inmigración mezcló lenguas que no tenían nombre propio.

Pero lo más complicado para una IA no es el vocabulario. Es el tono. El lunfardo tiene una cadencia específica que no está en ningún diccionario porque nunca fue codificada formalmente. Se transmite oralmente, varía por generación, y su uso correcto depende de saber cuándo no usarlo.

Eso es información que los modelos de lenguaje no tienen porque nunca fue escrita de la manera en que los modelos aprenden.

Por qué los modelos aprenden mal el lunfardo

Los grandes modelos de lenguaje aprenden de texto escrito. El lunfardo existe principalmente en la oralidad, en el cine argentino, en las letras de tango y en conversaciones que nunca se transcribieron. El corpus escrito de lunfardo es pequeño y distorsionado: diccionarios académicos, letras de tango del siglo XX, algunas novelas.

El resultado es que los modelos aprenden el lunfardo "de libro". Saben que "pibe" es chico y "laburo" es trabajo. Pero no saben que hay diferencias sutiles entre cómo usa esas palabras alguien de cuarenta años del barrio de La Boca y alguien de veinte años de Palermo, aunque los dos sean porteños.

Lo que esto revela

El lunfardo es un caso de manual de un fenómeno más amplio: el lenguaje vivo existe en capas que la escritura no captura. El acento, el ritmo, el contexto de uso, las connotaciones que cambian con el tiempo, las palabras que se usan con ironía y las que se usan en serio —todo eso está fuera del texto.

Los modelos de IA son extraordinariamente buenos con el lenguaje que fue escrito y fijado. Son limitados con el lenguaje que vive principalmente en la boca.

Eso no es una crítica a la IA. Es una descripción de lo que es el lenguaje. La escritura siempre fue una representación parcial del habla. La IA hereda esa parcialidad y la hace más visible.

El dato práctico

Si querés saber si un texto fue generado por IA o por un humano argentino, no le pidas que mencione el Obelisco. Pedile que suene como alguien de Boedo hablando de fútbol. La diferencia va a ser inmediata.

El lunfardo funciona como una contraseña cultural que los modelos actuales no pueden replicar con fidelidad porque la contraseña vive en un lugar donde los datos de entrenamiento no llegan del todo. En la boca, en el barrio, en el tono de una conversación que nunca nadie transcribió.

Fuente original: RAE - Diccionario de americanismos

Qué es el lunfardo y por qué es difícil

Por qué los modelos aprenden mal el lunfardo

Lo que esto revela

El dato práctico

Noticias relacionadas

IA militar: acelerar decisiones puede ser útil, pero también puede romper el juicio humano

Armas autónomas: el límite más oscuro aparece cuando una máquina puede elegir a quién atacar

Anthropic apuesta por ciberseguridad para reparar su relación con Washington