YouTube tiene más de 800 millones de videos y sus usuarios suben 500 horas de contenido nuevo por minuto. El algoritmo tiene que decidir, para cada usuario en cada momento, cuál de esos millones de videos mostrar. Lo hace en menos de 200 milisegundos. Cómo funciona exactamente fue explicado en parte por ingenieros de Google en un paper de 2016, y varios detalles adicionales emergieron desde entonces a través de documentación oficial y investigación independiente.
El objetivo real del algoritmo
Un error común es pensar que el algoritmo optimiza para vistas o para tiempo de reproducción. Hasta 2016, YouTube efectivamente optimizaba para vistas, lo que generó el clickbait masivo: títulos engañosos y miniaturas exageradas que generaban clics pero dejaban al usuario insatisfecho.
En 2016, YouTube cambió la métrica principal a satisfacción del usuario, medida principalmente por el tiempo que el usuario pasa en la plataforma después de ver un video — no solo el video en sí, sino la sesión completa. Esto incentiva mostrar videos que el usuario quiere seguir viendo, no solo que hace clic impulsivamente.
También incorporó señales explícitas de satisfacción: encuestas directas donde YouTube pregunta a usuarios si el video que vieron fue lo que esperaban, y si lo recomendarían.
Las dos etapas del proceso
El sistema tiene dos etapas distintas:
Candidatos: el algoritmo genera un conjunto de cientos de videos candidatos para un usuario específico. Para esto usa redes neuronales entrenadas con el historial de visualizaciones del usuario, videos con comportamiento similar a los que el usuario vio, y señales de contexto como la hora del día y el dispositivo. Esta etapa reduce el universo de millones de videos a unos pocos cientos relevantes.
Ranking: el sistema toma esos cientos de candidatos y los ordena usando un modelo más complejo que evalúa múltiples factores simultáneamente. Este ranking es el que determina el orden en la página de inicio y en los videos sugeridos.
Las señales que más pesan
CTR (click-through rate) ajustado: qué porcentaje de las veces que YouTube mostró el video alguien hizo clic. Pero el sistema no mira únicamente el CTR crudo — si un video tiene CTR alto pero la gente lo abandona rápido, penaliza eso.
Porcentaje de retención: qué fracción del video ve la gente en promedio. Un video de 20 minutos donde la gente ve el 80% vale más que uno de 5 minutos donde ven el 30%.
Velocidad de crecimiento: cuántas vistas, likes e interacciones acumula el video en las primeras horas. Un video que crece rápido recibe más distribución como señal de que es relevante en este momento.
Historial del usuario con el canal: si ya seguís un canal o viste varios videos de él, ese canal recibe mayor ponderación en tus recomendaciones.
Señales negativas: si marcás un video como "no me interesa", si cerrás YouTube inmediatamente después de verlo, o si omitís los anuncios muy rápido, eso penaliza el video en tus recomendaciones.
Por qué te lleva por caminos inesperados
El algoritmo no solo muestra videos de lo que buscaste o de canales que seguís. Constantemente explora: te muestra videos de temas adyacentes para ver si enganchan. Si enganchan, ese tema pasa a pesar más en tus recomendaciones futuras.
Esto crea lo que se llama "rabbit holes": empezás viendo un video de cocina, el sistema nota que lo terminaste, te muestra otro de cocina, lo terminás también, empieza a mezclarlo con videos de nutrición porque comparten audiencia, y 40 minutos después estás viendo algo que no tenías ninguna intención de ver cuando abriste YouTube.
El sesgo hacia contenido nuevo vs. contenido establecido
El algoritmo tiene un sesgo intrínseco hacia videos recientes para canales con audiencia establecida, porque puede medir rápidamente si el video engancha a esa audiencia. Para canales nuevos, el algoritmo es más conservador — distribuye poco hasta que hay evidencia de que el contenido funciona.
Esto crea un ciclo: los canales grandes consiguen distribución más fácil, lo que les da más datos para demostrar rendimiento, lo que les da más distribución. Los canales pequeños tienen que generar señales de engagement muy fuertes en las primeras horas para romper ese ciclo.
Lo que el algoritmo explícitamente evita
YouTube publicó sus políticas de "borderline content": contenido que no viola las reglas del servicio pero que el algoritmo activamente deja de distribuir. Esto incluye teorías conspirativas que rozan la desinformación, contenido médico no convencional, y ciertos tipos de contenido político divisivo.
La implementación de estas restricciones no es perfecta — el umbral exacto no es público y distintos tipos de contenido reciben tratamiento inconsistente. Pero el mecanismo existe: no todo el contenido permitido recibe la misma distribución algorítmica.
Fuente original: Ver fuente