El sistema de rating Elo, desarrollado por el profesor de física Arpad Elo para la Federación de Ajedrez de EE. UU. en 1960, resolvió un problema fundamental en la clasificación competitiva: cómo medir la habilidad relativa entre jugadores que no todos juegan entre sí. Al modelar la probabilidad de victoria como una función logística de la diferencia de rating y actualizar los ratings después de cada partida según los resultados reales vs. los esperados, Elo creó un sistema que se ajusta continuamente a la nueva información sin requerir un único torneo todos contra todos. La elegancia y precisión del diseño original de Elo lo ha convertido en la base de los sistemas de rating en ajedrez, Go, juegos en línea, deportes de equipo e incluso la revisión académica por pares.

Las Matemáticas del Puntaje Esperado

La fórmula del puntaje esperado E = 1/(1 + 10^((R_opp − R_me)/400)) mapea las diferencias de rating a probabilidades de victoria usando una curva logística. El factor de escala de 400 es una convención: Arpad Elo lo eligió para que una diferencia de rating de 400 puntos corresponda a una razón de puntaje esperado de 10:1 — es decir, el jugador con rating más alto debería obtener aproximadamente 10 puntos por cada 1 punto que obtenga el jugador con rating más bajo. Con 0 de diferencia de rating, E = 0.5 (50% de probabilidad de victoria). Con +200 puntos, E ≈ 0.76; con +400, E ≈ 0.91; con +600, E ≈ 0.97. La forma logística refleja la observación empírica de que las diferencias de habilidad en el ajedrez producen aproximadamente esta distribución de probabilidad de victoria. La fórmula original de Elo usaba una distribución normal en lugar de logística, pero la versión logística (adoptada por FIDE en 1978) es matemáticamente equivalente para la mayoría de los propósitos y más fácil de calcular.

Factor K: Estabilidad vs. Capacidad de Respuesta

El factor K controla la volatilidad del sistema de rating. Un K alto permite que los ratings cambien rápidamente, lo cual es apropiado cuando la fuerza real de un jugador es incierta (jugadores nuevos, juveniles que mejoran rápidamente) — el sistema de rating necesita 'encontrar' el nivel correcto rápido. Un K bajo produce ratings estables que cambian lentamente, apropiado para jugadores de élite establecidos cuya fuerza real se conoce con alta confianza. FIDE usa tres niveles de factor K: K=40 para jugadores en sus primeras 30 partidas o por debajo de 2300, K=20 para jugadores establecidos (2100–2400), K=10 para jugadores de élite por encima de 2400 con experiencia de partidas de toda la vida. Las plataformas de ajedrez en línea como Chess.com y Lichess a menudo usan factores K más altos (32–64) porque las partidas en línea son más rápidas y numerosas, permitiendo una convergencia más rápida a la fuerza real. La consecuencia de un factor K alto es que un solo batacazo puede mover los ratings entre 30 y 40 puntos; un K bajo significa que incluso un batacazo importante mueve los ratings solo entre 8 y 10 puntos. Ambos son correctos para sus casos de uso previstos.

Elo Más Allá del Ajedrez: Deportes de Equipo y Juegos en Línea

La elegancia de Elo — que requiere solo resultados de victoria/empate/derrota y los ratings actuales — lo hizo ideal para su adopción más allá del ajedrez. La FIFA usa una variante de Elo para los rankings de selecciones nacionales que asigna pesos a los partidos según la importancia del torneo y se ajusta por la diferencia de goles. La NFL ha usado ratings de poder basados en Elo para pronósticos desde la década de 1980, y el modelo Elo de NFL de FiveThirtyEight logró una notable precisión de predicción. Los sistemas de emparejamiento multijugador de videojuegos en League of Legends, Dota 2 y la mayoría de los juegos competitivos usan Elo o TrueSkill (una extensión bayesiana que maneja juegos de equipo y considera la incertidumbre). La idea clave que hizo a Elo extensible: cualquier juego de suma cero con resultados binarios (victoria/derrota) u ordenados (victoria/empate/derrota) puede modelarse con el mismo marco de puntaje esperado, con el factor K y la constante de escala ajustados al entorno competitivo específico del juego. La principal limitación del Elo clásico para los deportes de equipo es que trata a los equipos como jugadores individuales — la varianza del rendimiento individual se promedia, y los cambios de plantilla requieren ajuste manual.