Get a site

La puntuación Elo y el valor de K

Cualquiera de nosotros sabe qué es el ELO. Pero no muchos saben cómo se calcula. Es más, recientemente se ha cambiado el valor de un parámetro, la llamada \(K\). ¿Qué es? y ¿para qué sirve? En primer lugar, se debe decir que el nombre ELO viene de un profesor estadounidense (nacido húngaro) llamado Árpád Élő.

Puedes consultar en esta página de la FIDE tus nuevos Elos después de jugar partidas computables.

El sistema de puntuación ELO

Lo primero que debemos considerar es que cuando dos jugadores, sean A y B, se enfrentan hay una determinada probabilidad de que A gane, de que B gane o de que ambos entablen. Voy a denotar \( p_A, p_B\) y \(p_= \) estas tres probabilidades, respectivamente. Obviamente se tiene que \( p_A + p_B + p_= = 1 \). Pero realmente estas tres probabilidades no son un buen indicador de la fuerza relativa entre dos jugadores ya que dan más información de la necesaria. Pensemos en las dos situaciones siguientes:

Situación 1: \( \hspace{10mm} p_A = 0'5, \hspace{5mm} p_= = 0, \hspace{5mm} p_B = 0'5, \)

Situación 2: \( \hspace{10mm} p_A = 0'2, \hspace{5mm} p_= = 0'6, \hspace{5mm} p_B = 0'2. \)

En ambas situaciones, los dos jugadores tienen la misma fuerza. La única diferencia es que en la situación 1, los jugadores A y B arriesgan más que en la situación 2. Por tanto, las probabilidades \( p_A, p_B, p_= \) dan más información de la necesaria para estimar la fuerza entre dos jugadores.

El parámetro que nos va a determinar la fuerza entre dos jugadores es la puntuación esperada del jugador A. Matemáticamente hablando es la esperanza de la variable aleatoria dada por los puntos que obtiene el jugador A. Al final de la página puedes ver una pequeña explicación de este concepto, aunque no es necesario que leas esto para saber cómo funciona el ELO.

Antes de ver esto de la puntuación esperada, quizás te estés preguntando si se me ha olvidado el factor blancas o negras. El propio profesor Élő señaló que como en un torneo, lo normal es que un jugador alterne blancas y negras, el color no afecta mucho en su sistema y por lo tanto, es más sencillo simplemente ignorar este factor. Sin embargo, esta suposición puede dar lugar a situaciones anómalas cuando o bien hay una gran diferencia de Elos o bien cuando se juega muchas veces con un determinado color (pensemos en un interclubs, cuando hay jugadores del tipo solo-juego-en-casa ).

Imaginemos que dos jugadores A y B se enfrentan entre sí y sean \( p_A, p_B\) y \(p_= \) las probabilidades de que A gane, de que B gane y de que entablen, respectivamente. Como es habitual en ajedrez, la partida ganada es un punto y la entablada es medio. La puntuación esperada por A viene dada por \[ \text{Puntación esperada por A} = p_A + \frac{1}{2} p_= \]

Sin embargo..., esta fórmula no vale para nada. Por dos razones: no conocemos las probabilidades \( p_A \) y \(p_=\) y aunque las llegáramos a conocer, habría una cantidad enorme de estas probabilidades debido a que, por ejemplo la probabilidad de que yo gane a un amigo mío es distinta a la que yo gane a Carlssen y así con cualquier otro jugador.

La idea de Árpád Élő fue asignar un número que mide la fuerza de cada jugador, siendo este número la puntuación ELO. El profesor Élő propuso que la puntuación esperada del jugador A (con ELO \(R_A\)) cuando juega contra el jugador B (con ELO \(R_B\)) solo depende de la diferencia de elos, es decir \( R_A-R_B\). Por ejemplo, pensemos en los siguientes jugadores: \[ \begin{array}{cc} \text{Jugador} & \text{ELO} \\ \text{A} & 1850 \\ \text{B} & 1790 \\ \text{C} & 2060 \\ \text{D} & 2010 \end{array} \]

Como la diferencia de Elos entre A y B es la misma que la diferencia de Elos entre C y D es la misma (50), entonces, la puntuación esperada de A frente a B es la misma que la puntuación esperada de C frente a D.

Además, puesto que el Elo de A es superior al de B, deberíamos tener que la puntuación esperada de A frente a B es mayor que 0,5.

No voy a dar ahora la fórmula exacta que calcula la puntuación esperada, sino simplemente la siguiente tabla (\(\Delta\) es la diferencia de Elos, que es positiva si el elo de A es mayor que el de B y es negativa si el elo de A es menor que el de B). Pondré la expresión exacta al final (aunque adelanto que aparecen integrales y algo de teoría de probabilidad; pero de nuevo no es necesario leerlo para saber qué es el Elo y el factor K).

\[ \begin{array}{c|rrrrrr} \Delta & -200 & -150 & - 120 & -100 & -80 & -60 \\ \hline \text{Punt. esperada por A} & 0,24 & 0,3 & 0,34 & 0,36 & 0,39 & 0,42 \end{array} \] \[ \begin{array}{c|rrrrrrr} \Delta & -40 & -30 & -20 & -10 & -5 & 0 & 5 \\ \hline \text{Punt. esperada por A} & 0,44 & 0,46 & 0,47 & 0,49 & 0,49 & 0,5 & 0,51 \end{array} \] \[ \begin{array}{c|rrrrrr} \Delta & 10 & 20 & 30 & 40 & 60 & 80 \\ \hline \text{Punt. esperada por A} & 0,51 & 0,53 & 0,54 & 0,56 & 0,58 & 0,61 \end{array} \] \[ \begin{array}{c|rrrr} \Delta & 100 & 120 & 150 & 200 \\ \hline \text{Punt. esperada por A} & 0,64 & 0,66 & 0,7 & 0,76 \end{array} \]

Obviamente, si el valor de \( \Delta \) no aparece arriba se puede calcular por medio de la fórmula exacta que pondré luego (aunque, insisto, no es necesario que vayas a la fórmula). Más adelante explicaré cómo he obtenido esta tabla. La gráfica siguiente muestra la relación entre la diferencia de Elos y la puntuación esperada.

Por supesto, como la suma de las puntuaciones obtenidas por A y B es 1, entonces \[ \text{Puntación esperada por B} = 1- \text{Puntuación esperada por A}. \]

Veamos un ejemplo, si yo tengo un ELO de 1800 y me enfrento a un jugador con 1950 de ELO, como la diferencia de Elos es \( 1800 - 1950 = -150 \), entonces mirando la tabla, la puntuación esperada por mi en una partida es \( 0,3. \)

¿Y cómo se calcula la puntuación esperada en un torneo? Veamos um ejemplo sencillo: Si yo tengo 1800 de ELO y me he enfrentado con los jugadores X, Y y Z con los siguientes datos \[ \begin{array}{ccc} \text{Mis rivales} & \text{ELO de mis rivales} & \text{Resultado obtenido por mi} \\ X & 1860 & 1 \\ Y & 1770 & 1/2 \\ Z & 2000 & 0 \end{array} \] entonces tengo que sumar las tres puntuaciones esperadas (mírese la tabla anterior) \[ \text{Punt. esperada por mí ante X} = 0,42 \] \[ \text{Punt. esperada por mí ante Y} = 0,54 \] \[ \text{Punt. esperada por mí ante Z} = 0,24 \] \[ \text{Suma de punt. esperadas} = 0,42 + 0,54 + 0,24 = 1,2.\] Vemos que para saber la puntuación esperada, no es necesario conocer la puntuación obtenida. Pero como podemos observar en este ejemplo, he obtenido una puntuación mayor que la esperada; por tanto parece que mi ELO debería ser algo mayor que el actual.

El parámetro \(K \)

El sistema de puntuación ELO debe ser dinámico, es decir, que sea por sí mismo capaz de modificarse, ya que un jugador cambia de fuerza de manera continua. Y es aquí en donde entra el famoso factor \(K\) también propuesto por el profesor Árpád Élő.

Si un jugador con ELO \(R\) espera conseguir \(E\) puntos; pero consigue \(S\) puntos, entonces el nuevo ELO viene dado por la fórmula \[ \text{nuevo ELO} = R+K(S-E). \] Veamos un ejemplo con dos valores de \(K \) distintos. Supongamos que yo tengo 1800 puntos ELO, he jugado un torneo en donde espero sacar 4 puntos y he conseguido 5 puntos, ¿cuál es mi nuevo ELO?

\(K = 20\): \( \hspace{10mm} \text{nuevo ELO} = R+K(S-E) = 1800+20 \times(5-4) = 1820. \)

\(K = 40\): \( \hspace{10mm} \text{nuevo ELO} = R+K(S-E) = 1800+40 \times(5-4) = 1840. \)

Vemos que un mayor valor de \(K\) implica mayores cambios. Recientemente, la FIDE ha aumentado el valor de \(K\). Y como consecuencia hay una mayor oscilación del ELO. Aquí debajo escribo los nuevos valores propuestos por la FIDE (es una traducción casi literal de un documento de la FIDE, que puedes verlo aquí).

● \(K=40\) para un jugador nuevo en la lista hasta que haya completado eventos con al menos 30 juegos.

● \(K=40\) para todos los jugadores hasta su decimo-octavo cumpleaños mientras su puntuación permanece por debajo de 2300.

● \(K=20\) mientras el rating de un jugador permanece por debajo de 2400.

● \(K=10\) una vez que la puntuación de un jugador haya alcanzado 2400, incluso si la puntuación baja de 2400.

Quizá te estés preguntando la razón de que los novatos tengan un mayor \(K\). La razón es que si se posee poca información sobre un jugador, entonces su fuerza estimada puede ser imprecisa y necesita una mayor corrección.

Agradezco a Alejandro Tello sus amables puntualizaciones sobre una versión anterior de esta página.

Julio Benítez López

jbenitez@mat.upv.es


La Esperanza Matemática

Un suceso que depende del azar puede originar varios resultados numéricos. Por ejemplo al jugar a la loteria, el dinero que gano o pierdo es un número aleatorio. Otro ejemplo, es el número que sale en un lanzamiento de un dado numerado del 1 al 6. Además, estos valores numéricos tienen una determinada probabilidad de salir. Por ejemplo, cuando lanzo un dado equilibrado, todas las probabilidades son 1/6.

Si un suceso aleatorio puede originar los números \( x_1, x_2, \ldots, x_n\) y la probabilidad de que el número \(x_i\) salga es \(p_i\), entonces la esperanza viene dada por \[ x_1p_1 + \cdots + x_n p_n.\]

Veamos un ejemplo: cuando dos equipos de fútbol, A y B, juegan entre sí, hay una probabilidad de que A gane, \(p_A\), de que empaten, \(p_=\), o de que A pierda, \(p_B\). Si consideramos la puntuación actual de la FIFA, si A gana, obtiene 3 puntos, si empatan entonces A obtiene 1 punto, y si A pierde entonces no consigue ningún punto. La puntuación esperada por A es \[ 3 \cdot p_A + 1 \cdot p_= + 0 \cdot p_B \] Esta expresión se simplifica a \[ 3 p_A + p_= \] Veamos dos ejemplos

Situación 1: \( \hspace{10mm} p_A = 0'5, \hspace{5mm} p_= = 0, \hspace{5mm} p_B = 0'5, \) \[ \text{Puntuación esperada por A} = 3 \times 0'5 + 0 = 1'5. \]

Situación 2: \( \hspace{10mm} p_A = 0'2, \hspace{5mm} p_= = 0'6, \hspace{5mm} p_B = 0'2. \) \[ \text{Puntuación esperada por A} = 3 \times 0'2 + 0'6 = 1'2. \]

Vemos que en la situación 1 se espera conseguir más puntos que en la 2. Ésta es la razón del cambio introuducido por la FIFA hace años: favorecer a los equipos más agresivos y penalizar el empate (antes el partido ganado valía 2 puntos y el empate 1 punto).


La obtención de la puntuación esperada

Árpád Élő consideró que la fuerza de los jugadores (= Elo) era una variable aleatoria normal. Hay que decir, que antes la elaboración del sistema Elo, la federación norteamericana de ajedrez ya disponía de unas tablas midiendo la fuerza de los jugadores norteamericanos (el sistema Harkness, el precursor del sistema Elo), por lo que el profesor Élő tomó el valor 200 como la desviación típica del Elo para ajustarse lo más posible al sistema previo.

Sean \( F_A \) la fuerza del jugador A y \( F_B \) la fuerza del jugador B. Los valores concretos de \(F_A\) y \(F_B\) no pueden saberse a priori: son aleatorios (unas veces jugamos mejor y otras peor), por eso se dice que \(F_A\) y \(F_B\) son variables aleatorias . Lo que no es aleatorio es el ELO, ya que es conocido de antemano.

Lo normal es que la fuerza tome valores alrededor del ELO, y que sea poco probable que la fuerza difiera mucho del ELO. Matemáticamente esto se puede lograr de muchas maneras; pero lo habitual (normal) es decir que la fuerza de un jugador sea una variable aleatoria normal de media su ELO (y desviación estándar 200 como se comentó antes). Con símbolos \[ F_A \sim N(\mu = R_A, \sigma=200), \quad F_B \sim N(\mu = R_B, \sigma=200).\]

¿Cuándo el jugador A gana al jugador B? Cuando en la partida, la fuerza mostrada por A sea mayor que la mostrada por B, es decir, cuando \( F_A > F_B \). De igual forma, ambos jugadores empatan cuando \(F_A=F_B\) y A pierde cuando \(F_A < F_B\).

La puntuación esperada por el jugador A es \[ 1 \cdot p(F_A>F_B) + \frac{1}{2} p(F_A=F_B) + 0 \cdot p(F_B>F_A). \]

Calculemos \(p(F_A>F_B)\) y \(p(F_A=F_B)\).

Supongamos que las fuerzas de dos jugadores no dependen una de la otra (en términos estadísticos se dice que las variables son independientes). Con la siguiente suposición matemática (que simplifica el razonamiento) la diferencia de fuerzas es otra variable normal, entonces se tiene que la media de \(F_B-F_A\) es \[ \text{media de }(F_B-F_A) = \text{media de } F_B - \text{media de }F_A = R_B-R_A.\] y la desviación típica de \(F_B - F_A\) es \(\sigma = 200 \sqrt{2}\). Esto último proviene del hecho de que si \(\sigma^2(F_A), \sigma^2(F_B), \sigma^2(F_B-F_A)\) denotan las varianzas (el cuadrado de las desviaciones) de \(F_A, F_B, F_B-F_A\), respectivamente, entonces \[ \sigma^2(F_B-F_A)=\sigma^2(F_B)+\sigma^2(F_A) = 200^2+200^2 = 2\cdot 200^2. \]

Ahora, \[ p(F_A>F_B) = p(F_B-F_A<0) = p(F_B-F_A-(R_B-R_A) < R_A-R_B).\] Pero \( F_B-F_A-(R_B-R_A) \) es una variable normal de media 0 y desviación \( \sigma = 200 \sqrt{2} \). Por tanto, \[ p(F_A>F_B) = \int_{-\infty}^{R_A-R_B} f(x) \, {\rm d}x, \] siendo \(f\) la función de densidad de una distribución normal de media 0 y desviación típica \(\sigma\), es decir, \[ f(x) = \frac{1}{\sigma \sqrt{2 \pi}}{\rm e}^{-x^2/2 \sigma^2}. \]

Pero \( p(F_B-F_A=0) \), ya que \(F_B-F_A \) es una distribución normal, y en particular continua.

Por tanto, si el Elo del jugador A es \(R_A\) y el Elo del jugador B es \(R_B\), entonces \[ \text{Puntuación esperada por A} = \int_{-\infty}^{R_A-R_B} f(x) \, {\rm d}x, \]

Afortunadamente, no hay necesidad de usar la integral anterior, ya que el uso de tablas (y ahora paquetes de cálculo numérico) permite calcular estas expresiones de forma rápida.

Por ejemplo (la lectura de este párrafo es sólo para los más matemáticos). Octave es un programa de cálculo numérico disponible de forma gratuita en Internet (yo tengo la versión de la Universidad Politécnica de Madrid que se puede descargar aquí). Si quieres saber, usando Octave, la puntuación esperada si la diferencia de Elos es \(+40\), se puede teclear

sigma = 200*sqrt(200);

normcdf(40,0,sigma)

Obteniendo 0.55623. O si la diferencia de Elos es \(-180\), entonces normcdf(-180,0,sigma) proporciona 0.26226. La función normcdf tiene la siguiente sintaxis: normcdf(x,m,s) calcula el valor en x de la función de distribución de una variable normal de media m y desviación típica s.