El viernes 14 de junio dio inicio la Eurocopa. La pregunta que sobrevuela el ambiente futbolístico es la habitual: ¿cuáles son las posibilidades de cada una de las selecciones que compiten? De ahí que cada vez más periódicos, empresas y particulares muestren sus predicciones antes de que comience el evento.
Algunas de estas predicciones se van actualizando a medida que va avanzando el campeonato. Voy a explicar las diferentes metodologías que se emplean, al tiempo que comento algunas predicciones.
Spoiler: Francia es la que más probabilidad tiene de obtener el triunfo. Concretamente, @Futbometrix1, una cuenta del prestigioso economista Daniel Paserman, le concede un 16,5 % de probabilidades. En el podio de las predicciones le siguen Inglaterra (13,7 %) y España, con una probabilidad del 11,7 % de ganar la Eurocopa.
No hay predicción sin probabilidad
La semana pasada se celebró el XIV Congreso Iberoamericano de Economía del Deporte que organiza la Sociedad Española de Economía del Deporte. En mi presentación afirmé que “las predicciones son probabilidades o no son predicciones”.
En el caso de la Eurocopa, cualquier predicción debe dejar clara la probabilidad de un equipo de ser campeón. Por ejemplo, España tiene un 10 % de probabilidad de salir campeón. En cambio, decir que un equipo va o no va a ganar la competición no es valido en términos predictivos. Por ejemplo, “España no va a ganar la Eurocopa” no es una predicción porque el enunciado no se sustenta en un cálculo de probabilidad.
También es importante comprender el significado de probabilidad. Si alguien dice que España tiene un 10 % de probabilidad de ganar la Eurocopa significa que, si se jugasen 100 Eurocopas bajo estas mismas condiciones, España ganaría diez. Lo que no significa es que esa predicción sea adecuada si España no resulta vencedora. Como obviamente no se van a celebrar 100 Eurocopas, no representa una tarea inmediata delimitar quién o qué modelo ha predicho mejor.
Desde hace un tiempo la cuenta de X @Futbolmetrix1 de Daniele Paserman realiza un concurso para ver quién predice mejor un torneo como la Eurocopa. Los interesados envían las probabilidades de llegar a cada una de las rondas para todos los equipos antes de que empiece alguna competición. En el caso de la Eurocopa 2024 de Alemania, se han recibido más de 30.
Para delimitar qué predicción resulta vencedora, @Futbometrix1 usa tres métodos estadísticos diferentes: Brier Score, Log Score y RPS. En los tres modelos, cuanto menor sea su valor, mejor será la predicción.
España resultó vencedora en el Mundial femenino de 2023. La predicción ganadora se realizó con el promedio de varias casas de apuestas. Estas predijeron mejor que hasta 20 predicciones basadas en distintos modelos. Este resultado, que puede resultar paradójico, es relativamente habitual.
No basta con hacer muchas simulaciones
A continuación voy a explicar cómo se pueden realizar las predicciones para un torneo de las características de la Eurocopa.
La mayoría de las predicciones se realizan simulando el torneo mediante un número elevado de repeticiones. ¿Cuánto es elevado? Por lo general van desde las 1 000 hasta las 200 000 simulaciones, como las que usa el diario El País para esta Eurocopa. Calcular las predicciones simulando el torneo es tan sencillo cómo ver el porcentaje de las simulaciones en las que una selección alcanza una determinada ronda. El País dice que la probabilidad de que España gane la Eurocopa es del 11 %, lo que implica que España resultaba vencedora en unas 22 000 simulaciones de las 200 000 realizadas.
Sin embargo, la clave de esta metodología no es tanto el número de simulaciones. En mi experiencia, se consigue llegar cerca de las probabilidades finales del modelo tras unas 200 o 300 simulaciones. La clave reside en cómo asignar las probabilidades (victoria, empate, derrota) para cada partido. Aquí emergen dos alternativas destacadas: resultados pasados o calidad de los jugadores.
Los resultados registrados en los enfrentamientos celebrados en el pasado se cuantifican mediante puntuación Elo, que es una modificación de la famosa clasificación de ajedrez, mientras que otros siguen la puntuación de la FIFA o de la UEFA.
Para medir la calidad de los jugadores, la forma más sencilla es sumar el valor de traspaso que proporciona la web Transfermarkt. Esta proporciona un hipotético valor de traspaso para todos los jugadores de ligas profesionales. Para ello se basa en la valoración colectiva bajo el supuesto de que los muchos son más inteligentes que los pocos.
Toni Kross vale más de lo que se dice
Sin embargo, usar el valor de Transfermarkt como medida de la calidad de un futbolista tiene el problema de que dicho valor depende en gran medida de la edad, y no del rendimiento. Por ejemplo, Toni Kross, centrocampista titular indiscutible del Real Madrid en las últimas temporadas, tiene un valor de diez millones de euros. Exactamente el mismo que se le asigna a Nico Paz, centrocampista del Real Madrid de 19 años que ha disputado 19 minutos en LaLiga 2023-2024.
Para alcanzar una valoración más realista, debería ajustarse el valor de Transfermarkt en función de la edad.
Otra forma de medir la calidad de los jugadores es a través de estadísticas individuales, que pueden obtenerse por medio de modelos de inteligencia artificial. Obviamente, estas fuentes pueden ser integradas a través de distintas combinaciones y baremos. Por ejemplo, para medir la calidad de un equipo, El País integra el ranking Elo y el valor de Transfermarkt.
Las predicciones se actualizan con los resultados
Algunos pronosticadores no solo lanzan sus predicciones precompetición sino que van actualizando las mismas en función de los resultados ya realizados. En este caso, una decisión que tienen que tomar los modelos es si van actualizando la calidad de los equipos a medida que discurre la competición o se quedan con la calidad establecida pretorneo. Un hecho especialmente relevante sucede cuando equipos sorpresa llegan a rondas finales, como fue el caso de Marruecos en el Mundial de Catar 2022, alcanzando las semifinales.
Desde mi visión aristotélica, que sitúa la virtud en un punto medio, creo que un buen modelo debería haber tenido en cuenta que el Marruecos de semifinales era mucho mejor equipo que la selección que inició el Mundial. Pero tampoco se debe actualizar tanto su calidad e inferir que era uno de los cuatro mejores equipos del torneo.
Una vez que se determinan las probabilidades, dato clave para la precisión de un modelo, resulta relativamente sencillo realizar las simulaciones, pues basta con decirle al programa informático que escoja el resultado de un partido.
Por su parte, las casas de apuestas establecen su probabilidad inicial por algún medio similar a los descritos con anterioridad. Pero una vez que se abre una apuesta, esta se va actualizando. Tanto por nueva información que pueda aparecer, como puede ser una lesión de algún jugador relevante, como por las apuestas recibidas.
Supongamos que juego un partido de tenis contra Carlos Alcaraz, y que, por error, las cuotas me establecen como favorito (jugador con cuota más baja). Los apostantes irán en masa a apostar por Alcaraz. Esto hará replantearse a la casa de apuestas si modifica sus cuotas. De tal forma que lo normal es que la cuota final considere que es medio imposible o imposible del todo que gane a Alcaraz en un partido de tenis. Lógicamente, sucede lo mismo con otras apuestas como pueden ser las de ganador de la Eurocopa.
Las probabilidades de la Eurocopa 2024
Para mostrar un ejemplo de las predicciones, voy a utilizar la probabilidad promedio tomando como base los 30 participantes en el concurso establecido por @Futbolmetrix1 de alcanzar cada una de las rondas y de resultar ganador. La tabla aparece ordenada según la probabilidad de ganar la Eurocopa.
Y sí, la selección favorita es Francia, con una probabilidad de ganar del 16,5 %, seguida de Inglaterra con 13,7 %. Tercera se sitúa España con una probabilidad del 11,7 % de ganar la Eurocopa. Así que, enhorabuena a los aficionados franceses, aunque su ventaja probabilística no es tan grande. Los españoles nos encomendamos a ese 11,7 %.