Matemáticamente tenemos chance

2 de Diciembre de 2015

Empezamos bastante bien estas eliminatorias y estamos todos contentos con los últimos resultados de Uruguay; pero más allá de la sensación de éxito, si tomamos en cuenta los resultados de los últimos años, objetivamente lo más probable aún es que salgamos 5tos y vayamos al repechaje.

Datos del gráfico: probabilidades por posición.

¿Cómo llegué a estos resultados?

Motivado por la idea de cuantificar nuestras chances de ir a Rusia 2018 se me ocurrió calcular las probabilidades que tenemos de clasificar dada la situación actual.

Para esto se me plantearon dos problemas:

  1. Las cantidad de partidos restantes hacen que sean muchas las combinaciones de posibles resultados. Quedan 70 partidos, lo que considerando 3 resultados posibles por partido (gana local, gana visitante y empate) nos daría 3^70 posibilidades. Es un número muy grande y es imposible realizar el cálculo (al menos con mi PC).
  2. ¿Cómo determino la probabilidad de resultado para cada partido individual? Hay partidos que ya se sabe que es más probable un resultado que otro, estaría bueno que esto se pueda modelar.

El primer problema se resuelve estimando la probabilidad mediante simulación. En computación existe un método que permite estimar las probabilidades de un problema complejo mediante la simulación de posibles resultados. Para un número suficiente de simulaciones, las probabilidades de los resultados obtenidos se aproximarán a las probabilidades reales. Ver método de Montecarlo.

Para el segundo problema, tomé como referencia para calcular la probabilidad de cada partido los resultados históricos de las últimas 3 eliminatorias. Por ejemplo, para Uruguay-Paraguay (Uruguay local), se dieron 2 partidos ganados por Uruguay y un empate. Las probabilidades de ganar Uruguay serían 0.666, de empate 0.333 y de ganar Paraguay 0.

A los efectos de siempre contemplar todos los resultados y que no hayan probabilidades con 0, para cada una de los posibles resultados repartí equiprobablemente una probabilidad de 0.3 y luego el 0.7 restante lo ponderé con el histórico. Para el caso del ejemplo sería:

P(ganar Uruguay) = 0.1 + ( 0.7 * 0.666) = 0.567

P(empate) = 0.1 + (0.7 * 0.333) = 0.333

P(ganar Paraguay) = 0.1 + (0.7 * 0) = 0.1

Las probabilidades resultado para todos los partidos pueden verse acá.

Implementación del modelo

El modelo toma en cuenta 3 posibles resultados por partido: ganador local, ganador visitante y empate. A efectos de simplificar los goles son ignorados. Al finalizar la simulación, si hay empate en puntos entre países la posición de cada uno se resuelve aleatoriamente. Para una gran cantidad de simulaciones debería ser una buena aproximación.

El modelo toma como datos de entrada los resultados de los partidos ya jugados.

Para implementarlo utilicé numpy que es una librería de python optimizada para la realización eficiente de operaciones y cálculos con matrices. El código del modelo está acá.

Cálculo de cantidad de simulaciones

Para determinar la cantidad suficiente de simulaciones fui incrementando esté valor hasta que la desviación estándar en 20 corridas diferentes me dio < 0.01 para todas los resultados y la diferencia entre el mínimo y el máximo me dio < 0.015.

La cantidad de simulaciones que tomé fueron 20000.

Resultados

Como se puede ver en la Figura 1 (al principio del post), en la situación actual y con el modelo dado:

  • Uruguay lo más probable es que quede 5to

Considerando solamente la clasificación y acumulando las probabilidades de entrar en los primeros 5 lugares por país, nos da el siguiente gráfico:

Datos del gráfico: probabilidades clasificación.

En éste gráfico se ve que:

  • Ecuador, Brasil y Chile seguramente clasifiquen.
  • Argentina y Uruguay es muy probable que clasifiquen.
  • Bolivia, Perú y Venezuela seguramente no clasifiquen.

MUY IMPORTANTE:

Este modelo está MUY atado a los resultados históricos de las 3 últimas eliminatorias. NO ES UNA PREDICCIÓN de lo que va a pasar, es solamente una proyección de lo que pasaría si los resultados van de acuerdo con lo que ha pasado en los últimos años.

Ventajas del uso de simulación

  • Mediante simulación se puede estimar soluciones a problemas complejos donde la solución teórica es de cálculo muy costoso.
  • Se pueden simular posibles escenarios. Por ejemplo:
    • ¿Qué pasaría si le ganamos a Brasil y Perú en la próxima fecha? ¿Cuánto aumentarían nuestras posibilidades?
    • ¿Cual es el partido más importante de aquí en más, el que puede modificar más nuestras posibilidades?

UPDATE 02/2016: Hice un cambio en el modelo para tener un mínimo de probabilidades de 0.1 para cada resultado en cada partido. Lo restante se pondera con el histórico igual que antes.


Comentarios

Los comentarios de este post hacelo en el siguiente tweet. Gracias.