Aller au menu Aller au contenu Aller à la recherche

Intuitions et Statistiques: le match des pronostics footballistiques

La Coupe du Monde est un événement planétaire qui mobilise au-delà des simples fans de football. Que l’on soit dirigeant, analyste financier, ingénieur informatique, statisticien, chercheur, supporter d’une équipe ou simple spectateur, chacun y va de son avis. Dans beaucoup d’entreprises, entre amis, sur les blogs sportifs… se sont multipliés les concours de pronostics. Qu’ils soient manuscrits ou compilés sur des tableaux croisés dynamiques, tout le monde s’y est mis en cette période de Coupe du Monde. Et parfois les personnes en tête de ces concours à la fin des matchs de poules ou même après la finale ne sont pas toujours les plus grands experts du ballon rond.

Après la phase de poule il est intéressant de confronter à la réalité des résultats les différentes méthodologies prévisionnelles. L’article de Sport Intelligence (http://www.sportingintelligence.com/2014/06/24/bankers-and-bookies-oust-fifa-as-better-bets-for-world-cup-forecasts-240601/) nous offre un tableau récapitulatif de différents pronostiqueurs pour le premier tour (soit 48 matchs de poule).

FootRank 2014

Comprenons ce tableau

A la première place, nous trouvons une banque danoise, la DANSKE BANK qui a réussi à pronostiquer 32 bons résultats (le score n’est pas pris en compte dans ce classement) sur 48 matchs (66% de réussite) et de trouver 11 nations sur 16 (69% de réussite) qualifiées pour le second tour.

Suivent un ingénieur informatique brésilien – Andrew YUAN – qui a basé ses pronostics sur l’analyse Big Data sur une période de 20 ans, BLOOMBERG, puis un pronostic selon la méthodologie ELO – système d’évaluation du niveau de capacités relatif, utilisé habituellement pour le classement des joueurs d’échecs.

Viennent ensuite le pronostic en fonction du classement FIFA résultat des rencontres déjà jouées sur une période de 5 ans, puis un site de paris sportifs BETFAIR.COM -dont le modèle statistique doit être le plus efficient possible.  La banque GOLDMAN SACHS avec un peu plus de la moitié des pronostics corrects et le FINANCIAL TIMES ferment la marche.

Puisque GOLDMAN SACHS joue le jeu…

L’un des exemples les plus frappants de l’universalité de cet événement est la sortie du rapport World Cup and Economics de GOLDMAN-SACHS (http://www.goldmansachs.com/our-thinking/outlook/world-cup-and-economics-2014-folder/world-cup-economics-report.pdf), pour la 5ème fois depuis 1998.

A priori, aucun rapport entre la prestigieuse banque d’affaires et une compétition sportive… Pourtant cette étude est souvent aussi attendue que le tirage au sort lui- même, car il est considéré comme un outil utile pour les parieurs. Sa lecture est toujours intéressante mais lorsque l’on regarde la fiabilité du pronostic à l’aune des 48 matchs disputés, on s’aperçoit que leurs prévisions ne sont pas les plus pertinentes.

L’un des nombreux critères pris en compte dans le modèle prévisionnel de GOLDMAN SACHS est le classement ELO combiné à d’autres variables. Nous nous apercevons pourtant que le pronostic basé sur le seul classement ELO est plus fiable en termes de nombre total de résultats corrects. La même analogie avec le classement FIFA peut être effectuée.

Evidemment, les modèles de simulation ne peuvent jamais prévoir les « accidents de parcours » qui sont par définition inattendus. Prévoir la déroute de l’Espagne face aux Pays Bas ou celle du Portugal face à l’Allemagne semblait impossible, pourtant des parieurs ont misé et gagné à une cote de 500/1. Les cotes de paris sont définies par des modèles de simulation semblables à ceux des banques, d’ailleurs on a vu ces dernières années des analystes quantitatifs quitter les marchés de capitaux pour rejoindre les sociétés de paris.

Les premières analyses montrent un nombre très élevé de résultats sur un score de parité 1-1 dans les matchs de groupes, leur modèle prévisionnel aurait il un biais quelque part ou est-ce la multiplication des critères qui nuit à la pertinence des résultats ?

Une piste, qu’en pensez-vous ?

Le problème peut être dans l’utilisation d’une simulation de Monte-Carlo* à 100 000 tirages et l’arrondi pour le nombre de buts, en phase de poule en tout cas, parce que, quelque soit le nombre moyen de but résultant compris entre 0.5 et 1.49, cela fera toujours 1 !
100 000 tirages garantissent une convergence a priori, mais 1 000 tirages auraient peut être suffi et donneraient sans doute des résultats plus divers.

Pour les phases finales, le nombre de buts moyens sans l’arrondir est pris en compte. Celui avec le plus grand nombre passe.
Etant basé sur des données historiques, il est tout à fait normal de retrouver le Brésil, l’Argentine et l’Allemagne dans le dernier carré.

Peut être aurait-il fallu faire moins de tirages pour les poules ? Par contre on peut conserver un nombre élevé de tirages pour les phases finales où c’est la valeur absolue qui est comparée.

* Explications des coefficients.
La méthodologie prend en compte entre autre les résultats en matchs officiels depuis 1960, ce qui donne un coefficient pour chaque équipe. Le coefficient tient compte de l'adversaire rencontré à ce moment là de l'histoire pour chaque match grâce au coefficient ELO. Ensuite pour chaque match on simule 100 000 fois le résultat du match grâce aux coefficients des 2 équipes.

Intuition, Expertise, « Chance du débutant »…

Les intuitions sont parfois plus pertinentes que les simulations modélisées (appliquées au football évidemment).

Même si le nombre de matchs lisse la probabilité de retrouver en tête des personnes qui ne s’y connaissent pas et ont tenté leur chance « au pif », sur un match, n’importe quel pronostiqueur peut battre le moteur de simulation le plus puissant et le plus complet au monde.

Pourquoi ? Tout simplement parce que le football n’est pas rationnel et échappe à la plupart des modèles statistiques ou de simulation, qu’on ne réduira jamais un match à des statistiques et que l’impact psychologique d’une Coupe du Monde sur le mental des joueurs ne peut se modéliser.

Après tout, qui a envie de connaître à l’avance l’identité du joueur qui marquera le but de la victoire d’une superbe reprise de volée dans la lucarne à la dernière minute de la finale au Maracanã ?

Personne !

Tout le monde préférera le vivre en direct !!

 

Par Germain TUSZYNSKI

More than executive search, Career Design