Julio del Corral Cuervo : Euro 2024 : la France a plus de chances de gagner et nous expliquons ici comment nous le savons

-

La Coupe d’Europe a débuté vendredi 14 juin. La question qui plane sur le milieu du football est la plus habituelle : quelles sont les possibilités de chacune des équipes en compétition ? C’est pourquoi de plus en plus de journaux, d’entreprises et de particuliers affichent leurs prévisions avant le début de l’événement.

Certaines de ces prédictions sont mises à jour au fur et à mesure que le championnat progresse. Je vais expliquer les différentes méthodologies utilisées, tout en commentant quelques prédictions.

Spoiler : la France est la plus susceptible de gagner. Plus précisément, @Futbometrix1, un compte rendu du prestigieux économiste Daniel Paserman, lui donne 16,5 % de chances. Sur le podium des pronostics suivent l’Angleterre (13,7%) et l’Espagne, avec une probabilité de 11,7% de remporter le Championnat d’Europe.

Il n’y a pas de prédiction sans probabilité

La semaine dernière s’est tenu le XIVe Congrès ibéro-américain d’économie du sport, organisé par la Société espagnole d’économie du sport. Dans ma présentation, j’ai déclaré que « soit les prédictions sont des probabilités, soit elles ne sont pas des prédictions ».

Dans le cas de l’Euro Coupe, tout pronostic doit indiquer clairement la probabilité qu’une équipe soit championne. Par exemple, l’Espagne a 10 % de chances de devenir championne. En revanche, dire qu’une équipe gagnera ou non la compétition n’est pas valable en termes prédictifs. Par exemple, « l’Espagne ne gagnera pas la Coupe d’Europe » n’est pas une prédiction car l’affirmation n’est pas basée sur un calcul de probabilité.

Il est également important de comprendre le sens de la probabilité. Si quelqu’un dit que l’Espagne a 10 % de chances de remporter le Championnat d’Europe, cela signifie que si 100 Championnats d’Europe se jouaient dans ces mêmes conditions, l’Espagne en gagnerait dix. Ce que cela ne signifie pas, c’est que cette prédiction soit appropriée si l’Espagne ne gagne pas. Comme il n’y aura évidemment pas 100 Coupes d’Europe, ce n’est pas une tâche immédiate de définir qui ou quel modèle a mieux prédit.

Depuis quelque temps, le compte X @Futbolmetrix1 de Daniele Paserman organise un concours pour savoir qui peut le mieux prédire un tournoi comme l’Euro. Les personnes intéressées envoient les probabilités d’atteindre chacun des tours pour toutes les équipes avant le début de toute compétition. Dans le cas de l’Euro 2024 en Allemagne, plus de 30 ont été reçus.

Pour déterminer quel pronostic est le gagnant, @Futbometrix1 utilise trois méthodes statistiques différentes : Brier Score, Log Score et RPS. Dans les trois modèles, plus sa valeur est faible, meilleure est la prédiction.

L’Espagne a remporté la Coupe du monde féminine 2023. Le pronostic gagnant a été fait à partir de la moyenne de plusieurs maisons de paris. Celles-ci prédisaient mieux que 20 prédictions basées sur différents modèles. Ce résultat, qui peut paraître paradoxal, est relativement courant.

Il ne suffit pas de faire de nombreuses simulations

Ci-dessous, je vais vous expliquer comment faire des pronostics pour un tournoi présentant les caractéristiques de la Coupe d’Europe.

La plupart des pronostics sont réalisés en simulant le tournoi à travers un nombre élevé de répétitions. Combien coûte haut ? Elles vont généralement de 1 000 à 200 000 simulations, comme celles utilisées par le journal El País pour cette Euro Coupe. Calculer des pronostics en simulant le tournoi est aussi simple que de voir le pourcentage de simulations dans lesquelles une équipe atteint un certain tour. El País affirme que la probabilité que l’Espagne remporte la Coupe d’Europe est de 11%, ce qui implique que l’Espagne a été vainqueur dans environ 22 000 simulations sur les 200 000 réalisées.

Cependant, la clé de cette méthodologie n’est pas tant le nombre de simulations. D’après mon expérience, vous pouvez vous rapprocher des probabilités finales du modèle après environ 200 ou 300 simulations. La clé réside dans la manière d’attribuer les probabilités (victoire, nul, défaite) pour chaque match. Ici, deux alternatives notables se dessinent : les résultats passés ou la qualité des joueurs.

Les résultats enregistrés lors des matchs passés sont quantifiés par le classement Elo, qui est une modification du célèbre classement des échecs, tandis que d’autres suivent le classement de la FIFA ou de l’UEFA.

Pour mesurer la qualité des joueurs, le plus simple est d’ajouter la valeur de transfert fournie par le site Transfermarkt. Cela fournit une valeur de transfert hypothétique pour tous les joueurs des ligues professionnelles. Pour ce faire, il s’appuie sur une évaluation collective sous l’hypothèse que le plus grand nombre est plus intelligent que quelques-uns.

Toni Kross vaut plus que ce qu’on dit

Cependant, l’utilisation de la valeur Transfermarkt comme mesure de la qualité d’un footballeur pose le problème que cette valeur dépend largement de l’âge et non de la performance. Par exemple, Toni Kross, milieu de terrain titulaire incontesté du Real Madrid ces dernières saisons, vaut dix millions d’euros. Exactement le même attribué à Nico Paz, un milieu de terrain du Real Madrid de 19 ans qui a joué 19 minutes en Liga 2023-2024.

Pour obtenir une évaluation plus réaliste, la valeur Transfermarkt doit être ajustée en fonction de l’âge.

Une autre façon de mesurer la qualité des joueurs consiste à utiliser des statistiques individuelles, qui peuvent être obtenues grâce à des modèles d’intelligence artificielle. Évidemment, ces sources peuvent être intégrées selon différentes combinaisons et échelles. Par exemple, pour mesurer la qualité d’une équipe, El País intègre le classement Elo et la valeur Transfermarkt.

Les prédictions sont mises à jour avec les résultats

Certains prévisionnistes publient non seulement leurs prévisions d’avant-compétition, mais les mettent également à jour en fonction des résultats déjà réalisés. Dans ce cas, la décision que les modèles doivent prendre est de savoir s’ils mettent à jour la qualité des équipes au fur et à mesure que la compétition progresse ou s’ils maintiennent la qualité établie avant le tournoi. Un événement particulièrement important se produit lorsque des équipes surprises atteignent les tours finaux, comme ce fut le cas du Maroc lors de la Coupe du monde 2022 au Qatar, atteignant les demi-finales.

De ma vision aristotélicienne, qui place la vertu à mi-chemin, je crois qu’un bon modèle aurait dû prendre en compte le fait que l’équipe du Maroc en demi-finale était une bien meilleure équipe que l’équipe qui a débuté la Coupe du monde. Mais il ne faut pas tant mettre à jour sa qualité et en déduire qu’elle était l’une des quatre meilleures équipes du tournoi.

Une fois les probabilités déterminées, donnée clé pour la précision d’un modèle, il est relativement facile de réaliser les simulations, puisqu’il suffit de dire au programme informatique de choisir le résultat d’une correspondance.

De leur côté, les maisons de paris établissent leur probabilité initiale par des moyens similaires à ceux décrits ci-dessus. Mais une fois qu’un pari est ouvert, il est mis à jour. À la fois en raison de nouvelles informations qui peuvent apparaître, comme une blessure d’un joueur concerné, et en raison des paris reçus.

Supposons que je joue un match de tennis contre Carlos Alcaraz et que, par erreur, les cotes m’établissent comme favori (joueur avec la cote la plus faible). Les parieurs iront en masse parier sur Alcaraz. Cela amènera le bookmaker à reconsidérer sa décision s’il modifie ses cotes. De telle sorte que la chose normale est que le quota final considère qu’il lui est à moitié impossible ou complètement impossible de battre Alcaraz dans un match de tennis. Logiquement, la même chose se produit avec d’autres paris comme celui du vainqueur de la Coupe d’Europe.

Les cotes pour l’Euro 2024

Pour montrer un exemple de pronostics, je vais utiliser la probabilité moyenne basée sur les 30 participants au concours établi par @Futbolmetrix1 d’atteindre chacun des tours et de gagner. Le tableau apparaît classé selon la probabilité de remporter l’Euro Coupe.

Tableau de prédiction de l’Euro 2024.

L’auteur, d’après les données de @Futbolmetrix1

Et oui, l’équipe favorite est la France, avec une probabilité de victoire de 16,5%, suivie de l’Angleterre avec 13,7%. L’Espagne est troisième avec une probabilité de 11,7% de remporter la Coupe d’Europe. Alors félicitations aux supporters français, même si leur avantage probabiliste n’est pas si grand. Nous, Espagnols, nous confions à ces 11,7 %.

Cet article a été publié dans « The Conversation ».

Ce contenu est exclusif aux abonnés

2€/mois pendant 4 mois

Êtes-vous déjà abonné? Se connecter

-