Quelle équipe a eu le plus de chance en Ligue 1 ?

Nous avons analysé tous les tirs de la saison précédente pour comprendre comment les choses auraient pu se dérouler autrement

Le football est un sport chaotique. Un tir improbable peut faire basculer un match, voire une saison. C'est sans doute là où réside sa beauté ; dans cette insaisissable part qui échappera toujours aux statisticiens, aux analystes vidéo ou aux tacticiens qui s'attèlent à en décortiquer tous les aspects.

L'analyse des tirs d'un match permet d'ouvrir en partie l'éventail des possibles. En partant des xG associés à chaque tir, on peut simuler dérouler différents scénarios à partir d'un même match. Par exemple, si un tir a un xG de 0.1, cela veut dire que lors de nos simulations, il provoquera de manière aléatoire un but environ 1 fois sur 10. De l'accumulation des simulations vont progressivement émerger des probabilités pour chacun des résultats possibles.

Prenons comme exemple, le match Marseille - Toulouse de la saison 2019-2020 :

Si on cumule les xG de chaque côté, Toulouse domine assez largement avec 1.78 xG contre 0.72 pour Marseille. Le score de 1:2 pour Toulouse est le plus probable au regard de ces données. Loin devant la victoire 1:0 pour Marseille, le score réel.
D'après les simulations, celui-ci n'avait que 15 chances sur 1000 de se produire.

Une fois cette mécanique mise en place globalement, on obtient pour chaque match une probabilité de victoire / nul / défaite. Il s'agit maintenant de comparer le cumul de ces probabilités aux points réellement obtenus par chaque équipe afin de déterminer laquelle offre le plus grand écart entre son classement réel et celui établi à partir des simulations.

À ce jeu, Marseille apparaît comme le vainqueur. Par ailleurs, Toulouse connaît le plus grand écart dans le sens inverse ; l'équipe passe de 13 points réels à environ 28 points simulés. Rien de remarquable ; la méthode de calcul par pondération va répartir les points distribués à chaque match et ainsi réduire les écarts des équipes aux extrémités. Qui plus est, son classement ne change pas sur les deux classements. En revanche Amiens peut nourrir des regrets au vu de ce nouveau classement. L'équipe y devance 6 équipes, largement suffisant pour rester en Ligue 1.

Il est possible d'aller encore plus loin. Pourquoi ne pas appliquer la même méthode de Monte-Carlo lors du calcul du classement des simulations ? Et ce afin d'obtenir la distribution possible des points plutôt qu'un seul résultat final. Ainsi, plutôt que de faire la somme pondérée des points à chaque match, nous lancerons des simulations afin de désigner aléatoirement un vainqueur à chaque match en fonction des probabilités calculées précédemment. Avec suffisamment de simulations, nous obtiendrons une distribution des possibilités de points pour chaque équipe.

Chance ou talent

Le diagnostic de ces résultats demeure l'étape la plus délicate et n'est pas le sujet de cet article.

Mais pour continuer sur Marseille, l'équipe a surtout marqué plus que prédit par les xG (41 buts contre 36.5 xG). Dans une moindre mesure, l'équipe a également encaissé moins de buts (29 contre 32 xG contre).

Notre modèle est-il biaisé ou trop peu sophistiqué pour capturer les chances réelles de marquer ? Et surtout qu'en est-il du talent ou de la chance ? Une différence chronique entre xG et buts réels est souvent le symptôme d'un des deux phénomènes. À ce stade, rien ne vaut le visionnage des buts.

Comme l'unique but de la rencontre Marseille - Toulouse. L'oeuvre de Payet et accessoirement le but avec le plus faible xG de Marseille cette saison.