Comment évaluer un gardien ?
Les statistiques avancées fournissent de précieux outils pour apprécier le niveau des goals. Avec, comme toujours, des nuances...
Cette semaine, regardons comment évaluer un gardien, ou plus spécifiquement son aptitude à arrêter les tirs. Pour ce faire, on partira des post-shot expected goals (PSxG). Si les xG représentent la charnière sur laquelle s’articule le soccer analytics moderne, les PSxG en sont un heureux prolongement correspondant à la probabilité de marquer un but, mais calculée après le tir. La nuance est de taille car ces modèles disposent d’informations sur la frappe comme sa vitesse ou sa trajectoire. Ainsi, seuls les ballons cadrés et non-contrés sont pris en compte. En faisant l’outil de référence pour estimer la capacité d’un portier à préserver sa cage.
Les modèles les plus sophistiqués comme celui de StatsBomb1 valent de l’or. Les modestes analystes comme moi, travaillant à partir de données «scrapées», se contentent de celui d’Opta/StatsPerform, plus rustique mais gracieusement disponible via FBRef sur chaque tir des principales ligues 🫡.
Outre la qualité du modèle, on commence à voir d’autres trous dans la raquette. En travaillant avec les PSxG des tirs subis par un gardien, les CSC nous échappent. Tel le renard qui ne peut attraper les raisins, on postulera qu’ils sont inévitables.
Autre angle mort, un shot peut être consécutif à un renvoi raté ou à un ballon boxé à la va-comme-je-te-pousse par Anthony Lopes par le gardien. Nous n’analyserons pas ici si un portier provoque des frappes (notamment des penaltys) par ses erreurs ou son placement.
Taquiner le Poisson binomial
Une fois récupérés les PSxG des tirs subis, il nous reste à appliquer la loi Poisson binomiale, une généralisation de la loi binomiale, souvent confondue avec la loi de Poisson. Elle modélise la fréquence du nombre de succès obtenus (marquer un but) lors de plusieurs expériences aléatoires indépendantes (des frappes cadrées).
Imaginons un gardien qui subit 3 tirs avec les PSxG suivants
Poisson binomiale nous permet de trouver :
Dans cette situation, un portier a 5,6% de garder ses cages inviolées d’après les PSxG. On cumule ces probabilités pour arriver à un score allant de 0 à 100, signifiant «la probabilité d’encaisser plus ou autant de buts que le gardien sur les tirs qu’il a subi». Ici, un gardien ayant pris un unique but aurait un score de 94,4. Plus il y aura de tirs, plus la mesure sera fine.
En appliquant ce principe aux goals de notre championnat :
On trouve un Donnarumma au sommet de son art. Sans surprise, Brice Samba ou Chevalier figurent également en bonne position. De l’autre côté, Pau Lopez accuse le coup avec un très faible score de 15,93.
Pour nuancer encore un peu, il faut tenir compte du fait que les gardiens ne sont pas notés sur les mêmes tirs. Pour un gardien, il n’est pas rare d’observer des variations importantes d’une année à l’autre, c’est le cas de Pau Lopez qui a pu autrefois mieux figurer dans ce type de classement.
Une lurking variable2 qu’on a pas encore abordée concerne les tireurs eux-mêmes. Il ne faut pas perdre de vue que les PSxG servent également à les évaluer. On pourrait ainsi pondérer les PSxG en fonction des tireurs, mais le mieux est souvent l’ennemi du bien.
De même, il y a longtemps que le rôle d’un gardien de but ne se réduit plus à cette simple dénomination. Avec des entraîneurs comme Biesla, Sampaoli ou Guardiola, qui privilégient les relances courtes et précises, les goals se muent en joueurs de champ et évoluent de plus en plus en dehors de leur surface. À son arrivée à l’OM, Pau Lopez effectuait 40 passes par match. S’il est depuis rentré dans le rang, il ne faut pas éluder ses autres qualités.
Dernier point, il serait intéressant de segmenter plus finement ce type de données, notamment pour estimer la qualité d’un goal sur des phases spécifiques, comme les coups de pieds arrêtés.
Le lien de la semaine
Pour prolonger cette lecture, on lira les travaux d’Ismaël Haffoud sur Coparena. À partir de hacking statistics3, il calcule le nombre de points qu’un gardien fait perdre ou gagner à son équipe.
Dinesh Vatvani, Upgrading Expected Goals, StatsBomb, 16 mai 2022
Jim Frost, What is a Lurking Variable?
John Rauser, Statistics Without the Agonizing Pain, Strata Conference, 2014