Le statistiche nel calcio – parte terza

In genere, tendo a mantenere le promesse. Infatti, avevo fatto la promessa di ridurre la lunghezza dei singoli articoli, e la sto mantenendo.

I due articoli precedenti, “Le statistiche nel calcio (parte prima e parte seconda)” erano in realtà un articolo unico, ma quando mi sono reso conto che la lettura avrebbe impegnato circa dieci minuti, l’ho diviso in due parti.

Ma per venirti incontro, giovane lettore, ho perso un po’ il filo di quello che stavo dicendo, pertanto ti propongo un breve riassunto.

Un magnate americano ha deciso di investire nel mondo dello sport e per farlo, visto che aveva fatto i soldi con un algoritmo, ha deciso di applicare un algoritmo allo scouting (in inglese scouting indica un’attività di esplorazione: in ambito militare è una ricognizione per raccogliere informazioni sul nemico; in ambito sportivo, dello spettacolo o aziendale è una ricerca alla scoperta di persone di talento da poter inserire nella propria squadra o in un organico).

Con uno staff di analisti composto da Ian Graham, fisico, Tim Waslett, astrofisico, Dafydd Steele, matematico e Will Spearman, fisico delle particelle, ha così riportato alla vittoria il Liverpool, squadra inglese di calcio (e aveva fatto lo stesso con i Boston Red Sox, squadra americana di baseball).

È mai possibile che una squadra possa vincere solo affidandosi ai dati?

Non è la prima volta che squadre di calcio si affidano ai dati statistici piuttosto che agli osservatori per ingaggiare giocatori: Arsène Wenger, allenatore dell’Arsenal, cercava un centrocampista di un certo tipo: scovò il semisconosciuto Mathieu Flamini grazie alle statistiche (correva 14 chilometri a partita), e lo ingaggiò dal Marsiglia.

E anche Frank Rijkaard, che volle per il suo Barcellona il brasiliano naturalizzato portoghese Deco, per la sua percentuale di palloni recuperati.

Oramai, tutte le squadre di un certo livello hanno uno staff di analisti, che misurano le prestazioni degli atleti e delle squadre in modo oggettivo attraverso molteplici dati che analizzano tiri, occasioni da gol, passaggi, occupazione degli spazi, pressing, e molti altri fattori, non solo per quantità ma anche per qualità.

Prima di andare avanti, una precisazione. Negli sport americani, soprattutto nel basket, le prestazioni sono correlate fortemente con i risultati: se giochi bene, fai molti punti, e se fai molti punti, vinci.

Nel calcio, cosa che lo aveva reso indigesto agli americani all’inizio, le partite possono finire 0-0 anche se sono giocate bene da entrambe le squadre (anzi, si usa dire che il risultato perfetto nel calcio sia proprio quello).

Quindi possiamo dire che nel calcio la correlazione tra prestazione e risultato è debole nella singola partita e si manifesta in maniera più consistente, ma comunque meno forte che in altri sport, solo nell’arco di parecchie partite.

Uno dei parametri maggiormente in voga in questo periodo sono gli expected goals (xG).

In italiano possiamo chiamarli “gol attesi”, e sono semplicemente i tiri fatti da una squadra, ai quali viene poi assegnata una probabilità di fare gol.

Questa probabilità non è assegnata a caso, ma deriva dall’analisi e dalla classificazione di decine di migliaia di tiri fatti nei vari anni nei 5 maggiori campionati europei, ognuno classificato in base a posizione, distanza, angolo del tiratore, tipo di passaggio ricevuto, presenza o meno di una marcatura, presenza o meno di giocatori che oscurano lo specchio della porta, ecc.

Per fare un esempio semplicissimo, su migliaia di calci di rigore tirati, i rigoristi delle massime serie di Italia, Spagna, Inghilterra, Germania e Francia 1 hanno fatto gol il 76% delle volte.

In termini decimali un calcio di rigore vale perciò 0,76 gol, cioè 0,76 xG, e ciò esprime la probabilità che ha un rigorista di uno dei 5 maggiori campionati europei di fare gol su rigore.

Se alla mia squadra viene assegnato un rigore, se segno, avrò un +0,23, se sbaglio, un -0,76.

A fine partita, ad esempio, la mia squadra ha prodotto 6 tiri pari a 0,20xG + 0,13xG + 0,30xG + 0,37xG + 0,10xG + 0,50xG, e poi le è stato assegnato un rigore, quindi + 0,76xG. Complessivamente la mia squadra ha un xG pari a 2,36, quindi la probabilità di segnare, arrotondando, 2 gol.

Se ho segnato 2 gol, sono in linea.

Ovviamente, così come esistono i miei xG, esistono quelli degli avversari, che si chiamano xGA (expected goals against, cioè contro).

Il ragionamento è lo stesso. Restando nell’esempio, la mia squadra nella partita in cui ha prodotto complessivamente 2,36 xG ha concesso complessivamente 1,45 xGA. Specularmente l’altra squadra ha prodotto 1,45 xG e concesso 2,36 xGA.

Come dicevo prima, se fossimo nel basket, la mia squadra avrebbe vinto quasi sicuramente, mentre nel calcio la partita potrebbe, pure con quei dati dell’esempio, finire 0 a 0.

Vediamo un esempio sull’anno scorso.

Figura 1 – Anno 2018-2019

Come vediamo, la Juventus ha avuto un rendimento sicuramente superiore, realizzando più di quanto prodotto e subendo meno di quanto concesso.

Ciò ha comportato addirittura un +19 nel computo degli xPTS (expected points, ora avrete capito il giochino).

Gli xPTS tendono, per come sono concepiti, a essere sempre inferiori ai punti effettivi nelle squadre di testa, dato che queste vincono molto spesso, visto che sono in cima alla classifica, e quando vincono prendono sempre 3 punti nella realtà, e non 2,1 o 1,7 o 1,3.

Analogamente gli xPTS tendono a essere superiori ai punti reali nelle squadre in lotta per la salvezza, dato che quelle perdono molte partite per essere finite in quella posizione precaria, ma quando perdono fanno sempre e solo 0 punti nella realtà, non 0,3, 0,6, ecc.

In linea di massima le squadre più proattive come Barcellona o Man City avranno più vicinanza tra punti reali e xPTS, mentre squadre più reattive come Atletico Madrid o Manchester United più facilmente avranno punti regolarmente abbastanza superiori agli xPTS.

Infine i punti reali dipendono dalle qualità dei singoli, essendo il calcio un gioco di squadra ma anche un gioco di singoli.

Gli xPTS sono utili a un allenatore, al pari di xG o xGA e di altri parametri più complessi, per valutare e poi migliorare la qualità complessiva del gioco di squadra, indipendentemente dalla presenza di singoli giocatori in grado di risolvere le partite da soli.

Attenzione, però. Gli xG e tutti gli altri parametri (ce ne sono molti altri, ma non volevo tediarvi oltre) non sono solo un giochino da nerds.

E possono essere molto utili, come dicevo prima, ma a DUE condizioni (e su questo il prof. Kantor sarà sicuramente d’accordo con me).

  • Prima: rallentare le proprie brame predittive. In matematica, si sa, esiste una spada di Damocle chiamata “regressione verso la media”, descritto da Galton alla fine dell’800. Se lancio innumerevoli volte una moneta in aria, alla fine, il numero di teste o croci uscite convergerà al 50%. O, scientificamente parlando, prima o poi tutte le cose si allontanano dagli estremi e convergono verso un valore medio.
  • Seconda: l’impiego dei dati va reso chiaro e comprensibile. Non esistono depositari della verità in questo giochino della statistica applicata al calcio.

Io sono convinto che la tecnologia cambierà il calcio, ed è inevitabile che accada. Ma fondamentalmente, che mi frega, quando Paulo Dybala fa un tiro a giro dal vertice destro dell’area e lo piazza nell’angolino lontano, sapere che il suo xG è 0,13?

11 pensieri riguardo “Le statistiche nel calcio – parte terza

  1. Ho iniziato a seguire il calcio da poco, ma solo quello di mio figlio, e come dici, nelle partite il cui risultato è 0-0 la prestazione di entrambe le squadre è pressoché superiore! Personalmente preferisco guardare queste anche se poi ho il cuore in gola! Poi ad un certo punto del post, mi sono accorta, che tolta la statistica e gli studi algoritmi i applicati (cosa che analizza sempre mio marito e nel calcio di serie A e minori e nelle partite del figlio) il resto non è totalmente di mio interesse! Ma è stato carino!
    Buon week end

    Piace a 1 persona

  2. Negli USA le statistiche sono ancora più utilizzate, e da decenni.
    Sport come Basket e Baseball, per esempio, necessitano di più di un assistente ad ogni partita per l’analisi dell’andamento e la preparazione della partita stessa.
    Un po’ si snatura l’evento sportivo, a dire il vero, ma certamente migliora la professionalità e l’approccio all’evento.

    Flamini e Fabregas erano il duo di centrocampo più bello d’Europa (insieme ai 2 del Barca), io ne andavo pazzo. Bravissimi.

    Piace a 1 persona

      1. Quello bravo era Fabregas, Flamini era un portatore d’acqua.
        Lo prendemmo a parametro zero, ma non riuscì a confermare le sue doti di incontrista.
        Gli venne dato uno stipendio assurdamente alto e poi divenne difficilissimo poterlo rivendere. Solite stupide operazioni di Galliani.

        Piace a 1 persona

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...