Buildup Disruption Percentage (BDP): analisi e utilizzi.
Il BDP è una metrica recentemente introdotta da @Soccerment_Blog, dopo considerazioni con @toni_Gagliardi, volta a quantificare l'efficienza del pressing di una squadra.
Il BDP di una singola partita quantifica lo scostamento in % del tasso di completamento dei passaggi degli avversari rispetto al loro tasso di completamento medio, moltiplicato per l'accuratezza degli avversari. Mediando poi su tutte le partite si ottiene quindi il BDP stagionale
Il segno negativo fa si che valori positivi del BDP siano associati a un'efficienza positiva nel pressing, ossia:
BDP > 0 ---> efficenza positiva.
(La formula nel precedente tweet l'ho ricavata dal ragionamento nel blog, mi sembra che sia questa ma non è specificata).
Visto che vogliamo valutare il pressing di una squadra non andiamo a considerare però tutto il terreno di gioco ma solo i 2/3 offensivi per la squadra in esame, quindi in particolare valutiamo la prima pressione.
Nella foto la zona verde per chi difende da sx a dx.
Tutti i valori saranno quindi riferiti a quella zona di campo, cioè i primi 2/3 per chi è in possesso. L'unico dubbio che ho riguarda l'accuratezza stagionale dei passaggi, se considerarla su tutto il campo o meno. Nelle mie considerazioni anche α è riferita ai 2/3 di campo.
Il primo punto che vorrei discutere è l'utilizzo della media del tasso di completamento dei passaggi, il termine in rosso nella formula. Per valutarne l'utilizzo propongo di andare a vedere le distribuzioni delle singole squadre.
Un modo rapido per avere informazioni su queste distribuzioni di valori è valutarle graficamente con i boxplot. Come si vede dal grafico sono presenti diversi outlier e più in generale si nota per alcune squadre una discreta dispersione nei valori.
E' la media il miglior parametro per rappresentare il valore centrale di queste distribuzioni? Sicuramente si se le distribuzioni fossero gaussiane. Ho provato a fare dei test per valutare se lo fossero e questi sono i risultati.
Senza entrare troppo nel tecnico, per diverse distribuzioni il carattere gaussiano non sembra confermato. Visto l'esito dei test, e la presenza di diversi outlier, a mio avviso il parametro da adottare per rappresentare il tasso di completamento dei passaggi è la mediana.
La prima proposta sarebbe quindi di valutare nel BDP lo scostamento rispetto alla mediana e non rispetto alla media, così da caratterizzare meglio la tendenza "media" delle squadre in possesso, pesando meno gli outlier.
Come cambiano i valori? Come potete vedere c'è uno shift quasi costante dei valori in alto, questo perché (2a foto) la mediana è generalmente più alta della media per come sono fatte le distribuzioni.
Una seconda riflessione, di carattere analogo alla precedente, riguarda la scelta della media (il termine rosso in foto) per andare a valutare il BDP stagionale, questo sia che si prenda la media o la mediana del tasso di completamento dei passaggi.
Come abbiamo fatto in precedenza, andiamo innanzitutto a vedere la distruzione dei valori dei BDP per le singole squadre. Sia per il BDP che per il BDP-mod1 ci sono diversi outlier (in numero maggiore per il BDP-mod1).
Il test per la controllare il carattere gaussiano per le distribuzioni relative al BDP originale mostrano un che per diverse squadre le distribuzioni sono lontane dalla gaussiana.
La stessa cosa accade per il BDP-mod1. Vista la presenza di numerosi outlier, a mio avviso usare la mediana per rappresentare il BDP stagionale potrebbe caratterizzare meglio le distribuzioni.
L'idea è quindi passare a considerare la mediana (nella formula ho esplicitato l'operazione) per il valore stagionale, sia che si consideri la media o la mediana per il tasso di completamento dei passaggi.
Guardando ora al BDP-mod3 e alla differenza rispetto alla proposta originaria (Delta3) si notano alcune importanti differenze. Il numero a sx rappresenta la posizione in classifica per il BDP, la tabella è ordinata per BDP-mod3.
Per dare un po' di chiarezza ecco la classifica per BDP-mod3 con la differenza in posizione rispetto al BDP.
Il BDP per me è un'ottima metrica, motivo per cui ho deciso di analizzarla in dettaglio. Ritengo che con i correttivi proposti possa essere ancora più utile per rappresentare l'abilità di una squadra nel pressing.
Correttivi che si propongono di rendere più stabile la metrica e meno soggetta a singoli valori fuori scala, che tipicamente possono succedere quando una squadra è inferiorità numerica oppure in situazioni di doppio vantaggio/svantaggio ad esempio.
Vediamo infine come utilizzare il BDP per entrare nel dettaglio delle squadre. Una cosa che si può fare, e che svilupperò in seguito, è quella di valutare l'andamento del BDP nel corso della partita.
Ad esempio se uno deve affrontare il Genoa può aspettarsi che il loro BDP crescerà generalmente durante la partita, anche per una questione di punteggio. Però è una squadra che mantiene alti livelli durante la partita.
L'Inter invece tra il 60' e il 75' decresce sensibilmente il suo livello di pressing, forse in un momento in cui ci sono i primi cambi e deve riorganizzarsi.
Concludiamo con il Milan che invece presenta dati migliori verso la fine delle due frazioni.
Dedicherò poi un thread specifico a questo argomento. Direi che è già abbastanza lungo e tecnico questo.
Preview di #VeronaMilan: Hellas dopo un periodo con xGA > xG è tornata ad avere dati positivi, in particolare si può vedere come la media mobile degli xG su 4 partite (cambiato da 5 dopo il thread di @BeGriffis) sia superiore a quella del Milan, che ha dati impressionati per xGA
Andando a normalizzare gli avversari incontrati si può notare come le ottime prestazioni offensive del Verona sia anche dovute agli avversari affrontati nell'ultimp periodo. Milan tornato a dati positivi dopo negli ultimi tempi.
Dal punto difensivo si può notare come il Verona si adegui abbastanza all'avversario ma da tempo è riuscito a concedere sempre meno rispetto a quanto producono di solito i suoi avversari. Milan che difensivamente ha fornito sempre ottime prestazioni, soprattutto nelle ultime.
Due grafici in previsioni di #InterEmpoli: Inter che continua a creare molte occasioni in termini di xG e saldo che è ampiamente positivo. La difesa si è assestata intorno a 1 xGA a partita, buonissimi valori ma peggio della fase migliore del campionato. Empoli con saldo negativo
Guardando ai dati rispetto all'avversario l'Empoli nelle ultime partite è tornato ad avere un saldo positivo, dopo un lungo periodo in cui l'attacco aveva faticato enormemente. Inter con ottimi dati offensivi, come già evidenziato dai grafici precedenti.
Qui il dettaglio delle singole partite. Per l'Empoli ha grande peso l'ottimo risultato contro il Napoli.
Preview di #LazioMilan: le due squadre hanno entrambe un trend positivo nella differenza tra xG creati e xG concessi. Si notano le ultime ottime prestazioni del Milan sul lato difensivo. Lazio che ha trovato una certa continuità dopo un inizio molto oscillante.
Il trend offensivo considerando l'avversario ci dice che il Milan nelle ultimissime ha ritrovato un po' di brillantezza offensiva, vediamo se continuerà. Lazio che ha nell'ultimo un dato negativo dopo diverso tempo in positivo.
Nonostante i pochi gol fatti nelle ultime il Milan è tornato a produrre un buon numero di occasioni complessivo (vedendo le partite soprattutto c'è stato un alto volume ma forse poca qualità nelle occasioni, sommandosi danno comunque dato positivo).
Dopo una breve pausa, dovuta a ragioni personali, si riparte con qualche grafico in previsione di #InterRoma.
Vorrei focalizzarmi sulla fase di costruzione, sono due squadre che sotto quest'ottica non ho ancora analizzato.
- xT da passaggi: l'Inter è nettamente la prima.
La Roma è comunque una delle migliori dopo l'Inter. Questo vuole dire che dalla fase di costruzione riescono a portare la palla in zona pericolosa con costanza.
Sono due squadre bilanciate tra verticalizzazioni e conduzioni verticali. L'Inter verticalizza un po' meno.
In fase di costruzione i portieri tendono a giocare palla a terra o comunque a ridurre i lanci lunghi (ciò non vuol dire che non accade ma con bassa frequenza).
Rui Patricio poco coinvolto nella fase di costruzione.
Qualche grafico in previsione di #JuventusInter. Partiamo da un'analisi della fase di costruzione, tema su cui sto sperimentando un po' nell'ultimo periodo.
L' #Inter è la squadra che dalla costruzione in passaggio produce più xT. #Juve comunque in ottima posizione.
Sono due squadre che non verticalizzano molto. La Juve risale raramente il campo tramite conduzione ma più con passaggi.
Entrambe non producono molto xT da conduzione
Il portiere viene coinvolto in costruzione in modo abbastanza simile ed entrambe prediligono una costruzione dal basso del portiere che raramente lancia lungo.