Pax Profile picture
18 Sep, 15 tweets, 4 min read
Torniamo al simpatico tweet ricciardiano qui sotto.
Tralasciamo lo sfondone sui 400'000 morti, e passiamo al grafico del tweet citato.
Ora, uno statistico per prima cosa si chiederebbe quale modello sia stato utilizzato per le previsioni, come siano stati trattati i dati, quali siano le assunzioni di base, in quale rischio di modello si incorra.
Poi scoprirebbe cose imbarazzanti e sarebbe colto dallo sconforto.
Ma per un non statistico diventa ostico (e forse pure inutile) guardare a queste cose.
Però c'è una cosa semplice che può fare, sia per evitare di farsi fregare da tre righe colorate, sia per spingere gli esperti e i giornali a produrre grafici migliori, prima di pontificare.
Una previsione un minimo seria, presenterebbe infatti intervalli di previsione, come quelli nella figura qui sotto.
NB: questi intervalli sono stati disegnati da me e non hanno alcuna valenza, se non quella "pedagogica". Non sono stati ricavati dai dati.
Queste graziose bande colorate ci danno informazioni circa l'incertezza della previsione.
Assumendo un classico (quanto fallace, ma soprassediamo) 95% di confidenza, la banda rosa mi dice che la previsione "worse" starà al 95% in quell'area, con la linea rosa come "media".
Lo stesso vale per le bande verdi e viola.
Ora, in un grafico del genere, i tre scenari sarebbero ben distinti, quindi confrontabili senza troppi patemi, a meno di non voler fare appunto gli statistici.
Ma la situazione cambia se il grafico diventa questo.
Come vedete le bande si
intersecano in più punti.
Questo mi dice che non è banale separare gli scenari.
Difficilmente un test rifiuterebbe l'ipotesi di indifferenza tra le previsioni, per diverse settimane.
Quindi, se un grafico non ha intervalli di confidenza, diffidate. Non prendetelo per oro colato.
Chiedete che vengano mostrate. Se un ricercatore rifiuta di mostrarle, è un pessimo segno. Probabilmente sta facendo di tutto per far passare la sua tesi a ogni costo, obbligando i dati a confermarla.
Non proprio un approccio scientifico.
In realtà molte volte le previsioni che vedete potrebbero essere rappresentate con questa figura (volutamente esagerata, ancora per motivi didattici).
Un intervallo previsorio del genere mi dice che faccio prima a tirare la monetina per fare previsione (di certo per gennaio '22).
O banalmente posso prendere il valore di oggi come predittore di domani.
In generale, quando vi mostrano una previsione di questo tipo (in epidemiologia, in economia, in finanza, in tutto):
1) cercate/pretendete gli intervalli di previsione
2) chiedete il livello utilizzato: 95%
99%? 90%? 77.7%? π%? Devono sempre dirlo.
3) Diffidate di previsioni che vadano oltre le 10/20 unità di tempo. Per dati giornalieri, parliamo di max 20 giorni. Per dati settimanali, di 20 settimane, etc.
E questo sempre che il modello sottostante sia valido e ben alimentato.
Anche con tantissimi dati, una previsione che si spinga oltre il 2% degli stessi è probabilmente fuffa (con 1'000 giorni arriviamo appunto a 20), a meno di non trovarsi di fronte a un fenomeno talmente regolare che diventa inutile fare certe previsioni.
4) Se vi rimandano al "paper", insistete. Un grafico deve essere quanto più possibile informativo.
Nessuno pretende la descrizione del modello, ma le basi come gli intervalli di previsione sì.
5) Euristica: diffidate di chi posta in continuazione grafici di previsione su Twitter.
Nel caso specifico del Covid, poi, come è stato più volte sottolineato, la stragrande maggioranza dei modelli continua a basarsi su ipotesi fallaci.
Ma di questo ne ho già parlato altre volte, e quindi mi fermo qui.
PS: se vi tirano fuori gli "ensemble" (o previsione ensemble), scappate.
È banale mostrare che gli ensemble sottostimano gli scenari più rilevanti dal punto di policy, cioè quelli di coda (i classici "bene bene", "male male").
E se parliamo di fenomeni rischiosi...fate 2+2.

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with Pax

Pax Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @dottorpax

17 Sep
Pronti ai "Ma che sarà mai?!", "Se uno non ha nulla da nascondere!", "ci vuole più sicurezza"?
Ma guardiamo in positivo: finalmente AdE, in carenza cronica di informazioni, potrà incrociare il redditometro con le facce di quelli che entrano nei negozi.
ilpost.it/2021/09/16/ric…
Che poi, visti i capi della polizia municipale saliti agli onori della cronaca ultimamente, o la qualità media dei politici locali, è tutto ancora più eccitante.
Vedo un'opportunità di business nelle mascherine, anche dopo la pandemia.
Specie quelle in grado di modificare i punti chiave per misurazioni e rilevazioni cui applicare PCA e LDA.
E si potrà sempre dire: lo faccio per la salute.
Read 4 tweets
27 Aug
Convocazione in una commissione di dottorato.
Resto del mondo: una breve mail e uno massimo due allegati chiari e precisi sulle norme dell'università.
Italia: PEC di 34 righe, 16 allegati, di cui quello per il rimborso spese ha oltre 20 pagine di regole.
Notare che all'estero la PEC non esiste e ti arriva questa mail con allegata una mail con allegati i 16 allegati, più due coccodrilli e un orangotango.
La chicca: uno degli hotel convenzionati per noi commissari è un convento con foresteria.
Tutta vita!
Read 7 tweets
8 Jul
Quella di Hanley è una regoletta che si applica per avere una stima veloce dell'intervallo di confidenza della probabilità di accadimento di uno specifico evento in una popolazione, analizzando un campione di n>30 individui (indipendenti o almeno scambiabili).
Se su n>30 individui l'evento non si è manifestato, la probabilità di accadimento nella popolazione starà al 95% nell'intervallo [0,3/n].
Al 99% nell'intervallo [0,4.6/n].
Se per esempio un vaccino è testato su una campione di 3000 individui, e nessuno di questi ha effetti collaterali di un determinato tipo (es: la febbre), avremo che la probabilità di sviluppare la febbre starà, al 95%, nell'intervallo [0,3/3000], ossia [0,0.001].
Read 6 tweets
23 Jun
"Le nove cifre degli indiani sono queste: 9 8 7 6 5 4 3 2 1. Con tali nove cifre, e con il simbolo 0, dagli arabi chiamano zefiro (vi ricorda lo zero?!), qualsiasi numero può essere scritto, come sarà dimostrato più avanti."
Con queste parole si apre uno dei libri che hanno permesso la nascita della matematica moderna, e con essa della teoria della probabilità (come si capisce bene da alcuni passi della "Summa de arithmetica, geometria, proportioni et proportionalita" di Luca Pacioli).
Parliamo del Liber Abbaci di Fibonacci, all'anagrafe Leonardo Pisano.
In tale testo fondamentale, scritto in latino per la prima volta nel 1202, e seguito da diverse riscritture (la più nota quella del 1228), Fibonacci introduce in Italia e in Europa
Read 17 tweets
22 Jun
Se è vero che la moderna teoria della probabilità si sviluppa durante il Rinascimento, sia per motivi filosofico-religiosi (nuovo antropocentrismo) che tecnici (prima di Fibonacci, e ancor più prima di Pacioli e Cardano, non avevamo gli strumenti matematici
per descrivere il caso), è anche vero che nell'antichità si ritrovano alcuni ragionamenti probabilistici di grandissimo interesse tecnico e storico (nel senso di storia della matematica).
Ad esempio in Lao Tzu e Sun Tzu si trovano riferimenti non banali ai concetti di rischio, incertezza e puro caso. Lao Tzu è stato uno dei primi a introdurre la distinzione tra "assumere un rischio" e "correre un rischio", distinzione fondamentale per l'approccio
Read 14 tweets
5 Jun
Che ne pensate della tesi di laurea?
Io sono favorevole a renderla opzionale, lasciando la possibilità allo studente di sostituirla con corsi aggiuntivi e/o stage.
La tesi può essere una grande opportunità di crescita personale, ma per tanti si riduce a scopiazzare qua e là.
E la colpa non è solo dello studente che la prende sottogamba, ma anche del docente accondiscendente, e dei tempi di ricerca e stesura che stanno diventando sempre più assurdi.
Se voglio continuare gli studi, tenderò a scegliere la tesi, per mostrare le mie capacità di fare
ricerca. Io leggo sempre le tesi di chi invito al colloquio di selezione per un posto di PhD: una tesi dice molto sul candidato.
Ma uno stage fatto bene è ugualmente formativo. Quando coordinavo la specializzazione di ingegneria finanziaria passavo molto tempo a stringere accordi
Read 7 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!

Follow Us on Twitter!

:(