Tweet

Pax

24 Nov, 15 tweets, 3 min read

Prendiamo un gruppo di 100 persone che si sottopongono a un test rapido. Per semplicità le assumeremo indipendenti, nel senso che Tizio e Caio (due a caso) sono abbastanza lontani, ad esempio vivono in città diverse e non si conoscono, da non potersi influenzare a vicenda

(né in termini di contagio, né nell'esecuzione del test, né in altro).
I test rapidi hanno un'affidabilità non proprio eccelsa, e la probabilità (p) di un falso negativo (si resulta negativi al Covid quando in realtà lo si ha) è in media del 15%, mettendo insieme sintomatici

e asintomatici, ma con punte oltre il 50% per certi produttori, specie nei primi giorni dell'infezione.
Prendiamo per buono il 15% (0.15 in decimali).
Il numero medio di falsi negativi nel nostro campione di 100 persone sarà dato da una Binomiale(n=100,p=0.15), e sarà

semplicemente np, vale a dire 15. La deviazione standard sarà la radice quadrata di np(1-p), ossia 3.6.
Per fare le cose un po' più divertenti, assumiamo che p sia in realtà una variabile aleatoria (lo è!).

Del resto p non è sempre 0.15, ma vari studi ci dicono che può variare, per diversi motivi (produttore, fase di test, abilità di chi fa il test, etc.).
Diciamo che una Beta può essere una scelta semplice per riprodurre la probabilità di un falso positivo.

La Beta, specie in ottica bayesiana, è una scelta abbastanza standard per modellizzare le probabilità come variabili aleatorie, essendo una distribuzione che vive nell'intervallo [0,1] e molto flessibile.

Con una Beta(a=3,b=17) abbiamo una distribuzione con media 0.15 e deviazione standard 0.08, in linea con la variabilità empirica rilevata nei test rapidi, con riferimento ai falsi negativi.

Ora, se i nostri 100 si testano, ognuno di loro avrà una probabilità di un falso negativo data da una realizzazione della Beta(3,17). Il numero totale di falsi negativi non seguirà più una Binomiale, ma una Beta Binomiale. In particolare una BetaBinomiale (a=3,b=17,n=100).

Quindi, quale numero medio di falsi negativi possiamo aspettarci? Sempre 15=na/(a+b).
Ma cosa succede alla variabilità? Qual è il valore della deviazione standard? Ci ritroviamo con 8.5, superiore al 3.6 della Binomiale.

Questa non è una sorpresa: abbiamo aggiunto incertezza nel modello, dato che p è ora una variabile aleatoria.
Andiamo oltre, qual è la probabilità di avere un alto numero di falsi negativi? Diciamo più di 30 su 100.
Per il modello Binomiale abbiamo 0.01%, ma sotto la

Beta Binomiale la probabilità cresce sensibilmente al 6%!
E la probabilità di avere più di 60 falsi negativi?!
Se assumiamo p data e usiamo la Binomiale, abbiamo un numero vicinissimo a 0, ossia 8.5*10^(-25). Ma con la Beta Binomiale siamo a 0.005%, una quantità piccola, certo,

ma non trascurabile, se pensiamo che ogni giorno si effettuano e ripetono tantissimi test.
La morale è sempre la stessa: l'incertezza aumenta le code, e rende più probabili scenari estremi, con importanti effetti sul rischio di modello, qualora la si ignori (come spesso accade).

Se accettiamo un valore medio maggiore di p, diciamo 0.25, come riportato da alcune fonti, con una Binomiale(100,0.25) la probabilità di osservare più di 60 casi sarebbe 1.32*10^(-13), ma con una Beta Binomiale saremmo al 2% (e 2% è tantissimo con una malattia contagiosa).

Per completezza, la differenza tra i due modelli si fa molto meno marcata per p->0 (ossia piccola), motivo per cui sono banalmente da preferire test più affidabili.
Ecco, le considerazioni sul GP e i vari tamponi seguono.

Disclaimer: i modellini utilizzati sono volutamente semplici. Aggiungendo dipendenza e una migliore caratterizzazione dell'incertezza i risultati sarebbero ancora più netti.

• • •

Missing some Tweet in this thread? You can try to force a refresh

This Thread may be Removed Anytime!

Twitter may remove this content at anytime! Save it as PDF for later use!

More from @dottorpax

Pax

@dottorpax

18 Sep

Torniamo al simpatico tweet ricciardiano qui sotto.
Tralasciamo lo sfondone sui 400'000 morti, e passiamo al grafico del tweet citato.

Ora, uno statistico per prima cosa si chiederebbe quale modello sia stato utilizzato per le previsioni, come siano stati trattati i dati, quali siano le assunzioni di base, in quale rischio di modello si incorra.
Poi scoprirebbe cose imbarazzanti e sarebbe colto dallo sconforto.

Ma per un non statistico diventa ostico (e forse pure inutile) guardare a queste cose.
Però c'è una cosa semplice che può fare, sia per evitare di farsi fregare da tre righe colorate, sia per spingere gli esperti e i giornali a produrre grafici migliori, prima di pontificare.

Read 15 tweets

Pax

@dottorpax

17 Sep

Pronti ai "Ma che sarà mai?!", "Se uno non ha nulla da nascondere!", "ci vuole più sicurezza"?
Ma guardiamo in positivo: finalmente AdE, in carenza cronica di informazioni, potrà incrociare il redditometro con le facce di quelli che entrano nei negozi.
ilpost.it/2021/09/16/ric…

Che poi, visti i capi della polizia municipale saliti agli onori della cronaca ultimamente, o la qualità media dei politici locali, è tutto ancora più eccitante.

Vedo un'opportunità di business nelle mascherine, anche dopo la pandemia.
Specie quelle in grado di modificare i punti chiave per misurazioni e rilevazioni cui applicare PCA e LDA.
E si potrà sempre dire: lo faccio per la salute.

Read 4 tweets

Pax

@dottorpax

27 Aug

Convocazione in una commissione di dottorato.
Resto del mondo: una breve mail e uno massimo due allegati chiari e precisi sulle norme dell'università.
Italia: PEC di 34 righe, 16 allegati, di cui quello per il rimborso spese ha oltre 20 pagine di regole.

Notare che all'estero la PEC non esiste e ti arriva questa mail con allegata una mail con allegati i 16 allegati, più due coccodrilli e un orangotango.

La chicca: uno degli hotel convenzionati per noi commissari è un convento con foresteria.
Tutta vita!

Read 7 tweets

Pax

@dottorpax

8 Jul

Quella di Hanley è una regoletta che si applica per avere una stima veloce dell'intervallo di confidenza della probabilità di accadimento di uno specifico evento in una popolazione, analizzando un campione di n>30 individui (indipendenti o almeno scambiabili).

Se su n>30 individui l'evento non si è manifestato, la probabilità di accadimento nella popolazione starà al 95% nell'intervallo [0,3/n].
Al 99% nell'intervallo [0,4.6/n].

Se per esempio un vaccino è testato su una campione di 3000 individui, e nessuno di questi ha effetti collaterali di un determinato tipo (es: la febbre), avremo che la probabilità di sviluppare la febbre starà, al 95%, nell'intervallo [0,3/3000], ossia [0,0.001].

Read 6 tweets

Pax

@dottorpax

23 Jun

"Le nove cifre degli indiani sono queste: 9 8 7 6 5 4 3 2 1. Con tali nove cifre, e con il simbolo 0, dagli arabi chiamano zefiro (vi ricorda lo zero?!), qualsiasi numero può essere scritto, come sarà dimostrato più avanti."

Con queste parole si apre uno dei libri che hanno permesso la nascita della matematica moderna, e con essa della teoria della probabilità (come si capisce bene da alcuni passi della "Summa de arithmetica, geometria, proportioni et proportionalita" di Luca Pacioli).

Parliamo del Liber Abbaci di Fibonacci, all'anagrafe Leonardo Pisano.
In tale testo fondamentale, scritto in latino per la prima volta nel 1202, e seguito da diverse riscritture (la più nota quella del 1228), Fibonacci introduce in Italia e in Europa

Read 17 tweets

Pax

@dottorpax

22 Jun

Se è vero che la moderna teoria della probabilità si sviluppa durante il Rinascimento, sia per motivi filosofico-religiosi (nuovo antropocentrismo) che tecnici (prima di Fibonacci, e ancor più prima di Pacioli e Cardano, non avevamo gli strumenti matematici

per descrivere il caso), è anche vero che nell'antichità si ritrovano alcuni ragionamenti probabilistici di grandissimo interesse tecnico e storico (nel senso di storia della matematica).

Ad esempio in Lao Tzu e Sun Tzu si trovano riferimenti non banali ai concetti di rischio, incertezza e puro caso. Lao Tzu è stato uno dei primi a introdurre la distinzione tra "assumere un rischio" e "correre un rischio", distinzione fondamentale per l'approccio

Read 14 tweets

Support us! We are indie developers!

This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Thank you for your support!

Share this page!

Pax

Try unrolling a thread yourself!

More from @dottorpax

Pax

Pax

Pax

Pax

Pax

Pax

Did Thread Reader help you today?

Like this author's thread?