My Authors
Read all threads
LA STATISTICA AI TEMPI DEL #COVID - THREAD

Vi ricordate quando ad aprile giravano le spiegazioni più disparate sul perchè la letalità del #COVID19 fosse in Italia così elevata? La demografia, il virus più aggressivo, lo smog, i presunti dati truccati della Germania.
Per la maggior parte, la spiegazione era molto più semplice.

L’indice di letalità altro non è che il rapporto tra morti e casi. Si contano i morti, si contano i casi è infine si divide il numero di morti per il numero di casi.
Piccolo problema: stavamo contando “tutti” i morti ma ci stavamo perdendo per strada la maggior parte dei casi. Insomma, il numero che stavamo utilizzando al denominatore era enormemente sottostimato.
Sottostimando di quanto? Se prendiamo per buona la stima puntuale fornita dall’indagine sierologica #istat, allora ci siamo persi per strada più dell’80% dei casi. Ne abbiamo trovati 254mila e persi 1.2mln. Per ogni positivo che abbiamo trovato, altri 5 sono “sfuggiti”.
La conseguenza più immediata è appunto una fatalità calcolata che era dalle 5 alle 7 volte più alta di quella reale, ma il punto è un altro: abbiamo la certezza che ció che vedevamo allora era solo una frazione del totale, e questo impone di essere MOLTO prudenti
nell’assumere che le varie statistiche, medie, trend, del campione riflettano quelle della popolazione.

Nonostante questo, tg e giornali ad es. parlano quotidianamente di età media dei contagiati, dando di fatto per scontato che il campione sia rappresentativo della popolazione
Ma è così? Badate bene che non è nemmeno un problema di numerosità del campione, quanto piuttosto di “costruzione”.

Come si fa a garantire che un campione estratto da una popolazione sia rappresentativo della popolazione stessa?
In estrema sintesi, sfruttando il caso: estraendo i partecipanti in maniera CASUALE.

È evidente che il campione “positivi al test” non poteva allora e non puó tutt’oggi, essere rappresentativo della popolazione “totale dei contagiati” per un motivo molto semplice...
I tamponi non sono distribuiti secondo le logiche proprie della statistica (random), bensì secondo logiche mediche e con priorità giustamente diverse rispetto alla costruzione di un campione rappresentativo è che sia consistente nel tempo.
Cosa ne consegue? Che da un punto di vista scientifico, inferire le caratteristiche del campione all’intera popolazione è semplicemente SBAGLIATO, perché mancano i requisiti minimi per poterlo fare.
C’è una popolazione che non possiamo osservare direttamente e c’è un campione, che possiamo osservare direttamente ma che non è rappresentativo e non è consistente nel tempo. Quando vediamo delle variazioni nelle statistiche descrittive del campione (il variare dell’età media)
queste sono la somma di (almeno) 2 effetti: il variare dell’età media nella popolazione (che è quello che ci interessa) e il variare della composizione del campione. Vediamo la somma di questi due effetti, ma non possiamo separare l’uno dall’altro ne quantificarli.
Magari l’età media nella popolazione è veramente diminuita, magari è rimasta invariata e la variazione che osserviamo è interamente dovuta al variare del campione, o magari l’età media nella popolazione è persino aumentata ma l’effetto è stato più che compensato...
...dalla variazione di composizione del campione. E non c’è alcun modo di sapere in quale delle tre situazioni ci troviamo.

È per questo che una campagna di testing realizzata secondo criteri statistici sarebbe così importante: è l’unico modo per monitorare realmente...
...l’evoluzione dell’epidemia all’interno della popolazione, e questo è requisito fondamentale per poter prendere decisioni razionali. Ricordo in tal senso gli appelli di @micheleboldrin. Quello di @ricpuglisi a fornire i dati individuali nasce probabilmente dai medesimi dubbi.
È complesso? È lungo? È costoso? Sicuramente si, sopratutto se si vuole costruire un campione stratificato degno di tale nome.

Mancano le risorse? Che si faccia il possibile, si accetti qualche compromesso, ma si agisca in tal senso.
Ricordo la proposta, estremamente efficace nella sua semplicità, avanzata da @SignorErnesto in questo tweet:


Le armi ci sono, sfruttiamole.

L’indagine dell’istat ci ha fornito un fermo immagine, ora serve una sequenza di fotogrammi
E nel frattempo, ricordiamoci sempre di non trarre conclusioni sui contagi a partire dai dati sui positivi perchè quella che ci arriverebbe è un’immagine potenzialmente molto distorta della realtà.
Missing some Tweet in this thread? You can try to force a refresh.

Keep Current with Alessio S.

Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

Twitter may remove this content at anytime, convert it as a PDF, save and print for later use!

Try unrolling a thread yourself!

how to unroll video

1) Follow Thread Reader App on Twitter so you can easily mention us!

2) Go to a Twitter thread (series of Tweets by the same owner) and mention us with a keyword "unroll" @threadreaderapp unroll

You can practice here first or read more on our help page!

Follow Us on Twitter!

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!