Thomas Arend Profile picture
👣📷📹💻👨‍👩‍👦‍👦🚴‍♂️ #NoCOVID #ZeroCovid

Jul 18, 2022, 11 tweets

Ich bin mir nicht sicher, ob wir mit Zeitreihenanalysen sehr viel glücklicher werden.
Quick and dirty habe ich auf die Tabelle 12613-0006 der @destatis Datenbank mal die build-in forceast von R laufen lassen.
Ausgang sind die Sterbefälle nach Geschlecht ab 1950-01.
1/n

Was mich interessiert ist der Zeitraum ab Januar 2020 bis heute. Der Forecast wird aus den Daten bis Dezember 2019 berechnet. Wobei cih unterschiedliche Anfagspunkte nehmen: 1950, 2000, 2010 und 2016. 2016 bis 2019 deckt sich mit dem Verfahren von #destatis.
2/n

Ergebnis und Siegerehrung:

Alle Ansätze kommen auf eine mittlere Übersterblichkeit ab Januar 2020 zwischen 120.000 und 140.000. Das Startjahr 2000 liefert den höchsten und 1950 den zweithöchsten Wert.
Interessanter ist aber das CI 80 % (vom CI 95 % reden wir lieber nicht.)
3/n

Im günstigsten Fall liegt die Übersterblichkeit zwischen -85.000 und +330.000.

Auf die Gesamtzahl der zu erwartenden Sterbefälle etwa 2,2 Mio. beträgt der Fehlerbereich nur ± 10 %. Aber für die Schätzung der Übersterblichkeit ist das CI natürlich eine Katastrophe.
4/n

Was die tatsächliche Übersterblichkeit angeht, sind wir genauso schlau, wie mit dem Meridian, der 182.548 ergeben hat.
Nun wird der eine oder andere einwenden, dass das weit vom Ergebnis der Zeitreihen entfernt ist. Die sind doch viel besser.
5/n

Nicht so schnell.

Die Zeitreihen haben Ausreißer in den Mittelwerten verwurste, während der Median Ausreißer eliminiert. Wenn nun Ausreißer nach oberen größer sind, als Ausreißer nach unten, dann überschätzt die Zeitreihenanalyse die »normale« Sterblichkeit.
6/n

Die zusätzlichen Grippetoten von 2018 werden bei einer Zeitreihenanalyse normale Sterbefälle, während sie beim Median weg fallen.

So kommt die Zeitreihenanalyse zu einer geringeren Übersterblichkeit.
7/n

Die Sterberaten nach Monat deuten darauf hin, dass Ausreißer nach ober eher größer sind, als Ausreißer nach unten. Müsste man mal genauer analysieren.
Nachteil des Medians ist, dass er keinen Trend erkennt und bei steigendem Trend die Sterbefälle unterschätzt.

8/n

Was die Zeitreihen nicht hergeben, ist, dass die
Übersterblichkeit gem. Meridian falsch ist.

Fazit

Das eine Verfahren überschätzt, das andere unterschätzt, so liegt die Wahrheit vielleicht in der Mitte.

Es ist nicht trivial.
9/n

PS: Wie entscheidungsrelevant ist es, ob es 120.000, 140.000, 160.000 oder 185.000 waren?

10/n

Share this Scrolly Tale with your friends.

A Scrolly Tale is a new way to read Twitter threads with a more visually immersive experience.
Discover more beautiful Scrolly Tales like this.

Keep scrolling