My Authors
Read all threads
So verhält sich meine Covid-19 Infektionen-Vorhersage von vor einer Woche zu den tatsächlich gemeldet Werten. Habe zusätzlich die Werte vom John Hopkins Institut mit heineingenommen, obwohl die Vorhersage auf RKI Daten beruht. Diese Daten erscheinen aber zunehmend unzuverlässig.
Meine Vorhersage liegt zwischen den eingetreten RKI und John-Hopkins Meldungen, aber beide zeigen eine frühere Abflachung der Kurve, als vor einer Woche von mir angenommen. Hier zwei Vorhersagen basierend auf aktuellen RKI und John Hopkins Daten:
Man sieht, dass nach den John-Hopkins-Daten, obwohl höher, ein stärkerer Rückgang erwartbar ist als nach den RKI-Daten, was einen Unterschied von 60.000 gegenüber 90.000 Gesamtinfizierten ausmacht.
Man sieht, warum sich offizielle Stellen schwer damit tun, Prognosen abzugeben. Kleine Variationen in den Zahlen führen noch zu sehr unterschiedlichen Ergebnissen. Beide Kurven deuten darauf hin, dass wir den Wendepunkt erreicht haben, am 17.3. nach JH und 22.3. nach RKI-Daten.
Beim Beispiel China (s.u.) lag der Wendepunkt 14 Tage nach den Schulschliessungen, aber es brauchte dann noch 11 Tage, um sicher zu sein, wo man landet. Übertragen auf Deutschland wäre der Wendepunkt erst am 25.3. gewesen und am 5.4. würden wir sicher wissen, wo wir landen.
Hier eine Erklärung, wie diese Prognosen zustandekommen. Sie basieren auf der Annahme, dass die Gesamtzahl der Infizierten einer bestimmten Funktion folgt, einer allgemeinen logistischen Funktion. en.wikipedia.org/wiki/Generalis…
Viele biologische Wachstumsprozesse folgen dieser Funktion. Sie beginnt langsam, steigt dann exponentiell an, um sich dann an ein Maximum anzunähern. Die "Beschleunigung" und das "Abbremsen" können unterschiedlich stark sein, was sich in der Position des Wendepunktes ausdrückt.
Was ich für die Vorhersagen tue ist, dass ich die Parameter für eine solche Funktion berechne, die sich möglichst gut an die bisherigen Werte "anschmiegt" und rechne diese dann auch für die Zukunft aus.
Ich hatte das zunächst für die Daten aus China gemacht um zu sehen, wie gut sich diese mit einer solchen logistischen Kurve annähern lassen. Das Ergebnis fand ich erstaunlich gut; hier ein Fit mit aktuellen Daten:
Wie man sieht, passt diese einfach Funktion erstaunlich gut zu den Daten, obwohl die chinesichen Daten eine Reihe von Problemen haben und eine so einfache Funktion eigentlich die tatsächliche Dynamik gar nicht abbilden kann.
Vom Grundprinzip haben wir eine Exponentialfunktion, deren Exponent sich aber mit der Zeit abschwächt. Das entspricht der abnehmenden Virus-Reproduktionszahl, die abnimmt, weil entweder Gegenmassnahmen erfolgen oder die Immunität zunimmt.
Als Parameter hat die Funktion eine eine obere und untere Asymptote, eine Basis, einen Exponenten und zwei Parameter, die bestimmen, wo der Wendepunkt liegt. Wie gut kann man damit Zukunft vorhersagen, wenn man nur den ersten Teil der Kurve kennt, aber nicht ihr Ende?
Klar dürfte sein, dass wenn in den Daten noch kein Wendepunkt erkennbar ist, die Kurve beliebig weiter wachsen kann, aber nicht von einem Tag auf den anderen aufhören zu wachsen. Nach oben ist alles offen, aber man kann sozusagen den besten Fall skizzieren, die rascheste Wende.
Probleme ergeben sich, wenn die Daten schlecht sind und man mittendrin die Regeln ändert wie gezählt wird. Hätte man in China die Vorgersage an Tag 21 gemacht, bevor die Zählweise geändert wurde, hätte man diese zu optimistische Kurve erhalten:
Diese Vorhersage an Tag 33 hingegen wäre zu pessimistisch gewesen.
Eine gute Vorhersage erhält man für China an Tag 36, 11 Tage nach dem Wendepunkt, der 14 Tage nach den Schulschliessungen lag. Das Ende zuverlässig vorhersagen tut die Methode im Fall China also 25 Tage nach den den Schulschliessungen.
Man kann aber eine Aussage darüber machen, wann man einigermassen sicher sein kann, nämlich, wenn die Lösung einen Wendepunkt ergibt, der weit genug zurückliegt, 10-12 Tage im Fall von China. Wären die Daten besser, könnte man früher genau vorhersagen.
Mit besseren Daten könnten wir Tage früher Maßnahmen lockern, und da jeder Tag Lockdown grob fünf Milliarden Euro kostet, würden sich ein paar Mrd. in schnelle und gute Datenerhebung investiert schnell rentieren.
Wie verhält es sich nun mit anderen Vorhersageverfahren, die die Ausbreitung simulieren? Diese haben das Problem, dass sie in der Regel mehr Parameter brauchen, die nicht bekannt sind und geschätzt oder mit medizischen Studien ermittelt werden müssen, brauchen also mehr Daten.
Mit Hilfe der vollständigen von den Gesundheitsämtern gemeldeten Daten wie Erkrankungsbeginn und Meldedatum könnte man mehr machen, und allein die Zahl der täglich durchgeführten Tests würde sehr helfen.
Dieses relativ einfache Kurvenanpassen hat den Vorteil, dass es aus wenigen und fehlerbehafteten Daten viele hilfreiche Informationen herausholt, visuelle Leitlinien liefert und man die Vorhersage täglich anpassen und verfolgen kann, wie sich die Realität dazu verhält.
Mit so einer Funktion kann man sehr gut andere Funktionen kalibrieren, mit denen man stetig besser verschiedene Werte für die Inanspruchnahme medizischer Ressourcen vorraussagen kann. Sie ist ausserdem stetig und differenzierbar und nach verschiedenen Parametern lösbar.
Letztlich kommt es aber bei der Modellierung eher darauf an, die Wirksamkeit einzelner Maßnahmen bewerten zu können, aber das wird bei der derzeitigen Datenlage ein mühsames Unterfangen, und es bleibt zu hoffen, dass genügend Mediziner gerade Zeit finden, genug zu dokumentieren.
Und noch mal mein Appell, doch vielleicht auch oder gerade in solchen Zeiten wie jetzt den "Open Data"-Gedanken hochzuhalten. Ich möchte nicht undankbar sein, aber die Daten über die Pandemie sind in Deutschland gerade andere als offen.
Ich wäre ja schon glücklich, wenn es offiziell wenigstens Datenreihen als .csv oder Spreadsheet gäbe, aber solche Aufgaben werden gerade von freiwilligen gemacht, die Webseiten abtippen oder crawlern und in git-repos einchecken.
Liebes @rki_de, wäre es zu viel verlangt, wenn ihr einmal am Tag eine Datenbankabfrage macht und das Ergebnis als .csv exportiert und auf einen Webserver packt? Müssen am Anfang nicht viele Felder sein, alles wäre besser als das, was wir jetzt haben.
Missing some Tweet in this thread? You can try to force a refresh.

Enjoying this thread?

Keep Current with Pavel Mayer

Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

Twitter may remove this content at anytime, convert it as a PDF, save and print for later use!

Try unrolling a thread yourself!

how to unroll video

1) Follow Thread Reader App on Twitter so you can easily mention us!

2) Go to a Twitter thread (series of Tweets by the same owner) and mention us with a keyword "unroll" @threadreaderapp unroll

You can practice here first or read more on our help page!

Follow Us on Twitter!

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just three indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!