My Authors
Read all threads
Meine neue Auswertung der Corona-Zahlen bringt einige interessante Erkenntnisse zum effektiven Reproduktionsfaktor und seinen Schwankungen im Wochenrhytmus, die die Interpretation des RKI einordnet und relativiert.
Erst mal aber: Es sieht alles relativ gut aus, wir laufen auf ein Plateau mit 156.000 Gesamtinfizierten und 9000-12.000 Corona-Toten hinaus, und der effektive Reproduktionsfaktor liegt je nach Rechenmethode 0,72-0,83, und schon sind wir bei der Crux mit der Berechnung von R.
Das Robert-Koch-Institut sagt, man könne den Reproduktionsfaktor aus den normalen, öffentlichen Zahlen nicht berechnen und zieht dafür eine Vorhersage ("Nowcast") auf Basis von Erkrankungsbeginn sofern angegeben oder Meldedatum beim Gesundheitsamt heran.
Das hat den Vorteil, dass Fehler durch unterschiedlich langes Testen und Übermitteln, die in den "normalen" Zahlen enthalten sind, ausgeräumt werden können. Das wird aber mit dem Nachteil erkauft, dass diese Zahlen erst ca. 1 Woche später feststehen, also 3 Wochen nach Infektion.
Um das zu kompensieren, setzt das RKI auf eine Methode namens "Nowcast", die versucht vorherzusagen, wie viele verspätete Meldungen noch eingehen werden und rechnet dann mit diesen Vorhersagen. Das mag genauer sein, aber liefert bisher dieselben Ergebnisse wie die normalen Daten.
Im Prinzip berechnet das RKI den Reproduktionsfaktor, indem die Neurerkrankungen von 4 Tagen durch die der darauf folgenden 4 Tage teilt. 4, weil das die angenommene Generationszeit ist, in der ein Infizierter eine neue Person ansteckt.
In meinem Graphen findet sich diese Berechnung auf den nackten Zahlen als lila Rauten wieder, und eine lila Kurve zeigt den geglätteten Verlauf, so wie bei anderen Kurven auch die Punkte die diskreten Zahlen zu gleichfarbigen geglätteten Kurven sind, um die die Punkte streuen.
Ich hatte bereits Einiges zu den wöchentlichen Schwankungen in diesem Thread geschrieben, und ich bin nummehr deutlich weiter gegangen, was die wöchentlichen Schwankungen angeht.
Zum einen habe ich eine Fourieranalyse bzw. Spektrogramm sowohl der Rohdaten wie der Abweichungen von meiner logistischen Kurve gemacht und in beiden Fällen wenig überraschend Häufungen bei einer Periode von 7 Tagen gefunden.
Das hat mich dazu gebracht, die Logistikfunktion mit einem sinusförmigen Brumm zu überlagern und auf diese Funktion zu fitten. Das Ergebnis halte ich für einigermaßen spektakulär:
Plötzlich werden zuvor wild um die jeweiligen Kurven springenden Werte von den nun schwingenden Kurven deutlich besser angenähert, auch bei den täglichen Neuerkrankungen (blau) und den Toten (schwarz).
Interessant ist, was der Reproduktionsfaktor macht. Er sinkt nicht stetig, sondern der Wochentagseffekt ist so stark, dass er scheinbar zwischendurch kurz ansteigt, um dann umso schneller zu fallen.
Interessanterweise berichtete das RKI im EpidBull17 von einem Anstieg des effektiven Reproduktionsfaktor über 1, den man hier auch deutlich sehen kann, wobei der Ausschlag nach oben hier grösser ist als in den RKI-Berechnungen.
Bemerkenswert ist, wie stark der 7-Tage "Brumm" auf den Zahlen ist; der Sinus-Amplituden-Faktor vom Fit ist 0,227 für die Infizierten und 0,457 (!) für die Toten, was heißt, dass die täglichen Meldungen zu +/-22,7% respektive +/- 45,7% bei den Toten vom Wochentag bestimmt sind.
Neben offensichtlichen Lücken bei der Erhebung und Bearbeitung der Meldungen am Wochenende sind aber noch weitere Faktoren denkbar: Maßnahmen wurden drei Mal, am 9., 16. und 23, jeweils im Abstand einer Woche verschärft. Drei solche "Impulse" könnten ja wie Schwingungen aussehen.
Die drei blau hinterlegten Bereiche markieren Zeiträume 10-14 Tage jeweils nach dem 9.3.,16.3. und 23.3., wo sich die Rückgänge hätten bemerkbar machen müssen, aber die Wochentagsschwankungen sind so stark, dass in diesen Zeiten überall Anstiege zu verzeichnen sind.
Zeitlich definierbare Impulse durch die Maßnahmen kann ich nicht finden; sie scheinen eher allmählich als zu Stichtagen Wirkung zu entfalten; das halte ich für eine wichtige Erkenntnis. Denoch: Wir haben diese sehr starken Schwankungen, die bisher im Wochenrhytmus auftreten.
Für die Interpretation und die Vorhersage der offiziellen Zahlen scheint es erst mal vielversprechend zu sein, diesen Rhytmus einfach miteinzubeziehen, und genau das machen meine Kurven, wenn ich die Sinusfunktion mit 7 Tagen Periodenlänge einbeziehe.
Die resultierende Funktion ist eine Art "christliche Logistikfunktion", die berücksichtigt, dass alle sieben Tage Sonntag bzw. Wochenende ist. Könnte es jetzt vielleicht doch so sein, dass sich tatsächlich das Virus am Wochenende anders ausbreitet als in der Woche?
Das wäre natürlich für die Maßnahmen superinteressant zu wissen, aber ich fürchte, das geben die Daten nicht her. Unglücklich ist auch, dass mit einem seriellen Intervall von 4 Tagen auf 7 Tage-Schwankungen zu rechnen diese verstärkt. 4 Tage liegen im Hoch, die 4 anderen im Tief.
Fakt ist, dass unser Leben im Wochenrhytmus stattfindet und dieser sich aus vielfältigen Gründen in den Zahlen niederschlägt, und zwar massiv. Möchte man die Zahlen täglich und zeitnah interpretieren, scheint es mir hilfreich, die Wochenkurve mitzurechnen, egal, woher sie kommt.
Bemerkenwert auch, dass bei den Toten die Wochentagseinflüsse doppelt so stark sind wie bei den Infizierten. Die Gründe dafür wären interessant. Doch zurück zum effektiven Reproduktionsfaktor. Die Berechnung des RKI mit dem 4-Tage Quotienten entspricht nicht exakt der Definition.
Der Reproduktionsfaktor gibt an, wie viele andere jemand ansteckt, bis er geheilt oder tot ist. Meine beste Modellierung davon ist, aus Neuerkrankungen, Beginn und Ende der Infektiosität die Zahl der Infektiösen zu berechnen und deren Änderung über eine Generationszeit zu nehmen.
Nachteil ist, dass es zwei weitere Werte erfordert, aber wohl genauer an der Definition von R ist und direkt eine wichtige Frage beantwortet: Wie verändert sich die Zahl der Ansteckenden. Letzlich aber laufen beide Kurven zusammen, der Infektiösenfaktor läuft 1 Woche hinterher.
Wie sieht es nun im Ausland mit Wochenenden aus? Hier die USA. Geringere periodische Schwankungen, aber die Zahl der täglichen Toten (schwarz) und Neuinfektionen(blau) liegt frappierend nahe an den errechneten gleichfarbigen Kurven.
Ansonsten laufen die USA gerade auf über 1 Mio. Infizierte und über 60.000-90.000 Tote zu, aber man sieht trotz Wochentagsschwankungen, dass Anlass zur Hoffnung besteht, wenn die Menschen dort weiter vorsichtig sind. R knapp unter 1; hier die letzten 5 Tage Progn. überlagert:
Man sieht bedauerlicherweise auch, dass die Zahl der erwarteten Toten in den letzten fünf Prognosetagen stetig gestiegen ist, was ein Zeichen dafür ist, dass sich die Abschwächung verlangsamt. Hier noch mal ein Zoom in den USA-Graphen:
Ich finde es bemerkenswert und überraschend, wie nah viele Werte am Fit liegen und wie stabil der Wochenrhytmus auch hier aussieht. Die Frage, die sich sofort stellt ist, ob das wohl anhalten wird. Ein Blick nach China hilft leider nicht, die Chinesen kennen wohl kein Wochenende.
Eine interessante Erkenntnis: Keine nennenswerten wochentagsabhängigen Rhytmen in den chinesichen Corona-Daten. Ein Verschwörungstheoretiker könnte nun daraus ziehen, dass die Daten gefälscht sind und sie vergessen haben, diese Schwankungen einzubauen, aber das glaube ich nicht.
Ich nehme eher an, dass in China einfach weniger Rücksicht genommen wird, insbesondere im Fall der Corona-Krise. Ich glaube es ist ein Zeichen, wie tief der Eingriff ist das Leben der EInzelnen dort war. Woche oder Wochenende machte da wohl für kaum jemanden einen Unterschied.
Italien hätte ich noch. Weniger "christliche Logistik" als in Deutschland, aber deutlich messbar, allerdings kaum bei den Toten. Die Toten werden in Italien also an beliebigen Wochentagen gemeldet, aber die Infiziertenzahlen sind in Italien mit +/- 16% wochentagsabhängig.
Ansonsten sieht man in der Überlagerung der Prognosen der letzten 14-Tage, dass es in Italien langsamer zurückgeht, als es das Curve-Fitting prognostiziert; die Prognosen wandern nach oben aus. Sie sind höher als je in den letzen 2 Wochen; zuletzt sahen sie vor 3 Wochen so aus.
Mit viel Phantasie kann man reininterpretieren, dass vor 3 Wochen Massnahmen gegriffen haben, aber nichts mehr nachgekommen ist. Es sieht sogar so aus, dass um den 1.April herum in Italien etwas passiert ist, das diese Woche 3 mal den Anstieg des Reproduktionswertes R > 1 zeigte.
Entgleiten Italien bereits wieder die Erfolge? Noch kann man das nicht bestätigen, und es kann ein besonderes Ereignis gewesen sein, Wetter, Ausbruch in Alterheimen oder Firmen. Wochentage waren es nicht allein. Italien wird wieder spannender, als ich es mir gewünscht hätte.
Missing some Tweet in this thread? You can try to force a refresh.

Enjoying this thread?

Keep Current with Pavel Mayer

Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

Twitter may remove this content at anytime, convert it as a PDF, save and print for later use!

Try unrolling a thread yourself!

how to unroll video

1) Follow Thread Reader App on Twitter so you can easily mention us!

2) Go to a Twitter thread (series of Tweets by the same owner) and mention us with a keyword "unroll" @threadreaderapp unroll

You can practice here first or read more on our help page!

Follow Us on Twitter!

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!