Kann man die tatsächlichen SARS CoV2 Infektionszahlen und die daraus folgenden Longcovid Patientenzahlen aus öffentlich verfügbaren Daten abschätzen? Eine Statistik-Fingerübung zum Zuschauen. #manycharts
Ein längerer 🧵
1.
Was folgt ist eine Abschätzung der Zahlen für die COVID-Infektionen und LongCovid-Patienten in Deutschland. Aufgrund der mauen Datenlage kann das hier nur ein Versuch einer Annäherung sein. Trotzdem sollten diese Zahlen zumindest eine brauchbare Abschätzung "nach unten" sein.
2.
Wir gehen von den vom RKI vermeldeten Fallzahlen der letzten Jahre aus. Irgendetwas ist ab März 2023 passiert, die offiziellen Fallzahlen könnten suggerieren, dass die Pandemie vorbei gewesen wäre, aber....
3.
... aber sowohl die COVID Hospitalisierungen (von RKI und DGINA) als auch die Krankschreibungen (BKK) erzählen eine andere Sprache: Die Krankschreibungen sind in 2022 und 2023 überhaupt erst angestiegen. Auch die COVID-Hospitalisierungen liegen seit 2022 höher als vorher.
4.
Die grüne Kurve basiert auf dem Krankenstand für "Atemwege" und "Infektionen". Zitat BKK Website: "Der Krankenstand gibt den Prozentanteil der Kalendertage im Betrachtungszeitraum an, die jeder Beschäftigter im Durchschnitt krankheitsbedingt arbeitsunfähig ist. ...
5.
... Man erhält den Krankenstand eines Monats aus der Zahl der AU-Tage je beschäftigtes Mitglied dividiert durch die Anzahl der Kalendertage im Monat (als Prozentwert multipliziert mit 100)."
Alle Datenquellen sind am Ende des Threads verlinkt!
6.
Ein Wert von 1,96% im Dez 2023 bedeutet also, dass über Monat hinweg 2% der Berufstätigen in DE krank waren. Wir nehmen vereinfachend an, dass 2% Wert auf die ganze Bevölkerung verwendet werden kann und haben damit einen qualitativen Indikator des Krankenstandes über die Zeit
7.
Den Berg der o.g. grünen Linie sieht man auch in der jährlichen Krankenstands-Statistik (Destatis), in 2022/2023 lag der Krankenstand um ca. 40% über 2019.
Also, die Infektionszahlen vom RKI sind nicht zu gebrauchen, um die Lage abzuschätzen. Was können wir sonst verwenden?
8.
Es müßte möglich sein, aus den Hospitalisierungsdaten von RKI und DGINA, die wie man oben sieht sehr ähnlich verlaufen, die tatsächlichen Fallzahlen zurückzurechnen.
9.
Das besondere bei den beiden Zahlenreihen ist, dass sie völlig verschiedene Entstehungs-/Meldewege haben und trotzdem ähnliche Daten liefern, was ich als Indiz dafür sehe, dass die Zahlen brauchbar gut sind.
10.
Die blaue und die rote Linie zeigt die Hospitalisierungsrate für beide Datensätzen, also wie viele "Fälle" müssen als COVID-Patienten ins Krankenhaus. Hier sieht man wie im Verlauf von 2021 die Rate gesunken ist parallel zur Impfkampagne und dem Übergang zu Delta.
11.
Diese Absenkung kann rechnerisch m.E. noch nicht eine Wirkung der steigenden Immunität sein, dafür gab es zu wenige Infektionen im Jahr 2021.
12.
Anfang 2022 hatten wir dann den Übergang zur Omicron Variante, die die Ansteckung erheblich in Höhe hat schnellen lassen und gleichzeitig aber weniger "krank" gemacht hat, die Hosp-Rate sinkt erneut deutlich ab. Hier die wöchentliche Rate nach Alter bis März 2023.
13.
Längerfristig würden wir ein stetiges Absinken der Hosp-Rate erwarten, weil immer mehr Menschen immer öfter mit dem Virus Kontakt hatten, und sich langsam eine Immunität aufbauen sollte.
14.
Wir sehen aber ein stetiges, steiles Ansteigen der Hosp-Rate und das liegt daran, dass wir im Laufe des Jahres 2022 immer "schlechter" getestet haben und dann bis Mitte 2023 das Testen quasi komplett eingestellt haben. Danach gehen rote und blaue Linie "seitwärts".
15.
Daher müssen wir eine *korrigierte Hospitalisierungsrate* verwenden, die ein stetiges Absinken der Hospitalisierungen annimmt (hier: -2,5% pro Monat = ca. Halbierung in 2 Jahren => der Wert ist geraten, passt aber gut ins Gesamtbild) und es ergibt sich die grüne Linie.
16.
Damit können wir jetzt aus den Hospitalisierungszahlen und der korrigierten Hosp-Rate die tatsächlichen, korrigierten Fallzahlen abschätzen (Annahme: DZF=1,6 im März 2022).
17.
Plausibilitäts-Check 1: Die Anzahl der Krankschreibungen pro korrigierte Fallzahlen (rot) steigt nicht mehr steil an. Die hatten die offiziellen Zahlen gezeigt und das war unplausibel.
18.
Plausicheck 2: der sich ergebende Dunkelzifferfaktor zu RKI Fallzahlen bewegt sich hier aktuell bei ca. 130-150, bleibt damit unterhalb der Werte, die @rv_enigma in seinen Zahlen verwendet (190-230, siehe ). @Martin46er1 verwendet den DZF 100 z.Zt.
Plausicheck 3: @rv_enigma hat für 2023 ca. 53 Mio Infektionen in seinen DZF-korrigierten Zahlen (dunkelrote Linie), wir haben hier jetzt 57 Mio Infektionen in 2023.
Plausi-Check 5: Wenn wir auch noch die COVID-Todesfälle mit reinnehmen und die Rate der Verstorbenen auf die RKI-Fallzahlen und die korrigierten Fallzahlen beziehen sieht man, dass die neuen Zahlen plausibler sind, denn die Rate sinkt, wie zu erwarten war.
22.
Aus diesen Zahlen können wir errechnen, wie hoch Wahrscheinlichkeit für jeden Bundesbürger ist, in den letzten 12 Monaten eine Covid-Infektion gehabt zu haben:
Ca. 1 Infektion pro Jahr in 2023, in 2024 sind es eher 1 Infektion alle 2 Jahre, aber der Herbst kommt erst noch.
23.
Und schließlich können wir mit den Risiko-Raten für Longcovid, die @Jean__Fisch auf Basis der der ONS Daten aus UK berechnet hat, eine Abschätzung über die Patientenzahlen für Long Covid machen.
Bis hier waren Zahlen m.E. noch relativ robust, jetzt werden Unsicherheiten leider größer. Leider stehen uns aber keine besseren Zahlen zur Verfügung. Als malen wir an die Kurven auch große "Error-Bars" dran, damit jeder versteht, dass das hier "Ballpark Figures" sind.
25.
Ich verwende folgende Quoten aus der Grafik von @Jean__Fisch:
Quote LC No Impact: 0,50%
Quote LC little impact: 0,80%
Quote LC strong impact: 0,30%
26.
Und damit ergeben sich für den Sommer 2024 ca. 2,5 Mio Longcovid Patienten in Deutschland, davon 1/2 Million, die stark eingeschränkt sind (Stacked Area Chart, Werte sind gestapelt).
27.
Letzter Plausicheck: Aus den o.g. ONS Daten von @Jean__Fisch ergab sich:
Anteil betroffene Bevölkerung in UK, Ende 2023
Alle: ~3%
Schwer: ~0.5%
In meinen Zahlen für DE ergeben sich dafür ebenfalls ca. 3% und ca. 0.5%, wenn ich mit großen Error-Bars.
28.
Als ein Teil der blauen Fläche (Longcovid seid 7 Monaten) sehe ich den beständigen Anstieg der "strong impact" Patienten mit einer gewissen Sorge. Diese Sch**e wünsche ich echt niemandem.
29.
Liegen die Werte ggf. sogar noch höher? Oder Drunter?
Wie könnte man die Qualität der Abschätzung verbessern? Das kann man aus der Folge der Berechnungen ableiten: Die Schlüsselzahlen sind die Infektionszahlen und das Longcovid Risiko bzw. Länge.
30.
1. Surveillance der Infektionszahlen mit breiter Datenbasis (nicht nur für ein Bundesland wie bei Sentisurv ) 2. Es müßte eine Surveillance für LongCovid geben ähnlich wie Sentisurv
Wie könnte man Infektionszahlen und damit Zahl der Longcovid-Betroffenen senken?
Das übliche, was seit 2020 bekannt ist: Ansteckung erfolgt über die Luft! Also bessere/saubere Luft in Gebäuden mit Lüftungsanlagen, Luftfiltern und Umsetzung der schon bestehenden Vorschriften
32.
Impfungen senken Ansteckungs- und LC-Risiko. Und Masken in sensiblen/vulnerablen Bereichen (Kliniken, Arztpraxen), zumindest wenn die Infektionszahlen hoch sind. Aber das will ja keiner hören.
33.
Bisher sind wir in 2024 ganz gut durch das Jahr gekommen. Wenn man sich den Verlauf der Vorjahre anschaut kann man aber nicht unbedingt davon ausgehen, dass das so bleibt.
Im Vergleich zur Vorwoche liegt die Modellrechnung mit den neuen Daten aus dieser Woche etwas optimistischer, aber nicht erheblich verändert. Spitze der Welle im Modell in der KW des 6.3.2023.
Der Peak bei den COVID-Hospitalisierungen hat sich um eine Woche nach vorne verschoben auf die KW des 6.3.2023 mit dem Wert 9250. Auch der Peak der COVID ITS-Belegung hat sich um eine Woche nach vorne verschoben auf ca. 1220 in der KW des 20.3.2023.
Mit den neuen Krankenstands-Daten der @BKKDV zeigt sich, dass die Krankenstands-Berechnung des Modells für Januar den Wert korrekt vorhergesagt hat. Für Mitte März erwartet das Modell einen höheren Krankenstand als im Dezember.
Update Modellrechnung: Die Dunkelziffer-korrigierte Modell-Inzidenz liegt jetzt höher als letzte Woche und oberhalb der Skala. Erst Ende März ist Entspannung in Sicht im Modell, der Krankenstand strebt wohl neuem Rekord entgegen.
Es herrscht immernoch eine große Unsicherheit, was man an der großen Spanne der wöchentl. COVID-Hospitalisierungen und COVID-ITS-Bettenbelegung sieht, die je nach Szenario von sinkend bis Verdopplung geht.
Ab jetzt bis Ende März liegt im Modell die Dunkelziffer-korrigierte Inzidenz bei mehreren Tausend (im zentralen Szenario). Welcher genaue Wert das ist, ist eigentlich schon nicht mehr relevant (und nicht überprüfbar). Wohl aber m.E. höher als alles, was wir bis jetzt hatten.
Mit den neuesten Sequenzierungsdaten deutet sich im Modell weiterhin an, dass die XBB.1.5 Welle kleiner ausfällt als die Dezember-Welle. Die Ferien helfen beim Bremsen, die Faschingswoche ist bereits mit etwas erhöhter Ansteckung modelliert (interne Modell-Inzidenz max ~4000).
Wenn es nach dem Modell geht, dann würden die ITS-Betten mit COVID nicht mehr über 500-700 steigen.
Krankenstand liegt im Modell Ende Februar auf ähnlichem Level wie im Dezember 2022.
Im Modell wird XBB.1.5 ab Ende Februar dominant (=Mehrheit der Infektionen). Die gestrichelten Linien zeigen wie das Modell die Entwicklung der Sequenzierungsdaten (durchgezogene Linien) synthetisch nachzeichnet um daraus einen möglichen weiteren Verlauf zu berechnen.
Wichtig: Die Datenlage der Sequenzierungen ist z.Zt. noch sehr sehr dünn, XBB.1.5 liegt noch unter 1% und Daten sind somit unsicher. Alles was jetzt kommt bitte als Gedankenspiel ansehen, und nicht als Vorhersage. 1/x
Es könnte locker bis Mitte Januar dauern, bis wir das genauer einschätzen können. Die Datengrundlage der Sequenzierungen scheint auch nicht besser zu werden, andere Länder sind da viel besser.
OK, wenn das mal klar ist: In meiner ersten Modellrechnung mit XBB.1.5 hatte ich angenommen, dass in Woche 9.1. ca. 1% der Fälle XBB.1.5. sein würden. Dies scheint mit den aktuellen Daten zu optimistisch gewesen zu sein.
Es kursieren Berechnungen, die für Variante XBB.1.5 eine Verbreitungsvorteil um +50-70% im Vgl. zu BQ.1.* aufzeigen.
Noch taucht das in dt. Sequenzierungen kaum auf, bis Mitte Januar gibt's kaum brauchbare Daten.
Aber wie würde denn XBB.1.5 bei uns aussehen mit diesen Eckwerten?
Was für eine große oder kleine Welle könnte denn da kommen, schließlich klingen 70% Verbreitungsvorteil nach sehr viel?
Um dem nachzugehen habe ich folgende Annahmen getroffen:
* XBB.1.5 liegt aktuell bei 0,5% der Fälle
* XBB.1.5 hat 60-70% Verbreitungsvorteil zu BQ.1.*
Unter den genannten Annahmen ergäbe sich ein XBB.1.5 Peak vor/um Ostern. Wenn man sich das mit den Folgen (Klinik/Totenzahlen) anschaut, dann sieht das so aus:
Rückblick auf Modellrechnung vom 6.10. und Ausblick auf Januar 2023
1. Inzidenz: Am 6.10. erwartete das zentrale Szenario eine Welle um Inzidenz 750. Bekommen haben wir 2 Wellen (Inzidenz 800 Mitte Oktober und 500 im Dezember). Januar könnte etwa wie der September werden 1/x
Warum 2 Wellen: “Feriendelle” für BA.5 war stärker als erwartet, die 2. Welle mit Varianten um BQ.1.x waren noch nicht drin im Modell damals.
Anm.: RKI Inzidenzen sind seit Oktober mit mind. Faktor 2 zu niedrig (Dunkelziffer!), Modell rechnet mit DZF vom September weiter.
2/x
2. COVID-Hospitalisierungen
Zentralen Szenario erwartete am 6.10.2022 eine Welle mit Peak um 17.000 Hospitalisierungen pro Woche. Bekommen haben wir 2 Wellen mit 18.000 Hospitalisierungen Mitte Oktober und 15.000 im Dezember