My Authors
Read all threads
Hier eine Seite von mir, wo man sich schnell Überblick über das lokale Corona-Geschehen in ganz Deutschland machen kann, mit Rangliste aller Kreise nach Risiko. Bitte macht sie nicht kaputt, sie läuft in einem normalen uberspace. pavelmayer.de//covid/risks/
Das meiste dazu steht auf der Seite. Auch wenn man Zahlen nicht mag, ist es schon ein Erlebnis, einmal die Liste von Platz 1 bis 388 durchzuscrollen und die Farben von rot zu beruhigendem Grün wechseln zu sehen.
Technisch sind das 800 Zeilen Python und Flask, Dash, datatables, pandas, numpy und feather unter der Haube. Hab ich außer Python und numpy alles zum ersten mal benutzt. Dazu noch mal 1200 Zeilen für Datenaufbereitung und Experimente.
Die meiste Zeit ist dafür draufgegangen zu verstehen, was das RKI mit den Daten macht und durch Vergleich der täglichen Dumps herauszufinden, wann welche Datensätze bzw. Fälle beim RKI eingegangen sind, den Zeitstempel gibt es nur für den Eingang beim Gesundheitsamt.
Ich habe nun 15 Tage an Dumps, und aus all diesen Dumps versuche ich vor allem das Eingangsdatum eines Falls beim RKI zu rekonstruieren. Das ist aber nur eingeschränkt möglich, da es keine Fälle mit tagesübergreifenden Nummern gibt, sondern tägliche Dumps mit, ja, mit was?
Es ist immer die "komplette" Datenbank, aber nicht so, wie man denken würde. Es kommen und verschwinden nämlich Fälle von einem Tag auf den andere, als ob da Meldedatum und Erkrankungsdatum nachtträglich geändert werden, was ja eigentlich nicht geht.
Da ausserdem vereinzelt Meldungen beim RKI mit Wochen Verspätung eintreffen, es aber keinen Eingangsdatumsstempel gibt, lässt sich nicht unterscheiden, ob es verspätete Neueingänge, Bearbeitungen oder technische Fehler sind.
Eine einfache Operation, wie festzustellen, wie viele Fälle in den letzten 7 Tagen bei RKI eingetroffen sind, ist auf den täglichen Dumps nicht möglich. Das Abgleichen der Dumps der letzten 7 Tage untereinander geht aber auch nur bedingt wie bereits beschrieben.
Vielleicht hat das alles technische Gründe und das System kann Änderungen am Datenbestand und Stichtagszählungen nur schlecht abbilden. Vielleicht hat jemand Datumsfelder rausgeworfen, oder die Software, die Fälle zusammenfasst macht komische Dinge. Oder alles ist viel schlimmer.
Ich will nicht allzuviel klagen, ich finde das Ergebnis nicht schlecht, aber ich hätte ein oder zwei ähnliche Sachen mehr machen können, hätte ich nicht so viel Zeit darauf verwenden müssen, die dumps zu analysieren und zu verstehen, was da passiert. Vielleicht bin ich zu doof.
Wie gesagt, ich hoffe, der Server hält, wollte keine Firmenressourcen dafür einsetzen, sonst wäre das alles plötzlich Arbeit und viel anstrengender. Sollte es technische Probleme geben, sagt mir hier ruhig Bescheid, ich hab diese Technologie das erste Mal aufgesetzt.
Keine Ahnung, was die Seite ab kann und wie effizient das alles ist. Läuft mit wsgi, über den Webserver und ssl hab ich nicht viel Kontrolle, die Request schlagen magisch bei mir auf, also in der app, und ich wollte mich nicht erst tagelang mit Systemkonfiguration beschäftigen.
Missing some Tweet in this thread? You can try to force a refresh.

Enjoying this thread?

Keep Current with Pavel Mayer

Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

Twitter may remove this content at anytime, convert it as a PDF, save and print for later use!

Try unrolling a thread yourself!

how to unroll video

1) Follow Thread Reader App on Twitter so you can easily mention us!

2) Go to a Twitter thread (series of Tweets by the same owner) and mention us with a keyword "unroll" @threadreaderapp unroll

You can practice here first or read more on our help page!

Follow Us on Twitter!

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3.00/month or $30.00/year) and get exclusive features!

Become Premium

Too expensive? Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal Become our Patreon

Thank you for your support!