Die Aussagekraft einer derartigen Studie steht & fällt u.a. damit, wie repräsentativ die verwendete Stichprobe für die Gesamtbevölkerung ist.
Auf den ersten Blick sieht hier #Payback als Quelle der Stichprobe gut aus: Derzeit über 31 Mio aktive Kunden in #Deutschland. 2/
1. Problem:
52 Mio Menschen sind nicht in Paybacks Datenbank und es stellt sich die Frage, ob die darin enthaltenen 38 Mio Volljährigen (mehr als aktive #Payback-Nutzer) repräsentativ durch Payback-Nutzer abgebildet werden können.
Dem ist nicht so.
Indizien: 3/
Es gibt Menschen, die aus Überzeugung keine #Payback-Nutzer sind. Diese verhalten sich im Alltag also anders, z.B. beim Einkaufen, gehen vermutlich in andere Geschäfte mit anderer Häufigkeit, was z.B. andere Exposition mit #COVID19 bedeutet, etc.
Hierfür gibt es Evidenz: 4/
Die Drogeriemarkt-Kette dm fand 2004 heraus, dass #Payback-Nutzer im Schnitt ca. 50% mehr Umsatz generierten (d.h. bei dm 50% mehr Geld ausgaben) als Nicht-Nutzer [Quelle: z.B. Wikipedia + dortige Quelle]. 5/
Man kann jetzt einwenden, dass Payback aufgrund ihrer großen Nutzerdatenbank das irgendwie ausgleichen kann.
Das ist allerdings unmöglich:
Manche Menschen vermeiden #Payback aus dem Grund, damit Payback 6/
nichts über sie erfährt, was es Payback schlicht unmöglich macht, diese Gruppe adäquat mit eigenen Nutzern repräsentativ abzubilden.
Kurzum: Unter allen #Payback-Nutzern ist es unmöglich, eine für ganz #Deutschland repräsentative Stichprobe zu generieren. 7/
2. Problem:
Obwohl Paybacks Nutzerbasis eklatante Lücken hat, wissen sie trotzdem zuviel:
Es ist kein Geheimnis, dass #Payback aus den enormen Datenmenge Informationen extrahiert. Das ist eine wesentliche Säule ihres Geschäftsmodells. Dass es möglich ist, aus derartigen Daten 8/
medizinische Informationen über die Nutzer zu extrahieren, ist lange bekannt. Aufsehen erregte diesbezüglich ein Fall in den USA, wo #target durch gezielte Werbung versehentlich den Vater über die Schwangerschaft seiner Tochter in Kenntnis setzte, bevor sie mit ihm darüber 9/
Mit anderen Worten: #Payback weiß sehr wahrscheinlich mindestens über symptomatische #Corona-Erkrankungen seiner Nutzer bescheid (d.h. Zeitpunkt & Dauer & ggf. Schwergrad etc.). Vielleicht trifft das sogar auf asymptomatische Verläufe zu, was allerdings spekulativ ist. 11/
Wie dem auch sei: Durch Identifikation einer Gruppe von Nutzern, welche mit großer Wahrscheinlichkeit eine #Infektion hinter sich haben, wäre #Payback in der Lage, die repräsentative Stichprobe in die eine oder die andere Richtung zu frisieren. 12/
Da #Payback durch mehr Konsum mehr Umsatz macht und zugleich mehr Daten erhebt, was auch Gewinne erhöht, könnte dieses Unternehmen durchaus ein Interesse daran haben, dass zukünftig möglichst wenig Eindämmung betrieben wird, d.h. dass eine hohe Quote an Immunisierung gefunden 13/
wird.
Ich sage nicht, dass #Payback Daten frisieren wird oder anderweitig nicht korrekt operieren würde.
Ich sage lediglich, dass die Gelegenheit bestünde, Einfluss zu nehmen und ein hypothetisches Motiv dafür im Raum steht. 14/
3. Problem, unabhängig von #Payback:
Auch eine serologische Studie ist nur ein Blick in die Vergangenheit.
Deshalb werden alle daraus abgeleiteten Vorhersagen über die Zukunft mit großen Unsicherheiten behaftet sein.
Und selbst der Blick in die Vergangenheit kann trügen: 15/
Ein positiver serologischer Befund bedeutet nicht zwingend, daß tatsächlich eine #Infektion stattgefunden hat. Er kann auch durch wiederholte schwache Exposition (z.B. durch eine #Maske) entstanden sein. D.h. wir können damit bspw. die Infektionssterblichkeit (IFR) nicht 16/
zuverlässig erheben.
Damit stellt sich die Frage der Sinnhaftigkeit einer solchen Erhebung, insbesondere mit Blick auf die aktuelle Sommerwelle & den Herbst. 17/17
Addendum zur Veranschaulichung der Problematik nicht repräsentativer Datenerhebung:
das nächste Mal, wenn Sie oder die @fdpbt eine längere Laufzeiten von #AKW oder gar den Neubau fordern, bestehen Sie bitte auf den Nachweis der Kernspaltung als auch der Einsteinschen Formel E=m*c^2. 1/
Ohne diese Evidenz wird ggf. kein AKW jemals rechtssicher Strom produzieren. Rechtssicherheit geht ganz klar vor Nutzung des Atoms. 2/
Bitte vergessen Sie nicht, die Karlsruher Nuklidkarte validieren zu lassen. Andernfalls ist ggf. kein rechtssicherer Betrieb von AKW in Deutschland möglich. Es gilt weiterhin: Rechtssicherheit geht klar vor Nutzung des Atoms. 3/
Kürzlich wurde Klaus #Stöhr Nachfolger von Christian #Drosten im Sachverständigenausschuss im Sinne des #IfSG.
Ein angemessener Zeitpunkt, in die Vergangenheit zu blicken und mit dem heutigen Wissen abzugleichen, wie gut Urteile des #Pandemie-erprobten Experten gealtert sind. 1/
Kurzbio:
Klaus #Stöhr, Virologe und Epidemiologe, ehemaliger Leiter des globalen Influenza-Programms der #WHO, 2003 Koordinator für #SARS-Ätiologie, 2007-2017 bei Novartis, u.A. in der Impfstoffenwicklung, seit 2018 freier Berater. 2/
#Stöhr setzte und setzt sich dafür ein, daß die wenigen #Pandemie-Erfahrenen Experten, Virologen & Epidemiologen Deutschlands wie er mehr Einfluß in die politischen Prozesse um die #Pandemie-Politik in Zeiten von #Corona erhalten.
Sehen wir nach, ob das gerechtfertigt wäre. 3/
Ein 🧵 zur Problematik, ob #LaMDA ein Bewußtsein entwickelt haben könnte, welche Komplexität hier oft übersehen wird und warum die Diskussion darüber in Teilen mehr über uns aussagt, als über die eigentliche Frage zu dieser #KI. 1/
Vorab: Die Frage, was Bewußtsein ist, wird von Fachgebiet zu Fachgebiet unterschiedlich definiert und eine praktikable Definition, die verläßlich an Individuen oder intelligenten Maschinen getestet werden könnte, gibt es leider nicht. Das ist Teil des Dilemmas. 2/
Einige Mitmenschen sind sehr schnell in ihrem Urteil, daß #LaMDA gar kein Bewußtsein habe entwickeln können. Eine Mehrzahl der Argumente beruft sich auf: 1) Es ist ein Chatbot 2) Es ist eine Maschine 3) Hat aus vielen Daten gelernt und arbeitet probabilistisch
3/
Der Titel "Höhlenmenschen": Aus einer ironischen Selbstbezeichnung einer der interviewten Personen wird eine Bezeichnung für die ganze "Zero-Covid-Bubble". Pauschalisierend, diffamiert potentiell eine ganze Gruppe von Menschen. 2/N
Der Untertitel "Die Corona-Regeln sind gelockert, die Inzidenzen sinken – und doch leben einige junge Menschen noch immer im Lockdown. [...]"
suggeriert, daß das Risiko einer Infektion nun niedriger sei als zuvor, was ob der miserablen Datenlage (erschwerte Testbedingungen, 3/N
Disclaimer: Wir werden etwas mit Zahlen hantieren müssen, um Größenordnungen deutlich machen zu können. Ich werde mich bemühen, die Diskussion trotzdem einfach und verständlich und nicht zu trocken zu gestalten. 2/N
Wir beginnen mit einer hypothetischen exemplarischen Ausgangslage und nehmen an: 1) Prävalenz von #LongCovid bei KuJ U20 ist 3% 2) @DJanecek kennt 100 repräsentative KuJ und würde sofort erfahren, wenn eines davon von LC betroffen wäre 3) Alle LC-Fälle werden bereits 4 Wochen 3/N
Warum die #Inzidenz ein wichtiger Indikator war und ist und warum das aktuelle #IfSG dem nicht ausreichend Rechnung trägt.
Ein 🧵 aus mathematischer Sicht. 1/N
#Inzidenz basierend auf PCR-Tests spiegelt das (mehr oder weniger) aktuelle Infektionsgeschehen wider. Letztendlich lässt sich fast jede Kenngröße der #Pandemie mithilfe der #Inzidenz abschätzen, d.h. modellieren und vorhersagen. 2/N
Beispiel 1: Multiplizieren wir die aktuelle #Inzidenz mit der Fallsterblichkeit (CFR), so erhalten wir eine Schätzung für die Anzahl (pro 100.000 Einwohner & Zeitfenster), die aufgrund von #COVID19 versterben werden. Diese Schätzung wird präziser, wenn wir 3/N