Das große Zahlenmissverständnis – Einschätzung vom 10. Januar

[mit Dr. Constantin Weiser] Gegenwärtig sind nicht nur in Deutschland, sondern auch europa- und weltweit die CoV2-Infektionszahlen, die Zahl der schwer Erkrankten und die Zahl der mit Covid-assoziierten Todesfälle schwindelerregend hoch. Es steht außer Zweifel, dass diese Zahlen durch geeignete Maßnahmen, wie Kontaktbeschränkungen, zu reduzieren sind. Gleichzeitig ist es von Bedeutung, die Infektionskennzahlen und deren Interpretation in der öffentlichen Diskussion zu hinterfragen. Dieses Hinterfragen geschieht im öffentlichen Diskurs zur Zeit nicht. Dieses Nicht-Hinterfragen ist aktuell kein Problem, kann aber in wenigen Wochen zu einem großen Problem werden. Hier unsere zentrale Aussage:

Gemeldete und täglich vom RKI berichtete CoV-2 Infektionszahlen sind nicht geeignet, um gesundheitspolitische Maßnahmen zu begründen.

Warum? Gesundheitspolitische Maßnahmen müssen erlassen und umgesetzt werden, wenn die CoV-2 Epidemie zu viele Menschen gleichzeitig erfasst. Wenn sich mehr Menschen pro Tag infizieren, müssen Kontakte weiter reduziert werden, wenn sich weniger Menschen infizieren, müssen Kontaktbeschränkungen gelockert werden. Diesbezüglich sind sich alle einig.

Nun stellt sich die Frage, woher Entscheidungsträger und Privatpersonen in Deutschland wissen, wie viele Personen sich pro Tag infizieren. Diese Größe ist nicht bekannt. Statistisch würde man von einem "wahren Parameter" reden, der geschätzt werden muss. Bekannt und jeden Tag 1000-fach diskutiert ist die gemeldete Anzahl an CoV-2 Infektionen. Diese taugt jedoch nicht als Richtschnur für gesundheitspolitische Maßnahmen, da das Addieren gemeldeter Infektionszahlen, erneut statistisch ausgedrückt, keinen "unverzerrten Schätzer" des wahren Parameters darstellt. Dies liegt in der Ursache begründet, warum gemeldet und, vor allem, warum getestet wird, es liegt an den Testrichtlinien.

Testrichtlinien ("teste nach Symptomen", "teste Kontaktpersonen", "teste Reiserückkehrer", "Schnelltests", etc) führen, erneut in statistischem Jargon, zu einer "Selektionsverzerrung in der Stichprobe". Die getesteten Personen sind also nicht repräsentativ für die Bevölkerung. Wenn eine Testregel besagt, dass wir nur einen Teil der Bevölkerung testen, dann ist in keinerlei Weise sichergestellt, dass dieser Teil die Gesamtbevölkerung widerspiegelt. Wenn sich Testrichtlinien über die Zeit ändern, wird die Verzerrung in der Stichprobe noch undurchschaubarer. Somit sagt uns die Anzahl der gemeldeten Infizierten nichts über die Stärke der Pandemie.

Möchte man alles ohne statistischen Bezug ausdrücken, würde man den Grund der Erfassung von Infizierten betrachten: Infizierte zu identifizieren, um Mitmenschen durch Quarantäne der Infizierten zu schützen ist ein wünschenswertes Vorgehen. Die Anzahl der so identifizierten Infizierten ist jedoch nicht informativ, um festzustellen, wie weitverbreitet eine Infektion in einer Bevölkerung ist.

Ein einfaches Beispiel mag dies weiter veranschaulichen. Stellen wir uns vor, es gibt genau eine Art von Tests. Damit können eine bestimmte Anzahl von Personen pro Tag getestet werden. Damit ergibt sich eine maximale Anzahl von Infizierten pro Tag. Stellen wir uns nun vor, es gibt Schnelltests. Damit können dreimal so viele Personen pro Tag getestet werden. Wenn wir länger suchen und mehr testen, also die Testrichtlinien ändern, finden wir mehr. Obwohl sich am Infektionsgeschehen, am "wahren Parameter", selbst nichts geändert hat. (Siehe detailliertere Darstellungen zu diesen Aussagen.)

Was ist der Ausweg? Die offensichtliche (aber scheinbar institutionell-politisch nicht umsetzbare) Antwort ist: wöchentliche, repräsentative Testungen. Die zweite, statistische, Antwort ist auch erfolgsversprechend und würde u.U. wenig Zeit benötigen: Verwendung der Informationen über Tests. Wenn Informationen über die getesteten Personen vorlägen (Alter, Geschlecht, etc), dann könnte über diese Größen aus der verzerrten Stichprobe durch Verwendung von Gewichten eine ausreichend repräsentative Stichprobe erzeugt werden. Noch einfacher: Wenn nur die Tests gezählt werden würden, welche auf Symptome zurückgehen (man betrachtet also einen aus den vielen Gründen in den Testrichtlinien) und man annimmt, dass der Anteil der Infizierten, die sich aufgrund von Symptomen testen lassen über die Zeit konstant ist, dann ergäbe sich damit auch ein Index, der als Grundlage für gesundheitspolitische Maßnahmen dienen kann.

Warum ist dieses Nicht-Hinterfragen gemeldeter Infektionszahlen aktuell kein Problem für politische Entscheidungen in Deutschland? Weil vertrauenswürdige Indikatoren wie Belegung von Intensivbetten oder Todeszahlen in die gleiche Richtung weisen wie Infektionszahlen. Wir befinden uns sicher in einer zweiten Welle, da Ende Dezember die Anzahl der täglichen Todesfälle dreimal so hoch lag wie in der Spitze der ersten Welle im April. Ende Dezember lag die Anzahl der SARS-CoV-2 Fälle auf Intensivstationen ganz grob doppelt so hoch wie in der ersten Welle. Es liegt eine zweite Welle vor. Die Anzahl der Infektionen lag Ende Dezember jedoch fünfmal so hoch wie während der ersten Welle, dieser Unterschied zwischen zweimal, dreimal und fünfmal so hoch kann schwer über übliche Infektionsmodelle verstanden werden. Auch dies deutet auf verzerrte Infektionszahlen.

Das blinde Vertrauen auf Zahlen, auf vermeintliche Fakten, kann dann ein Problem darstellen, wenn sich, so wie alle hoffen, Intensivbetten, vielleicht durch erfolgreiche Impfmaßnahmen, vielleicht durch jahreszeitliche Effekte im Frühjahr, leeren. Stellen wir uns vor, (ein hoher Anteil von) Risikopatienten ist durch Impfungen geschützt. Es gäbe aber immer noch hohe Infektionszahlen, da es immer noch viele Millionen Menschen in Deutschland gibt, die nicht immun sind. Was tun? Welchen Kenngrößen soll dann vertraut werden? Wir benötigen ein besseres Verständnis von gemeldeten Infektionszahlen, sonst werden alle gesundheitspolitischen Maßnahmen weiterhin auf nicht stabilen Grund gebaut sein.