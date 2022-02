Die Corona-Lockdowns in Europa und den USA haben die Todeszahlen "nur um 0,2 Prozent reduziert". Diese Aussage einer Übersichtsstudie der Johns-Hopkins-Universität hätte das Zeug, die Corona-Politik zu verändern. Doch von anderen Wissenschaftlern gibt es scharfe Kritik an der Herangehensweise der Studienautoren und damit auch am Ergebnis.

Studie: Lockdowns hätten Todeszahlen kaum verringert

Die Studie ist eine sogenannte Metaanalyse, also praktisch eine Auswertung mehrerer Studien zur gleichen Fragestellung. In diesem Fall bildet die Studie insgesamt 24 Einzelstudien ab. Untersucht wurden zahlreiche Eingriffe des Staates, von Schulschließungen, Reisebeschränkungen, häuslicher Quarantäne bis zur Maskenpflicht. Jeder einzelne Eingriff firmiert dabei unter dem Begriff "Lockdown".

Das Ergebnis: Sämtliche Lockdown-Maßnahmen in den USA und Europa hätten die Todeszahlen nur um 0,2 Prozent verringert. "Zusammengefasst kommen wir zu dem Schluss, dass Lockdowns kein effektiver Weg sind, um Sterberaten während einer Pandemie zu reduzieren, das gilt zumindest nicht für die erste Welle der Covid-19-Pandemie", schreiben die Autoren.

Woher kommen die 0,2 Prozent?

Wie die mittlerweile vielzitierten 0,2 Prozent als Hauptergebnis der Studie zustande kommen, ist schwer nachzuvollziehen. Denn nahezu alle untersuchten Studien kommen – sowohl bei einzelnen Maßnahmen als auch in der Zusammenschau – auf wesentlich höhere Effekte: Immer wieder sind Werte um die 30 Prozent aufgeführt, eine Arbeit der US-Gesundheitsbehörde sieht einen Effekt durch Ausgangsbeschränkungen von geschätzten 59,8 Prozent.

Insgesamt ist die Bandbreite der aufgeführten Effekte riesig und bewegt sich zwischen den genannten 59,8 und 0 Prozent. In einem Fall ist der Effekt sogar negativ, nach dieser Arbeit haben Ausgangssperren zu einer um 1,0 Prozent höheren Sterberate geführt.

"Eine Bachelorarbeit hätte man mit der Studie nicht bestanden"

Andreas Peichl, Professor für Volkswirtschaftslehre an der LMU München hält die Arbeit für nicht nachvollziehbar: "Einen viel größeren methodischen Quatsch kann man nicht machen", sagt Peichl im Gespräch mit dem Bayerischen Rundfunk. "Eine Bachelorarbeit hätte man mit der Studie nicht bestanden." Der Leiter des ifo Zentrums für Makroökonomik und Befragungen wirft den Autoren vor, dass das Studienergebnis bereits von vorneherein festgestanden habe. "Die Studie wurde passend dazu gemacht."

Die 24 ausgewerteten Studien haben die Autoren aus mehr als 18.000 Arbeiten ausgewählt. Anschließend wurden auch die 24 übrig gebliebenen Studien extrem unterschiedlich gewichtet. Manche gingen mit dem Faktor 169 in die Metaanalyse ein, andere mit dem Faktor drei. Hier seien die Einzelstudien besonders hoch gewichtet worden, die bei den Lockdown-Maßnahmen keinen Effekt fanden, sagt Peichl.

Kritik: Autoren wählten nur für sie passende Daten aus

Die Biostatistikerin Sabine Hoffmann, derzeit Professorin an der LMU München, schlägt in die gleiche Kerbe. Hoffmann kritisiert vor allem, dass fast ausschließlich Studien ausgewählt wurden, die Berechnungen anstellen, die für Infektionskrankheiten nicht geeignet seien. So hätten die Autoren, um das exponentielle Wachstum einer Infektionskrankheit abzubilden, Modelle ausgesucht, die für die Modellierung von lineare Zusammenhängen vorgesehen sind – was zu völlig anderen Ergebnissen führt.

"Alle von uns wissen inzwischen, dass Infektionskrankheiten exponentiell wachsen. (…) An manchen Stellen machen die Autoren klar, dass sie einfach keine Epidemiologen sind und auch von Infektionskrankheiten anscheinend nur wenig Ahnung haben." Für die schwer nachvollziehbare Gewichtung der Arbeiten benutzen die Autoren laut Hoffmann "einen Trick", der grundsätzlich die Studien mit der niedrigsten Varianz am höchsten bewertet. Die Methode sei in manchen Fällen von statistischen Auswertungen durchaus gebräuchlich, hier aber völlig ungeeignet, weil sie automatisch die Arbeiten am höchsten gewichte, deren Ergebnis am nächsten bei Null liegt.

Studien, die großen Effekt von Corona-Maßnahmen nachweisen, werden untergewichtet

"Wenn Sie diese Gewichtung benutzen, dann bekommen die Studien, die keinen Effekt finden, ein teilweise 50 mal so großes Gewicht. Und die einen großen Effekt finden – also irgendetwas bei 40 Prozent – bekommen kein Gewicht mehr. Das ist nicht zulässig."

So erklärt sich dann auch, warum die Metastudie, die in Einzelauswertungen sehr häufig starke Effekte im zweistelligen Prozentbereich beschreibt, am Ende auf einen Gesamteffekt von 0,2 Prozent Reduzierung der Todesrate kommt. "Für mich ist die ganze Studie, als ob man sich zum Beispiel fragen würde, was die Auswirkungen von Radioaktivität sind. Und dann benutzt man eine Methode, die zur Auswertung von Fragebögen geeignet ist."

Richtlinien für Metaanalysen werden nicht erfüllt

Auch der Leiter des Instituts für Versorgungsforschung und Klinische Epidemiologie an der Universität Marburg, Max Geraedts, wirft den Autoren laut Nachrichtenagentur dpa vor, mit einer "eklektischen Literaturzusammenstellung" absichtlich versucht zu haben, die von Ihnen gewünschte Aussage zu belegen.

Peichl verweist beispielhaft auf die Richtlinien für Metaanalysen des Journals of Economic Surveys. "Die wären bei dieser Studie niemals erfüllt gewesen."

Zweifel an Fragestellung der Studie

Professor Andreas Schuppert von der RWTH Aachen zweifelt zudem an der Fragestellung der Studie. Diese bewertet den Nutzen der Lockdowns anhand der verhinderten Todesfälle. Das sei aber in den meisten Fällen gar nicht das zentrale Ziel der Lockdowns gewesen, sagt der Arbeitsgruppenleiter am Institut für computergestützte Biomedizin im Interview mit dem Bayerischen Rundfunk. "Die meisten Lockdowns waren ja geschaltet worden, um eine Überlastung des Gesundheitssystems zu vermeiden." Insofern sei die Frage, wie sinnvoll es ist, die Effizienz eines Lockdowns an der Sterberate zu messen.

Darauf aufbauend gebe es ein zweites Problem, sagt Schuppert. Von den 18.000 zunächst gesammelten Studien seien viele rausgefallen, weil sie eben nicht die Mortalität betrachten würden, sondern zum Beispiel, ob sie die Infektionswelle gebremst haben oder eine Überlastung des Gesundheitssystems verhindert haben.

Viele Studien verwenden Krankenhausaufenthalte als Messgröße

Die Studienautoren schreiben selbst: "Wir schließen Studien aus, die Fälle, Krankenhausaufenthalte oder andere Messgrößen verwenden." Und Schuppert ergänzt: "Die allermeisten Studien beschäftigen sich mit diesen Fragen, für die Lockdowns ja auch gemacht werden." Zusammengefasst bleiben also viele Studien, die die Effizienz eines Lockdowns vielleicht sogar besser messen würden, wegen der Fragestellung der Autoren außen vor.

Ergebnisse wurden nicht von Fachkollegen geprüft

Die Studie ist nicht in einem begutachteten Fachjournal erschienen, sondern auf der Instituts-Plattform von einem der Autoren. Die Ergebnisse sind also bislang nicht in einem nachvollziehbaren Review-Verfahren von Fachkollegen überprüft worden.

Peichl weist darauf hin, dass zumindest einige der untersuchten Einzelstudien ebenfalls nicht im Review-Verfahren gewesen seien. Es wurde also mehrmals ein Verfahren zur Qualitätssicherung wissenschaftlicher Arbeit übersprungen. Der Virologe Friedemann Weber von der Universität Gießen sagte der dpa: "Studien im Eigenverlag herausgeben ist absolut unüblich und unwissenschaftlich."

Das sind die Autoren

Jonas Herby, Lars Jonung und Steve Hanke sind Wirtschaftswissenschaftler. Herby ist Sonderberater am Zentrum für politische Studien in Kopenhagen, Jonung emeritierter Professor für Wirtschaftswissenschaften an der Universität Lund in Schweden und Hanke Professor für Angewandte Wirtschaftswissenschaften an der US-amerikanischen Johns-Hopkins-Universität. Auf der Website seines Instituts erschien die Studie.

Was bringen Lockdowns?

Wie sinnvoll waren die vergangenen Lockdown-Maßnahmen? Keiner zweifelt daran, dass die Beantwortung dieser Frage zentral ist, um die künftigen politischen Entscheidungen möglichst sinnvoll zu gestalten. Andreas Schuppert hat die sogenannte Bundesnotbremse im Frühjahr 2021 untersucht.

Zur Erinnerung: Eine Vielzahl von Maßnahmen gleichzeitig, um das Infektionsgeschehen möglichst schnell einzudämmen. "Man kann schon sagen, dass die Bundesnotbremse in der Tat flächendeckend maßgeblich zu dem sehr starken Abfall der Infektionsausbreitung im Mai beigetragen hat", sagt Schuppert.

Einzelne Maßnahmen können nur schwer bewertet werden

Schwieriger wird es aber, Antworten auf die Frage zu finden, wie viel einzelne Maßnahmen brachten, also beispielsweise nur das Schließen von Bars und Clubs oder die FFP2-Maskenpflicht in Bus und Bahn. "Das ist genau die schwierige Frage, die wir seit zwei Jahren eigentlich nur sehr schlecht beantworten können", sagt Schuppert.

Der Grund: "Uns fehlen wesentliche Daten." Zwar seien viele Daten durchaus in unterschiedlichen Quellen zu finden, sagt der Experte – allerdings fehlten die Zusammenhänge zwischen den ganzen Informationen. "So behindert es doch die Auswertung sehr massiv, dass eben die Daten nicht als ein gesamter Pool zur Verfügung stehen."

Es fehlt an Daten

Aus den zur Verfügung stehenden Daten "kann eigentlich die Effizienz von einzelnen Maßnahmen nur sehr sehr schwer wirklich abgeschätzt werden." Um die Effizienz einzelner Maßnahmen zu prüfen, werden Modelle benötigt. Die machen Annahmen, wie sich das Verhalten der Menschen ändert, wenn bestimmte Maßnahmen eingeführt werden.

Die gemachten Annahmen sind zwar plausibel, sagt Schuppert, aber mit den vorliegenden Daten könnten sie nicht überprüft werden. "Insofern wäre die Erfassung dieser Daten von extremer Wichtigkeit."