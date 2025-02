💬 "Dein Argument" greift Euren Input auf: Kommentare aus der BR24-Community sind Anlass für diesen Beitrag. 💬

Stichprobe, Grundgesamtheiten, Repräsentativität: Kennwerte bei Studien und Umfragen sind komplex. DeinArgument hat Fragen zur BR24-Berichterstattung über den ARD-DeutschlandTrend gesammelt und beantwortet sie hier. Ein Ausflug in die Statistik.

User "Arancia" fragt zum Beispiel: "Hinsichtlich der Umfragen fände ich eine objektive Recherche und Berichterstattung darüber mal sehr gut. Die Ergebnisse werden als gottgegeben hingenommen. Aber mich würde interessieren, wie tatsächlich erhoben wird, nach wie vor via Festnetztelefon? Wie repräsentativ sind sie? [...]"

Was ist das Grundprinzip einer statistischen Erhebung?

Eine bestimmte Menge an Personen (Stichprobe) wird zu einem Thema befragt – bei Wahlumfragen etwa zu ihren aktuellen Wahlabsichten und anderen politischen Präferenzen. Anhand dieser Stichprobe kann auf die sogenannte Grundgesamtheit geschlossen werden – bei Wahlumfragen etwa auf Meinungen und Präferenzen der gesamten wahlberechtigten Bevölkerung.

In Deutschland sind zur kommenden Bundestagswahl mindestens 59,2 Millionen Menschen aufgerufen. Sie haben das 18. Lebensjahr vollendet, besitzen die deutsche Staatsbürgerschaft und wohnen seit mindestens drei Monaten in Deutschland. Die Stichprobe für den ARD-DeutschlandTrend – der bundesweiten Wahlumfrage der ARD – beinhaltet immer rund 1.300 Personen. Sie werden in einem Zeitraum von drei Tagen (immer Montag bis Mittwoch) befragt.

Wie wird eine Stichprobe gebildet?

"Die Grundidee einer statistischen Befragung ist meist die Zufallsauswahl", sagt Helmut Küchenhoff, Professor für Statistik an der Ludwig-Maximilians-Universität München. Im Idealfall würden die Wissenschaftlerinnen und Wissenschaftler komplett zufällig Menschen auswählen. Dadurch habe jede Person etwa in der Bevölkerung theoretisch die gleiche Chance, in die Stichprobe aufgenommen zu werden. Auf diese Weise ist sichergestellt, dass man, bei einer ausreichend großen Stichprobe, die Ergebnisse auf die gesamte Bevölkerung beziehen kann.

In der Realität ist das schwierig umzusetzen. Deshalb versucht man, sich der Zufallsauswahl so gut es geht anzunähern.

Wie werden Menschen für statistische Erhebungen wie den DeutschlandTrend befragt?

Es gibt verschiedene Ansätze, um Teilnehmerinnen und Teilnehmer für eine statistische Erhebung zu befragen – zum Beispiel: telefonische Erhebung, Online-Erhebung, persönliche oder postalische Befragungen.

Der DeutschlandTrend setzt ein sogenanntes Mixed-Mode-Design ein. Dabei werden computergestützte Telefoninterviews (zufällige Festnetz- und Mobilnummern) mit Onlinebefragungen kombiniert. Die zufällig Ausgewählten werden entweder angerufen oder angeschrieben und zur Teilnahme aufgefordert. Dass sich niemand selbst einbringen kann, sei ein entscheidendes Qualitätskriterium, sagt Roberto Heinrich, der für die Wahlforschungsgesellschaft Infratest Dimap den ARD-DeutschlandTrend betreut. Durch die Kombination der Methoden (Festnetz, Mobil, Online) gleiche man methodenspezifische Abbildungsschwächen von Bevölkerungsteilgruppen aus.

Was bedeutet Repräsentativität?

Die Stichprobe einer Befragung ist dann repräsentativ, wenn die befragten Menschen ein Abbild der Grundgesamtheit, zum Beispiel aller Wahlberechtigten, darstellen. Da das nie perfekt gelingen kann, fokussiert man sich, so Statistiker Helmut Küchenhoff, auf einige wichtige Merkmale, die etwas mit der Zielgröße, also zum Beispiel mit der Wahlentscheidung, zu tun haben.

So wird bei Wahlumfragen unter anderem darauf geachtet, dass Alter, Geschlecht oder Bildung in der gleichen Weise verteilt sind, wie in der wahlberechtigten Bevölkerung. Um diese Verteilung zu erreichen, muss teilweise gewichtet werden.

Ein Beispiel: In der wahlberechtigten Bevölkerung sind Männer und Frauen fast gleich verteilt. Besteht die Stichprobe aber zu 75 Prozent aus Männern, müssen die Stimmen der Frauen stärker gewichtet werden, um wieder auf rund 50:50 zu kommen.

Für die Wahlumfragen der ARD muss laut Roberto Heinrich kaum nach Geschlecht gewichtet werden, dafür stärker nach Bildung. Menschen mit höherem Bildungsabschluss seien tendenziell überrepräsentiert, da sie eher politisch interessiert seien und deshalb eher an den Umfragen teilnehmen.

Wie können auch kleine Stichproben Repräsentativität garantieren?

Deshalb muss die Stichprobe nicht riesig sein, um repräsentativ zu werden. "Bei 1.500 Personen kann man Stimmanteile mit einer Genauigkeit von circa 2,5 Prozent schätzen", sagt Helmut Küchenhoff. Dabei sei es egal, ob die Grundgesamtheit eine Million oder 80 Millionen Menschen umfasst. Diese Genauigkeit ändert sich mathematisch auch bei größeren Stichproben nur langsam. Bei einer Befragung von 10.000 Menschen liege sie bei einem Prozent. Zwischen einer Stichprobe von 1.500 und 3.000 Personen gibt es kaum einen Unterschied.

Statistische Unsicherheit: Wie aussagekräftig sind Veränderungen in Umfragewerten?

Umfrageergebnisse sind trotz allem immer eine statistisch gestützte Schätzung, die ein gewisses Maß an Unsicherheit enthält. Häufig wird für einen durch die Umfrage ermittelten Wert ein sogenanntes Konfidenzintervall berechnet. Das ist zum Beispiel wichtig, wenn sich die Ergebnisse zwischen zwei Umfragen nur leicht verändert haben.

Ein Beispiel: Eine Partei hat in der Sonntagsfrage in einer Woche 10 Prozent, in der nächsten Woche 11 Prozent. Die von Infratest angegebene Schwankungsbreite liegt meist bei rund zwei Prozentpunkten – entsprechend wären die Grenzwerte der Konfidenzintervalle etwa 8 bis 12 Prozent und 9 bis 13 Prozent. Der wahre Wert wird zu 95 Prozent von diesen Bereichen abgedeckt. Man kann also nicht sicher sagen, ob es sich um eine tatsächliche Entwicklung handelt oder um eine Abweichung innerhalb der errechneten statistischen Unsicherheit.

Warum nutzt der BR nur Infratest als Quelle?

Das fragte sich zum Beispiel die BR24 Userin "Kaethe": "Es wird eben immer nur ein Institut vom ÖR abgebildet, Infratest. Bei der Befragung dort wurden 1300 Leute gefragt. Dass […] andere die CDU bei 29 bzw 28% sehen, erfährt man so nicht. Obwohl die doppelt so viele Leute fragen."

Warum größere Stichproben nicht zwangsläufig ein besseres Ergebnis liefern, wurde bereits erklärt. Die ARD und der Bayerische Rundfunk arbeiten seit vielen Jahren mit Infratest dimap zusammen. "Wir sind mit den Wahlforschern dort in einem ständigen, engen Austausch und erarbeiten beispielsweise die Fragebögen gemeinsam", sagt BR-Wahlexperte Andreas Bachmann. "Wir kennen die Arbeitsweise und die hohen Standards von Infratest dimap. Deshalb genießt dieses Umfrageinstitut unser Vertrauen."

Für die Fragen im Deutschlandtrend, die sich zum Teil in den einzelnen Umfragen unterschieden, schlagen Journalistinnen und Journalisten Themen vor – die Wahlforscherinnen und -forscher setzen diese dann in konkrete Fragestellungen um, erklärt Roberto Heinrich von Infratest.