Statistik-Lexikon: Definition Lügen mit Statistiken

Damit Sie sich gegen die Scharlatane der Statistik wappnen können, zeigen wir Ihnen hier beliebte Tricks und Gaukeleien. Bedenken Sie dabei: Trotz ihres mitunter schlechten Rufs haben Statistiken großes Argumentationsgewicht. Mit den Worten der deutschen Statistikerin Elisabeth Noelle-Neumann: „Statistik ist für mich das Informationsmittel der Mündigen. Wer mit ihr umgehen kann, kann weniger leicht manipuliert werden. Der Satz »Mit Statistik kann man alles beweisen« gilt nur für die Bequemen, die keine Lust haben, genau hinzusehen.“

Versteckte Variablen

In einer (fiktiven) Studie wird für verschiedene Berufe erfasst, in welchem Alter die Personen dieser Berufsgruppe im Schnitt sterben. Das Ergebnis der Studie ist überraschend. Während Piloten und Berufsfußballer im Schnitt mit unter 60 Jahren sterben, leben Lehrer und Mediziner deutlich länger. Was ist die Ursache? Gefährliche Arbeitsbedingungen, zu viel Stress auf dem Fußballplatz, zu viele Flugunfälle? Nein. Der Grund ist, dass hier Berufsgruppen miteinander verglichen werden, die keinen direkten Vergleich erlauben, weil eine dritte Variable (neben Beruf und Lebensalter) die Untersuchung stört: das Durchschnittsalter. Echte Berufsfußballer gibt es erst seit den 60er Jahren und die Flugbranche ist in den vergangenen Jahren stark gewachsen. Entsprechend gibt es im Schnitt viel mehr junge Piloten und Berufsfußballer als junge Lehrer und Ärzte. Sterben nun Fußballer oder Piloten jung aufgrund von Unfall oder Krankheit, so fallen diese Fälle stärker ins Gewicht als bei den anderen beiden Berufsgruppen, weil ihnen weniger Fälle in ihrer Berufsgruppe gegenüberstehen, die in hohem Alter sterben.

Präzise Flunkereien


Kleider machen Leute und Ziffern machen Zahlen - je präziser die Zahlen, desto mehr vertrauen wir ihnen auch. Im antiken Griechenland kannte man diesen Trick: Herodot schrieb etwa nach dem Perserkrieg, das Heer der Feinde habe genau 5.283.220 Mann umfasst. Der Historiker hat zwar hemmungslos gelogen (es waren wohl etwa 15.000), machte aber einen informierten Eindruck und der Sieg der Griechen berückte und strahlte in einem glorreichen Licht. Auch der englische Theologe John Lightfoot wusste um die Kraft der Präzision: „Himmel und Erde und alles was dazugehört wurden vom dreifaltigen Gott zusammen und zur gleichen Zeit erschaffen: Am Sonntag, dem 21. Oktober 4004 vor Christus, 9 Uhr morgens“. Wer kann bei dieser Genauigkeit noch am Datum der Welterschaffung zweifeln?
Doch „Scheingenauigkeit“ als Überzeugungsmittel ist nicht allein dem Altertum vorbehalten: Wenn heute ein Wirtschaftbericht besagt, dass in Deutschland jedes Jahr 1.450.000.000 Überstunden gemacht wurden, ist auch diese Zahl mit Vorsicht zu genießen. Auf rund 40 Mio. Arbeitnehmer in Deutschland gerechnet, wären dies exakt 36,25 Überstunden im Jahr pro Person. Genauso wahrscheinlich sind es aber 33, 34, 38 oder 40 Stunden pro Person. Redlich wäre es daher zu sagen, die Zahl der Überstunden in Deutschland liegt nach Schätzungen zwischen ein bis zwei Milliarden.

Durchschnittliche Täuschungen


“Ich stehe Statistiken etwas skeptisch gegenüber”, sagte einst Franklin D. Roosevelt, der 32. Präsident der Vereinigten Staaten. „Denn laut Statistik haben ein Millionär und ein armer Kerl jeder eine halbe Million.“ Addiert ein Statistiker das Vermögen von Millionär und Mittellosem, teilt die Summe durch zwei, errechnet er zwei Halb-Millionäre. Klingt überspitzt, trifft aber ein Problem in der Statistik. Der Durchschnitt heißt in der Statistik arithmetisches Mittel, kürzer Mittelwert.
Immer dann, wenn extreme Werte in einer Gruppe auftauchen, ist der Mittelwert mit Vorsicht zu genießen – vor allem, wenn die Gruppe nicht besonders groß ist. Aber gleicht sich dies nicht immer über die große Anzahl aus? Nehmen wir als Beispiel eine schwäbische Kleinstadt mit 10.000 Haushalten: Im Schnitt kommt diese Kleinstadt auf ein Haushaltseinkommen von 42.000 Euro im Jahr je Haushalt (es ist eine wohlhabende Region). Im kommenden Jahr zieht Familie König in den Ort – der Jahresverdienst dieses Haushalts liegt dank eines Handelsimperiums bei 200 Mio. Euro im Jahr. Statistisch verdient die Kleinstadt in Summe nun nicht mehr 420 Mio. Euro im Jahr (10.000 Haushalte mal 42.000 Euro), sondern 620 Mio. Euro. Der Durchschnittshaushalt hat nun 62.000 Euro zur Verfügung - zumindest in der Statistik. Extreme Zahlen haben also auch in großen Gruppen eine starke Wirkung auf den Mittelwert.
Der Mittelwert hat einen Konkurrenten: den Zentralwert, auch Median genannt. Errechnet etwa ein Statistiker das monatliche Durchschnittseinkommen von sieben Anwälten mithilfe des Mittelwerts, werden die Einkommen addiert (1.000 + 2.000 + 5.000 + 7.000 + 10.000 + 20.000 + 95.000 = 140.000) und das Ergebnis durch sieben geteilt (140.000 / 7 = 20.000). So verdient der Anwalt im Durchschnitt beeindruckende 20.000 Euro. Der Median sagt aber, der mittlere Wert dieser sieben Einkommen beträgt 7.000 Euro. Dieser Wert liegt genau in der Mitte – drei Einkommen sind niedriger, drei Einkommen höher als er. Ob der durchschnittliche Anwalt nun rechnerisch 20.000 oder 7.000 Euro in der Tasche hat, entscheidet die Wahl zwischen arithmetischem Mittel und Median.

Geschummelte Basis


Eine Zeitung titelt: „Wieder Mord an Ehefrau – Verheiratete leben gefährlich“. Der verantwortliche Redakteur kommt auf diesen Schluss, weil eine Statistik offenbart, dass 75 Prozent aller ermordeten Frauen vom Ehemann um die Ecke gebracht werden. Dass es nun halsbrecherisch sei, verheiratet zu sein, ist jedoch ein Trugschluss. Vom Verfasser wurde hier nur eine Teilmenge der Basis betrachtet: Korrekterweise müsste in diesem Fall nicht geprüft werden, wie viele der ermordete Frauen vom Ehemann umgebracht wurden – sondern wie viele verheiratete Frauen im Vergleich zu unverheirateten Frauen ein gewaltsames Ableben ereilt.
Nehmen wir als Beispiel die kleine Ortschaft Demise County. In der Ortschaft wurden im letzten Jahr (es war kein gutes für die örtliche Polizei) drei Ehefrauen von ihren Gatten erschlagen. Hinzu kam ein Mord an einer unverheirateten Frau. Damit sind hier, landesüblich, 75 Prozent der ermordeten Frauen durch einen Ehemann umgekommen (drei von insgesamt vier Ermordeten). In Demise County leben 6.000 verheirate und 1.000 unverheiratete Frauen. Die Wahrscheinlich gewaltsam ums Leben zu kommen, lag damit bei den Ehefrauen bei 1 zu 2.000 (drei Morde auf 6.000 Frauen) – bei Ledigen aber bei 1 zu 1.000. In Demise County bringt der Ehering demnach einen klaren Sicherheitsgewinn (auf Platz zwei nach dem Wegzug aus der Gegend).

Doppelzüngige Trends

Das Klima erwärmt sich, der Meeresspiegel steigt; folgt daraus, dass Deutschland demnächst überschwemmt wird? Eine logische Prognose. Aber tatsächlich können die Meteorologen nicht voraussehen, welche Folgen der Klimawandel genau haben wird. Auch die nachvollziehbarsten Prognosen können nur mit Vorbehalt weitergesponnen werden. Angenommen, die durchschnittliche Körpergröße eines 18-Jährigen war 1970 etwa 1,80 Meter; 20 Jahre später war der durchschnittliche junge Mann 1,85 Meter groß. Selbst wenn der normale 18-jährige Bursche in weiteren 20 Jahren – also 2010 – durchschnittlich 1,90 Meter groß ist, kann man nicht bedenkenlos den Trend ausmachen, dass 18-Jährige im Jahre 2030 rund 2 Meter groß sein werden.

Unaufrichtige Stichproben

„Akzeptieren Sie Atomstrom aus dem Kernkraftwerk?“ Fragt man zehn Greenpeace-Mitglieder und zehn Mitarbeiter eines Kraftwerks, bekommt man wahrscheinlich zehn „Ja“- und zehn „Nein“-Antworten. Die Stichprobe, also die zum Thema befragten Personen, kann so oder so gewählt werden. Ein überzeugter Umweltschützer könnte seine These „Die meisten Bundesbürger missbilligen Atomstrom“ leicht beweisen, indem er vor allem Umweltschützer befragt. Doch die Stichprobenmanipulation kann auch verdeckter geschehen. Möchte man beispielsweise beweisen, dass die Menschen phlegmatischer geworden sind, wählt man eine Befragung aus, bei der Menschen am Freitagabend daheim zwischen 20 und 22 Uhr angerufen werden. Die Wahrscheinlichkeit, um diese Uhrzeit an diesem Wochentag eher häusliche Personen anzutreffen steigt - völlig unabhängig von Alter, Geschlecht, Einkommen oder Region. Das Gegenteil beweist man, wenn man die gleiche Befragung am Sonntagnachmittag in Parks und auf öffentlichen Plätzen durchführt. Professionelle Umfragen berücksichtigen daher nicht nur unterschiedliche Personengruppen, die Befragungen werden oft auch auf unterschiedliche Wochentage verteilt und die Interviewer wechseln zwischen Telefonbefragungen und Befragungen im öffentlichen Raum (z. B. in der Fußgängerzone).

Doppelbödige Fragen


Der gleiche Umweltschützer fragt auch: „Sind Sie auch für Umweltschutz und gegen Atomstrom?“ Viele der Befragten werden bejahen, weil Sie sich ungern als Umweltsünder outen möchten. Im gleichen Zuge werden sie jedoch als Atomkraft-Gegner klassifiziert. Mit hinterlistigen Fragen kann umfangreich manipuliert werden. Das Problem ist hierbei, dass die Originalfragen in den veröffentlichten Statistiken häufig nicht mehr erwähnt werden. Dann kann beispielsweise die Schlagzeile lauten: „88 Prozent der Deutschen sagen „Nein“ zu Rindfleisch.“ Ein Schock für alle Viehbauern. Wer vermutet dahinter die Frage: „Können Sie sich vorstellen, aufgrund der zahlreichen Fleischskandale, der Gefährdung durch BSE und dem vermehrten Auftreten von Fleischparasiten wie Fadenwürmern in Zukunft häufiger auf Rindfleisch zu verzichten?“.

Getrickste Grafiken


Graphische Darstellungen von Statistiken werden gerne kosmetisch aufgepeppt. Das Wichtigste, worauf Sie hier achten sollten, ist der Maßstab. Diagramme heben wichtige Punkte hervor, um ein statistisches Ergebnis greifbar zu machen – häufig schießen sie dabei aber auch über das Ziel hinaus und sind schlicht falsch. Solche irreführenden Diagramme sind in den Medien überall zu finden. Redakteure können die Maßstäbe beispielsweise manipulieren, indem sie Intervalle verkleinern oder Balken nicht bei Null beginnen lassen.

Frömmelnde Prozente

Die Partei ABC bejubelt eine 100-prozentige Erhöhung ihrer Frauenquote – diese Prozentzahl klingt fulminant. Partei XYZ muss zerknirscht zugeben, dass ihre Frauenquote nur um 20 Prozent erhöht werden konnte. Doch wie viele Frauen sind es nun tatsächlich?
Angenommen, in der Partei ABC waren vier weibliche Abgeordnete und jetzt kommen vier Damen dazu. Damit hat sich die Frauenquote bei Partei ABC tatsächlich um 100 Prozent erhöht. Im Ergebnis beherbergt die Partei ABC nun insgesamt acht Frauen – dies jedoch bei über hundert Abgeordneten. Ihr Anteil weiblicher Abgeordneter liegt damit nur bei acht Prozent. Partei XYZ hingegen hatte bei 100 Abgeordneten bereits 40 Frauen in den eigenen Reihen – also 40 Prozent. Jetzt kommen acht dazu - bei unglücklicher Betrachtung sind dies nur 20 Prozent. Besser wäre es gewesen, Partei XYZ hätte sich gerühmt, 100 Prozent mehr weibliche Abgeordnete hinzuzubekommen als Partei ABC (nämlich acht statt vier). Oder zu sagen, dass ihre Fraktion 400 Prozent mehr weibliche Frauen in Ihren Reihen hat als die Fraktion ABC (nämlich 32 mehr). Man sieht: Mit Prozenten lässt sich vieles behaupten.
Nehmen wir als weiteres Beispiel einen ehrgeizigen Kleinwinzer, der stolz verkündet, dass er 57 Prozent Weißwein, 30 Prozent Rotwein und 13 Prozent Sekt abgesetzt hat. Wer käme da auf die Idee, dass der junge Winzer dieses Jahr 13 Flaschen Grauburgunder, 7 Flaschen Dornfelder und 3 Flaschen Schaumwein an den Kunden bringen konnte?

Verheimlichte Realitäten

Sinken die Arbeitslosenzahlen klopfen sich Verantwortliche gerne gegenseitig auf die Schulter. Bei dem darauf folgenden Jubeltaumel fragt niemand, wer denn eigentlich die Arbeitslosen sind und wie ihre Zahl zustande kommt. „Arbeitslos ist, wer keinen Job hat“ klingt zwar einleuchtend, ist aber naiv. Denn als arbeitslos gilt ein Bürger dann, wenn er sich arbeitslos meldet, mehr als 18 Stunden die Woche bereit ist zu arbeiten und dem Arbeitsmarkt zur Verfügung steht. Die Millionärsgattin, der Langzeitstudent, der ungemeldete Arbeitslose und die 52-jährige Frührentnerin haben zwar keinen Job, tauchen aber in der offiziellen Statistik nicht auf. Solange der Leser weiß, wie die Arbeitslosenzahl errechnet wurde, können Statistiken auch nicht schaden. Greift aber ein Statistiker unter die Theke und bietet uns eine Zahl an, dessen Rezeptur nur er kennt, sollte man genauer hinschauen. Um über die wirtschaftliche Entwicklung aufgeklärt zu sein, ist etwa die Zahl der sozialpflichtig versicherten Beschäftigten erhellender als die Negativkennzahl der Arbeitslosen.

Erstaunliche Wahrscheinlichkeiten

Nicht jede Wahrscheinlichkeit für ein (statistisches) Ereignis, lässt sich intuitiv auf Basis eines Bauchgefühls korrekt erfassen. Nehmen wir folgendes Beispiel: Sie waren gerade drei Wochen in einem tropischen Land im Urlaub. In den Nachrichten kommt die Meldung, dass in diesem Land seit kurzem Rotfieber ausgebrochen ist. Alle Touristen werden umgehend aufgefordert, sich auf diese Krankheit testen zu lassen. Am nächsten Tag sagt Ihnen der Arzt, dass dieser Krankheitstest einen Fehlerwert von einem Prozent bei Gesunden und keinen Fehler bei Kranken aufweist. Was heißt das? Von 100 gesunden Personen, die getestet werden, werden 99 als gesund erkannt. Bei einer Person, obwohl sie gesund ist, gibt der Test als Ergebnis „erkrankt“ an. Ist eine Person erkrankt, ist das Testergebnis immer „erkrankt“.
Zwei Tage später sind Sie wieder beim Arzt. Sie haben in der Zwischenzeit recherchiert, dass sich nur etwa jeder tausendste Tourist des tropischen Landes mit Rotfieber ansteckt und sind guten Mutes. Doch dann das erschreckende Ergebnis: Der Test sagt, Sie sind erkrankt. Wie wahrscheinlich ist es nun, dass Sie wirklich unter dem gefährlichen Rotfieber leiden? Das Bauchgefühl sagt Ihnen „ca. 99 Prozent“ – also absolut wahrscheinlich. Doch stimmt das?
Machen wir folgende Rechnung auf: Nehmen wir an, dass aus Ihrem Urlaubsland im besagten Zeitraum rund 100.000 Touristen zurückgekommen sind, die sich einem Rotfieber-Test unterziehen müssen. Da sich im Schnitt jeder Tausendste ansteckt, werden unter diesen 100.000 Touristen rund 100 tatsächlich Erkrankte sein. Alle 100 erkrankten Personen werden durch den Test korrekt ermittelt. Von den 99.900 gesunden Personen werden 99 Prozent richtigerweise als „gesund getestet“. Doch ein Prozent der eigentlich Gesunden bekommen das Testergebnis „an Rotfieber erkrankt“. Das sind bei 99.900 Touristen stattliche 999 Personen. Insgesamt wurden also 100 Personen zu recht als erkrankt geführt und 999 zu unrecht. Die Wahrscheinlichkeit, dass Sie erkrankt sind, liegt also nicht bei „ca. 99 Prozent“, sondern nur bei 9 Prozent. Die Berechnung: 100 Erkrankte : (100 Erkrankte + 999 falsche Kranke) = 0,09. So sehr kann das Bauchgefühl bei Wahrscheinlichkeiten täuschen.

Zum Thema „Lügen mit Statistik“ sind viele, sehr unterhaltsame Bücher erschienen, auf denen unsere Beispiele zum Teil beruhen. Wenn Sie Interesse an einem umfangreicheren Einstieg haben, empfehlen wir Ihnen "Statistik für Dummies" von Deborah Rumsey, "So lügt man mit Statistiken" von Walter Krämer sowie "Der Hund, der Eier legt" von Hans-Peter Beck-Bornholdt.

Bitte beachten Sie, dass es sich bei den einzelnen Definitionen in unserem Statistik-Lexikon um vereinfachte Erläuterungen handelt. Hierbei ist es das Ziel, die einzelnen Begriffe einer möglichst breiten Nutzergruppe näher zu bringen. Insofern besteht die Möglichkeit, dass einzelne Definitionen wissenschaftlichen Standards nicht zur Gänze entsprechen.

Lexikon-Einträge mit L