Statistik-Lexikon: Definition Regressionsanalyse

Die Regressionsanalyse ist das Analyseverfahren zur Errechung einer Regression in Form einer Regressionsgeraden bzw. – funktion. Die Regression gibt an, welcher gerichtete lineare Zusammenhang zwischen zwei oder mehr Variablen besteht. Das so genannte Bestimmtheitsmaß (R²) drückt dabei aus, wie gut die Regressionsgerade den Zusammenhang zwischen unabhängiger und abhängiger Variable wiedergibt. R² liegt zwischen 0 und 1, wobei der Wert R² = 1 bedeuten würde, dass jeder beobachtete Datenpunkt direkt auf der Regressionsgeraden liegt.

Die Ermittlung einer Regressionsfunktion besagt noch nicht, dass der ermittelte Zusammenhang signifikant ist. Das heißt, dass der errechnete Zusammenhang zwischen zwei oder mehr Variablen, der für die Stichprobe gilt, auch auf die Grundgesamtheit übertragen werden kann. Die Zulässigkeit dieser Übertragung - anders gesagt, die Signifikanz der Regression – wird durch den so genannten F-Test ermittelt. Wenn man den Zusammenhang von mehreren unabhängigen Variablen auf eine abhängige Variable errechnet, wird die jeweilige Signifikanz der unabhängigen Variablen mit dem t-Test ermittelt.

Die Aussagekraft einer Regression beruht auf der Vollständigkeit des Modells. Wenn beispielsweise im Modell eine oder mehrere unabhängige Variablen nicht berücksichtigt werden, kann das Ergebnis zwar rechnerisch „korrekt“ sein, die realen Zusammenhänge werden aber nicht vollständig aufgedeckt. Ein Beispiel: Der Eiscremeabsatz im Jahresschnitt wird auf Basis der unabhängigen Variablen Tagesdurchschnittstemperatur errechnet. Der errechnete Zusammenhang, wiedergegeben mit der Regressionsgerade, ist signifikant, trifft also auf die Grundgesamtheit zu. In diesem Fall steigt der Absatz von Eiscreme mit jedem Grad Celsius um 12 Prozent. Da aber nur die Tagesdurchschnittstemperatur betrachtet wurde, nicht aber der Preis je Eiskugel, fehlt eine maßgebliche Auswirkung auf den Eiscremeabsatz. Auch der Preis je Kugel hat in unserem Beispiel einen Einfluss auf den Absatz. Der Preis steigt in den Sommermonaten an und fällt zum Herbst wieder ab. Die zuvor errechnete Regression ist daher verzerrt. Würde der Eiscremepreis korrekt in das Modell eingebunden werden, ließe sich feststellen, dass bei konstantem Eiscremepreis jedes Grad Celsius nicht zu 12 Prozent, sondern zu 16 Prozent mehr Absatz führen würde. Durch die Preiserhöhung im Sommer wird diese Absatzzunahme jedoch ausgebremst.

Bitte beachten Sie, dass es sich bei den einzelnen Definitionen in unserem Statistik-Lexikon um vereinfachte Erläuterungen handelt. Hierbei ist es das Ziel, die einzelnen Begriffe einer möglichst breiten Nutzergruppe näher zu bringen. Insofern besteht die Möglichkeit, dass einzelne Definitionen wissenschaftlichen Standards nicht zur Gänze entsprechen.

Lexikon-Einträge mit R