Als Autokorrelation bezeichnet man eine Systematik in den Residuen, insbesondere Zusammenhänge zwischen nebeneinanderliegenden Residualgrößen. Beispiel: Auf große positive Residuen folgen regelmäßig große negative Residuen – eine deutliche Systematik ist erkennbar.
Autokorrelation kann generell immer dort auftreten, wo die einzelnen Fälle nicht zufällig angeordnet sind. Dies ist beispielsweise bei Zeitreihenanalysen der Fall, wo die Fälle zeitlich geordnet vorliegen. Das Auftreten von Autokorrelationen kann auf zwei mögliche Probleme mit dem Regressionsmodell hindeuten: Entweder eine erklärungsrelevant Variable wurde nicht in das Modell aufgenommen oder aber es liegt ein nicht-linearer Zusammenhang, beispielsweise ein quadratischer Zusammenhang vor.
Abgesehen von diesen Problemen birgt die Autokorrelation noch eine weitere Gefahr: Sie führt dazu, dass die Standardfehler der Regressionskoeffizienten zu gering eingeschätzt werden. Die Ergebnisse der Signifikanztests können damit nicht mehr als zuverlässig betrachtet werden, als Folge davon werden die Regressionskoeffizienten als signifikanter bewertet, als sie es tatsächlich sind – ihr Einfluss auf die abhängige Variable wird also überschätzt.
Wie man sieht, wirft das Auftreten von Autokorrelation aus verschiedenen Gründen Fragen bezüglich der Interpretationsfähigkeit einer Regressionsfunktion auf – bei starker Autokorrelation ist sogar das ganze Modell als ungültig zu betrachten. Aus diesem Grund muss vor der Modellinterpretation nach Autokorrelationen in den Residualgrößen gesucht werden – dies geschieht in SPSS mittels des Durbin-Watson-Tests auf Autokorrelation.
Der Ergebniswert des Durbin-Watson-Tests, der Durbin-Watson-Koeffizient, kann Werte zwischen 0 und 4 annehmen. Je näher der Wert des Koeffizienten dabei an 2 liegt, desto geringer ist das Ausmaß der Autokorrelation. Dagegen deuten Werte deutlich unter 2 auf eine positive Autokorrelation, Werte deutlich über 2 auf eine negative Autokorrelation hin. Als generelle Faustregel für die Interpretation des Koeffizienten kann folgendes festgehalten werden: Durbin-Watson-Werte zwischen 1,5 und 2,5 sind akzeptabel, Werte unter 1 oder über 3 deuten definitiv auf Autokorrelation hin. Dazwischen existiert eine interpretatorische Grauzone, in der die Entscheidung über die Fortsetzung der Regressionsanalyse beim Marktforscher selbst liegt.
Der Durbin-Watson-Test kann nur unter zwei Voraussetzungen durchgeführt werden: Die Regressionsfunktion muss einen konstanten Term enthalten (diesen baut SPSS aber automatisch ein) und die abhängige Variable im Regressionsmodell darf nicht zeitverzögert auch als unabhängige Variable verwendet werden. Dies kann zum Beispiel bei Zeitreihenanalysen der Fall sein, wenn der Wert einer Variablen aus der vorangegangenen Periode als erklärender Wert für eben diese Variable in der aktuellen Periode herangezogen wird (Beispiel: Schätzung der Ozonwerte für August aus den Ozonwerten für Juli).
Als Einschränkung ist noch festzuhalten, dass mit dem Durbin-Watson-Test lediglich die sogenannten Autokorrelationen der 1. Ordnung identifiziert werden können. Eine solche Autokorrelation liegt dann vor, wenn direkt benachbarte Residuen miteinander verknüpft sind. In einigen Fällen, beispielsweise bei quartalsweise erhobenen Daten, ist jedoch auch eine Autokorrelation der 4. Ordnung denkbar. Besteht eine solche Möglichkeit, sollte neben dem Durbin-Watson-Test auch noch der Wallis-Test auf Autokorrelationen 4. Ordnung durchgeführt werden.
Quellen[]
C. Reinboth: Multivariate Analyseverfahren in der Marktforschung, LuLu-Verlagsgruppe, Morrisville, 2006.
Fahrmeir, L., Künstler, R., Pigeot, I. & Tutz, G. (1999). Statistik. Der Weg zur Datenanalyse (2. Aufl.). Berlin: Springer.
Brosius, F. (2002). SPSS 11. Bonn: mitp-Verlag.