Marktforschungs-Wiki

Genereller Ablauf[]

Der T-Test dient dem Vergleich von Mittelwerten (arithmetischen Mitteln) von zwei Untergruppen einer Stichprobe. Der T-Test verwendet als Prüfkriterium einen Wert aus der t- oder Student-Verteilung. Dieser Wert lässt sich aus den Stichprobenwerten berechnen und kann anschließend mit dem theoretischen t-Wert unter bestimmten Annahmen verglichen werden. Standardmäßig wird beim T-Test von der Annahme ausgegangen, dass die „wahren“ Mittelwerte einer Variablen in zwei Gruppen in der Grundgesamtheit identisch sind, dass also die unabhängige Variable, durch welche die Gruppen gebildet werden, keinen signifikanten Einfluss auf die betrachtete abhängige Variable ausübt.

Der t-Wert berechnet sich aus den Stichprobenwerten als:

Sind beide Gruppenmittelwerte identisch, ergibt sich ein t-Wert von Null. Hierbei ist zu beachten, dass der t-Wert aus den Stichprobenwerten und nicht aus den Daten einer Vollerhebung berechnet wird. Mittelwerte, Varianzen und andere statistische Größen aus einer Stichprobe stimmen aber höchstens zufällig exakt mit den „wahren“ Werten in der Grundgesamtheit überein – in der Regel werden sie, in Abhängigkeit von der Sorgfalt der Messung oder der Genauigkeit des Erhebungsdesigns mehr oder weniger stark von diesen „wahren“ Werten abweichen. Dies ist jedem Marktforscher klar, denn würde man in irgendeiner Untersuchung erneut eine Stichprobe ziehen, würden sich andere Stichprobenwerte und damit auch andere Rechenergebnisse einstellen. Bei der Ziehung mehrerer Stichproben ist zu erwarten, dass die erhobenen Varianzen und Mittelwerte also mehr oder weniger stark um die „wahren“ Werte herum streuen.

Dieser Gedanke ist wiederum auch auf die t-Werte übertragbar, da sich bei unterschiedlichen Stichproben aus derselben Grundgesamtheit ebenfalls unterschiedliche t-Werte ergeben dürften. Die Schlussfolgerung, die daraus gezogen werden kann ist, dass eine Übereinstimmung der „wahren“ Mittelwerte in der Grundgesamtheit durch die Berechnung des t-Wertes nicht unmittelbar erkannt werden muss, da eben mit den besagten Schwankungen in den t-Werten zu rechnen ist. Da die Verteilung von t bekannt ist, lässt sich aber errechnen, mit welcher Wahrscheinlichkeit der t-Wert um ein bestimmtes Ausmaß von dem Wert abweicht, den t bei einer perfekten Übereinstimmung von Stichprobe und Grundgesamtheit angenommen hätte.

Alpha-Fehlerinflation[]

Der T-Test ist ein probates Mittel zum Vergleich zweier Mittelwerte. Wie sieht es aber aus, wenn mehr als zwei Gruppen existieren und daher auch mehr als zwei Mittelwerte miteinander verglichen werden müssen? Liegt eine solche Situation vor, lassen sich theoretisch doch auch zwei oder mehr T-Tests hintereinander durchführen, dennoch muss auf die komplexere Varianzanalyse zurückgegriffen werden. Grund dafür ist die sogenannte Alpha-Fehlerinflation.

Wie bei jedem statistischen Test wird auch beim T-Test mit einer Irrtumswahrscheinlichkeit Alpha gerechnet. Diese kann durch den Marktforscher frei festgelegt werden, liegt aber üblicherweise entweder bei 0,05 oder auch bei 0,01. Bei der Durchführung einer Reihe von T-Tests kommt es nun zu einer sogenannten Alpha-Fehlerinflation, also einer Potenzierung der ursprünglichen Irrtumswahrscheinlichkeit. Wie ist dies zu erklären?

Angenommen, die Irrtumswahrscheinlichkeit für eine beliebige Reihe von T-Tests wird auf 0,05 festgelegt. Die Wahrscheinlichkeit dafür, dass ein Vergleich nun lediglich zufällig signifikant wird, also die Wahrscheinlichkeit für einen sogenannten Alpha-Fehler, liegt somit bei 0,05 oder 5%. Bei mehreren Vergleichen erhöht sich diese Irrtumswahrscheinlichkeit dramatisch. Nach nur 28 durchgeführten Vergleichen ist sie bereits auf 76,2% gestiegen – die Wahrscheinlichkeit ist also recht gross, schon mindestens einen fehlerhaften Vergleich in der Reihe zu haben. Der Grund dafür wird deutlich, dass eine Irrtumswahrscheinlichkeit von 5% auch aussagt, dass die Nicht-Irrtumswahrscheinlichkeit für einen T-Test bei 95% liegt. Führt man zwei hintereinander durch, liegt die Wahrscheinlichkeit, dass beide fehlerfrei verlaufen sind schon nicht mehr bei 95% sondern bei 95%² = 90,25%. T-Tests werden daher generell für Vergleiche von mehr als zwei Gruppen als ungeeignet eingestuft, daher ist für solche Analysevorhaben der Rückgriff auf die Varianzanalyse erforderlich.

Quellen[]

C. Reinboth: Multivariate Analyseverfahren in der Marktforschung, LuLu-Verlagsgruppe, Morrisville, 2006.

Fahrmeir, L., Künstler, R., Pigeot, I. & Tutz, G. (1999). Statistik. Der Weg zur Datenanalyse (2. Aufl.). Berlin: Springer.