Die P-P-Diagramme sowie die „artverwandten“ Q-Q-Diagramme gestatten den schnellen Vergleich einer Verteilung mit einer Testverteilung. Sie kommen beispielsweise dann zum Einsatz wenn zu klären ist, inwiefern ein vorliegender Datensatz normalverteilte Werte aufweist.
Ein P-P-Diagramm trägt die kumulierten Häufigkeiten der beobachteten Werte (dargestellt durch einzelne Punkte) gegen die zu erwartenden kumulierten Häufigkeiten einer perfekt verlaufenden Vergleichsverteilung (dargestellt durch eine diagonale Linie) ab. In den meisten Fällen ist dies eine Normalverteilung, da die Prüfung auf das Vorliegen einer Normalverteilung zu vielen multivariaten Analyseverfahren dazugehört, es kann aber auch gegen jede beliebige andere Verteilung abgetragen werden, beispielsweise gegen eine Student-Verteilung (T-Verteilung) oder eine F(isher)-Verteilung. Je stärker sich die Verteilung der real aufgetretenen Stichprobenwerte und die Vergleichsverteilung ähneln, desto stärker stimmen die empirischen mit den erwarteten kumulierten Häufigkeiten überein – zu erkennen am mehr oder weniger diagonalen Verlauf des Diagramms. Bei einer perfekten Übereinstimmung von empirischen Werten und theoretischer Verteilung, die in der Praxis allerdings nicht zu erwarten ist, liegen sämtliche Punkte auf der diagonalen Linie.
Zusätzliche zum P-P-Diagramm kann mit SPSS auch ein sogenanntes trendbereinigtes P-P-Diagramm erstellt werden, bei dem die beobachteten kumulierten Häufigkeiten nicht gegen die erwarteten kumulierten Häufigkeiten, sondern gegen die Abweichungen der beobachteten von den erwarteten kumulierten Häufigkeiten abgetragen werden. Auch hier kann neben der Normalverteilung noch gegen andere Vergleichsverteilungen abgetragen werden.
Quellen[]
C. Reinboth: Multivariate Analyseverfahren in der Marktforschung, LuLu-Verlagsgruppe, Morrisville, 2006.
Fahrmeir, L., Künstler, R., Pigeot, I. & Tutz, G. (1999). Statistik. Der Weg zur Datenanalyse (2. Aufl.). Berlin: Springer.
Brosius, F. (2002). SPSS 11. Bonn: mitp-Verlag