Marktforschungs-Wiki

Die explorative Datenanalyse ist in der Regel das erste Verfahren, dem zur Analyse vorliegende Daten unterzogen werden und zudem auch das einzige Verfahren, das im Verlauf beinahe jeder Analyse zum Einsatz kommt. Ziel der explorativen Datenanalyse ist es, dem Marktforscher einen ersten Überblick über die vorliegenden Daten zu ermöglichen, sowie nach bestimmten Auffälligkeiten und Regelmäßigkeiten in der Verteilung eines Merkmals oder mehrerer Merkmale zu suchen. Die Kernfrage der explorativen Datenanalyse lässt sich daher auch so formulieren: Was ist an der Verteilung eines Merkmals bemerkenswert? Um diese Frage beantworten zu können, kann anhand verschiedener statistischer Lagemaße wie dem arithmetischen Mittel, dem Median oder dem Modus bzw. statistischer Streumaße wie der Varianz, der Spannweite oder dem IQR versucht werden, einen ersten Einblick in die Lage und Verteilung des vorliegenden Merkmals zu erhalten. Dieser Einblick kann durch eine Vielzahl grafischer Darstellungsformen ergänzt werden, wobei zwischen den Möglichkeiten für die grafische Darstellung diskreter und stetiger Daten zu unterscheiden ist. Doch nicht nur der Gesamtüberblick ist von Bedeutung. Mitunter sind es gerade einzelne Werte, die das Ergebnis weiterführender Analyseverfahren entscheidend beeinflussen können. Hier sind vor allem die Ausreißer von Bedeutung, einzelne Werte, die besonders groß oder klein ausfallen und nicht zum Rest der Verteilung zu gehören scheinen. Ebendiese Ausreißer müssen gefunden, analysiert und für die weitere Analyse entweder beibehalten oder aus dem Datensatz entfernt werden. Aber auch fehlende Werte, also leere Zellen in der SPSS-Datentabelle, können für den Marktforscher von Interesse sein, da sie auf mögliche Probleme während der Datenerhebung hinweisen. Daher muss auch das Auftreten fehlender Werte entspre-chend festgestellt, analysiert und bewertet werden. All dies geschieht im Rahmen der explorativen Datenanalyse.

Zuguterletzt ist vor der Anwendung weiterführender Analyseverfahren wie der multiplen Regression oder der Varianzanalyse häufig zu überprüfen, ob die vorliegenden Daten gewisse Grundvoraussetzungen erfüllen, wie beispielsweise das Vorliegen einer Normalverteilung in der Grundgesamtheit, gleichbleibende Varianzen in verschiedenen Untergruppen einer Merkmalsverteilung (die sogenannte Homoskedastizität) oder das Auftreten von linearen Zusammenhängen zwischen zwei Variablen. Für die Überprüfung dieser Voraussetzungen liegen verschiedene Testverfahren und -kriterien vor, die ebenfalls zum Methodenspektrum der explorativen Datenanalyse gezählt werden können. Ein festgelegter „Ablaufplan“, der bei jeder explorativen Datenanalyse einzuhalten wäre, existiert nicht. Je nach Art der Daten und nach den Voraussetzungen der eingeplanten weiteren Analyseverfahren sind andere Kennwerte, andere grafische Darstellungsformen und andere Testverfahren anzuwenden. Der Marktforscher bestimmt im Rahmen einer explorativen Datenanalyse sein Vorgehen daher bis zu einem gewissen Grad selbst, wobei ihm ein beträchtlicher Methodenvorrat zur Verfügung steht. Lediglich die Ausreißeranalyse und die Analyse der fehlenden Werte sind aus naheliegenden Gründen stets durchzuführen.

Quellen[]

C. Reinboth: Multivariate Analyseverfahren in der Marktforschung, LuLu-Verlagsgruppe, Morrisville, 2006.

Fahrmeir, L., Künstler, R., Pigeot, I. & Tutz, G. (1999). Statistik. Der Weg zur Datenanalyse (2. Aufl.). Berlin: Springer.