Test auf Normalverteilung
Eine der häufigsten Voraussetzungen für statistische Testverfahren ist, dass die verwendeten Daten normalverteilt sind. Wenn z.B. ein t-Test oder eine ANOVA berechnet werden soll, muss zunächst geprüft werden, ob die Daten bzw. Variablen normalverteilt sind.
Die Annahme der Normalverteilung ist auch für die lineare Regressionsanalyse wichtig, aber in diesem Fall ist es wichtig, dass der Fehler, den das Modell macht, normalverteilt ist und nicht die Daten selbst.
Nichtparametrische Tests
Wenn die Daten nicht normalverteilt sind, können die oben genannten Verfahren nicht angewendet werden und es müssen nichtparametrische Tests verwendet werden. Nichtparametrische Tests setzen keine Normalverteilung der Daten voraus.
Wie wird die Normalverteilung geprüft?
Die Normalverteilung kann entweder analytisch oder graphisch geprüft werden. Die gebräuchlichsten analytischen Tests zur Überprüfung der Normalverteilung von Daten sind:
- Kolmogorov-Smirnov Test
- Shapiro-Wilk Test
- Anderson-Darling Test
Zur grafischen Überprüfung wird entweder ein Histogramm oder besser der Q-Q-Plot verwendet. Q-Q steht für Quantil-Quantil-Plot, wobei die tatsächlich beobachtete Verteilung der theoretisch erwarteten Verteilung gegenübergestellt wird.
Analytische Prüfung der Daten auf Normalverteilung
Um deine Daten analytisch (mit statistischen Tests) auf Normalverteilung zu prüfen, gibt es verschiedene Test verfahren, die bekanntesten sind der Kolmogorov-Smirnov Test, der Shapiro- Wilk Test und der Anderson Darling Test.
Mit all diesen Tests prüfst du die Nullhypothese, dass deine Daten normalverteilt sind. Die Nullhypothese lautet also, dass die Häufigkeitsverteilung deiner Daten normalverteilt ist. Um die Nullhypothese zu verwerfen oder nicht zu verwerfen, erhältst du bei all diesen Tests einen p-Wert. Entscheidend ist, ob dieser p-Wert kleiner oder größer als 0,05 ist.
Ist der p-Wert kleiner als 0,05, wird dies als signifikante Abweichung von der Normalverteilung interpretiert und man kann davon ausgehen, dass die Daten nicht normalverteilt sind. Wenn der p-Wert größer als 0,05 ist und man statistisch ganz sauber sein will, kann man nicht unbedingt sagen, dass die Häufigkeitsverteilung normalverteilt ist, man kann nur die Nullhypothese nicht widerlegen.
In der Praxis wird jedoch, auch wenn dies nicht ganz korrekt ist, ab einem Wert größer als 0,05 von einer Normalverteilung ausgegangen. Trotzdem sollte immer auch die graphische Lösung betrachtet werden.
Anmerkung: Mit dem Kolmogorov-Smirnov-Test und dem Anderson-Darling-Test können auch andere Verteilungen als die Normalverteilung getestet werden.
Nachteil der analytischen Tests auf Normalverteilung
Leider hat die analytische Methode einen großen Nachteil, weshalb immer mehr zu grafischen Methoden übergegangen wird.
Das Problem ist, dass der berechnete p-Wert von der Größe der Stichprobe beeinflusst wird. Wenn du eine sehr kleine Stichprobe hast, kann es daher sein, dass dein p-Wert weit größer als 0,05 ist, wenn du aber eine sehr große Stichprobe aus der gleichen Grundgesamtheit hast, kann es sein, dass dein p-Wert kleiner als 0,05 ist.
Angenommen, die Verteilung in der Grundgesamtheit weicht nur geringfügig von der Normalverteilung ab, dann erhält man bei einer sehr kleinen Stichprobe einen sehr großen p-Wert und geht daher von normalverteilten Daten aus. Nimmt man jedoch eine größere Stichprobe, dann wird der p-Wert immer kleiner, obwohl die Stichproben aus derselben Grundgesamtheit mit derselben Verteilung stammen. Mit einer sehr großen Stichprobe kann man sogar einen p-Wert von weniger als 0,05 erhalten und damit die Nullhypothese der Normalverteilung verwerfen.
Um dieses Problem zu umgehen, sollten zusätzlich auch immer grafische Verfahren verwendet werden.
Grafische Prüfung auf Normalverteilung
Um die Normalverteilung grafisch zu überprüfen, kann man sich entweder das Histogramm oder besser noch den Q-Q Plot ansehen.
Wenn du die Normalverteilung mit Hilfe eines Histogramms überprüfen möchtest, zeichne die Normalverteilung in das Histogramm deiner Daten ein und überprüfe, ob die Verteilungskurve der Daten ungefähr der Normalverteilungskurve entspricht.
Besser ist jedoch der so genannte Quantil-Quantil-Plot oder kurz Q-Q-Plot. Hier werden die theoretischen Quantile, die die Daten bei perfekter Normalverteilung haben müssten, den Quantilen der Messwerte gegenübergestellt.
Wenn die Daten perfekt normalverteilt wären, würden alle Punkte auf der Linie liegen. Je weiter die Daten von der Linie abweichen, desto weniger sind die Daten normalverteilt.
Zusätzlich zeigt DATAtab das 95%-Konfidenzintervall an. Wenn alle oder fast alle Daten innerhalb dieses Intervalls liegen, ist dies ein sehr starker Hinweis darauf, dass die Daten normalverteilt sind. Nicht normalverteilt sind sie z. B., wenn sie einen Bogen bilden und in einigen Bereichen weit von der Linie entfernt liegen.
Normalverteilung in DATAtab prüfen
Wenn du deine Daten auf Normalverteilung prüfen möchtest, kopiere sie deine Daten einfach in die Tabelle von DATAtab, klicke dann auf deskriptive Statistik und wähle die Variable aus, die du auf Normalverteilung prüfen möchtest. Anschließend, klickst du auf „Normalverteilung prüfen“ und du bekommst die Ergebnisse.
Wie sehen die Ergebnisse aus? Zuerst bekommst du die analytischen Testverfahren übersichtlich in einer Tabelle, dann kommen die grafischen Testverfahren.
Wenn du deine Daten auf Normalverteilung prüfen möchtest, kopiere deine Daten einfach in die Tabelle auf DATAtab, klicke auf deskriptive Statistik und wähle dann die Variable aus, die du auf Normalverteilung prüfen möchtest. Anschließend, einfach auf Normalverteilung prüfen klicken und du bekommst die Ergebnisse.
Hinweis: Wenn du einen Hypothesentest mit DATAtab berechnest, dann kannst du bei jedem Hypothesentest die Voraussetzungen prüfen. Handelt es sich zum Beispiel bei der Normalverteilung um eine Voraussetzung, dann bekommst du auch die Prüfung auf Normalverteilung.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.