Wilcoxon-Test
Der Wilcoxon-Test (Wilcoxon-Vorzeichen-Rang-Test) überprüft, ob sich zweie abhängige Stichproben signifikant voneinander unterscheiden. Dazu verwendet der Wilcoxon-Test die Ränge der Gruppen anstelle der Mittelwerte.

Der Wilcoxon-Test ist ein nichtparametrischer Test und unterliegt damit wesentlich geringeren Anforderungen als sein parametrisches Pendant, dem t-Test für abhängige Stichproben.
Sobald also die Anforderungen für den t-Test für abhängige Stichproben nicht mehr erfüllt sind, wird der Wilcoxon-Test verwendet.
Medizinisches Beispiel:
Du möchtest prüfen, ob die Gedächtnisleistung von Betroffenen morgens oder abends besser ist.
Technisches Beispiel:
Ein Keilriemen Produzent hat sehr hohe Stillstands-Zeiten bei seinen fünf Produktionsanlagen. Du sollst nun herausfinden, ob eine neue Systemeinstellung einen Einfluss auf die Stillstands-Zeiten hat.
Voraussetzungen Wilcoxon-Test
Da der Wilcoxon-Test ein nichtparametrischer Test ist, müssen die Daten nicht normalverteilt sein. Um einen Wilcoxon-Test berechnen zu können, müssen jedoch die Stichproben abhängig sein. Abhängige Stichproben liegen z. B. vor, wenn Daten aus Messwiederholung gewonnen worden sind oder wenn es sich um sogenannte natürliche Paare handelt.
- Messwiederholung: Eine Eigenschaft einer Person, z.B. das Gewicht, ist an zwei Zeitpunkten gemessen worden
- Natürliche Paare: Die Werte müssen nicht zwangsläufig von der gleichen Person stammen, aber von Personen, die zusammengehören, z.B. Anwältin/Klient, Ehefrau/Ehemann, Psychologe/Patientin. Natürlich muss es sich auch nicht um Personen handeln.
- Unabhängigkeit: Der Wilcoxon-Vorzeichentest setzt Unabhängigkeit voraus, d. h. die gepaarten Beobachtungen werden zufällig und unabhängig voneinander gezogen.
Des Weiteren sollte die Verteilungsform der Differenzen der beiden abhängigen Stichproben in etwa symmetrisch sein. Liegen die Daten nicht paarweise vor, wird der Mann-Whitney U-Test anstatt des Wilcoxon-Tests verwendet.
Hypothesen beim Wilcoxon-Test
Die Hypothesen beim Wilcoxon-Vorzeichen-Rang-Test sind sehr ähnlich der des abhängigen t-Test. Im Falle des Wilcoxon-Test wird jedoch geprüft, ob es einen Unterschied in der zentralen Tendenz gibt, beim t-Test wird geprüft, ob es einen Unterschied in dem Mittelwert gibt. Damit ergibt sich beim Wilcoxon-Test:
- Nullhypothese: Es gibt keinen Unterschied (in Bezug auf die zentrale Tendenz) der beiden Gruppen in der Grundgesamtheit.
- Alternativhypothese: Es gibt einen Unterschied (in Bezug auf die zentrale Tendenz) der beiden Gruppen in der Grundgesamtheit.
Wilcoxon-Test und Teststärke
Jetzt kann natürlich die Frage kommen, warum verwende ich nicht einfach immer den Wilcoxon Test anstatt dem t-Test für abhängige Stichproben? Dann brauche ich nicht auf Normalverteilung prüfen! Parametrische Tests wie der t-Test sind in der Regel teststärker!
Bei einem parametrischen Test reicht in der Regel ein kleinerer Unterschied oder eine kleinere Stichprobe aus, um die Nullhypothese zu verwerfen. Beides ist natürlich sehr praktisch. Daher, wenn es möglich ist, immer parametrische Tests verwenden!
Wilcoxon-Test berechnen
Um den Wilcoxon-Test für zwei abhängige Stichproben zu berechnen, wird zunächst die Differenz zwischen den abhängigen Werten ermittelt. Nachdem die Differenzen berechnet worden sind, werden aus den Absolutwerten der Differenzen die Rangplätze gebildet. Hierbei ist wichtig, sich das ursprüngliche Vorzeichen der Differenzen zu notieren (Ein Beispiel mit verbundenen Rängen kommt weiter unten).

Im letzten Schritt werden dann jeweils die Summen der Rangplätze gebildet, die aus einer positiven und einer negativen Differenz entstammen. Die Teststatistik W ergibt sich dann aus dem kleineren Wert von T+ und T-.
In diesem Beispiel errechnet sich die Teststatistik W mit 8
Gibt es keinen Unterschied in der Rangsumme, ergibt sich der Erwartungswert mit
In diesem Beispiel ergibt sich der Erwartungswert mit 10,5. Die berechnete Teststatistik muss nun auf Signifikanz geprüft werden.

Ist die Stichprobe genügend groß, also liegt eine Fallzahl von mehr als 20 vor, ist der kritische Wert annähernd normalverteilt. Wenn Normalverteilung angenommen wird, kann der z-Wert mit der oberen Formel berechnet werden. Liegen weniger als 25 Werte vor, wird der kritische T-Wert aus einer Tabelle mit den kritischen T-Werten abgelesen. Daher in diesem Fall würde eigentlich die Tabelle verwendet werden.
Der berechnete z-Wert aus dem Wilcoxon-Test kann nun auf Signifikanz geprüft werden, indem er mit dem kritischen Wert der Standardnormalverteilung verglichen wird.
Verbundene Ränge beim Wilcoxon-Test
Wenn sich mehrere Personen einen Rangplatz teilen, liegen verbundene Ränge vor. In diesem Fall ergibt sich eine Änderung in der Berechnung der Rangsummen und der Standardabweichung des W-Wertes. Beides gehen wir nun wieder an einem Beispiel durch.
In dem Beispiel ist zu sehen, dass es...
- ...drei Personen gibt, die einen Differenzbetrag von zwei haben, diese Personen teilen sich die Ränge 2, 3 und 4.
- ...zwei Personen gibt, die einen Differenzbetrag von 4 haben, diese Personen teilen sich die Ränge 6 und 7.

Um diese verbundenen Ränge zu berücksichtigen, werden jeweils die Mittelwerte der verbundenen Ränge berechnet. Im ersten Fall ergibt sich damit ein "neuer" Rang von 3 und im zweiten Fall ein "neuer" Rang von 6,5. Nun kann man die Rangsummen der positiven und negativen Ränge berechnen.

Da in der oberen Tabelle die Rangbindungen gut ersichtlich sind, wird hier schon mal ein Term berechnet, der für die spätere Berechnung der Steuerung von dem W-Wert bei vorliegen von Rangbindungen benötigt wird.
Nun stehen alle Werte zur verfühgung, um den z-Wert unter Berücksichtungung von verbundenen Rängen zu berechnen.

Wieder mit dem Hinweis, dass man eigentlich ca. 20 Fälle benötig, um Normalverteilung der W-Werte an zu nehmen.
Effektstärke beim Wilcoxon-Vorzeichen-Rang-Test
Die Effektstärke gibt an, wie groß der beobachtete Effekt im Vergleich zum Zufallsrauschen ist. Es gibt verschiedene Maße, um die Effektstärke beim Wilcoxon-Test zu berechnen. Eine gängige Methode ist die Verwendung von r, definiert als:

wobei z der standardisierte Test-Statistik-Wert aus dem Wilcoxon-Test ist und n die Gesamtzahl der Beobachtungen (also die Summe der Größen beider Gruppen) ist.
Der Wert von r kann zwischen -1 und 1 liegen, wobei Werte nahe 0 darauf hinweisen, dass kein Effekt vorhanden ist, und Werte nahe -1 oder 1 auf einen starken Effekt hinweisen. Das Vorzeichen von r gibt die Richtung des Effekts an.
Für die Interpretation der Effektstärke kann die folgende Tabelle verwendet werden (Effektstärke r nach Cohen (1988)).
|r| < 0.1 | kein Effekt / sehr geringer Effekt |
---|---|
|r| = 0.1 | geringer Effekt |
|r| = 0.3 | mittlerer Effekt |
|r| = 0.5 | großer Effekt |
Wilcoxon-Test mit DATAtab berechnen
Ein Wilcoxon-Test kann in wenigen Schritten mit DATAtab berechnet werden. Kopiere hierfür einfach die untenstehende Tabelle oder deine eigenen Daten in den Statistik Rechner und klicke auf Hypothesentests. Anschließend klicke die beiden Variablen an und wähle Nicht-parametrischer Test aus.
Reaktionszeit morgens | Reaktionszeit abends |
---|---|
34 | 45 |
36 | 33 |
41 | 35 |
39 | 43 |
44 | 42 |
37 | 42 |
39 | 43 |
39 | 43 |
45 | 42 |
DATAtab gibt dir dann die folgenden Ergebnisse aus.

Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €

"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €

Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.
