Wilcoxon-Test

Der Wilcoxon-Test (Wilcoxon-Vorzeichen-Rang-Test) überprüft, ob sich zweie abhängige Stichproben signifikant voneinander unterscheiden.

Der Wilcoxon-Test ist ein nichtparametrischer Test und unterliegt damit wesentlich geringeren Anforderungen als sein parametrisches Pendant, dem t-Test für abhängige Stichproben.

Sobald also die Anforderungen für den t-Test für abhängige Stichproben nicht mehr erfüllt sind, wird der Wilcoxon-Test verwendet.

Medizinisches Beispiel:

Du möchtest prüfen, ob die Gedächtnisleistung von Betroffenen morgens oder abends besser ist.

Technisches Beispiel:

Ein Keilriemen Produzent hat sehr hohe Stillstands-Zeiten bei seinen fünf Produktionsanlagen. Du sollst nun herausfinden, ob eine neue Systemeinstellung einen Einfluss auf die Stillstands-Zeiten hat.

Voraussetzungen Wilcoxon-Test

Da der Wilcoxon-Test ein nichtparametrischer Test ist, müssen die Daten nicht normalverteilt sein. Um einen Wilcoxon-Test berechnen zu können, müssen jedoch die Stichproben abhängig sein. Abhängige Stichproben liegen z. B. vor, wenn Daten aus Messwiederholung gewonnen worden sind oder wenn es sich um sogenannte natürliche Paare handelt.

Messwiederholung: Eine Eigenschaft einer Person, z.B. das Gewicht, ist an zwei Zeitpunkten gemessen worden
Natürliche Paare: Die Werte müssen nicht zwangsläufig von der gleichen Person stammen, aber von Personen, die zusammengehören, z.B. Anwältin/Klient, Ehefrau/Ehemann, Psychologe/Patientin. Natürlich muss es sich auch nicht um Personen handeln.
Unabhängigkeit: Der Wilcoxon-Vorzeichentest setzt Unabhängigkeit voraus, d. h. die gepaarten Beobachtungen werden zufällig und unabhängig voneinander gezogen.

Des Weiteren sollte die Verteilungsform der Differenzen der beiden abhängigen Stichproben in etwa symmetrisch sein. Liegen die Daten nicht paarweise vor, wird der Mann-Whitney U-Test anstatt des Wilcoxon-Tests verwendet.

Hypothesen beim Wilcoxon-Test

Die Hypothesen beim Wilcoxon-Vorzeichen-Rang-Test sind sehr ähnlich der des abhängigen t-Test. Im Falle des Wilcoxon-Test wird jedoch geprüft, ob es einen Unterschied in der zentralen Tendenz gibt, beim t-Test wird geprüft, ob es einen Unterschied in dem Mittelwert gibt. Damit ergibt sich beim Wilcoxon-Test:

Nullhypothese: Es gibt keinen Unterschied (in Bezug auf die zentrale Tendenz) der beiden Gruppen in der Grundgesamtheit.
Alternativhypothese: Es gibt einen Unterschied (in Bezug auf die zentrale Tendenz) der beiden Gruppen in der Grundgesamtheit.

Wilcoxon-Test und Teststärke

Jetzt kann natürlich die Frage kommen, warum verwende ich nicht einfach immer den Wilcoxon Test anstatt dem t-Test für abhängige Stichproben? Dann brauche ich nicht auf Normalverteilung prüfen! Parametrische Tests wie der t-Test sind in der Regel teststärker!

Bei einem parametrischen Test reicht in der Regel ein kleinerer Unterschied oder eine kleinere Stichprobe aus, um die Nullhypothese zu verwerfen. Beides ist natürlich sehr praktisch. Daher, wenn es möglich ist, immer parametrische Tests verwenden!

Wilcoxon-Test berechnen

Um den Wilcoxon-Test für zwei abhängige Stichproben zu berechnen, wird zunächst die Differenz zwischen den abhängigen Werten ermittelt. Nachdem die Differenzen berechnet worden sind, werden aus den Absolutwerten der Differenzen die Rangplätze gebildet. Hierbei ist wichtig, sich das ursprüngliche Vorzeichen der Differenzen zu notieren (Ein Beispiel mit verbundenen Rängen kommt weiter unten).

Im letzten Schritt werden dann jeweils die Summen der Rangplätze gebildet, die aus einer positiven und einer negativen Differenz entstammen. Die Teststatistik W ergibt sich dann aus dem kleineren Wert von T⁺ und T^-.

In diesem Beispiel errechnet sich die Teststatistik W mit 8

Gibt es keinen Unterschied in der Rangsumme, ergibt sich der Erwartungswert mit

In diesem Beispiel ergibt sich der Erwartungswert mit 10,5. Die berechnete Teststatistik muss nun auf Signifikanz geprüft werden.

Ist die Stichprobe genügend groß, also liegt eine Fallzahl von mehr als 20 vor, ist der kritische Wert annähernd normalverteilt. Wenn Normalverteilung angenommen wird, kann der z-Wert mit der oberen Formel berechnet werden. Liegen weniger als 25 Werte vor, wird der kritische T-Wert aus einer Tabelle mit den kritischen T-Werten abgelesen. Daher in diesem Fall würde eigentlich die Tabelle verwendet werden.

Der berechnete z-Wert aus dem Wilcoxon-Test kann nun auf Signifikanz geprüft werden, indem er mit dem kritischen Wert der Standardnormalverteilung verglichen wird.

Verbundene Ränge beim Wilcoxon-Test

Wenn sich mehrere Personen einen Rangplatz teilen, liegen verbundene Ränge vor. In diesem Fall ergibt sich eine Änderung in der Berechnung der Rangsummen und der Standardabweichung des W-Wertes. Beides gehen wir nun wieder an einem Beispiel durch.

In dem Beispiel ist zu sehen, dass es...

...drei Personen gibt, die einen Differenzbetrag von zwei haben, diese Personen teilen sich die Ränge 2, 3 und 4.
...zwei Personen gibt, die einen Differenzbetrag von 4 haben, diese Personen teilen sich die Ränge 6 und 7.

Um diese verbundenen Ränge zu berücksichtigen, werden jeweils die Mittelwerte der verbundenen Ränge berechnet. Im ersten Fall ergibt sich damit ein "neuer" Rang von 3 und im zweiten Fall ein "neuer" Rang von 6,5. Nun kann man die Rangsummen der positiven und negativen Ränge berechnen.

Wilcoxon-Test berechnung mit Rangbindungen

Da in der oberen Tabelle die Rangbindungen gut ersichtlich sind, wird hier schon mal ein Term berechnet, der für die spätere Berechnung der Steuerung von dem W-Wert bei vorliegen von Rangbindungen benötigt wird.

Nun stehen alle Werte zur verfühgung, um den z-Wert unter Berücksichtungung von verbundenen Rängen zu berechnen.

Wilcoxon-Vorzeichen-Rang-Test bei Rangbindungen

Wieder mit dem Hinweis, dass man eigentlich ca. 20 Fälle benötig, um Normalverteilung der W-Werte an zu nehmen.

Effektstärke beim Wilcoxon-Vorzeichen-Rang-Test

Die Effektstärke gibt an, wie groß der beobachtete Effekt im Vergleich zum Zufallsrauschen ist. Es gibt verschiedene Maße, um die Effektstärke beim Wilcoxon-Test zu berechnen. Eine gängige Methode ist die Verwendung von r, definiert als:

Effektstärke Wilcoxon-Vorzeichen-Rang-Test

wobei z der standardisierte Test-Statistik-Wert aus dem Wilcoxon-Test ist und n die Gesamtzahl der Beobachtungen (also die Summe der Größen beider Gruppen) ist.

Der Wert von r kann zwischen -1 und 1 liegen, wobei Werte nahe 0 darauf hinweisen, dass kein Effekt vorhanden ist, und Werte nahe -1 oder 1 auf einen starken Effekt hinweisen. Das Vorzeichen von r gibt die Richtung des Effekts an.

Für die Interpretation der Effektstärke kann die folgende Tabelle verwendet werden (Effektstärke r nach Cohen (1988)).

\|r\| < 0.1	kein Effekt / sehr geringer Effekt
\|r\| = 0.1	geringer Effekt
\|r\| = 0.3	mittlerer Effekt
\|r\| = 0.5	großer Effekt

Wilcoxon-Test mit DATAtab berechnen

Ein Wilcoxon-Test kann in wenigen Schritten mit DATAtab berechnet werden. Kopiere hierfür einfach die untenstehende Tabelle oder deine eigenen Daten in den Statistik Rechner und klicke auf Hypothesentests. Anschließend klicke die beiden Variablen an und wähle Nicht-parametrischer Test aus.

Reaktionszeit morgens	Reaktionszeit abends
34	45
36	33
41	35
39	43
44	42
37	42
39	43
39	43
45	42

DATAtab gibt dir dann die folgenden Ergebnisse aus.

Statistik leichtgemacht

Viele anschauliche Beispiele
Ideal für Prüfungen und Abschlussarbeiten
Statistik leichtgemacht auf 321 Seiten
4. überarbeitete Auflage (April 2024)
Nur 7,99 €

Leseprobe

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

Viele anschauliche Beispiele
Ideal für die Abschlussarbeit
Fragebogen leichtgemacht auf 61 Seiten
3. überarbeitete Auflage (April 2024)
Nur 3,99 €

Leseprobe

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.

Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.

Zum Buch auf Amazon

Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.

Bortz, J. & Schuster, C.

Zum Buch auf Amazon

Wilcoxon-Test

Medizinisches Beispiel:

Technisches Beispiel:

Voraussetzungen Wilcoxon-Test

Hypothesen beim Wilcoxon-Test

Wilcoxon-Test und Teststärke

Wilcoxon-Test berechnen

Verbundene Ränge beim Wilcoxon-Test

Effektstärke beim Wilcoxon-Vorzeichen-Rang-Test

Wilcoxon-Test mit DATAtab berechnen

Statistik leichtgemacht

Fragebogen leichtgemacht

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Literatur

Statistik: Der Weg zur Datenanalyse.

Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.

Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.

Bortz, J. & Schuster, C.

Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.

Grabinger B.

Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.

Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.

evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich

Balzer, L. & Beywl, W.

Basiswissen Medizinische Statistik.

Weiß, C.

Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.

Doring, N. & Bortz, J.