Spearman Korrelation - Rangkorrelationskoeffizient
Die Rangkorrelation nach Spearman untersucht den Zusammenhang zwischen zwei Variablen. Dabei ist die Spearman Rangkorrelation das nichtparametrische Gegenstück zur Pearson Korrelation. Bei der Spearman-Korrelation müssen die Daten also nicht normalverteilt sein.

Zwischen beiden Korrelationskoeffizienten gibt es einen wichtigen Unterschied! Die Spearman Korrelation verwendet nicht die Ausgangsdaten, sondern die Rangplätze der Daten, daher auch der Name Rangkorrelation.
Beispiel Spearman Korrelation
Wir haben von 8 Computerspielern die Reaktionszeit gemessen und das Alter abgefragt.

Wenn wir eine Pearson Korrelation verwenden, nehmen wir einfach die beiden Variablen Reaktionszeit und Alter und berechnen den Pearson Korrelationskoeffizienten. Da wir aber die Spearman-Rangkorrelation berechnen wollen, ordnen wir zunächst jeder Person einen Rang für die Reaktionszeit und das Alter zu.

Die Reaktionszeit ist bereits nach der Größe nach sortiert. 12 ist der kleinste Wert, bekommt also Rang 1, 15 ist der zweitkleinste Wert, bekommt also Rang 2 und so weiter. Dasselbe machen wir jetzt mit dem Alter.
Schauen wir uns das einmal in einem Streudiagramm an. Auf der linken Seite sehen wir die Ausgangsdaten von Alter und Reaktionsfähigkeit und auf der rechten Seite die Rangplätze.

Wir haben 8 Personen untersucht und da wir keine Rangbindungen haben, haben wir daher 8 Rangplätze zu vergeben. Durch diese Transformation haben wir nun die Daten gleichmäßiger verteilt.
Um nun die Spearman Korrelation zu berechnen, berechnen wir einfach die Pearson Korrelation der Rangplätze. Also die Spearman Korrelation ist gleich der Pearson Korrelation, nur dass die Rangplätze anstelle der Ausgangswerte verwendet werden.
Wir schauen uns das kurz in DATAtab an. Die verwendeten Daten kannst du hier laden.
Beispieldaten ladenWir haben einmal die Reaktionszeit und das Alter und dann haben wir die gerade erstellten Ränge von der Reaktionszeit und dem Alter.

Nun können wir entweder die Spearman Rankkorrelation von der Reaktionszeit und dem Alter berechnen oder wir können von den Rängen die Pearson Korrelation berechnen. In beiden Fällen bekommen wir eine Korrelation von 0,9 heraus.
Spearman Rangkorrelation und Kendalls Tau
Kendalls Tau ist der Spearman-Korrelation sehr ähnlich. Kendalls Tau sollte jedoch der Spearman-Korrelation vorgezogen werden, wenn nur wenige Daten mit vielen Biegungen vorliegen.
Spearman Korrelation Gleichung
Wenn es keine Rangbindungen gibt, kann zur Berechnung der Spearman Korrelation auch diese Gleichung verwendet werden.

Hierbei ist n die Anzahl der Fälle und d die Differenz der Rangplätze zwischen den beiden Variablen. Für unser Beispiel ergibt sich folgendes:

Die Summe von di2 ist 8 und n, also die Anzahl der Personen, ist auch 8. Wenn wir alles einsetzen, erhalten wir einen Korrelationskoeffizenzten von 0,9.

Spearman Korrelationskoeffizient
Genauso wie der Pearson Korrelationskoeffizient r, schwankt der Spearman Korrelationskoeffizient rs auch zwischen –1 und 1.

Mithilfe des Koeffizienten können wir zwei nun Dinge bestimmen:
- Wie stark der Zusammenhang ist
- und in welche Richtung der Zusammenhang geht.
Die Stärke des Zusammenhangs, kann von einer Tabelle abgelesen werden.
Betrag von r | Stärke der Korrelation |
---|---|
0,0 < 0,1 | keine Korrelation |
0,1 < 0,3 | geringe Korrelation |
0,3 < 0,5 | mittlere Korrelation |
0,5 < 0,7 | hohe Korrelation |
0,7 < 1 | sehr hohe Korrelation |
Bei einem Koeffizienten zwischen -1 und 0 besteht eine negative Korrelation, d.h. ein negativer Zusammenhang zwischen den Variablen. Bei einem Koeffizienten zwischen 0 und 1 besteht eine positive Korrelation, d.h. ein positiver Zusammenhang zwischen den beiden Variablen. Ist der Koeffizient gleich 0, liegt keine Korrelation vor.
Korrelationskoeffizenzten auf Signifikanz prüfen
Oft wollen wir aber, ausgehend von einer Stichprobe, eine Hypothese über die Grundgesamtheit prüfen.

Wir haben den Korrelationskoeffizienten für die Stichprobendaten berechnet. Nun können wir prüfen, ob der Korrelationskoeffizient signifikant von 0 abweicht.
Die Nullhypothese und die Alternativhypothese ergeben sich damit zu:
- Nullhypothese: Der Korrelationskoeffizient r = 0 (Es gibt keinen Zusammenhang.)
- Alternativhypothese: Der Korrelationskoeffizient r ≠ 0 (Es gibt einen Zusammenhang.)
Ob der Korrelationskoeffizient, ausgehend von der erhobenen Stichprobe, signifikant von Null abweicht, kann mit Hilfe eines t-Tests überprüft werden.

Hierbei ist r der Korrelationskoeffizient und n die Stichprobengröße. Aus der Test-Statistik t kann dann ein p-Wert berechnet werden. Ist der p-Wert kleiner als das festgelegte Signifikanzniveau (meistens 5%), dann wird die Nullhypothese verworfen, sonst nicht.
Wenn wir für die Berechnung des Beispiels DATAtab verwenden, erhalten wir einen p-Wert von 0,002.

Der p-Wert ist also kleiner als 0,05 und wir können damit die Nullhypothese, dass in der Grundgesamtheit der Korrelationskoeffizient Null ist verwerfen.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €

"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €

Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.
