Punktbiseriale Korrelation
Die Punktbiseriale Korrelation ist ein Spezialfall der Pearson Korrelation und untersucht den Zusammenhang zwischen einer dichotomen und einer metrischen Variable.
Was ist eine dichotome und was ist eine metrische Variable? Eine dichotome Variable ist eine Variable mit zwei Ausprägungen, zum Beispiel das Geschlecht mit männlich und weiblich oder der Raucherstatus mit raucher und nichtraucher. Eine metrische Variablen ist z.B. das Gewicht einer Person oder das Gehalt einer Person.
Also, wenn wir eine dichotome und eine metrische Variable haben und wissen möchten, ob es einen Zusammenhang gibt, können wir eine Punktbiseriale Korrelation verwenden. Natürlich müssen wir vorher die Voraussetzungen prüfen, dazu aber später mehr.
Punktbiseriale Korrelation berechnen
Wie zu Beginn gesagt, ist die Punktbiseriale Korrelation ein Spezialfall der Pearson Korrelation. Aber wie können wir die Pearson Korrelation berechnen, wenn eine Variable nominal ist? Schauen wir uns das an einem Beispiel an.
Nehmen wir an, wir wollen den Zusammenhang zwischen der Anzahl der Lernstunden für eine Prüfung und dem Prüfungsergebnis (bestanden/nicht bestanden) untersuchen.
Wir haben Daten von 20 Schülerinnnen gesammelt, von denen 12 den Test bestanden und 8 nicht bestanden haben. Wir haben die Anzahl der Stunden festgehalten, die jede Schülerin für die Prüfung gelernt hat.
Um die Punktbiseriale Korrelation zu berechnen, müssen wir zunächst das Prüfungsergebnis in Zahlen umwandeln. Wir können den Schülerinnen, die den Test bestanden haben, den Wert 1 zuweisen und den Schülerinnen, die den Test nicht bestanden haben, den Wert 0.
Nun können wir entweder die Pearson Korrelation von Zeit und Prüfungsergebnis berechnen oder wir verwenden die Gleichung für die Punktbiseriale Korrelation.
Punktbiseriale Korrelation und Pearson Korrelation
Aber egal ob wir die Pearson Korrelation berechnen oder ob wir die Gleichung für die Punktbiseriale Korrelation verwenden. Wir bekommen beide Male das Gleiche raus!
Schauen wir uns das kurz in DATAtab an. Wir haben die Lernstunden, das Testergebnis mit bestanden und nicht bestanden und das Prüfungsergebnis mit null und eins. Das Prüfungsergebnis mit Null und eins, definieren wir als metrisch.
Wenn wir nun auf Korrelation gehen und für diese beiden Variablen die Person Korrelation berechnen, bekommen wir einen Korrelationskoeffizienten von 0,31. Wenn wir die Punktbiseriale Korrelation für Lernstunden und Prüfungsergebnis mit „bestanden“ und „nicht bestanden“ berechnen bekommen wir auch eine Korrelation von 0,31.
Punktbiserialer Korrelationskoeffizient
Genauso wie der Pearson Korrelationskoeffizient r, schwankt der Punktbiseriale Korrelationskoeffizient rpbbp auch zwischen –1 und 1.
Wenn wir einen Koeffizienten zwischen -1 und kleiner 0 haben, besteht eine negative Korrelation, also ein negativer Zusammenhang zwischen den Variablen.
Wenn wir einen Koeffizienten zwischen größer 0 und 1 haben, besteht eine positive Korrelation, also ein positiver Zusammenhang zwischen den beiden Variablen. Wenn das Ergebnis 0 ist, haben wir keine Korrelation.
Hypothesen
Oft wollen wir aber, ausgehend von einer Stichprobe, eine Hypothese über die Grundgesamtheit prüfen. Im Falle der Korrelationsanalyse können wir prüfen, ob der Korrelationskoeffizient signifikant von 0 abweicht.
Die Hypothesen für die Punktbiseriale Korrelation ergeben sich damit zu:
- Nullhypothese: Der Korrelationskoeffizient r = 0 (Es gibt keinen Zusammenhang)
- Alternativhypothese: Der Korrelationskoeffizient r ≠ 0 (Es gibt einen Zusammenhang)
Punktbiseriale Korrelation und der t-Test für unabhängige Stichproben
Wenn wir eine Punktbiseriale Korrelation berechnen, erhalten wir den gleichen p-Wert, wie wenn wir für die gleichen Daten einen t-Test für unabhängige Stichproben berechnen.
Also, egal ob wir mit der Punktbiseriale Korrelation eine Zusammenhangshypothese prüfen, oder mit dem t-Test eine Unterschiedshypothese, wir erhalten den gleichen p-Wert.
Wenn wir in Datatab mit den Daten unter dem Tab "Hypothesentests" einen t-test berechnen, und die Nullhypothese haben: "Es gibt keinen Unterschied zwischen den Gruppen nicht bestanden und bestanden in Bezug auf die Variable Lernstunden", dann bekommen wir einen p-wert von 0,179 heraus.
Und genauso wenn wir unter dem Tab "Korrelation" eine Punktbiseriale Korrelation berechnen und wir die Nullhapythese haben: "Es gibt keinen Zusammenhang zwischen Lernstunden und Prüfungsergebnis", bekommen wir auch einen p-Wert von 0,179 heraus!
In unserem Beispiel ist der p-Wert größer als 0,05, was meistens als Signifikanzniveau verwendet wird, und damit wird die Nullhypothese nicht abgelehnt.
Voraussetzungen für eine Punktbiseriale Korrelation
Bezüglich der Voraussetzungen bei der Punktbiseriale Korrelation müssen wir unterscheiden, ob wir lediglich den Korrelationskoeffizienten berechnen möchten, oder ob wir eine Hypothese prüfen möchten. Um den Korrelationskoeffizienten zu berechnen muss lediglich eine metrische Variable und eine dichotome Variable vorliegen.
Wenn wir jedoch prüfen möchten, ob der Korrelationskoeffizient signifikant von Null abweicht, muss die metrische Variablen zusätzlich normalverteilt sein! Ist das nicht gegeben, können die Teststatistik t bzw. der p-Wert nicht verlässlich interpretiert werden!
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.