Log Rank Test
Was ist der Log Rank Test? Der Log Rank Test wird in der Überlebenszeitanalyse verwendet und vergleicht die Verteilung der Zeit bis ein Event Eintritt von zwei oder mehr unabhängigen Stichproben.

Nun besprechen wir die einzelnen Punkte Schritt für Schritt. Was heißt "Verteilung", was bedeutet „Zeit bis ein Event eintritt“ und was wird unter zwei oder mehr unabhängigen Stichproben verstanden? Starten wir beim letzten Punkt, beim Thema zwei oder mehr unabhängigen Stichproben.
Log Rank Test Beispiel
Mit dem Log Rank Test kannst du prüfen, ob es einen Unterschied zwischen zwei oder mehr unterschiedlichen Gruppen gibt.

Zum Beispiel könnte dich interessieren, ob es einen Unterschied zwischen zwei verschiedenen Materialien gibt, die für eine Zahnfüllung verwendet werden.
Die nächste Frage ist nun, in Bezug worauf es einen Unterschied gibt? Der Log Rank Test prüft, ob es einen Unterschied in der Zeit gibt, bis ein Event eintritt.
Was bedeutet nun „Zeit, bis ein Event eintritt“? Bei dem Log Rank Test wird eine Variable betrachtet, die einen Startzeitpunkt hat und einen Endzeitpunkt, wenn ein gewisses Event eintritt.

Die Zeit zwischen dem Startzeitpunkt und dem Event wird bei dem Log Rank Test betrachtet. Diese kann dabei beispielsweise in Tagen, Wochen oder Monaten gemessen werden.
In unserem Beispiel könnte uns interessieren, ob das Material einen Einfluss darauf hat, nach welcher Zeit die Zahnfüllung wieder herausbricht.
In diesem Beispiel haben wir einen Startpunkt, nämlich den Moment, wo die Füllung eingesetzt wird. Außerdem haben wir einen Endpunkt bzw. ein Event, welches der Zeitpunkt ist, wo die Füllung wieder herausbricht.
Nun interessiert uns die Zeit zwischen Start und dem Ende, also die Zeit zwischen dem Einsetzen der Füllung und dem Ausbrechen der Füllung.

Wie vergleichen wir nun die jeweilige Zeit bis die Füllung bei den Probandinnen und Probanden wieder herausbricht?
Das machen wir mit Hilfe der Kaplan Meier Kurve bzw. mit der Tabelle, die verwendet wird, um diese Grafik zu erstellen. Hierbei werden auf der x-Achse die Zeit und auf der y-Achse die Überlebensrate eingetragen.
Was ist die Überlebensrate? Die Kaplan Meier Kurve sagt uns, wie wahrscheinlich es ist, dass eine Füllung länger als bis zu einem gewissen Zeitpunkt hält.
Sagen wir du möchtest wissen, wie wahrscheinlich es ist, dass eine Füllung länger als 5 Jahre hält. In diesem Fall kannst du in der Kaplan Meier Kurve ablesen, dass es zu 70% wahrscheinlich ist, dass eine Füllung länger als 5 Jahre hält.

Nun möchten wir aber prüfen, ob es einen Unterschied zwischen zwei Materialien gibt, also tragen wir in die Grafik beide Kurven ein.
Die Frage, die der Log Rank Test nun beantwortet ist: Gibt es einen signifikanten Unterschied zwischen den beiden Kurven? Oder anders ausgedrückt: Hat das Füllmaterial einen Einfluss auf die „Überlebenszeit“ der Zahnfüllung?
Hypothesen beim Log Rank Test
Damit können wir nun zur Null- und Alternativhypothese des Log Rank Tests kommen.
- Nullhypothese: Beiden Gruppen haben eine identische Verteilungskurven.
- Alternativhypothese: Beiden Gruppen haben unterschiedliche Verteilungskurven.

Also, wie immer bei einem statistischen Hypothesentest bekommst du auch beim Log Rank Test am Ende einen p-Wert raus.

Die Frage ist nun, ob dieser p-Wert größer ist, als das Signifikanzniveau oder nicht. Das Signifikanzniveau wird in den meisten Fällen mit 0,05 festgelegt.
Ist der berechnete p-Wert größer als 0,05, wird die Nullhypothese beibehalten. Anhand der vorliegenden Daten wird dann davon ausgegangen, dass beide Gruppen die gleiche Verteilungskurve haben.
Ist der p-Wert kleiner als 0,05, wird die Nullhypothese abgelehnt.
Log Rank Test berechnen
Im nächsten Schritt besprechen wir nun die Formeln des Log Rank Tests und wie dieser händisch berechnet wird.
Nehmen wir an, wir haben Gruppe 1 und Gruppe 2 und wir möchten nun prüfen, ob beide Gruppe die gleiche Überlebenszeit-Funktion haben oder nicht.

Hier sehen wir die Zeitpunkte, wann entweder ein Event eingetreten ist oder der jeweilige Fall zensiert wurde. In diesem Fall bedeutet "1" Event eingetreten "0" bedeutet zensiert.
Wenn wir unser vorheriges Beispiel mit den Füllmaterialien betrachten, dann hätten die Gruppen jeweils unterschiedliches Material für die Füllung bekommen. Gehen wir davon aus, dass die Zeit in Jahren gemessen wird, dann wäre bei Gruppe eins die erste Füllung nach zwei Jahren ausgefallen, die zweite Füllung nach 3 Jahren und so weiter und so fort.
Damit wir einen Log Rank Test berechnen können, müssen wir beide Tabellen kombinieren. Hierfür notieren wir uns erst mal alle Zeitpunkte, die in den Gruppen vorkommen.
Das ist einmal 2, 3, 4, 6, 7 und 8. Wichtig ist, dass die Zeitpunkte bei denen lediglich Fälle zensiert wurden nicht in die Tabelle mit aufgenommen werden. Zum Zeitpunkt 5 wurde ein Fall zensiert, sonst kommt 5 aber nicht vor, daher übernehmen wir den Zeitpunkt 5 nicht mit in diese Tabelle.
Ähnlich wie bei der Kaplan Meier Kurve füllen wir in weiterer Folge die Spalten m q und n für jeweils die Gruppe 1 und 2 aus. m sagt uns, bei wie viel Personen genau zu diesem Zeitpunkt ein Event eingetreten ist.
Bei Gruppe 1 ist nach zwei Jahren 1 Füllung ausgebrochen, nach 3 Jahren wieder eine Füllung, zum Zeitpunkt 4 und 6 ist nichts passiert, zum Zeitpunkt 7 sind zwei Füllungen ausgebrochen und zum Zeitpunkt 8 eine.
q sagt uns, zu welchem Zeitpunkt wie viele Fälle zensiert wurden. Hier haben wir nur den Zeitpunkt 5. Da wir, wie schon gesagt, diesen Zeitpunkt nicht mit in die Tabelle übernommen haben, wird dieser Wert dem nächstfrüheren Zeitpunkt zu geordnet, also bei 4, daher steht hier eine 1.
Das gleich können wir nun auch für die zweite Gruppe machen. Aus den nun erzeugten Tabellen können wir uns jetzt die sogenannten erwarteten Werte berechnen. Für die Gruppe 1 geschieht dies mit dieser Formel und für die Gruppe 2 mit dieser Formel.

Schauen wir uns das für den ersten Fall nun genauer an. n1 ist 6 und n2 ist auch 6, daher haben wir 6 durch 6 plus 6 und m1 ist 1 und m2 ist 2 daher haben wir 1 plus 2. Das ergibt dann 1,5. Das wiederholen wir nun für alle Reihen und für beide Gruppen.

Nun brauchen wir noch die beobachteten Werte minus die erwarteten Werte. Hierfür berechnen wir einfach m1 minus e1 bzw. m2 minus e2.

Wir erhalten diese Werte jeweils für die Gruppen.
Nun können wir die sogenannte Log Rank Statistik berechnen. Hierfür können wir entweder die Werte von Gruppe 1 oder von Gruppe 2 verwenden. Jetzt nehmen wir einfach mal die Werte von Gruppe 2.
O2 minus E2 ergibt sich, indem wir diese Werte aufsummieren, das ist 1,15. Was ist aber die Varianz davon? Die Varianz ergibt sich mit dieser Formel.

Also wir berechnen erst mal für jede Reihe diesen Ausdruck hier, das summieren wir dann auf. In unserem Fall erhalten wir 1,78.

Damit können wir nun die Log Rank Statistik berechnen. In unserem Beispiel erhalten wir 0,74.

Die Log Rank Statistik entspricht einem Chi2 Wert. Daher kann der kritische p-Wert über die Chi2 Verteilung ermittelt werden. Die benötigten Freiheitsgrade ergeben sich aus der Anzahl der Gruppen minus 1.

Log Rank Test mit DATAtab berechnen
Nun fragst du dich, wie du den Log Rank Test am einfachsten berechnen kannst? Dies lässt sich am besten online mit DATAtab machen. Die Schritte dafür sind: Du gehst zunächst zu dem (1) Statistik Rechner auf datatab.de und du (2) kopierst deine eigenen Daten in die Tabelle. Anschließend (3) klickst du auf "Plus" und klickst auf den (4) Tab Survival Analysis.
Wir haben hier einmal eine Spalte mit der Zeit, dann eine Spalte, die uns sagt, ob das Event eingetreten ist oder nicht. Hierbei steht 1 für "eingetreten" und 0 für "zensiert". Dann haben wir die Variable Material mit den zwei Materialien A und B.
Je nachdem, was du hier auswählst, werden gleich die passenden Methoden für dich berechnet.
Wenn du nur die Variable Zeit auswählst, wird dir die Kaplan-Meier Survival Kurve ausgegeben mit der zugehörigen Tabelle. Wird keine Variable mit dem Status angegeben, wird davon ausgegangen, dass kein Fall zensiert ist. Ist das nicht der Fall, kannst du einfach noch hier bei "Status" die Variable anklicken, die die Daten enthält, ob das Event eingetreten ist oder nicht.
Wenn nun noch ein Faktor ausgewählt wird, z.B. das Material, wird in diesem Fall der Log-Rank Test berechnet. Du kannst die Null- und die Alternativhypothese ablesen und bekommst die Ergebnisse des Log Rank Tests aufgelistet.

Die Nullhypothese ist: Es gibt keinen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung der Zeit bis das Event eintritt.
Und die Alternativhypothese: Es gibt einen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung der Zeit bis das Event eintritt.
Hier unten kannst du nun die Ergebnisse ablesen und du den siehst den p-Wert für den Log Rank Test.
Wenn du nicht genau weißt, wie dieser interpretiert wird, kannst du einfach auf Zusammenfassung in Worten klicken:
Ein Log-Rank Test wurde berechnet, um herauszufinden, ob es einen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung von der Zeit bis das Event eintritt, gibt.
Für die vorliegenden Daten hat der Log-Rank Test ergeben, dass es einen Unterschied zwischen den Gruppen in Bezug auf die Verteilung von der Zeit bis das Event eintritt gibt, p=<0,001. Die Nullhypothese wird damit abgelehnt.
Dies bedeutet, dass wenn der p-Wert größer als das vorher festgelegte Signifikanzniveau ist, welches in den meisten Fällen bei 5% liegt, die Nullhypothese beibehalten wird, also es dann keinen nennenswerten Unterschied gibt.
Ist der p-Wert kleiner, wird die Nullhypothese verworfen und man geht aufgrund der vorliegenden Daten davon aus, dass es einen Unterschied zwischen den Kurven gibt.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 260 Seiten
- 3. überarbeitete Auflage (Januar 2023)
- Nur 6,99 €

"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 59 Seiten
- 2. überarbeitete Auflage (Januar 2023)
- Nur 3,49 €

Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.
