Menu

Log Rank Test

Beispieldaten laden

Was ist der Log Rank Test? Der Log Rank Test wird in der Überlebenszeitanalyse verwendet und vergleicht die Verteilung der Zeit bis ein Event Eintritt von zwei oder mehr unabhängigen Stichproben.

Log Rank Test

Was heißt "Verteilung", was bedeutet „Zeit bis ein Event eintritt“ und was wird unter zwei oder mehr unabhängigen Stichproben verstanden? Starten wir beim letzten Punkt, beim Thema zwei oder mehr unabhängigen Stichproben.

Log Rank Test Beispiel

Mit dem Log Rank Test kannst du prüfen, ob es einen Unterschied zwischen zwei oder mehr unterschiedlichen Gruppen gibt.

Vergleich von zwei Gruppen beim Log Rank Test

Zum Beispiel könnte dich interessieren, ob es einen Unterschied zwischen zwei verschiedenen Materialien gibt, die für eine Zahnfüllung verwendet werden.

Die nächste Frage lautet: Worin besteht der Unterschied? Der Log-Rank-Test prüft, ob es einen Unterschied in der Zeit bis zum Eintreten eines Events gibt.

Was bedeutet nun „Zeit, bis ein Event eintritt“? Der Log Rank Test betrachtet eine Variable, die einen Startzeitpunkt hat und wenn ein gewisses Event eintritt einen Endzeitpunkt.

Überlebenszeit Log Rank Test

Die Zeit zwischen dem Startzeitpunkt und dem Event wird bei dem Log Rank Test betrachtet. Diese kann dabei beispielsweise in Tagen, Wochen oder Monaten gemessen werden.

In unserem Beispiel könnte uns interessieren, ob das Material einen Einfluss darauf hat, nach welcher Zeit die Zahnfüllung wieder herausbricht.

In diesem Beispiel haben wir einen Startpunkt, nämlich den Moment, wo die Füllung eingesetzt wird. Außerdem haben wir einen Endpunkt bzw. ein Event, welches der Zeitpunkt ist, an dem die Füllung wieder herausbricht.

Nun interessiert uns die Zeit zwischen Start und dem Ende, also die Zeit zwischen dem Einsetzen der Füllung und dem Herausbrechen der Füllung.

Beispiel Log Rank Test

Wie vergleichen wir nun die jeweilige Zeit bis die Füllung bei den Probandinnen und Probanden wieder herausbricht?

Das machen wir mit Hilfe der Kaplan Meier Kurve bzw. mit der Tabelle, die verwendet wird, um diese Grafik zu erstellen. Hierbei werden auf der x-Achse die Zeit und auf der y-Achse die Überlebensrate eingetragen.

Was ist die Überlebensrate? Die Kaplan Meier Kurve sagt uns, wie wahrscheinlich es ist, dass eine Füllung länger als bis zu einem gewissen Zeitpunkt hält.

Angenommen, wir möchtest wissen, wie wahrscheinlich es ist, dass eine Füllung länger als 5 Jahre hält. In diesem Fall kannst du aus der Kaplan Meier Kurve ablesen, dass eine Füllung mit einer Wahrscheinlichkeit von 70% länger als 5 Jahre hält.

Kaplan Meier Überlebenszeitkurven

Nun möchten wir aber prüfen, ob es einen Unterschied zwischen zwei Materialien gibt, also tragen wir beide Kurven in das Diagramm ein.

Die Frage, die der Log Rank Test nun beantwortet ist: Gibt es einen signifikanten Unterschied zwischen den beiden Kurven? Oder anders ausgedrückt: Hat das Füllungsmaterial einen Einfluss auf die „Überlebenszeit“ der Zahnfüllung?

Hypothesen beim Log Rank Test

Damit können wir nun zur Null- und Alternativhypothese des Log Rank Tests kommen.

  • Nullhypothese: Beiden Gruppen haben eine identische Verteilungskurven.
  • Alternativhypothese: Beiden Gruppen haben unterschiedliche Verteilungskurven.
Log Rank Test Hypothesen

Also, wie immer bei einem statistischen Hypothesentest bekommst du auch beim Log Rank Test am Ende einen p-Wert raus.

Log Rank Test Nullhypothese und Alternativhypothese

Die Frage ist nun, ob dieser p-Wert größer ist, als das Signifikanzniveau oder nicht. Das Signifikanzniveau wird in den meisten Fällen mit 0,05 festgelegt.

Ist der berechnete p-Wert größer als 0,05, wird die Nullhypothese beibehalten. Anhand der vorliegenden Daten wird dann davon ausgegangen, dass beide Gruppen die gleiche Verteilungskurve haben. Ist der p-Wert kleiner als 0,05, wird die Nullhypothese abgelehnt.

Voraussetzungen für den Log-Rank-Test

Die Voraussetzungen für den Log-Rank-Test sind wie folgt:

Unabhängigkeit: Die Überlebenszeiten oder Ereigniszeiten der Individuen in jeder Gruppe sollten unabhängig voneinander sein. Diese Annahme bedeutet, dass das Eintreten eines Ereignisses (z. B. Tod oder Misserfolg) bei einer Person keinen Einfluss auf das Eintreten eines Ereignisses bei einer anderen Person haben sollte.

Non-Informative Censoring: Die Zensierung sollte weder mit dem untersuchten Ereignis noch mit der Gruppenzuordnung zusammenhängen (zensierte und nicht zensierte Patienten unterscheiden sich nicht bezüglich ihrer tatsächlichen Ereigniszeiten). Der Log-Rank-Test geht davon aus, dass die Wahrscheinlichkeit einer Zensierung für alle Personen innerhalb jeder Gruppe gleich ist. Mit anderen Worten: Die Zensierung sollte weder mit dem untersuchten Ereignis noch mit der Gruppenzuordnung zusammenhängen.

Die Überlebenswahrscheinlichkeiten ändern sich im Laufe der Zeit nicht: Die Ausfallrate (das Risiko, dass ein Ereignis eintritt) für die verglichenen Gruppen sollten im Laufe der Zeit konstant sein. Das Verhältnis der Hazardraten sollte konstant bleiben, was darauf hindeutet, dass die Gruppen zu verschiedenen Zeitpunkten keine signifikant unterschiedlichen Risiken aufweisen.

Log Rank Test berechnen

Nehmen wir an, wir haben Gruppe 1 und Gruppe 2 und wir möchten nun prüfen, ob beide Gruppe die gleiche Überlebenszeit-Funktion haben oder nicht.

Log Rank Test berechnen

In der oberen Tabelle sehen wir die Zeitpunkte, wann entweder ein Event eingetreten ist oder der jeweilige Fall zensiert wurde. In diesem Fall bedeutet "1" Event eingetreten "0" bedeutet zensiert.

Wenn wir unser vorheriges Beispiel mit den Verfüllmaterialien betrachten, dann hätte jede Gruppe ein anderes Verfüllmaterial erhalten. Geht man davon aus, dass die Zeit in Jahren gemessen wird, so wäre bei Gruppe 1 die erste Füllung nach 2 Jahren, die zweite Füllung nach 3 Jahren usw. ausgefallen.

Um einen Log-Rank-Test berechnen zu können, müssen wir die Tabellen der beiden Gruppen kombinieren. Dazu werden zunächst alle in den Gruppen vorkommenden Zeitpunkte notiert.

Das ist 2, 3, 4, 6, 7 und 8. Wichtig ist, dass die Zeitpunkte bei denen lediglich Fälle zensiert wurden nicht in die Tabelle mit aufgenommen werden. Zum Zeitpunkt 5 wurde ein Fall zensiert, sonst kommt 5 aber nicht vor, daher übernehmen wir den Zeitpunkt 5 nicht mit in die Tabelle.

Ähnlich wie bei der Kaplan Meier Kurve füllen wir in weiterer Folge die Spalten m q und n für jeweils die Gruppe 1 und 2 aus. m sagt uns, bei wie viel Personen genau zu diesem Zeitpunkt ein Event eingetreten ist.

Bei Gruppe 1 ist nach zwei Jahren 1 Füllung ausgebrochen, nach 3 Jahren wieder eine Füllung, zum Zeitpunkt 4 und 6 ist nichts passiert, zum Zeitpunkt 7 sind zwei Füllungen ausgebrochen und zum Zeitpunkt 8 eine.

q sagt uns, zu welchem Zeitpunkt wie viele Fälle zensiert wurden. Hier haben wir nur den Zeitpunkt 5. Da wir, wie schon gesagt, diesen Zeitpunkt nicht mit in die Tabelle übernommen haben, wird dieser Wert dem nächstfrüheren Zeitpunkt zu geordnet, also bei 4, daher steht hier eine 1.

Das gleich können wir nun auch für die zweite Gruppe machen. Aus den nun erzeugten Tabellen können wir uns die sogenannten erwarteten Werte berechnen. Für die Gruppe 1 und Gruppe 2 geschieht dies mit diesen Gleichungen:

Log Rank Test Erwartungswert Formel

Schauen wir uns das für die erste Reihe genauer an. n1 ist 6 und n2 ist auch 6, also haben wir 6 durch 6 plus 6 und m1 ist 1 und m2 ist 2 daher haben wir 1 plus 2. Das ergibt dann 1,5. Das wiederholen wir jetzt für alle Reihen und für beide Gruppen.

Log Rank Test Erwartungswert

Nun brauchen wir noch die beobachteten Werte minus die erwarteten Werte. Hierfür berechnen wir einfach m1 minus e1 bzw. m2 minus e2.

Log Rank statistik

Nun können wir die sogenannte Log Rank Statistik berechnen. Hierfür können wir entweder die Werte von Gruppe 1 oder von Gruppe 2 verwenden. wir nehmen einfach mal die Werte von Gruppe 2.

O2 minus E2 ergibt sich, indem wir die Werte in der Spalte "m2 - e2" aufsummieren, das ist 1,15. Was ist aber die Varianz davon? Die Varianz ergibt sich mit dieser Formel.

Log Rank statistik Varianz Formel

Zuerst berechnen wir für jede Zeile den Ausdruck in der Grafik unten und addieren ihn. In unserem Fall erhalten wir 1,78.

Log Rank statistik Varianz berechnen

Damit können wir nun die Log Rank Statistik berechnen. In unserem Beispiel erhalten wir 0,74.

Log Rank statistik Gleichung

Die Log Rank Statistik entspricht einem Chi2 Wert. Daher kann der kritische p-Wert über die Chi2 Verteilung ermittelt werden. Die benötigten Freiheitsgrade ergeben sich aus der Anzahl der Gruppen minus 1.

Log Rank statistik und chi2

Log Rank Test mit DATAtab berechnen

Beispieldaten laden

Nun fragst du dich, wie du den Log Rank Test berechnen kannst? Dies lässt sich am besten online mit DATAtab machen. Die Schritte dafür sind:

  • Du gehst zunächst zu dem Statistik Rechner auf datatab.de.
  • kopierst deine eigenen Daten in die Tabelle.
  • klickst du auf "Plus" und klickst auf den Tab "Survival Analysis".

Wir haben hier einmal eine Spalte mit der Zeit, dann eine Spalte, die uns sagt, ob das Event eingetreten ist oder nicht. Hierbei steht 1 für "eingetreten" und 0 für "zensiert". Dann haben wir die Variable Material mit den zwei Materialien A und B.

Je nachdem, was du hier auswählst, werden gleich die passenden Methoden für dich berechnet. Wenn du nur die Variable Zeit auswählst, wird dir die Kaplan-Meier Survival Kurve ausgegeben mit der zugehörigen Tabelle. Wird keine Variable mit dem Status angegeben, wird davon ausgegangen, dass kein Fall zensiert ist. Ist das nicht der Fall, kannst du einfach noch hier bei "Status" die Variable anklicken, die die Daten enthält, ob das Event eingetreten ist oder nicht.

Wenn nun noch ein Faktor ausgewählt wird, z.B. das Material, wird in diesem Fall der Log-Rank Test berechnet. Du kannst die Null- und die Alternativhypothese ablesen und bekommst die Ergebnisse des Log Rank Tests aufgelistet.

Log-Rank Test online Rechner

Die Nullhypothese ist: Es gibt keinen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung der Zeit bis das Event eintritt.

Und die Alternativhypothese: Es gibt einen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung der Zeit bis das Event eintritt.

Weiter unten kannst du nun die Ergebnisse ablesen und du den siehst den p-Wert für den Log Rank Test.

Wenn du nicht genau weißt, wie dieser interpretiert wird, kannst du einfach auf Zusammenfassung in Worten klicken:

Ein Log-Rank Test wurde berechnet, um herauszufinden, ob es einen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung von der Zeit bis das Event eintritt, gibt.

Für die vorliegenden Daten hat der Log-Rank Test ergeben, dass es einen Unterschied zwischen den Gruppen in Bezug auf die Verteilung von der Zeit bis das Event eintritt gibt, p=<0,001. Die Nullhypothese wird damit abgelehnt.

Dies bedeutet, dass wenn der p-Wert größer als das vorher festgelegte Signifikanzniveau ist, welches in den meisten Fällen bei 5% liegt, die Nullhypothese beibehalten wird, also es dann keinen nennenswerten Unterschied gibt.

Ist der p-Wert kleiner, wird die Nullhypothese verworfen und man geht aufgrund der vorliegenden Daten davon aus, dass es einen Unterschied zwischen den Kurven gibt.


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 260 Seiten
  • 3. überarbeitete Auflage (Januar 2023)
  • Nur 6,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 59 Seiten
  • 2. überarbeitete Auflage (Januar 2023)
  • Nur 3,49 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz