Menu

Überlebenszeitanalyse (Survival Analysis)

Beispieldaten laden

In diesem Tutorial geht es um das Thema Überlebenszeitanalyse (Survival Analysis). Wir starten mit der Frage, was eine Überlebenszeitanalyse ist, kommen dann zu dem wichtigen Punkt was die Zensierung von Daten bedeutet. Danach besprechen wir die Kaplan Meier Kurve, den Log Rank Test und die Cox Regression (mehr dann dazu in den separaten Tutorials).

Was ist eine Überlebenszeitanalyse?

Die Überlebenszeitanalyse ist eine Gruppe von statistischen Methoden, bei denen die untersuchte Variable die Zeit bis zum Eintreten eines Events ist. Was bedeutet „Zeit bis zum Eintreten eines Ereignisses“?

Überlebenszeitanalyse

Bei der Überlebenszeitanalyse wird eine Variable betrachtet, die einen Startzeitpunkt hat und wenn ein gewisses Event eintritt einen Endzeitpunkt. Die Zeit zwischen dem Startzeitpunkt und dem Event steht im Fokus der Überlebenszeitanalyse. In Tagen, Wochen oder Monaten kann die Zeit beispielsweise gemessen werden.

Anwendungsfälle der Überlebenszeitanalyse

Ein Beispiel wäre, die Zeit zwischen einem Drogenentzug und dem Rückfall der jeweiligen Person zu betrachten. Der Startzeitpunkt wäre dann das Ende des Entzugs und das betrachtete Event wäre dann der Rückfall. Dich könnte zum Beispiel interessieren, ob unterschiedliche Therapieformen einen Einfluss auf die Zeit bis zum Rückfall haben.

Überlebenszeitanalyse Therapieformen

Wie der Name „Überlebenszeitanalyse“ schon sagt, gibt es auch ein klassisches Beispiel: Die Zeit bis zum Tod nach einer Krankheit. Hierbei ist der Startzeitpunkt das Erkennen der Krankheit und der Endzeitpunkt der Tod. Von großem Interesse ist dann oft, ob ein gewisses Medikament einen Einfluss auf die Überlebenszeit hat.

Das Event muss natürlich kein negatives Ereignis sein, du könntest beispielsweise auch die Zeit bis zur Rückkehr zur Arbeit nach einem Burn-out betrachten.

Überlebenszeitanalyse Versuchsstand

Außerdem muss der untersuchte Gegenstand auch keine Person sein. Im Ingenieurwesen ist zum Beispiel eine gängige Fragestellung, wie lange ein Bauteil in einem Versuch durchhält, ohne zu versagen. Hier könnte man dann an verschiedenen Parametern drehen und schauen, ob diese einen Einfluss auf die Überlebenszeit des Gegenstandes haben.

Überlebenszeit (Time-to-Event)

Die betrachtete Zeit muss nichts mit der tatsächlichen “Überlebenszeit” zu tun haben, trotzdem spricht man von der Überlebenszeit und der Überlebenszeitanalyse (engl. Survival Time und Survival Time Analysis).

Überlebenszeitanalyse Beispiel

Wie genau wird eine Überlebenszeitanalyse durchgeführt? Dazu ein Beispiel. Angenommen, du bist Zahntechnikerin und möchtest die „Überlebenszeit“ einer Füllung in einem Zahn untersuchen.

Dein Startzeitpunkt ist also der Zeitpunkt, an dem eine Person beim Zahnarzt eine Füllung bekommt. Der Endzeitpunkt, das Ereignis (Event), ist der Moment, in dem die Füllung herausbricht. Dich interessiert nun die Zeit zwischen diesen beiden Ereignissen.

Überlebenszeit

Zunächst benötigst du natürlich ProbandInnen, damit du Daten hast, die du auswerten kannst. Von jedem Probanden/jeder Probandin kannst du dir nun die Zeit notieren, die vergeht, bis die Füllung herausbricht.

Jetzt stellst du dir bestimmt gleich die Frage, was ist, wenn die Zahnfüllung eines Probanden/einer Probandin gar nicht herausbricht? Oder was passiert, wenn eine Person umzieht, die Zahnärztin wechselt und es damit einfach nicht bekannt ist, wann die Füllung herausbricht?

All diese Fälle werden unter dem Begriff "Zensierung" (engl. censoring) zusammengefasst. Nun sehen wir uns an, was darunter genau verstanden wird.

Zensierte Daten

Zunächst einmal ist es wichtig zu bedenken, dass eine Untersuchung nicht unendlich lange dauern kann, sondern sich über einen begrenzten Zeitraum erstreckt. Aus Ressourcengründen (zeitlich, finanziell etc.) und einfach aus dem Umstand, dass man die Ergebnisse irgendwann veröffentlichen möchte, hat jede Studie ein klares Start- und Enddatum.

Überlebenszeitanalyse Zensierung

Wenn innerhalb dieses Zeitraums eine Füllung eingesetzt wird und dann auch innerhalb dieses Zeitraums die Füllung wieder ausbricht und dies auch dokumentiert wird, liegt ein gültiger Fall vor. Das Event ist eingetreten.

Jetzt kann es aber auch sein, dass eine Füllung eingesetzt wird und dann das Ende der Studie erreicht, wird, bevor das Event eintritt. Oder, dass ein Proband/eine Probandin sich entschließt, nicht mehr weiter bei der Studie mitzumachen. In beiden Fällen weißt du dann nicht, wann bzw. ob überhaupt das betrachtete Event eingetreten ist.

Genauso ist es möglich, dass ein anderes Event eintritt, das in der Studie nicht berücksichtigt wurde. So könnte der Patient/die Patientin sterben oder sogar den ganzen Zahn verlieren. In beiden Fällen kann das betrachtete Event, dass die Füllung bricht, nicht mehr eintreten.

Natürlich kann es auch vorkommen, dass die Person nicht bemerkt, dass die Füllung gebrochen ist und dies erst bei der nächsten Routineuntersuchung festgestellt wird.

Insgesamt gibt es also eine ganze Menge an Fällen, wo Daten nicht komplett vorliegen können. Diese Daten werden dann "zensierte Daten" genannt. Wie du mit diesen Daten umgehen kannst, erfährst du im Tutorial zur Kaplan Meier Kurve. Nun schauen wir uns erst mal die bekanntesten Methoden der Überlebenszeitanalyse an.

Methoden der Überlebenszeitanalyse

Die drei gängigsten Methoden der Überlebenszeitanalyse sind (1) die Kaplan Meier Überlebenszeitkurven, (2) der Log Rank Test und (3) die Cox Regression.

Methoden der Überlebenszeitanalyse

Auf alle drei Bereiche gehen wir nun kurz ein und ich zeige dir dann, wie du diese Methoden ganz einfach online mit DATAtab berechnen kannst. Für jede der drei Methoden gibt es ein ausführliches separates Tutorial mit Rechenbeispielen.

Kaplan Meier Überlebenszeitkurven

Mit Hilfe der Kaplan Meier Kurve wird die Überlebensrate bzw. die Überlebensfunktion grafisch dargestellt. Hierbei werden auf der x-Achse die Zeit und auf der y-Achse die Überlebensrate eingetragen.

Was ist die Überlebensrate? An dieser Stelle greifen wir wieder auf das Beispiel mit der Zahnfüllung zurück. Nehmen wir an, wir haben Daten gesammelt, wie lange es dauert, bis eine Füllung ausbricht. In der Kaplan Meier Kurve kannst du nun ablesen, wie wahrscheinlich es ist, dass eine Füllung länger als bis zu einem gewissen Zeitpunkt hält.

Kaplan Meier Überlebenszeitkurven

In diesem Zusammenhang könnte dich zum Beispiel interessieren, wie wahrscheinlich es ist, dass deine Füllung länger als 5 Jahre hält. Hierfür wanderst du einfach auf der x-Achse der Grafik zu 5 Jahren und liest nach, wie hoch die Überlebensrate (y-Achse) ausfällt. Bei 5 Jahren gibt dir die Kaplan Meier Kurve ein Wert von 0,7.

Es ist also zu 70% wahrscheinlich, dass eine Füllung länger als 5 Jahre hält. Die Daten sind natürlich rein fiktiv. Wenn dich interessiert, wie die Kaplan Meier Kurve aus vorhandenen Daten genau erstellt wird, schaue dir gerne mein Video dazu an. Jetzt könnte dich aber interessieren, ob sich diese Kurve für verschiedene Füllmaterialien unterschiedet, also z. B. ob ein Füllmaterial besser ist als ein anderes. Um diese Frage zu beantworten hilft dir der Log Rank Test.

Darüber hinaus wird in Forschungsberichten oft der Median der Überlebenszeit angegeben. Der Median der Überlebenszeit ist die Zeit, die die Hälfte der Probanden überlebt. Dies ist auf der Kaplan-Meier-Kurve zu erkennen, wenn die Kurve unter den Punkt "0,50" auf der y-Achse eintaucht.

Log Rank Test

Der Log Rank Test vergleicht die Verteilung der Zeit bis ein Event auftritt von zwei oder mehr unabhängigen Stichproben. Zum Beispiel könnte dich interessieren, ob es einen Unterschied in der Überlebenszeit zweier verschiedener Materialien gibt. In diesem Beispiel verwendest du bei der Hälfte der Probanden/Probandinnen Material A und bei der anderen Hälfte greifst du bei der Füllung auf Material B zurück.

Der Log Rank Test gibt dir nun eine Antwort auf folgende Frage: Gibt es einen signifikanten Unterschied zwischen den beiden Kurven?

Oder anders ausgedrückt: Hat das Füllmaterial einen Einfluss auf die „Überlebenszeit“ der Füllung?

Log Rank Test

Die Nullhypothese lautet also: Es gibt keine Tendenz, dass eine Gruppe weniger lange überlebt als die andere.

Cox Regression

Was ist, wenn du nun prüfen möchtest, ob es noch weitere Parameter gibt, die die Kurve beeinflussen? Nehmen wir an du möchtest nicht nur wissen, ob das Material einen Einfluss auf die Überlebenszeit hat, sondern auch, ob das Alter der Probanden/Probandinnen diese beeinflusst. Zur Beantwortung dieser Fragestellung ist die Cox Regression die geeignete Methode.

Cox Regression

Überlebenszeitanalyse mit DATAtab berechnen

Beispieldaten laden

Mit DATAtab kannst du ganz einfach online eine Überlebenszeitanalyse berechnen. Dafür gehst du einfach auf den (1) Überlebenszeitanalyse Rechner, (2) kopierst deine eigenen Daten in die Tabelle, und (3) klickst auf "Plus" und dann auf Survival Analysis.

Überlebenszeitanalyse online Rechner

Im oberen Beispiel haben wir einmal eine Spalte mit der "Zeit", dann eine Spalte, die uns sagt, ob das "Event eingetreten" ist oder nicht, der Fall also zensiert ist oder nicht. Hierbei steht 1 für "eingetreten" und 0 für "zensiert". Dann haben wir die Variable "Material" mit den zwei Materialien A und B und wir haben das "Alter". Je nachdem, was du hier anklickst, werden die passenden Methoden berechnet.

Wenn du nur die Variable "Zeit" auswählst, wird dir die Kaplan-Meier Survival Kurve ausgegeben und du bekommst die dazugehörige Überlebenszeit-Tabelle dargestellt. Wird keine Variable mit dem Status angegeben, wird bei der Berechnung davon ausgegangen, dass kein Fall zensiert ist. Ist das nicht der Fall, kannst du einfach noch bei "Status" die Variable anklicken, die jene Informationen darüber enthält, ob das Event eingetreten ist oder nicht.

Kaplan-Meier Kurve online Rechner

Wird nun noch ein weiterer Faktor ausgewählt, z.B. das "Material" wird in dem Fall der Log-Rank Test berechnet. Daraufhin erhältst du die Null- und die Alternativhypothese sowie und den p-Wert für den Long Rank Test.

Log-Rank Test online Rechner

Die Nullhypothese lautet: Es gibt keinen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung der Zeit bis das Event eintritt.

Wenn du im Ergebnisbereich weiter nach unten gehst, findest du den p-Wert. Wenn du nicht genau weißt, wie dieser interpretiert wird, kannst du einfach auf "Zusammenfassung in Worten" klicken:

Ein Log-Rank Test wurde berechnet, um herauszufinden, ob es einen Unterschied zwischen den Gruppen A und B in Bezug auf die Verteilung der Zeit bis das Event eintritt, gibt.

Für die vorliegenden Daten hat der Log-Rank Test ergeben, dass es einen Unterschied zwischen den Gruppen in Bezug auf die Verteilung der Zeit bis das Event eintritt, gibt, p=<0,001. Die Nullhypothese wird damit abgelehnt.

Für den Fall, dass hingegen das "Material" und das "Alter" ausgewählt wurden, wird die Cox Regression berechnet. Dann kannst du ablesen, ob die Faktoren einen signifikanten Einfluss haben oder nicht. Mehr Informationen dazu findest du im Tutorial zur Cox Regression.

Cox Regression online Rechner

Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 321 Seiten
  • 4. überarbeitete Auflage (April 2024)
  • Nur 7,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 61 Seiten
  • 3. überarbeitete Auflage (April 2024)
  • Nur 3,99 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz