Menu

Cox Regression (Cox Proportional Hazards Survival Regression)

Beispieldaten laden

Was ist die Cox Proportional Hazards Survival Regression oder kurz Cox Regression? Die Cox Regression wird in der Überlebenszeitanalyse verwendet, um den Einfluss von verschiedenen Variablen auf die Überlebenszeit zu ermitteln.

Bei den unabhängigen Variablen kann es sich um eine Mischung aus kontinuierlichen, binären oder kategorialen Daten handeln. Das Cox-Proportional-Hazards-Modell wird dann verwendet um die Auswirkungen auf das Überleben zu bestimmen.

Mit der Cox-Regression können wir die Auswirkungen mehrerer unabhängiger Variablen auf ein zeitlich bestimmtes Ergebnis ermitteln, um entweder Hypothesen über die unabhängigen Variablen zu testen oder ein Vorhersagemodell zu erstellen.

Überlebenszeitanalyse

Was heißt nun genau Überlebenszeitanalyse? Bei der Überlebensanalyse werden die Überlebenszeiten von Probandinnen und Probanden erfasst und eine Überlebenskurve erstellt. In der Regel liegt bei den Probandinnen und Probanden eine gewisse Krankheit vor.

Aus der Überlebenskurve geht dann hervor, wie viele der untersuchten Personen im Laufe der Zeit am Leben bleiben. Die betrachtete Zeit muss aber nichts mit der “Überlebenszeit” zu tun haben, trotzdem spricht man von der Überlebenszeit und der Überlebenszeitanalyse (engl. Survival Time und Survival Time Analysis)

Verallgemeinert lässt sich sagen: Bei der Überlebenszeitanalyse wird eine Variable betrachtet, die einen Startzeitpunkt hat und einen Endzeitpunkt, wenn ein gewisses Event eintritt.

Überlebenszeitanalyse

Die Zeit zwischen dem Startzeitpunkt und dem Event wird in der Überlebenszeitanalyse betrachtet. Diese kann dabei zum Beispiel in Tagen, Wochen oder Monaten gemessen werden.

Zensierung

Es besteht nun das Problem, dass eine Untersuchung nicht unendlich lange andauern kann. Dies ergibt sich aus begrenzten zeitlichen und finanziellen Ressourcen und aus dem Umstand, dass man die Ergebnisse irgendwann veröffentlichen möchte. Daher weist jede Studie ein Start- und eine End-Datum auf. Gibt es bei einem Fall keinen eindeutigen Zeitpunkt für das Event, spricht man von "Zensierung".

Überlebenszeitanalyse Zensierung

Es wurden mehrere Methoden entwickelt, um diesem Thema gerecht zu werden. Gerne kannst du dir dazu auch das Tutorial zur Kaplan Meier Kurve ansehen.

Cox Regression Beispiel

Kehren wir nun aber zurück zur Cox Regression. Wenn du beispielsweise die Überlebenszeit nach dem Erkennen einer Krankheit analysieren möchtest, interessiert dich oft nicht die Überlebenszeit an sich, sondern was einen Einfluss auf die Überlebenszeit hat.

Wir wollen also wissen, ob die Überlebenszeit von einem oder mehreren Faktoren, den so genannten "Prädiktoren" abhängt.

Für einfache Situationen mit einem einzigen Faktor mit nur zwei Werten wird der Log Rank Test verwendet. Wenn du beispielsweise testen möchtest, ob es einen Unterschied in der Überlebenszeit gibt, wenn zwei verschiedene Medikamente verabreicht werden.

Möchtest du nun aber z.B. auch noch das Alter der Probanden und Probandinnen mit einbeziehen, wird eine spezielle Art der Regression benötigt. Hierbei handelt es sich um die Proportional Hazards Survival Regression.

Diese Regression soll dann in weiterer Folge die Auswirkungen der einzelnen Prädiktoren auf die Form der Überlebenskurve bewerten.

Cox Regression beispiel

In unserem Beispiel haben wir als Prädiktoren (unabhängige Variablen) einerseits das verwendete Medikament und andererseits das Alter der Personen. Wir möchten nun wissen, welchen Einfluss diese Variablen auf die Überlebenszeitkurve haben. Dazu greifen wir auf die Cox Regression zurück.

Die einzelnen Schritte der Cox Regression sehen wir uns nun an einem Beispiel an. Gehen wir davon aus, dass uns die folgenden Daten vorliegen und wir diese auswerten möchten.

Cox Regression berechnen

Jede Reihe beschreibt einen Patienten/eine Patientin mit der entsprechenden Krankheit. Die Zeit gibt an, wann das Event bzw. der Tod eingetreten ist. Natürlich haben wir auch die Information darüber, welches Medikament verwendet wurde und das Alter der Personen.

Cox Regression berechnen

Beispieldaten laden

Im ersten Schritt müssen wir nun die Cox Regression berechnen, das machen wir nun online mit DATAtab, anschließend gehen wir dann durch, wie man die Ergebnisse interpretieren kann. Lade hierzu bitte die Daten.

Wenn du die Cox Proportional Hazards Survival Regression mit deinen eigenen Daten berechnen möchtest, gehe einfach auf den Cox Regression Rechner und kopiere deine Daten in die erscheinende Tabelle, einfach mit "copy und paste" wie in Excel.

Nun klicken wir auf "Survival Analysis". Je nachdem welche Variablen du nun auswählen möchtest, werden dir hier verschiedenen Methoden der Survival Analyse berechnet. Wählst du nur die "Zeit" und den "Status" aus, wird dir die Kaplan Meier Kurve ausgegeben.

Klickst du nun noch das Medikament an, bekommst du den Log Rank Test. Wenn du zusätzlich das Alter auswählst, wird die Cox Regression berechnet.

Cox Regression online Rechner

Cox Regression interpretieren

In der ersten Spalte stehen die Namen der Variablen. Die erste Reihe gibt die Variable Medikament wieder und die zweite Reihe zeigt das Alter der Personen auf.

Cox Regression interpretieren

Die wichtigsten Werte dieser Tabelle sind nun der geschätzte Regressionskoeffizient und der p-Wert. Mithilfe des p-Wertes kannst du ablesen, ob der Regressionskoeffizient signifikant von null abweicht.

Die Nullhypothese ist also, dass in der Grundgesamtheit der Koeffizient null ist. Nehmen wir an, wie üblich, dass das Signifikanzniveau mit 5 % festlegt wird, dann wird die Nullhypothese bei p-Werten kleiner als 5 bzw. 0,05 abgelehnt. Der Koeffizient unterscheidet sich somit signifikant von null.

Im Falle des Medikamentes ist der p-Wert kleiner als 0,05 und es liegt damit ein signifikanter Unterschied von null vor.

Im Falle des Alters erhalten wir einen p-Wert von 0,221, der somit größer ist als 0,05. Daher wird in diesem Fall die Nullhypothese nicht abgelehnt bzw. beibehalten und wir gehen anhand dieser Daten davon aus, dass das Alter keinen signifikanten Einfluss auf die Überlebenskurve hat.

Voraussetzungen für eine Cox-Regression

Proportional-Hazards-Annahme: Die Proportional-Hazards-Annahme ist die zentrale Annahme der Cox-Regression. Sie besagt, dass das Hazard Ratio (das Verhältnis der Hazard Rates zwischen zwei Gruppen) im Laufe der Zeit konstant bleibt. Mit anderen Worten: Es wird angenommen, dass die Wirkung der Prädiktorvariablen auf die Hazard-Funktion im Laufe der Zeit konstant ist.

Unabhängigkeitsannahme: Die Cox-Regression geht davon aus, dass die Überlebenszeiten der einzelnen Personen unabhängig voneinander sind, wenn die Werte der Prädiktorvariablen gegeben sind. Das bedeutet, dass die Überlebenszeit eines Individuums die Überlebenszeit eines anderen Individuums nicht beeinflussen sollte.

Linearitätsannahme: Die Cox-Regression geht davon aus, dass die Beziehung zwischen den Prädiktorvariablen und dem Logarithmus der Hazard Rate linear ist. Diese Annahme impliziert, dass der Effekt eines kontinuierlichen Prädiktors über seinen gesamten Bereich konstant ist.

Keine Multikollinearität: Die Cox-Regression geht davon aus, dass keine perfekte Multikollinearität zwischen den Prädiktorvariablen besteht. Multikollinearität tritt auf, wenn zwei oder mehr Prädiktorvariablen stark korreliert sind, was es schwierig macht, ihre individuellen Auswirkungen auf das Ergebnis zu trennen.

Keine Ausreißer: Die Cox-Regression geht davon aus, dass es keine extremen Ausreißer gibt, die die Ergebnisse erheblich beeinflussen. Ausreißer sind Beobachtungen, die erheblich vom Gesamtmuster der Daten abweichen und die geschätzten Koeffizienten verzerren können.

Keine Effektmodifikation: Die Cox-Regression geht davon aus, dass es keine Effektmodifikation oder Interaktion zwischen den Prädiktorvariablen gibt. Eine Effektmodifikation liegt vor, wenn die Wirkung einer Prädiktorvariable auf das Ergebnis von der Höhe einer anderen Prädiktorvariable abhängt.


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 260 Seiten
  • 3. überarbeitete Auflage (Januar 2023)
  • Nur 6,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 59 Seiten
  • 2. überarbeitete Auflage (Januar 2023)
  • Nur 3,49 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz