Menu

Regression

Die Regression ist eine statistische Methode, die es ermöglicht Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen zu modellieren.

Eine Regressionsanalyse dient somit dazu, ausgehend von einer oder mehreren Variablen auf eine weitere Variable zu schließen bzw. diese vorherzusagen.

Dich könnte zum Beispiel interessieren, welche Faktoren einen Einfluss auf das Gehalt einer Person haben. Hierfür könntest du z.B. den höchsten Bildungsabschluss, die wöchentliche Arbeitszeit und das Alter einer Person heranziehen.

Regression

In weiterer Folge könntest du nun untersuchen, ob diese drei Variablen einen Einfluss auf das Gehalt einer Person haben. Wenn ja, kannst du das Gehalt einer Person vorhersagen, wenn dir der höchste Bildungsabschluss, die wöchentliche Arbeitszeit und das Alter einer Person bekannt sind.

Was sind abhängige und unabhängige Variablen?

Die Variable, auf die geschlossen werden soll, wird als abhängige Variable (Kriterium) bezeichnet. Die Variablen, welche zur Vorhersage herangezogen werden, heißen unabhängige Variablen (Prädiktoren).

Im oberen Beispiel ist demnach das Gehalt die abhängige Variable und der höchste Bildungsabschluss, die wöchentliche Arbeitszeit und das Alter stellen die unabhängigen Variablen dar.

Wann verwende ich eine Regressionsanalyse?

Mit der Regressionsanalyse können zwei Ziele verfolgt werden: Einerseits kann der Einfluss von einer oder mehreren Variablen auf eine weitere Variable gemessen werden. Andererseits kann die Regression zur Vorhersage einer Variable durch eine oder mehrere andere Variablen verwendet werden.

1) Messung des Einflusses einer oder mehrerer Variablen auf eine weitere Variable

  • Was hat einen Einfluss auf die Konzentrationsfähigkeit von Kindern?
  • Haben das Bildungsniveau der Eltern und der Wohnort einen Einfluss auf das zukünftige Bildungsniveau von Kindern?

2) Vorhersage einer Variable durch eine oder mehrere andere Variablen

  • Wie lange bleibt ein Patient im Krankenhaus?
  • Welches Produkt kauft eine Person am ehesten in einem Online-Shop?

Die Regressionsanalyse gibt Aufschluss darüber, wie sich der Wert der abhängigen Variable ändert, wenn eine der unabhängigen Variablen geändert wird.

Formen der Regressionsanalyse

Regressionsanalysen werden in einfache lineare Regression, multiple lineare Regression und logistische Regression unterteilt. Welche Regressionsanalyse zum Einsatz kommt, ergibt sich einerseits durch die Anzahl der unabhängigen Variablen und andererseits durch das Skalenniveau der abhängigen Variable.

Anzahl
unabhängiger Variablen
Skalenniveau
abhängige Variable
Skalenniveau
unabhängige Variable
Einfache lineare Regression eine metrisch metrisch, ordinal, nominal
Multiple lineare Regression mehrere metrisch metrisch, ordinal, nominal
Logistische Regression mehrere ordinal, nominal metrisch, ordinal, nominal

Möchtest du nur eine Variable zur Vorhersage verwenden, kommt eine einfache Regression zur Anwendung. Ziehst du mehr als eine Variable heran, handelt es sich um eine multiple Regression. Ist die abhängige Variable nominal skaliert muss eine logistische Regression berechnet werden.

Ist die abhängige Variable metrisch skaliert wird eine lineare Regression berechnet. Ob nun eine lineare oder nicht-lineare Regression berechnet wird, hängt davon ab, ob ein linearer Zusammenhang zwischen den unabhängigen Variablen und der abhängige Variable besteht oder nicht.

Unabhängige Variable der Regression

Egal welche Regression berechnet wird, das Skalenniveau der unabhängigen Variablen kann jegliche Form annehmen (metrisch, ordinal und nominal). Liegt jedoch eine ordinale oder nominale Variable mit mehr als zwei Ausprägungen vor, müssen sogenannte Dummy-Variablen gebildet werden.

Beispiele für die Regression:

Einfache Lineare Regression

Hat die wöchentliche Arbeitszeit einen Einfluss auf den Stundenlohn von Angestellten?

Multiple Lineare Regression

Haben die wöchentliche Arbeitszeit und das Alter von Angestellten einen Einfluss auf deren Stundenlohn?

Logistische Regression

Haben die wöchentliche Arbeitszeit und das Alter von Erwerbstätigen einen Einfluss auf die Wahrscheinlichkeit, dass sie Burnout gefährdet sind?

  • Abhängige Variable
  • Unabhängige Variablen
Regressionsanalyse

Korrelation und Kausalität bei der Regressionsanalyse

Im Falle der linearen Regression kann mit Hilfe der der unabhängigen Variable auf die abhängige Variable vorhergesagt werden, wenn es eine Korrelation zwischen den beiden Variablen gibt. Was aber unbedingt beachtet werden muss, ist, dass eine Korrelation zwischen zwei Variablen nicht zwangsläufig Kausalität bedeutet. Was heißt das nun? Wenn hohe Werte der einen Variable mit hohen Werten der anderen Variable einhergehen, bedeutet das nicht, dass die Werte auf der einen Variable ansteigen, weil die Werte auf der anderen Variable ansteigen.

Wie berechne ich eine Regression?

Du möchtest eine Regressionsanalyse berechnen? Dafür sind nur drei einfache Schritte notwendig:

  • 1. Kopiere deine Daten in die Tabelle des Statistik Rechners
  • 2. Wähle den Bereich der Regression aus
  • 3. Wähle eine abhängige Variable und eine oder mehrere unabhängige Variablen aus

Liegt bei einer der unabhängigen Variablen kategorisches Skalenniveau (ordinal oder nominal) vor, werden automatisch Dummy-Variablen erzeugt und eine Referenzkategorie wird definiert. Sobald eine Variable nur Zahlen enthält, erkennt der Statistik-Rechner von DATAtab automatisch, dass es sich um eine metrische Variable handelt.


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 260 Seiten
  • 3. überarbeitete Auflage (Januar 2023)
  • Nur 6,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 59 Seiten
  • 2. überarbeitete Auflage (Januar 2023)
  • Nur 3,49 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2023). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz