Menu

Zweifaktorielle Varianzanalyse ohne Messwiederholung

ANOVA Datensatz laden

Was ist eine zweifaktorielle Varianzanalyse ohne Messwiederholung?

Die zweifaktorielle Varianzanalyse prüft, ob es einen Unterschied zwischen mehr als zwei unabhängigen Stichproben gibt, die auf zwei Variablen bzw. Faktoren aufgeteilt sind.

Zweifaktorielle Varianzanalyse ohne Messwiederholung

Was ist ein Faktor?

Ein Faktor ist zum Beispiel das Geschlecht einer Person mit den Ausprägungen "männlich" und "weiblich", die verwendete Therapieform bei einer Krankheit mit Therapie A, B und C oder die Studienrichtung mit z.B. Medizin, BWL, Psychologie und Mathe.

Was ist ein Faktor?

Im Falle der Varianzanalyse ist ein Faktor also eine kategoriale Variable. Eine Varianzanalyse verwendest du immer dann, wenn du testen möchtest, ob diese Kategorien einen Einfluss auf die sogenannte abhängige Variable haben.

Du könntest zum Beispiel testen, ob das Geschlecht einen Einfluss auf das Gehalt hat, die Therapie einen Einfluss auf den Blutdruck oder ob die Studienrichtung einen Einfluss auf die Studiendauer hat. Das Gehalt, der Blutdruck und die Studiendauer sind dann jeweils die abhängigen Variablen. In all diesen Fällen prüfst du nun, ob der Faktor einen Einfluss auf die abhängige Variable hat.

Da du in diesen Fällen nur einen Faktor hast, würdest du eine einfaktorielle Varianzanalyse verwenden (Außer natürlich beim Geschlecht, dort liegen nur zwei Ausprägungen, daher würden wir hier den t-Test für unabhängige Stichproben verwenden).

Zwei Faktoren

Jetzt kann es passieren, dass du noch einen weitere kategorische Variablen hast, die du auch mit einbeziehen möchtest. Dich könnte interessieren, ob:

  • neben dem Geschlecht auch der höchste Bildungsabschluss eine Einfluss auf das Gehalt hat
  • neben der Therapie auch das Geschlecht einen Einfluss auf den Blutdruck hat
  • neben der Studienrichtung auch noch die besuchte Universität einen Einfluss auf die Studiendauer hat
Ein Faktor vs zwei Faktoren

Nun hättest du in allen drei Fällen nicht einen Faktor, sondern jeweils zwei Faktoren. Und da du nun zwei Faktoren hast, verwendest du die zweifaktorielle Varianzanalyse.

Mithilfe der zweifaktoriellen Varianzanalyse kannst du nun drei Dinge beantworten:

  • Hat Faktor 1 einen Einfluss auf die abhängige Variable?
  • Hat Faktor 2 einen Einfluss auf die abhängige Variable?
  • Gibt es eine Interaktion zwischen Faktor 1 und 2?

Somit haben wir im Falle der einfaktoriellen Varianzanalyse einen Faktor, aus dem wir die Gruppen erstellen. Im Falle der zweifaktoriellen Varianzanalyse ergeben sich die Gruppe durch die Kombination der Ausprägungen der zwei Faktoren.

Einfaktorielle vs Zweifaktorielle ANOVA

Beispiel Zweifaktorielle Varianzanalyse

Hier ist ein Beispieldatensatz für eine zweifaktorielle ANOVA. Nehmen wir an, wir wollen die Auswirkungen der beiden Faktoren "Behandlung" und "Geschlecht" auf die Antwortvariable "Blutdruck" untersuchen.

Datensatz laden

In diesem Beispiel haben wir zwei Stufen des Faktors "Behandlung" (A und B) und zwei Stufen des Faktors "Geschlecht" (männlich und weiblich). Die "Blutdruck"-Messungen werden für jeden Teilnehmer entsprechend seiner Behandlung und seines Geschlechts aufgezeichnet.

Um eine zweifaktorielle ANOVA mit diesem Datensatz durchzuführen, testen wir die Nullhypothese, dass es keine Wechselwirkung zwischen den Faktoren "Behandlung" und "Geschlecht" und keine Haupteffekte der einzelnen Faktoren auf die Antwortvariable "Blutdruck" gibt.

Hypothesen

Mit der zweifaktoriellen Varianzanalyse können drei Aussagen getestet werden. Somit gibt es 3 Nullhypothesen und damit auch 3 Alternativhypothesen.

Nullhypothese H0 Alternativhypothese H1
Es gibt keine signifikanten Unterschiede im Mittelwert zwischen den Gruppen (Faktorstufen) des ersten Faktors. Es gibt einen signifikanten Unterschied im Mittelwert zwischen den Gruppen (Faktorstufen) des ersten Faktors.
Es gibt keine signifikanten Unterschiede im Mittelwert zwischen den Gruppen (Faktorstufen) des zweiten Faktors. Es gibt einen signifikanten Unterschied im Mittelwert zwischen den Gruppen (Faktorstufen) des zweiten Faktors.
Ein Faktor hat keinen Einfluss auf die Wirkung des anderen Faktors. Ein Faktor hat einen Einfluss auf die Wirkung des anderen Faktors.

Voraussetzungen

Damit eine zweifaktorielle Varianzanalyse ohne Messwiederholung berechnet werden kann, müssen folgende Voraussetzungen erfüllt sein:

  • Skalenniveau: Das Skalenniveau der abhängigen Variable sollte metrisch sein, jenes der unabhängigen Variable (Faktoren) nominalskaliert.
  • Unabhängigkeit: Die Messungen sollen unabhängig sein, also der Messwert einer Gruppe soll nicht durch den Messwert einer anderen Gruppe beeinflusst sein. Wäre das der Fall, bräuchten wir eine Varianzanalyse mit Messwiederholungen.
  • Homogenität: Die Varianzen in jeder Gruppe sollten in etwa gleich sein. Dies kann mit dem Levene-Test überprüft werden.
  • Normalverteilung: Die Daten innerhalb der Gruppen sollten normalverteilt sein.

Dies bedeutet, dass die abhängige Variable zum Beispiel das Gehalt, der Blutdruck oder die Studiendauer sein könnte. Das sind alles metrische Variablen. Darüber hinaus sollte die unabhängige Variable nominal oder ordinal skaliert sein. Dies ist zum Beispiel beim Geschlecht, dem höchsten Bildungsabschluss oder einer Therapieform der Fall. Zu beachten ist dabei, dass die Rangfolge bei ordinalen Variablen jedoch nicht verwendet wird und diese Information damit verloren geht.

Zweifaktorielle Varianzanalyse berechnen

Um eine zweifaktorielle Varianzanalyse zu berechnen, werden die folgenden Formeln benötigt. Dies schauen wir uns an einem Beispiel an.

Zweifaktorielle Varianzanalyse Formel

Nehmen wir an, du bist in der Marketingabteilung einer Bank tätig und möchtest herausfinden, ob das Geschlecht und die Tatsache, dass eine Person studiert hat oder nicht einen Einfluss auf deren Einstellung zur Altersvorsorge haben.

In diesem Beispiel sind deine beiden unabhängigen Variablen (Faktoren) das Geschlecht (männlich oder weiblich) und das Studium (ja oder nein). Deine abhängige Variable ist die Einstellung zur Altersvorsorge, wobei 1 "nicht wichtig" bedeutet und 10 "sehr wichtig".

Zweifaktorielle ANOVA Beispieldaten

Ist denn Einstellung zur Altersvorsorge wirklich eine metrische Variable? Gehen wir einfach mal davon aus, dass die Einstellung zur Altersvorsorge über eine Likert Skala gemessen wurde und wir damit die resultierende Variable als metrisch ansehen.

Mittelwerte

Im ersten Schritt berechnen wir die Mittelwerte der einzelnen Gruppen, also von männlich und nicht studiert, das ist 5,8 dann von männlich und studiert, das ist 5,4, das Gleiche machen wir nun für weiblich.

Dann berechnen wir uns jeweils den Mittelwert von allen männlichen und weiblichen Personen und von Nicht studiert und studiert. Zum Schluss berechnen wir noch den Gesamtmittelwert mit 5,4.

Quadratsummen

Damit können nun die benötigten Quadratsummen berechnet werden. QStot ergibt sich aus der Quadratsumme von jedem einzelnen Wert minus dem Gesamtmittelwert.

Zweifaktorielle Varianzanalyse Quadratsumme

QSzw ergibt sich aus der Quadratsumme der Gruppenmittelwerte minus dem Gesamtmittelwert multipliziert mit der Anzahl der Werte in den Gruppen.

Die Quadratsummen der Faktoren QSA und QSB ergeben sich aus der Quadratsumme von den Mittelwerten der Faktorstufen minus dem Gesamtmittelwert.

Nun können wir noch die Quadratsumme für die Wechselwirkung berechnen. Diese ergeben sich, in dem QSzw minus QSA minus QSB berechnet wird.

Zum Schluss wird noch die Quadratsumme des Fehlers ausgerechnet. Dieses wird ähnlich wie die Gesamtquadratsumme berechnen, also wir verwenden wieder jeden einzelnen Wert. Nur ziehen wir in diesem Fall nicht von jedem Wert den Gesamtmittelwert ab, sondern wir ziehen von jedem Wert den jeweiligen Gruppenmittelwert ab.

Freiheitsgrade

Die benötigten Freiheitsgrade ergeben isch folgendermaßen:

2 faktorielle Varianzanalyse Freiheitsgrade

Mittlere Quadrate bzw. Varianz

Zusammen mit den Quadratsummen und den Freiheitsgraden kann nun die Varianz berechnet werden:

Zweifaktorielle Varianzanalyse Varianz

F-Wert

Und nun können wir die F Werte berechnen. Die ergeben sich, in dem die Varianz von Faktor A, Faktor B oder der Wechselwirkung AB jeweils durch die Fehler Varianz geteilt wird.

Zweifaktorielle Varianzanalyse F-Wert

p-Wert

Für die Berechnung des p-Wertes wird der F-Wert, die Freiheitsgrade und die F-Verteilung benötigt. Wir verwenden den F-Verteilung p-Wert Rechner auf DATAtab. Natürlich kannst du das Beispiel auch einfach komplett mit DATAtab berechnen, dazu im nächsten Abschnitt mehr.

Zweifaktorielle ANOVA p-Wert und kritischer F-Wert

Damit erhalten wir für den Faktor A einen p-Wert von 0,323, für Faktor B einen p-Wert von 0,686 und für die Wechselwirkung einen p-Wert von 0,55. Keiner dieser p-Werte ist kleiner als 0,05 und damit behalten wir die jeweiligen Nullhypothesen bei.

Zweifaktorielle ANOVA mit DATAtab berechnen

Rechne das Beispiel direkt mit DATAtab kostenlos nach:

ANOVA Datensatz laden

Wir nehmen das gleiche Beispiel von oben. Die Daten sind nun in der Form angeordnet, damit deine Statistik Software damit was anfangen kann. In jeder Reihe ist ein befragte Person.

Einstellung zur Altersvorsorge Studium Geschlecht
6 nein männlich
4 nein männlich
5 nein weiblich
... ... ...
5 ja weiblich
9 ja weiblich
2 ja weiblich
3 ja weiblich

Hinweis: Dieses Beispiel besteht nur aus 20 Fällen, das ist natürlich nicht viel, wodurch wir eine sehr geringe Teststärke haben, als Beispiel ist es aber ausreichend.

Um eine zweifaktorielle Varianzanalyse online zu berechnen, besuche einfach datatab.de und kopiere deine eigenen Daten in diese Tabelle.

Anschließend klicke auf "Hypothesentest". Unter diesen Tab findest du viele verschiedene Hypothesentests. Je nachdem, welche Variablen du auswählst, bekommst du einen passenden Hypothesentest vorgeschlagen.

Zwei faktorielle ANOVA mit DATAtab berechnen

Wenn du in die Tabelle deine Daten kopierst, tauchen die Variablen unter der Tabelle auf. Sollte nicht automatisch das richtige Skalenniveau erkannt werden, kannst du es in der ersten Zeile der Tabelle ändern.

In unserem Beispiel möchtn wir wissen, ob das Geschlecht und ob eine Person studiert hat oder nicht einen Einfluss auf die Einstellung zur Altersvorsorge haben. Also klicken wir in diesem Fall einfach alle drei Variablen an.

DATAtab berechnet nun automatisch eine zweifaktorielle Varianzanalyse ohne Messwiederholung. Außerdem gibt dir DATAtab gibt die drei Null- und die drei Alternativhypothesen aus, anschließend die deskriptiven Statistiken und den Levene Test der Varianzgleichheit. Mit dem Levene Test kannst du prüfen, ob die Varianzen innerhalb der Gruppen gleich sind. Der p-Wert ist größer als 0,05, daher gehen wir bei diesen Daten von Varianzgleichheit in den Gruppen aus.

Zwei faktorielle ANOVA Ergebnisse

Als nächstes erhältst du die Ergebnisse der zweifaktoriellen ANOVA.

Zwei faktorielle ANOVA interpretieren

Zweifaktorielle ANOVA interpretieren

Am wichtigsten in der oberen Tabelle sind die drei gekennzeichneten Reihen. Mit diesen drei Reihen kannst du prüfen, ob die 3 Nullhypothesen, die wir vorher aufgestellt haben, beibehalten oder verworfen werden.

Die erste Reihe prüft du Nullhypothese, ob die Variable Studium (studiert oder nicht studiert) einen Einfluss auf die Einstellung zur Altersvorsorge hat. Die zweite Reihe prüft, ob das Geschlecht einen Einfluss auf die Einstellung zur Altersvorsorge hat. Schließlich prüft die dritte Reihe die Wechselwirkung zwischen studiert/nicht studiert und Geschlecht.

Den p-Wert kannst du jeweils in der letzten Spalte ablesen. Nehmen wir an, wir haben das Signifikanzniveau mit 5% festgelegt. Wenn unser berechneter p-Wert kleiner als 0,05 ist, wird die Nullhypothese abgelehnt. Wenn der berechnete p-Wert größer als 0,05 ist, wird die Nullhypothese beibehalten.

Damit sehen wir in diesem Fall, dass alle drei p-Werte größer als 0,05 sind und wir damit keine der drei Nullhypothesen ablehnen können bzw. alle drei beibehalten werden.

Dies bedeutet, dass weder ob man studiert hat oder nicht noch das Geschlecht einen signifikanten Einfluss auf die Einstellung zur Altersvorsorge haben. Darüber hinaus gibt auch keine signifikante Wechselwirkung zwischen den Variablen studiert/nicht studiert und Geschlecht in Bezug auf die Einstellung zur Altersvorsorge.

Falls du nicht genau weißt, wie man die Ergebnisse interpretieren kann, kannst du auch einfach auf Zusammenfassung in Worten klicken. Außerdem ist vorab noch wichtig zu prüfen, ob die Voraussetzungen für die Varianzanalyse überhaupt erfüllt sind.

Interaktionseffekt

Was bedeutet nun aber genau Wechselwirkung bzw. Interaktion? Hierfür schauen wir uns zunächst dieses Diagramm an.

Wechselwirkung

Auf der y-Achse ist die abhängige Variable aufgetragen, in unserem Beispiel die Einstellung zur Altersvorsorge. Auf der x-Achse ist einer der beiden Faktoren aufgetragen, wir nehmen hier einfach mal das Geschlecht. Der andere Faktor wird durch Linien mit unterschiedlichen Farben dargestellt. Grün ist studiert und rot ist nicht studiert.

Die Endpunkte der Linien sind jeweils die Mittelwerte der Gruppen, also z.b. von männlich und nicht studiert.

In diesem Diagramm kann man sehen, dass sowohl das Geschlecht als auch die Variable, ob man studiert hat oder nicht einen Einfluss auf die Einstellung zur Altersvorsorge haben. Weibliche Personen haben einen höheren Wert als männliche Personen und Personen, die studiert haben, haben einen höheren Wert, als jene, die nicht studiert haben.

Nun kommen wir zu den Interaktionseffekten, dafür vergleichen wir diese beiden Diagramme.

Interaktionseffekt

Im ersten Fall haben wir gesagt, es gibt keinen Interaktionseffekt. Wenn eine Person studiert hat, hat sie einen Wert, der sagen wir um 1,5 höher ist als eine Person, die nicht studiert hat.

Diese Erhöhung von 1,5 ist unabhängig davon, ob die Person männlich oder weiblich ist.

Anders ist es im zweiten Fall, hier haben studierte Personen zwar auch einen höheren Wert, aber wie viel höher der Wert ist, hängt davon ab, ob man männlich oder weiblich ist. Wenn ich männlich bin, gibt es einen Unterschied von, sagen wir z.B. 0,5 und wenn ich weiblich bin, gibt es einen Unterschied von 3,5.

In diesem Fall haben wir also ganz klar eine Interaktion zwischen Geschlecht und Studium, da die beiden Variablen sich gegenseitig beeinflussen. Es macht einen Unterschied, wie stark der Einfluss des Studiums ist, je nachdem, ob ich männlich oder weiblich bin.

In diesem Fall haben wir zwar einen Interaktionseffekt, aber die Richtung bleibt immer noch gleich. Also weibliche Personen haben höhere Werte als männliche Personen und Personen mit Studium haben höhere Werte, als Personen ohne Studium.

Man könnte natürlich auch folgendes Ergebnis erhalten. Im unteren linken Diagramm hätte das Studium bei den Männern überhaupt keinen Einfluss und nur bei den Frauen hätte das Studium einen Einfluss. Der Mittelwert ist also bei den Männern genau gleich, egal ob sie studiert haben oder nicht.

Interaktionseffekt ANOVA

Im rechten Diagramm würde sich sogar ein höherer Wert für Männer mit Studium und ein höherer Wert für Frauen ohne Studium ergeben.


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 260 Seiten
  • 3. überarbeitete Auflage (Januar 2023)
  • Nur 6,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 59 Seiten
  • 2. überarbeitete Auflage (Januar 2023)
  • Nur 3,49 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz