Menu

Varianzanalyse (ANOVA)

Was ist eine Varianzanalyse?

Eine Varianzanalyse (ANOVA - engl. Analysis of Variance) überprüft, ob statistisch signifikante Unterschiede zwischen mehr als zwei Gruppen vorliegen. Hierfür werden die Mittelwerte der jeweiligen Gruppen miteinander verglichen. Im Gegensatz zum t-Test, der prüft, ob es einen Unterschied zwischen zwei Gruppen gibt, prüft die ANOVA, ob es einen nterschied zwischen mehr als zwei Gruppen gibt.

Es gibt verschiedene Arten der Varianzanalyse, die gängigsten sind die einfaktorielle und zweifaktorielle Varianzanalyse die jeweils entweder mit oder ohne Messwiederholung berechnet werden kann.

In diesem Tutorial erfährst du die Basics zur ANOVA, zu jeder der vier Arten der Varianzanalyse findest du dann jeweils ein separates ausführliches Tutorial:

Varianzanalyse

Tipp: Alle vier Varianten der ANOVA kannst du auf DATAtab ganz einfach online berechnen. Besuche hierfür einfach den ANOVA Rechner.

Warum können nicht einfach mehrere t-Tests berechnet werden?

Die Varianzanalyse wird verwendet, wenn es mehr als zwei Gruppen gibt, die untersucht und verglichen werden sollen. Natürlich wäre es auch eine Möglichkeit, für jede Kombination der Gruppen jeweils einen t-Test zu berechnen. Hier bestünde jedoch das Problem, dass jeder Hypothesentest eine gewisse Irrtumswahrscheinlichkeit hat. Diese wird in der Regel auf 5% gesetzt, sodass rein statistisch jeder 20. Test ein falsches Ergebnis liefert.

Werden nun z.B. 20 Gruppen verglichen, in denen es eigentlich keinen Unterschied gibt, wird rein aufgrund der Stichprobenziehung einer der Tests einen signifikanten Unterschied aufweisen.

Unterschied einfaktorielle und zweifaktorielle ANOVA

Bei der einfaktoriellen Varianzanalyse wird geprüft ob eine unabhängige Variable einen Einfluss auf eine metrische abhängige Variable hat. Dies ist z.B. der Fall, wenn untersucht werden soll, ob der Wohnort (unabhängige Variable) einen Einfluss auf das Gehalt (abhängige Variable) hat. Werden jedoch zwei Faktoren, also zwei unabhängige Variablen betrachtet muss eine zweifaktorielle Varianzanalyse verwendet werden.

Einfaktorielle Varianzanalyse Zweifaktorielle Varianzanalyse
Hat der Wohnort (unabhängige Variable) einer Person Einfluss auf deren Gehalt Hat der Wohnort (1. unabhängige Variable) und das Geschlecht (2. unabhängige Variable) einer Person Einfluss auf dessen Gehalt

Die zweifaktorielle Varianzanalyse prüft ob es einen Unterschied zwischen mehr als zwei unabhängigen Stichproben gibt die auf zwei Variablen bzw. Faktoren aufgeteilt sind.

Faktoren in der Varianzanalyse

Varianzanalyse mit und ohne Messwiederholung

Je nachdem, ob es sich bei der Stichprobe um eine unabhängige oder eine abhängige Stichprobe handelt, wird entweder die Varianzanalyse mit oder ohne Messwiederholungen verwendet. Wurde ein und dieselbe Person zu mehreren Zeitpunkten befragt, handelt es sich um eine abhängige Stichprobe, und die Varianzanalyse mit Messwiederholungen wird verwendet.

Einfaktorielle Varianzanalyse

Die Einfaktorielle Varianzanalyse stellt eine Erweiterung des t-Tests für unabhängige Gruppen dar. Beim t-Test können nur maximal 2 Gruppen verglichen werden. Dies wird nun auf mehr als zwei Gruppen ausgeweitet. Für zwei Gruppen (k = 2) ist die Varianzanalyse also äquivalent mit dem t-Test. Die unabhängige Variable ist dementsprechend eine nominalskalierte Variable mit mindestens zwei Merkmalsausprägungen. Die abhängige Variable hat metrisches Skalenniveau. Im Falle der Varianzanalyse spricht man bei der unabhängigen Variablen vom Faktor.

Definition

Gibt es in der Grundgesamtheit einen Unterschied zwischen den verschiedenen Gruppen der unabhängigen Variable in Bezug auf die abhängige Variable.

Ziel der ANOVA ist es, möglichst viel Varianz der abhängigen Variable durch die Aufteilung in die Gruppen zu erklären. Betrachten wir hierfür folgendes Beispiel.

Einfaktorielle Varianzanalyse Beispiel

Mithilfe der unabhängigen Variable, z. B. höchster Bildungsabschluss mit den drei Ausprägungen Gruppe 1, Gruppe 2 und Gruppe 3 soll möglichst viel Varianz der abhängigen Variable Gehalt aufgeklärt werden. In der untenstehenden Grafik kann unter A) mit den drei Gruppen sehr viel Varianz aufgeklärt werden und unter B) nur sehr wenig.

Varianzanalyse

Demnach haben in Fall A) die Gruppen einen sehr hohen Einfluss auf das Gehalt und in Fall B) nicht.

Im Fall von A) weichen die Werte in den jeweiligen Gruppen nur wenig vom Gruppenmittelwert ab, die Varianz innerhalb der Gruppen ist daher sehr klein. Im Fall von B) ist die Varianz innerhalb der Gruppen jedoch groß. Mit der Varianz zwischen den Gruppen ist es genau andersherum, diese ist im Fall von A) groß und bei B) klein. Bei B) liegen die Gruppenmittelwerte nahe zusammen, bei A) nicht.

Varianz innerhalb der Gruppen Varianz zwischen den Gruppenmittelwerten
Fall A) Klein Groß
Fall B) Groß Klein

Hypothesen bei der Varianzanalyse

Vor der Durchführung einer Varianzanalysen, ist es natürlich notwendig, Hypothesen zu formulieren, die überprüft werden sollen. Die Nullhypothese und die Alternativhypothese ergeben sich bei einer einfaktoriellen Varianzanalyse folgendermaßen:

  • Nullhypothese H0: Der Mittelwert aller Gruppen ist gleich.
  • Alternativhypothese H1: Es gibt Unterschiede in den Mittelwerten der Gruppen.

Es ist dabei zu beachten, dass die Ergebnisse der ANOVA nur eine Aussage darüber treffen können, ob es grundsätzlich Unterschiede zwischen mindestens zwei Gruppen gibt. Es kann dabei jedoch nicht festgestellt werden, welche Gruppen sich genau unterscheiden. Um festzustellen, welche Gruppen sich unterscheiden, braucht es einen Posthoc-Test. Hierbei stehen verschiedene Verfahren zur Auswahl, wobei Duncan, Dunnet C und Scheffé zu den gängigsten Verfahren zählen.

Beispiel

In einer Schraubenfabrik wird eine Schraube von drei verschiedenen Produktionsanlagen produziert. Du möchtest nun herausfinden, ob alle Produktionsanlagen Schrauben mit demselben Gewicht produzieren. Hierfür entnimmst du von jeder Produktionsanlage 50 Schrauben und misst deren Gewicht. Nun wendest du das Verfahren der ANOVA an, um zu ermitteln, ob sich das durchschnittliche Gewicht der Schrauben aus den drei Produktionsanlagen signifikant voneinander unterscheidet.

Ein weiteres Beispiel für die einfaktorielle Varianzanalyse wäre zu untersuchen, ob sich der tägliche Kaffeekonsum von Studierenden aus unterschiedlichen Studienrichtungen signifikant unterscheidet.

Abhängige Variable Unabhängige Variable
Skalierung Eine intervallskalierte Variable Eine nominalskalierte Variable mit
mindestens zwei Stufen
Beispiel Wöchentlicher Kaffeekonsum Studienfach (Mathe, Psychologie, BWL)

Voraussetzungen einfaktorielle Varianzanalyse

Bevor du mit der Durchführung einer Varianzanalyse startest, gilt es die folgenden Voraussetzungen zu überprüfen, damit du weißt, ob deine Daten für diesen Test geeignet sind. Diese Voraussetzungen sind folgende:

  • Skalenniveau: Das Skalenniveau der abhängigen Variable sollte metrisch sein, jenes der unabhängigen Variable nominalskaliert
  • Unabhängigkeit: Die Messungen sollen unabhängig sein, also der Messwert von einer Gruppe soll nicht durch den Messwert einer anderen beeinflusst sein
  • Homogenität: Die Varianzen in jeder Gruppe sollten in etwa gleich sein. Dies kann mit dem Levene-Test überprüft werden.
  • Normalverteilung: Die Daten innerhalb der Gruppen sollten normalverteilt sein. Das bedeutet, dass der Großteil der Werte im durchschnittlichen Bereich liegt, während sich nur sehr wenige Werte deutlich darunter oder darüber befinden. Ist diese Voraussetzung nicht erfüllt, kann der Kruskal-Wallis-Test verwendet werden.

Liegen keine unabhängigen Stichproben vor, sondern abhängige, dann wird eine einfaktorielle Varianzanalyse mit Messwiederholungen verwendet.

Welch's ANOVA

Ist die Voraussetzung der Varianzhomogenität nicht erfüllt, kann anstatt der "normalen" ANOVA die Welch's ANOVA berechnet werden. Ergibt sich beim Levene-Test eine signifikante Abweichung der Varianzen in den Gruppen, berechnet DATAtab automatisch zusätzlich die Welch's ANOVA.

Welch's ANOVA

Varianzanalyse per Hand berechnen

Hinweis: Für die Berechnung der Varianzanalyse wird üblicherweise eine Statistik Software wie DATAtab verwendet. Das Wissen über die Hintergründe der Varianzanalyse, ist aber wichtig, um genauer zu verstehen, wie eine Varianzanalyse funktioniert und interpretiert wird. Schaue dir hierfür das folgende Video an:

Effektstärke Eta-Quadrat (η²)

Die bekanntesten Maße für die Effektstärke bei der Varianzanalyse ist das Eta-Quadrat und das partielles Eta-Quadrat. Für eine einfaktorielle ANOVA sind das Eta-Quadrat und das partielles Eta-Quadrat identisch.

Das Eta-Quadrat schätzen die Varianz, die eine Variable aufklärt. jedoch ist zu beachten, dass die aufgeklärte Varianz immer überschätzt wird. Eta-Quadrat wird berechnet, indem die Quadratsumme zwischen durch die Quadratsumme gesamt geteilt wird.

Effektstärke Eta-Quadrat (η²)

Zweifaktorielle Varianzanalyse

Wie der Name schon sagt, untersucht die zweifaktorielle Varianzanalyse den Einfluss von zwei Faktoren auf eine abhängige Variable. Hiermit wird die einfaktorielle Varianzanalyse noch um einen weiteren Faktor, also um eine weitere nominalskalierte unabhängige Variable ausgebaut. Die Frage ist hierbei wieder, ob sich die Mittelwerte der Gruppen signifikant unterscheiden.

Abhängige Variable Unabhängige Variable
Skalierung Eine intervallskalierte Variable Zwei nominalskalierte Variablen
Beispiel Wöchentlicher Kaffeekonsum Studienfach (Mathe, Psychologie, BWL)
und Semester (Winter, Sommer)

Beispiel zweifaktorielle Varianzanalyse

In einer Schraubenfabrik wird eine Schraube von drei verschiedenen Produktionsanlagen (Faktor 1) in zwei Schichten (Faktor 2) produziert. Du möchtest nun herausfinden, ob die Produktionsanlagen oder die Schichten einen Einfluss auf das Gewicht der Schrauben haben. Hierfür entnimmst du 50 Schrauben von jeder Produktionsanlage und jeder Schicht misst deren Gewicht.
Nun greifst du auf die zweifaktorielle ANOVA zurück, um zu ermitteln, ob sich das durchschnittliche Gewicht der Schrauben aus den drei Produktionsanlagen und den beiden Schichten signifikant voneinander unterscheidet.

Zweifaktorielle Varianzanalyse mit Messwiederholung

Bei der zweifaktoriellen Varianzanalyse mit Messwiederholung gibt es eine messwiederholte Variable und zusätzlich eine kategorische Variable.

Zweifaktorielle Varianzanalyse mit Messwiederholung

Beispiel Einfaktorielle Varianzanalyse:

Du möchtest prüfen, ob es zwischen den Studierenden verschiedener Studienfächer einen Unterschied hinsichtlich des Kaffeekonsums gibt. Hierfür befragst du 10 Studierende aus jeder Studienrichtung.

Kaffeekonsum Studienfach
21 Mathe
23 Mathe
18 BWL
22 BWL
... ...
Datensatz laden

Nachdem du die obenstehende Tabelle in den Statistik Rechner kopiert hast, klickst du einfach auf Hypothesentest und wählst die drei Variablen aus. Das Ergebnis sieht dann folgendermaßen aus:

Einfaktorielle Varianzanalyse:
n Mittelwert Standardabweichung
Mathe 10 16,6 7,291
BWL 10 19,8 4,131
Psychologie 10 17,8 6,443
Total 30 18,067 5,938
Summe der Quadrate df Mittelwert der Quadrate F p
Zwischen den Gruppen 52,267 2 26,133 0,702 0,505
Innerhalb der Gruppen 1005,6 27 37,244
Total 1057,867 29

Dabei ist N die Anzahl der Fälle für jede Kategorie, df die Freiheitsgrade, F die F-Statistik aus der berechneten Varianzanalyse und p der p-Wert.


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 260 Seiten
  • 3. überarbeitete Auflage (Januar 2023)
  • Nur 6,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 59 Seiten
  • 2. überarbeitete Auflage (Januar 2023)
  • Nur 3,49 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz