Varianzanalyse (ANOVA)
Was ist eine Varianzanalyse?
Eine Varianzanalyse (ANOVA - engl. Analysis of Variance) überprüft, ob statistisch signifikante Unterschiede zwischen mehr als zwei Gruppen vorliegen. Hierfür werden die Mittelwerte der jeweiligen Gruppen miteinander verglichen. Im Gegensatz zum t-Test, der prüft, ob es einen Unterschied zwischen zwei Gruppen gibt, prüft die ANOVA, ob es einen nterschied zwischen mehr als zwei Gruppen gibt.
Es gibt verschiedene Arten der Varianzanalyse, die gängigsten sind die einfaktorielle und zweifaktorielle Varianzanalyse die jeweils entweder mit oder ohne Messwiederholung berechnet werden kann.
In diesem Tutorial erfährst du die Basics zur ANOVA, zu jeder der vier Arten der Varianzanalyse findest du dann jeweils ein separates ausführliches Tutorial:
- Tutorial 1: Einfaktorielle Varianzanalyse
- Tutorial 2: Zweifaktorielle Varianzanalyse
- Tutorial 3: Einfaktorielle Varianzanalyse mit Messwiederholung
- Tutorial 4: Zweifaktorielle Varianzanalyse mit Messwiederholung
Tipp: Alle vier Varianten der ANOVA kannst du auf DATAtab ganz einfach online berechnen. Besuche hierfür einfach den ANOVA Rechner.
Warum können nicht einfach mehrere t-Tests berechnet werden?
Die Varianzanalyse wird verwendet, wenn es mehr als zwei Gruppen gibt, die untersucht und verglichen werden sollen. Natürlich wäre es auch eine Möglichkeit, für jede Kombination der Gruppen jeweils einen t-Test zu berechnen. Hier bestünde jedoch das Problem, dass jeder Hypothesentest eine gewisse Irrtumswahrscheinlichkeit hat. Diese wird in der Regel auf 5% gesetzt, sodass rein statistisch jeder 20. Test ein falsches Ergebnis liefert.
Werden nun z.B. 20 Gruppen verglichen, in denen es eigentlich keinen Unterschied gibt, wird rein aufgrund der Stichprobenziehung einer der Tests einen signifikanten Unterschied aufweisen.
Unterschied einfaktorielle und zweifaktorielle ANOVA
Bei der einfaktoriellen Varianzanalyse wird geprüft ob eine unabhängige Variable einen Einfluss auf eine metrische abhängige Variable hat. Dies ist z.B. der Fall, wenn untersucht werden soll, ob der Wohnort (unabhängige Variable) einen Einfluss auf das Gehalt (abhängige Variable) hat. Werden jedoch zwei Faktoren, also zwei unabhängige Variablen betrachtet muss eine zweifaktorielle Varianzanalyse verwendet werden.
Einfaktorielle Varianzanalyse | Zweifaktorielle Varianzanalyse |
---|---|
Hat der Wohnort (unabhängige Variable) einer Person Einfluss auf deren Gehalt | Hat der Wohnort (1. unabhängige Variable) und das Geschlecht (2. unabhängige Variable) einer Person Einfluss auf dessen Gehalt |
Die zweifaktorielle Varianzanalyse prüft ob es einen Unterschied zwischen mehr als zwei unabhängigen Stichproben gibt die auf zwei Variablen bzw. Faktoren aufgeteilt sind.
Varianzanalyse mit und ohne Messwiederholung
Je nachdem, ob es sich bei der Stichprobe um eine unabhängige oder eine abhängige Stichprobe handelt, wird entweder die Varianzanalyse mit oder ohne Messwiederholungen verwendet. Wurde ein und dieselbe Person zu mehreren Zeitpunkten befragt, handelt es sich um eine abhängige Stichprobe, und die Varianzanalyse mit Messwiederholungen wird verwendet.
Einfaktorielle Varianzanalyse
Die Einfaktorielle Varianzanalyse stellt eine Erweiterung des t-Tests für unabhängige Gruppen dar. Beim t-Test können nur maximal 2 Gruppen verglichen werden. Dies wird nun auf mehr als zwei Gruppen ausgeweitet. Für zwei Gruppen (k = 2) ist die Varianzanalyse also äquivalent mit dem t-Test. Die unabhängige Variable ist dementsprechend eine nominalskalierte Variable mit mindestens zwei Merkmalsausprägungen. Die abhängige Variable hat metrisches Skalenniveau. Im Falle der Varianzanalyse spricht man bei der unabhängigen Variablen vom Faktor.
Definition
Gibt es in der Grundgesamtheit einen Unterschied zwischen den verschiedenen Gruppen der unabhängigen Variable in Bezug auf die abhängige Variable.
Ziel der ANOVA ist es, möglichst viel Varianz der abhängigen Variable durch die Aufteilung in die Gruppen zu erklären. Betrachten wir hierfür folgendes Beispiel.
Einfaktorielle Varianzanalyse Beispiel
Mithilfe der unabhängigen Variable, z. B. höchster Bildungsabschluss mit den drei Ausprägungen Gruppe 1, Gruppe 2 und Gruppe 3 soll möglichst viel Varianz der abhängigen Variable Gehalt aufgeklärt werden. In der untenstehenden Grafik kann unter A) mit den drei Gruppen sehr viel Varianz aufgeklärt werden und unter B) nur sehr wenig.
Demnach haben in Fall A) die Gruppen einen sehr hohen Einfluss auf das Gehalt und in Fall B) nicht.
Im Fall von A) weichen die Werte in den jeweiligen Gruppen nur wenig vom Gruppenmittelwert ab, die Varianz innerhalb der Gruppen ist daher sehr klein. Im Fall von B) ist die Varianz innerhalb der Gruppen jedoch groß. Mit der Varianz zwischen den Gruppen ist es genau andersherum, diese ist im Fall von A) groß und bei B) klein. Bei B) liegen die Gruppenmittelwerte nahe zusammen, bei A) nicht.
Varianz innerhalb der Gruppen | Varianz zwischen den Gruppenmittelwerten | |
Fall A) | Klein | Groß |
---|---|---|
Fall B) | Groß | Klein |
Hypothesen bei der Varianzanalyse
Vor der Durchführung einer Varianzanalysen, ist es natürlich notwendig, Hypothesen zu formulieren, die überprüft werden sollen. Die Nullhypothese und die Alternativhypothese ergeben sich bei einer einfaktoriellen Varianzanalyse folgendermaßen:
- Nullhypothese H0: Der Mittelwert aller Gruppen ist gleich.
- Alternativhypothese H1: Es gibt Unterschiede in den Mittelwerten der Gruppen.
Es ist dabei zu beachten, dass die Ergebnisse der ANOVA nur eine Aussage darüber treffen können, ob es grundsätzlich Unterschiede zwischen mindestens zwei Gruppen gibt. Es kann dabei jedoch nicht festgestellt werden, welche Gruppen sich genau unterscheiden. Um festzustellen, welche Gruppen sich unterscheiden, braucht es einen Posthoc-Test. Hierbei stehen verschiedene Verfahren zur Auswahl, wobei Duncan, Dunnet C und Scheffé zu den gängigsten Verfahren zählen.
Beispiel
In einer Schraubenfabrik wird eine Schraube von drei verschiedenen Produktionsanlagen produziert. Du möchtest nun herausfinden, ob alle Produktionsanlagen Schrauben mit demselben Gewicht produzieren. Hierfür entnimmst du von jeder Produktionsanlage 50 Schrauben und misst deren Gewicht. Nun wendest du das Verfahren der ANOVA an, um zu ermitteln, ob sich das durchschnittliche Gewicht der Schrauben aus den drei Produktionsanlagen signifikant voneinander unterscheidet.
Ein weiteres Beispiel für die einfaktorielle Varianzanalyse wäre zu untersuchen, ob sich der tägliche Kaffeekonsum von Studierenden aus unterschiedlichen Studienrichtungen signifikant unterscheidet.
Abhängige Variable | Unabhängige Variable | |
---|---|---|
Skalierung | Eine intervallskalierte Variable | Eine nominalskalierte Variable mit mindestens zwei Stufen |
Beispiel | Wöchentlicher Kaffeekonsum | Studienfach (Mathe, Psychologie, BWL) |
Voraussetzungen einfaktorielle Varianzanalyse
Bevor du mit der Durchführung einer Varianzanalyse startest, gilt es die folgenden Voraussetzungen zu überprüfen, damit du weißt, ob deine Daten für diesen Test geeignet sind. Diese Voraussetzungen sind folgende:
- Skalenniveau: Das Skalenniveau der abhängigen Variable sollte metrisch sein, jenes der unabhängigen Variable nominalskaliert
- Unabhängigkeit: Die Messungen sollen unabhängig sein, also der Messwert von einer Gruppe soll nicht durch den Messwert einer anderen beeinflusst sein
- Homogenität: Die Varianzen in jeder Gruppe sollten in etwa gleich sein. Dies kann mit dem Levene-Test überprüft werden.
- Normalverteilung: Die Daten innerhalb der Gruppen sollten normalverteilt sein. Das bedeutet, dass der Großteil der Werte im durchschnittlichen Bereich liegt, während sich nur sehr wenige Werte deutlich darunter oder darüber befinden. Ist diese Voraussetzung nicht erfüllt, kann der Kruskal-Wallis-Test verwendet werden.
Liegen keine unabhängigen Stichproben vor, sondern abhängige, dann wird eine einfaktorielle Varianzanalyse mit Messwiederholungen verwendet.
Welch's ANOVA
Ist die Voraussetzung der Varianzhomogenität nicht erfüllt, kann anstatt der "normalen" ANOVA die Welch's ANOVA berechnet werden. Ergibt sich beim Levene-Test eine signifikante Abweichung der Varianzen in den Gruppen, berechnet DATAtab automatisch zusätzlich die Welch's ANOVA.
Varianzanalyse per Hand berechnen
Hinweis: Für die Berechnung der Varianzanalyse wird üblicherweise eine Statistik Software wie DATAtab verwendet. Das Wissen über die Hintergründe der Varianzanalyse, ist aber wichtig, um genauer zu verstehen, wie eine Varianzanalyse funktioniert und interpretiert wird. Schaue dir hierfür das folgende Video an:
Effektstärke Eta-Quadrat (η²)
Die bekanntesten Maße für die Effektstärke bei der Varianzanalyse ist das Eta-Quadrat und das partielles Eta-Quadrat. Für eine einfaktorielle ANOVA sind das Eta-Quadrat und das partielles Eta-Quadrat identisch.
Das Eta-Quadrat schätzen die Varianz, die eine Variable aufklärt. jedoch ist zu beachten, dass die aufgeklärte Varianz immer überschätzt wird. Eta-Quadrat wird berechnet, indem die Quadratsumme zwischen durch die Quadratsumme gesamt geteilt wird.
Zweifaktorielle Varianzanalyse
Wie der Name schon sagt, untersucht die zweifaktorielle Varianzanalyse den Einfluss von zwei Faktoren auf eine abhängige Variable. Hiermit wird die einfaktorielle Varianzanalyse noch um einen weiteren Faktor, also um eine weitere nominalskalierte unabhängige Variable ausgebaut. Die Frage ist hierbei wieder, ob sich die Mittelwerte der Gruppen signifikant unterscheiden.
Abhängige Variable | Unabhängige Variable | |
---|---|---|
Skalierung | Eine intervallskalierte Variable | Zwei nominalskalierte Variablen |
Beispiel | Wöchentlicher Kaffeekonsum |
Studienfach (Mathe, Psychologie, BWL) und Semester (Winter, Sommer) |
Beispiel zweifaktorielle Varianzanalyse
In einer Schraubenfabrik wird eine Schraube von
drei verschiedenen Produktionsanlagen (Faktor 1) in
zwei Schichten (Faktor 2) produziert. Du möchtest nun herausfinden, ob die
Produktionsanlagen oder die Schichten einen Einfluss auf das Gewicht der Schrauben
haben. Hierfür entnimmst du 50 Schrauben von jeder Produktionsanlage und jeder Schicht
misst deren Gewicht.
Nun greifst du auf die zweifaktorielle ANOVA zurück, um zu ermitteln, ob sich das
durchschnittliche Gewicht der Schrauben aus den drei Produktionsanlagen und den beiden
Schichten signifikant voneinander unterscheidet.
Zweifaktorielle Varianzanalyse mit Messwiederholung
Bei der zweifaktoriellen Varianzanalyse mit Messwiederholung gibt es eine messwiederholte Variable und zusätzlich eine kategorische Variable.
Beispiel Einfaktorielle Varianzanalyse:
Du möchtest prüfen, ob es zwischen den Studierenden verschiedener Studienfächer einen Unterschied hinsichtlich des Kaffeekonsums gibt. Hierfür befragst du 10 Studierende aus jeder Studienrichtung.
Kaffeekonsum | Studienfach |
---|---|
21 | Mathe |
23 | Mathe |
18 | BWL |
22 | BWL |
... | ... |
Nachdem du die obenstehende Tabelle in den Statistik Rechner kopiert hast, klickst du einfach auf Hypothesentest und wählst die drei Variablen aus. Das Ergebnis sieht dann folgendermaßen aus:
Einfaktorielle Varianzanalyse:
n | Mittelwert | Standardabweichung | |
Mathe | 10 | 16,6 | 7,291 |
BWL | 10 | 19,8 | 4,131 |
Psychologie | 10 | 17,8 | 6,443 |
Total | 30 | 18,067 | 5,938 |
Summe der Quadrate | df | Mittelwert der Quadrate | F | p | |
Zwischen den Gruppen | 52,267 | 2 | 26,133 | 0,702 | 0,505 |
Innerhalb der Gruppen | 1005,6 | 27 | 37,244 | ||
Total | 1057,867 | 29 |
Dabei ist N die Anzahl der Fälle für jede Kategorie, df die Freiheitsgrade, F die F-Statistik aus der berechneten Varianzanalyse und p der p-Wert.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.