Chi2-Test
Chi2-Test Datensatz ladenDer Chi-Quadrat-Test ist ein Hypothesentest, der dann verwendet wird, wenn man feststellen möchte, ob es einen Zusammenhang zwischen zwei kategorischen Variablen gibt.
Was sind nun nochmal kategorische Variablen? Kategorische Variablen sind z.B. das Geschlecht, die präferierte Zeitung, die Häufigkeit des Fernsehens oder der höchste Bildungsabschluss einer Person. Soll nun bei zwei kategorischen Variablen geprüft werden, ob es einen Zusammenhang zwischen ihnen gibt, verwendet man einen Chi2 Test.

Definition:
Der Chi-Quadrat-Test ist ein Hypothesentest der bei kategorischen Variablen, also bei nominalem oder ordinalem Skalenniveau verwendet wird. Der Chi-Quadrat-Test prüft, ob sich die in der Stichprobe vorkommenden Häufigkeiten signifikant von jenen Häufigkeiten unterscheiden, die man erwarten würde. Es werden somit die beobachteten Häufigkeiten mit den erwarteten Häufigkeiten verglichen und deren Abweichungen wird untersucht.

Sagen wir, wir möchten untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss gibt. Hierfür erstellen wir einen Fragebogen, bei dem die TeilnehmerInnen ankreuzen, welches Geschlecht sie haben und was deren höchster Bildungsabschluss ist. Das Ergebnis der Umfrage wird anschließend in einer Kreuztabelle dargestellt.

Um zu untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss gibt wird der Chi-Quadrat Test verwendet.
Nullhypothese und Alternativhypothese
Die Nullhypothese und die Alternativhypothese ergeben sich dann zu:
Nullhypothese: Es besteht kein Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss.
Alternativhypothese: Es besteht ein Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss.
Tipp: Auf DATAtab kannst du den Chi-Quadrat-Test online berechnen. Besuche hierfür einfach den Chi-Quadrat Test Rechner
Anwendungsbereiche des Chi-Quadrat Tests
Es gibt verschiedene Anwendungsbereiche des Chi-Quadrat-Test, er kann verwendet werden, um folgende Fragen zu beantworten:
1) Unabhängigkeitstest
Sind zwei kategorische Variablen voneinander unabhängig? Hat beispielsweise das Geschlecht einen Einfluss darauf, ob eine Person ein Netflix-Abo besitzt oder nicht?
2) Verteilungstest
Sind die beobachteten Ausprägungen zweier kategorischer Variablen gleich der erwarteten? Eine Fragestellung könnte sein, wird einer von den drei Video Streaming Diensten Netflix, Amazon und Disney überdurchschnittlich viel abonniert?
3) Homogenitätstest
Stammen zwei oder mehr Stichproben aus derselben Grundgesamtheit? Eine Fragestellung könnte sein, ob sich die Abo-Zahlen der drei Video Streaming Dienste Netflix, Amazon und Disney in verschiedenen Altersgruppen unterscheiden.
Chi-Quadrat berechnen
Der Chi-Quadrat-Wert berechnet sich über:

Um die Berechnung des Chi-Quadrat Wertes zu verdeutlichen, beziehen wir uns auf folgenden Fall: Für die Variablen eins und zwei mit der Kategorie A und B wurde eine Beobachtung gemacht bzw. es existiert eine Stichprobe. Nun soll geprüft werden, ob die Häufigkeiten aus der Stichprobe den erwarteten Häufigkeiten aus der Grundgesamtheit entsprechen.
Beobachtete Häufigkeit:
Kategorie A | Kategorie B | |
---|---|---|
Kategorie A | 10 | 13 |
Kategorie B | 13 | 14 |
Erwartete Häufigkeit:
Kategorie A | Kategorie B | |
---|---|---|
Kategorie A | 9 | 11 |
Kategorie B | 12 | 13 |
Mit der oberen Formel kannst du nun das Chi-Quadrat berechnen:
Nachdem das Chi-Quadrat berechnet worden ist, wird noch der Freiheitsgrad df benötigt. Dieser ergibt sich durch
mit
- p: Anzahl der Zeilen
- q: Anzahl der Spalten
Aus der Tabelle der Chi-Quadrat Verteilung kann man nun den kritischen Chi-Quadrat Wert ablesen. Für ein Signifikanzniveau von 5 % ergibt sich dieser zu 3,841. Da der berechnete Chi-Quadrat Wert kleiner ist, ergibt sich kein signifikanter Unterschied.
Als Voraussetzung für diesen Test gilt zu beachten, dass alle erwarteten Häufigkeiten größer als 5 sein müssen.
Chi-Quadrat-Unabhängigkeitstest
Der Chi-Quadrat-Unabhängigkeitstest wird berechnet, wenn zwei kategorische Variablen auf ihre Unabhängigkeit geprüft werden sollen. Es gilt dabei zu analysieren, ob die Merkmalsausprägungen der ersten Variablen von den Merkmalsausprägungen der zweiten beeinflusst werden und umgekehrt.
Eine Frage könnte in diesem Zusammenhang beispielsweise sein „Hat das Geschlecht einen Einfluss darauf, ob eine Person ein Netflix Abo hat, oder nicht?“ Für die beiden Variablen „Geschlecht“ (männlich, weiblich) und „Besitz eines Netflix Abos“ (Ja, Nein) wird geprüft, ob diese unabhängig sind. Ist dies nicht der Fall besteht ein Zusammenhang zwischen den Merkmalen. Die Forschungsfrage, welche mit dem Chi-Quadrat Test beantwortet werden kann, lautet: Sind die Merkmale Geschlecht und Besitz eines Netflix Abos unabhängig voneinander.
Um das Chi-Quadrat berechnen zu können, muss also eine beobachtete und eine erwartete Häufigkeit gegeben sein. Beim Unabhängigkeitstest ist die erwartete Häufigkeit diejenige, die sich ergibt, wenn beide Variablen unabhängig sind. Wenn zwei Variablen unabhängig sind, ergeben sich die erwarteten Häufigkeiten der einzelnen Zellen mit
wobei i und j jeweils die Anzahl der Zeilen und Spalten der Tabelle sind.
Für das fiktive Netflix-Beispiel könnte sich folgende Tabellen ergeben. Links ist die Tabelle mit den in der Stichprobe beobachteten Häufigkeiten dargestellt und rechts die Tabelle, die sich ergeben würde, wenn perfekte Unabhängigkeit vorliegt.
Beobachtete Häufigkeit:
Männlich | Weiblich | |
Netflix Ja | 10 | 13 |
Netflix Nein | 15 | 14 |
Erwartete Häufigkeit wenn unabhängig:
Männlich | Weiblich | |
Netflix Ja | (23 · 25) / 52 = 11,06 | (23 · 27) / 52 = 11,94 |
Netflix Nein | (29 · 25) / 52 = 13,94 | (29 · 27) / 52 = 15,06 |
Das Chi-Quadrat berechnet sich dann folgendermaßen:
Aus der Chi-Quadrat Tabelle kann man nun wieder den kritischen Wert ablesen und mit dem Ergebnis vergleichen.
Die Voraussetzungen für den Chi-Quadrat-Unabhängigkeitstest sind, dass die Beobachtungen aus einer Zufallsstichprobe stammen und dass die erwarteten Häufigkeiten pro Zelle größer als 5 sind.
Chi-Quadrat-Verteilungstest
Liegt eine Variable mit zwei oder mehreren Ausprägungen vor, können die Unterschiede in der Häufigkeit der einzelnen Ausprägungen untersucht werden.
Der Chi-Quadrat Verteilungstest, oder auch Anpassungstest genannt, prüft, ob die Häufigkeiten der einzelnen Merkmalsausprägungen in der Stichprobe den Häufigkeiten von einer definierten Verteilung entsprechen. Diese definierte Verteilung entspricht in den meisten Fällen jener der Grundgesamtheit. In diesem Fall wird geprüft, ob die Stichprobe aus der jeweiligen Grundgesamtheit stammt.
Hier ein Beispiel: Für Marktforscher könnte von Interesse sein, ob es einen Unterschied in der Marktdurchdringung von den drei Video Streaming Diensten Netflix, Amazon und Disney zwischen Berlin und ganz Deutschland gibt. Die erwartete Häufigkeit ist dann die Verteilung der Streaming Dienste in ganz Deutschland und die beobachtete Häufigkeit resultiert aus einer Umfrage in Berlin. In den folgenden Tabellen sind die fiktiven Ergebnisse für den Chi-Quadrat Anpassungstest dargestellt
Beobachtete Häufigkeit in Berlin:
Video Dienst | Häufigkeit |
---|---|
Netflix | 25 |
Amazon | 29 |
Disney | 13 |
Anderen oder keinen | 20 |
Erwartete Häufigkeit (ganz Deutschland):
Video Dienst | Häufigkeit |
---|---|
Netflix | 23 |
Amazon | 26 |
Disney | 16 |
Anderen oder keinen | 22 |
Das Chi-Quadrat ergibt sich dann zu
Chi-Quadrat-Homogenitätstest
Mit dem Chi-Quadrat-Homogenitätstest kann geprüft werden, ob zwei oder mehr Stichproben aus derselben Grundgesamtheit stammen? Eine Fragestellung könnte sein, ob sich die Abo-Zahlen der drei Video Streaming Dienste Netflix, Amazon und Disney in verschiedenen Altersgruppen unterscheiden. Als fiktives Beispiel wird hierzu eine Umfrage in drei Altersgruppen mit folgendem Ergebnis durchgeführt:
Observed frequency:
Age in years | 15-25 | 25-35 | 35-45 |
---|---|---|---|
Netflix | 25 | 23 | 20 |
Amazon | 29 | 30 | 33 |
Disney | 11 | 13 | 12 |
Others or none | 16 | 24 | 26 |
Gleich wie beim Chi-Quadrat-Unabhängigkeitstest wird dieses Ergebnis mit der Tabelle verglichen, die sich ergeben würde, wenn die Verteilungen der Streaming-Dienste unabhängig vom Alter sind.
Effektstärke beim Chi-Quadrat Test
Bisher wissen wir nur, ob wir die Nullhypothese ablehnen können oder nicht, es ist jedoch sehr oft auch von großem Interesse zu wissen, wie stark der Zusammenhang der beiden Variablen ist. Dies kann mit Hilfe der Effektstärke beantwortet werden.
Beim Chi-Quadrat Test kann zur Berechnung der Effektstärke Cramers V verwendet werden. Hier gilt ein Wert von 0,1 als klein, einer von 0,3 als mittel und ein Wert von 0,5 als groß. Die Effektstärke berechnet Ihnen natürlich DATAtab ganz einfach mit.
Effektstärke | Cramér’s V |
---|---|
Klein | 0.1 |
Mittel | 0.3 |
Groß | 0.5 |
Effektstärke VS p-Wert
Es ist zu beachten, dass dir der p-Wert nichts über die Stärke des Zusammenhangs bzw. des Effekts aussagt und von der Stichprobengröße abhängt! Folgende Punkte gilt es daher zu bedenken:
- Gibt es in der Grundgesamtheit einen Zusammenhang, wird dieser im p-Wert umso deutlicher angezeigt, je größer die Stichprobe ist.
- Ist die Stichprobe sehr groß, können auch sehr kleine Zusammenhänge in der Grundgesamtheit nachgewiesen werden.
- Diese kleinen Zusammenhänge können unter Umständen gar nicht mehr relevant ein.
Wenn somit einmal eine kleine Stichprobe und einmal eine große Stichprobe vorliegt, und in beiden Stichproben ein gleich großer Effekt besteht, würden sich die p-Werte trotzdem unterscheiden. Je größer die Stichprobe ist, desto kleiner wird der p Wert und damit lassen sich mit einer sehr großen Stichprobe auch sehr kleine Zusammenhänge bestätigen.
Hier kommt nun der Effektstärke eine wichtige Bedeutung zu. Mit der Effektstärke beim Chi-Quadrat Test können Unterschiede über mehrere Studien hinweg vergleichbar gemacht werden.
Beispiel: Chi-Quadrat-Test
Unabhängigkeitstest
Als Beispiel für einen Chi-Quadrat Test bei dem die Unabhängigkeit geprüft wird, wird der Gebrauch von Regenschirmen betrachtet. An einem regnerischen Tag wurde gezählt, wie viele Frauen und wie viele Männer mit einem Regenschirm zur Uni kommen.
Die Ergebnisse dieser Zählung sind in der folgenden Tabelle aufgelistet:
Geschlecht | Schirm mit dabei |
---|---|
weiblich | ja |
männlich | ja |
weiblich | ja |
weiblich | ja |
männlich | ja |
männlich | nein |
weiblich | nein |
männlich | nein |
weiblich | nein |
weiblich | nein |
männlich | nein |
weiblich | ja |
männlich | ja |
weiblich | ja |
männlich | ja |
männlich | ja |
männlich | nein |
weiblich | nein |
männlich | nein |
weiblich | nein |
weiblich | nein |
weiblich | nein |
Fragestellung:
Ist der Unterschied in der Verwendung eines Regenschirms bei Frauen und bei Männern statistisch signifikant oder zufällig?
So geht's im Online-Statistik-Rechner: Nachdem du die obenstehende Tabelle in den Hypothesentest Rechner kopiert hast, kannst du den Chi-Quardat Test berechnen. Klicke hierfür einfach auf die beiden Variablen „Geschlecht“ und „Schirm mit dabei“. Als Ergebnis bekommst du die (1) Kreuztabelle, die (2) erwarteten Häufigkeit bei perfekt unabhängigen Variablen und den (3) Chi-Quadrat-Test
Schirm mit dabei | ||||
ja | nein | Total | ||
Geschlecht | weiblich | 5 | 7 | 12 |
männlich | 5 | 5 | 10 | |
Total | 10 | 12 | 22 |
Erwartete Häufigkeiten bei perfekt unabhängigen Variablen:
Schirm mit dabei | ||||
---|---|---|---|---|
ja | nein | Total | ||
Geschlecht | weiblich | 5,455 | 6,545 | 12 |
männlich | 4,545 | 5,455 | 10 | |
Total | 10 | 12 | 22 |
Chi-Quadrat-Test | |
---|---|
Chi Quadrat | 0,153 |
df | 1 |
p | 0,696 |
Bei einem α-Niveau von 5% und einem Freiheitsgrad von 1 ergibt sich mit der Tabelle der Chi-Quadrat-Werte ein kritischer Wert von 3,841. Da der berechnete Chi-Quadrat-Wert kleiner als der kritische Wert ist, liegt in diesem Beispiel kein signifikanter Unterschied vor. Die Nullhypothese wird somit beibehalten. Inhaltlich bedeutet dies, dass sich Männer und Frauen hinsichtlich der Häufigkeit ihrer Schirmnutzung nicht voneinander unterscheiden.
Verteilungstest
In einem Wiener Stadtteil ist die Parteizugehörigkeit von 22 Personen erhoben worden. Nun soll geprüft werden, ob die BewohnerInnen des Stadtteils (Stichprobe), das gleiche Wahlverhalten haben wie die BewohnerInnen der gesamten Stadt Wien (Grundgesamtheit).
Partei |
---|
Partei A |
Partei C |
Partei A |
Partei C |
Partei A |
Partei C |
Partei B |
Partei B |
Partei C |
Partei A |
Partei C |
Partei A |
Partei A |
Partei B |
Partei B |
Partei A |
Partei A |
Partei B |
Partei A |
Partei A |
Partei C |
Partei C |
Um für das Beispiel den Chi-Quardat Test zu berechnen, kopierst du einfach die obenstehende Tabelle in den Statistik Rechner von DATAtab. Du erhältst somit nun folgende Ergebnisse:
Die Partei A hat in Wien einen Anteil von 40% und die Partei C von 35%. Sie erhalten somit nun folgende Ergebnisse:
Kategorie | n | Beobachtete Wahrsch. | Erwartete Wahrsch. | |
---|---|---|---|---|
Partei | Partei A | 10 | 45,455% | 40% |
Partei C | 7 | 31,818% | 35% | |
Partei B | 5 | 22,727% | ||
Total | 22 | 100% |
Chi-Quadrat Test | |
---|---|
Chi Quadrat | 0,264 |
df | 2 |
p | 0,876 |
Wenn das Signifikanzniveau mit 0,05 festgelegt ist, ist der mit 0,876 berechnete p-Wert größer als das Signifikanzniveau. Somit wird die Nullhypothese beibehalten und es kann davon ausgegangen werden, dass die BewohnerInnen des Stadtteils, das gleiche Wahlverhalten haben wie die BewohnerInnen der gesamten Stadt Wien.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €

"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €

Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.
