Menu

Chi2-Test

Chi2-Test Datensatz laden

Der Chi-Quadrat-Test ist ein Hypothesentest, der dann verwendet wird, wenn man feststellen möchte, ob es einen Zusammenhang zwischen zwei kategorischen Variablen gibt.

Was sind nun nochmal kategorische Variablen? Kategorische Variablen sind z.B. das Geschlecht, die präferierte Zeitung, die Häufigkeit des Fernsehens oder der höchste Bildungsabschluss einer Person. Soll nun bei zwei kategorischen Variablen geprüft werden, ob es einen Zusammenhang zwischen ihnen gibt, verwendet man einen Chi2 Test.

Chi-Quadrat-Test skalenniveau
Definition:

Der Chi-Quadrat-Test ist ein Hypothesentest der bei kategorischen Variablen, also bei nominalem oder ordinalem Skalenniveau verwendet wird. Der Chi-Quadrat-Test prüft, ob sich die in der Stichprobe vorkommenden Häufigkeiten signifikant von jenen Häufigkeiten unterscheiden, die man erwarten würde. Es werden somit die beobachteten Häufigkeiten mit den erwarteten Häufigkeiten verglichen und deren Abweichungen wird untersucht.

Chi-Quadrat-Test

Sagen wir, wir möchten untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss gibt. Hierfür erstellen wir einen Fragebogen, bei dem die TeilnehmerInnen ankreuzen, welches Geschlecht sie haben und was deren höchster Bildungsabschluss ist. Das Ergebnis der Umfrage wird anschließend in einer Kreuztabelle dargestellt.

Chi-Quadrat-Test online

Um zu untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss gibt wird der Chi-Quadrat Test verwendet.

Nullhypothese und Alternativhypothese

Die Nullhypothese und die Alternativhypothese ergeben sich dann zu:

Nullhypothese: Es besteht kein Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss.

Alternativhypothese: Es besteht ein Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss.

Tipp: Auf DATAtab kannst du den Chi-Quadrat-Test online berechnen. Besuche hierfür einfach den Chi-Quadrat Test Rechner

Anwendungsbereiche des Chi-Quadrat Tests

Es gibt verschiedene Anwendungsbereiche des Chi-Quadrat-Test, er kann verwendet werden, um folgende Fragen zu beantworten:

1) Unabhängigkeitstest

Sind zwei kategorische Variablen voneinander unabhängig? Hat beispielsweise das Geschlecht einen Einfluss darauf, ob eine Person ein Netflix-Abo besitzt oder nicht?

2) Verteilungstest

Sind die beobachteten Ausprägungen zweier kategorischer Variablen gleich der erwarteten? Eine Fragestellung könnte sein, wird einer von den drei Video Streaming Diensten Netflix, Amazon und Disney überdurchschnittlich viel abonniert?

3) Homogenitätstest

Stammen zwei oder mehr Stichproben aus derselben Grundgesamtheit? Eine Fragestellung könnte sein, ob sich die Abo-Zahlen der drei Video Streaming Dienste Netflix, Amazon und Disney in verschiedenen Altersgruppen unterscheiden.

Chi-Quadrat berechnen

Der Chi-Quadrat-Wert berechnet sich über:

Chi-Quadrat-Wert

Um die Berechnung des Chi-Quadrat Wertes zu verdeutlichen, beziehen wir uns auf folgenden Fall: Für die Variablen eins und zwei mit der Kategorie A und B wurde eine Beobachtung gemacht bzw. es existiert eine Stichprobe. Nun soll geprüft werden, ob die Häufigkeiten aus der Stichprobe den erwarteten Häufigkeiten aus der Grundgesamtheit entsprechen.

Beobachtete Häufigkeit:
Kategorie A Kategorie B
Kategorie A 10 13
Kategorie B 13 14
Erwartete Häufigkeit:
Kategorie A Kategorie B
Kategorie A 9 11
Kategorie B 12 13

Mit der oberen Formel kannst du nun das Chi-Quadrat berechnen:

Chi-Quadrat Beispiel

Nachdem das Chi-Quadrat berechnet worden ist, wird noch der Freiheitsgrad df benötigt. Dieser ergibt sich durch

Beispiel Freiheitsgrad Chi-Quadrat

mit

  • p: Anzahl der Zeilen
  • q: Anzahl der Spalten

Aus der Tabelle der Chi-Quadrat Verteilung kann man nun den kritischen Chi-Quadrat Wert ablesen. Für ein Signifikanzniveau von 5 % ergibt sich dieser zu 3,841. Da der berechnete Chi-Quadrat Wert kleiner ist, ergibt sich kein signifikanter Unterschied.

Als Voraussetzung für diesen Test gilt zu beachten, dass alle erwarteten Häufigkeiten größer als 5 sein müssen.

Chi-Quadrat-Unabhängigkeitstest

Der Chi-Quadrat-Unabhängigkeitstest wird berechnet, wenn zwei kategorische Variablen auf ihre Unabhängigkeit geprüft werden sollen. Es gilt dabei zu analysieren, ob die Merkmalsausprägungen der ersten Variablen von den Merkmalsausprägungen der zweiten beeinflusst werden und umgekehrt.

Eine Frage könnte in diesem Zusammenhang beispielsweise sein „Hat das Geschlecht einen Einfluss darauf, ob eine Person ein Netflix Abo hat, oder nicht?“ Für die beiden Variablen „Geschlecht“ (männlich, weiblich) und „Besitz eines Netflix Abos“ (Ja, Nein) wird geprüft, ob diese unabhängig sind. Ist dies nicht der Fall besteht ein Zusammenhang zwischen den Merkmalen. Die Forschungsfrage, welche mit dem Chi-Quadrat Test beantwortet werden kann, lautet: Sind die Merkmale Geschlecht und Besitz eines Netflix Abos unabhängig voneinander.

Um das Chi-Quadrat berechnen zu können, muss also eine beobachtete und eine erwartete Häufigkeit gegeben sein. Beim Unabhängigkeitstest ist die erwartete Häufigkeit diejenige, die sich ergibt, wenn beide Variablen unabhängig sind. Wenn zwei Variablen unabhängig sind, ergeben sich die erwarteten Häufigkeiten der einzelnen Zellen mit

Beispiel Freiheitsgrad Chi-Quadrat

wobei i und j jeweils die Anzahl der Zeilen und Spalten der Tabelle sind.

Für das fiktive Netflix-Beispiel könnte sich folgende Tabellen ergeben. Links ist die Tabelle mit den in der Stichprobe beobachteten Häufigkeiten dargestellt und rechts die Tabelle, die sich ergeben würde, wenn perfekte Unabhängigkeit vorliegt.

Beobachtete Häufigkeit:
Männlich Weiblich
Netflix Ja 10 13
Netflix Nein 15 14
Erwartete Häufigkeit wenn unabhängig:
Männlich Weiblich
Netflix Ja (23 · 25) / 52 = 11,06 (23 · 27) / 52 = 11,94
Netflix Nein (29 · 25) / 52 = 13,94 (29 · 27) / 52 = 15,06

Das Chi-Quadrat berechnet sich dann folgendermaßen:

Chi-Quadrat Unabhängigkeitstest

Aus der Chi-Quadrat Tabelle kann man nun wieder den kritischen Wert ablesen und mit dem Ergebnis vergleichen.

Die Voraussetzungen für den Chi-Quadrat-Unabhängigkeitstest sind, dass die Beobachtungen aus einer Zufallsstichprobe stammen und dass die erwarteten Häufigkeiten pro Zelle größer als 5 sind.

Chi-Quadrat-Verteilungstest

Liegt eine Variable mit zwei oder mehreren Ausprägungen vor, können die Unterschiede in der Häufigkeit der einzelnen Ausprägungen untersucht werden.

Der Chi-Quadrat Verteilungstest, oder auch Anpassungstest genannt, prüft, ob die Häufigkeiten der einzelnen Merkmalsausprägungen in der Stichprobe den Häufigkeiten von einer definierten Verteilung entsprechen. Diese definierte Verteilung entspricht in den meisten Fällen jener der Grundgesamtheit. In diesem Fall wird geprüft, ob die Stichprobe aus der jeweiligen Grundgesamtheit stammt.

Hier ein Beispiel: Für Marktforscher könnte von Interesse sein, ob es einen Unterschied in der Marktdurchdringung von den drei Video Streaming Diensten Netflix, Amazon und Disney zwischen Berlin und ganz Deutschland gibt. Die erwartete Häufigkeit ist dann die Verteilung der Streaming Dienste in ganz Deutschland und die beobachtete Häufigkeit resultiert aus einer Umfrage in Berlin. In den folgenden Tabellen sind die fiktiven Ergebnisse für den Chi-Quadrat Anpassungstest dargestellt

Beobachtete Häufigkeit in Berlin:
Video Dienst Häufigkeit
Netflix 25
Amazon 29
Disney 13
Anderen oder keinen 20
Erwartete Häufigkeit (ganz Deutschland):
Video Dienst Häufigkeit
Netflix 23
Amazon 26
Disney 16
Anderen oder keinen 22

Das Chi-Quadrat ergibt sich dann zu

Chi-Quadrat-Verteilungstest

Chi-Quadrat-Homogenitätstest

Mit dem Chi-Quadrat-Homogenitätstest kann geprüft werden, ob zwei oder mehr Stichproben aus derselben Grundgesamtheit stammen? Eine Fragestellung könnte sein, ob sich die Abo-Zahlen der drei Video Streaming Dienste Netflix, Amazon und Disney in verschiedenen Altersgruppen unterscheiden. Als fiktives Beispiel wird hierzu eine Umfrage in drei Altersgruppen mit folgendem Ergebnis durchgeführt:

Observed frequency:
Age in years 15-25 25-35 35-45
Netflix 25 23 20
Amazon 29 30 33
Disney 11 13 12
Others or none 16 24 26

Gleich wie beim Chi-Quadrat-Unabhängigkeitstest wird dieses Ergebnis mit der Tabelle verglichen, die sich ergeben würde, wenn die Verteilungen der Streaming-Dienste unabhängig vom Alter sind.

Effektstärke beim Chi-Quadrat Test

Bisher wissen wir nur, ob wir die Nullhypothese ablehnen können oder nicht, es ist jedoch sehr oft auch von großem Interesse zu wissen, wie stark der Zusammenhang der beiden Variablen ist. Dies kann mit Hilfe der Effektstärke beantwortet werden.

Beim Chi-Quadrat Test kann zur Berechnung der Effektstärke Cramers V verwendet werden. Hier gilt ein Wert von 0,1 als klein, einer von 0,3 als mittel und ein Wert von 0,5 als groß. Die Effektstärke berechnet Ihnen natürlich DATAtab ganz einfach mit.

Effektstärke Cramér’s V
Klein 0.1
Mittel 0.3
Groß 0.5

Effektstärke VS p-Wert

Es ist zu beachten, dass dir der p-Wert nichts über die Stärke des Zusammenhangs bzw. des Effekts aussagt und von der Stichprobengröße abhängt! Folgende Punkte gilt es daher zu bedenken:

  • Gibt es in der Grundgesamtheit einen Zusammenhang, wird dieser im p-Wert umso deutlicher angezeigt, je größer die Stichprobe ist.
  • Ist die Stichprobe sehr groß, können auch sehr kleine Zusammenhänge in der Grundgesamtheit nachgewiesen werden.
  • Diese kleinen Zusammenhänge können unter Umständen gar nicht mehr relevant ein.

Wenn somit einmal eine kleine Stichprobe und einmal eine große Stichprobe vorliegt, und in beiden Stichproben ein gleich großer Effekt besteht, würden sich die p-Werte trotzdem unterscheiden. Je größer die Stichprobe ist, desto kleiner wird der p Wert und damit lassen sich mit einer sehr großen Stichprobe auch sehr kleine Zusammenhänge bestätigen.

Hier kommt nun der Effektstärke eine wichtige Bedeutung zu. Mit der Effektstärke beim Chi-Quadrat Test können Unterschiede über mehrere Studien hinweg vergleichbar gemacht werden.

Beispiel: Chi-Quadrat-Test

Unabhängigkeitstest

Als Beispiel für einen Chi-Quadrat Test bei dem die Unabhängigkeit geprüft wird, wird der Gebrauch von Regenschirmen betrachtet. An einem regnerischen Tag wurde gezählt, wie viele Frauen und wie viele Männer mit einem Regenschirm zur Uni kommen.

Die Ergebnisse dieser Zählung sind in der folgenden Tabelle aufgelistet:

Geschlecht Schirm mit dabei
weiblich ja
männlich ja
weiblich ja
weiblich ja
männlich ja
männlich nein
weiblich nein
männlich nein
weiblich nein
weiblich nein
männlich nein
weiblich ja
männlich ja
weiblich ja
männlich ja
männlich ja
männlich nein
weiblich nein
männlich nein
weiblich nein
weiblich nein
weiblich nein
Fragestellung:

Ist der Unterschied in der Verwendung eines Regenschirms bei Frauen und bei Männern statistisch signifikant oder zufällig?

So geht's im Online-Statistik-Rechner: Nachdem du die obenstehende Tabelle in den Hypothesentest Rechner kopiert hast, kannst du den Chi-Quardat Test berechnen. Klicke hierfür einfach auf die beiden Variablen „Geschlecht“ und „Schirm mit dabei“. Als Ergebnis bekommst du die (1) Kreuztabelle, die (2) erwarteten Häufigkeit bei perfekt unabhängigen Variablen und den (3) Chi-Quadrat-Test

Schirm mit dabei
ja nein Total
Geschlecht weiblich 5 7 12
männlich 5 5 10
Total 10 12 22

Erwartete Häufigkeiten bei perfekt unabhängigen Variablen:

Schirm mit dabei
ja nein Total
Geschlecht weiblich 5,455 6,545 12
männlich 4,545 5,455 10
Total 10 12 22
Chi-Quadrat-Test
Chi Quadrat 0,153
df 1
p 0,696

Bei einem α-Niveau von 5% und einem Freiheitsgrad von 1 ergibt sich mit der Tabelle der Chi-Quadrat-Werte ein kritischer Wert von 3,841. Da der berechnete Chi-Quadrat-Wert kleiner als der kritische Wert ist, liegt in diesem Beispiel kein signifikanter Unterschied vor. Die Nullhypothese wird somit beibehalten. Inhaltlich bedeutet dies, dass sich Männer und Frauen hinsichtlich der Häufigkeit ihrer Schirmnutzung nicht voneinander unterscheiden.

Verteilungstest

In einem Wiener Stadtteil ist die Parteizugehörigkeit von 22 Personen erhoben worden. Nun soll geprüft werden, ob die BewohnerInnen des Stadtteils (Stichprobe), das gleiche Wahlverhalten haben wie die BewohnerInnen der gesamten Stadt Wien (Grundgesamtheit).

Partei
Partei A
Partei C
Partei A
Partei C
Partei A
Partei C
Partei B
Partei B
Partei C
Partei A
Partei C
Partei A
Partei A
Partei B
Partei B
Partei A
Partei A
Partei B
Partei A
Partei A
Partei C
Partei C

Um für das Beispiel den Chi-Quardat Test zu berechnen, kopierst du einfach die obenstehende Tabelle in den Statistik Rechner von DATAtab. Du erhältst somit nun folgende Ergebnisse:

Die Partei A hat in Wien einen Anteil von 40% und die Partei C von 35%. Sie erhalten somit nun folgende Ergebnisse:

Kategorie n Beobachtete Wahrsch. Erwartete Wahrsch.
Partei Partei A 10 45,455% 40%
Partei C 7 31,818% 35%
Partei B 5 22,727%
Total 22 100%
Chi-Quadrat Test
Chi Quadrat 0,264
df 2
p 0,876

Wenn das Signifikanzniveau mit 0,05 festgelegt ist, ist der mit 0,876 berechnete p-Wert größer als das Signifikanzniveau. Somit wird die Nullhypothese beibehalten und es kann davon ausgegangen werden, dass die BewohnerInnen des Stadtteils, das gleiche Wahlverhalten haben wie die BewohnerInnen der gesamten Stadt Wien.


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 321 Seiten
  • 4. überarbeitete Auflage (April 2024)
  • Nur 7,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 61 Seiten
  • 3. überarbeitete Auflage (April 2024)
  • Nur 3,99 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz