Chi²-Test

Chi²-Test Datensatz laden

Der Chi-Quadrat-Test ist ein Hypothesentest, der dann verwendet wird, wenn man feststellen möchte, ob es einen Zusammenhang zwischen zwei kategorischen Variablen gibt.

Was sind nun nochmal kategorische Variablen? Kategorische Variablen sind z.B. das Geschlecht, die präferierte Zeitung, die Häufigkeit des Fernsehens oder der höchste Bildungsabschluss einer Person. Soll nun bei zwei kategorischen Variablen geprüft werden, ob es einen Zusammenhang zwischen ihnen gibt, verwendet man einen Chi² Test.

Definition:

Der Chi-Quadrat-Test ist ein Hypothesentest der bei kategorischen Variablen, also bei nominalem oder ordinalem Skalenniveau verwendet wird. Der Chi-Quadrat-Test prüft, ob sich die in der Stichprobe vorkommenden Häufigkeiten signifikant von jenen Häufigkeiten unterscheiden, die man erwarten würde. Es werden somit die beobachteten Häufigkeiten mit den erwarteten Häufigkeiten verglichen und deren Abweichungen wird untersucht.

Sagen wir, wir möchten untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss gibt. Hierfür erstellen wir einen Fragebogen, bei dem die TeilnehmerInnen ankreuzen, welches Geschlecht sie haben und was deren höchster Bildungsabschluss ist. Das Ergebnis der Umfrage wird anschließend in einer Kreuztabelle dargestellt.

Um zu untersuchen, ob es einen Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss gibt wird der Chi-Quadrat Test verwendet.

Nullhypothese und Alternativhypothese

Die Nullhypothese und die Alternativhypothese ergeben sich dann zu:

Nullhypothese: Es besteht kein Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss.

Alternativhypothese: Es besteht ein Zusammenhang zwischen dem Geschlecht und dem höchsten Bildungsabschluss.

Tipp: Auf DATAtab kannst du den Chi-Quadrat-Test online berechnen. Besuche hierfür einfach den Chi-Quadrat Test Rechner

Anwendungsbereiche des Chi-Quadrat Tests

Es gibt verschiedene Anwendungsbereiche des Chi-Quadrat-Test, er kann verwendet werden, um folgende Fragen zu beantworten:

1) Unabhängigkeitstest

Sind zwei kategorische Variablen voneinander unabhängig? Hat beispielsweise das Geschlecht einen Einfluss darauf, ob eine Person ein Netflix-Abo besitzt oder nicht?

2) Verteilungstest

Sind die beobachteten Ausprägungen zweier kategorischer Variablen gleich der erwarteten? Eine Fragestellung könnte sein, wird einer von den drei Video Streaming Diensten Netflix, Amazon und Disney überdurchschnittlich viel abonniert?

3) Homogenitätstest

Stammen zwei oder mehr Stichproben aus derselben Grundgesamtheit? Eine Fragestellung könnte sein, ob sich die Abo-Zahlen der drei Video Streaming Dienste Netflix, Amazon und Disney in verschiedenen Altersgruppen unterscheiden.

Chi-Quadrat berechnen

Der Chi-Quadrat-Wert berechnet sich über:

Um die Berechnung des Chi-Quadrat Wertes zu verdeutlichen, beziehen wir uns auf folgenden Fall: Für die Variablen eins und zwei mit der Kategorie A und B wurde eine Beobachtung gemacht bzw. es existiert eine Stichprobe. Nun soll geprüft werden, ob die Häufigkeiten aus der Stichprobe den erwarteten Häufigkeiten aus der Grundgesamtheit entsprechen.

Beobachtete Häufigkeit:

	Kategorie A	Kategorie B
Kategorie A	10	13
Kategorie B	13	14

Erwartete Häufigkeit:

	Kategorie A	Kategorie B
Kategorie A	9	11
Kategorie B	12	13

Mit der oberen Formel kannst du nun das Chi-Quadrat berechnen:

Nachdem das Chi-Quadrat berechnet worden ist, wird noch der Freiheitsgrad df benötigt. Dieser ergibt sich durch

mit

p: Anzahl der Zeilen
q: Anzahl der Spalten

Aus der Tabelle der Chi-Quadrat Verteilung kann man nun den kritischen Chi-Quadrat Wert ablesen. Für ein Signifikanzniveau von 5 % ergibt sich dieser zu 3,841. Da der berechnete Chi-Quadrat Wert kleiner ist, ergibt sich kein signifikanter Unterschied.

Als Voraussetzung für diesen Test gilt zu beachten, dass alle erwarteten Häufigkeiten größer als 5 sein müssen.

Chi-Quadrat-Unabhängigkeitstest

Der Chi-Quadrat-Unabhängigkeitstest wird berechnet, wenn zwei kategorische Variablen auf ihre Unabhängigkeit geprüft werden sollen. Es gilt dabei zu analysieren, ob die Merkmalsausprägungen der ersten Variablen von den Merkmalsausprägungen der zweiten beeinflusst werden und umgekehrt.

Eine Frage könnte in diesem Zusammenhang beispielsweise sein „Hat das Geschlecht einen Einfluss darauf, ob eine Person ein Netflix Abo hat, oder nicht?“ Für die beiden Variablen „Geschlecht“ (männlich, weiblich) und „Besitz eines Netflix Abos“ (Ja, Nein) wird geprüft, ob diese unabhängig sind. Ist dies nicht der Fall besteht ein Zusammenhang zwischen den Merkmalen. Die Forschungsfrage, welche mit dem Chi-Quadrat Test beantwortet werden kann, lautet: Sind die Merkmale Geschlecht und Besitz eines Netflix Abos unabhängig voneinander.

Um das Chi-Quadrat berechnen zu können, muss also eine beobachtete und eine erwartete Häufigkeit gegeben sein. Beim Unabhängigkeitstest ist die erwartete Häufigkeit diejenige, die sich ergibt, wenn beide Variablen unabhängig sind. Wenn zwei Variablen unabhängig sind, ergeben sich die erwarteten Häufigkeiten der einzelnen Zellen mit

wobei i und j jeweils die Anzahl der Zeilen und Spalten der Tabelle sind.

Für das fiktive Netflix-Beispiel könnte sich folgende Tabellen ergeben. Links ist die Tabelle mit den in der Stichprobe beobachteten Häufigkeiten dargestellt und rechts die Tabelle, die sich ergeben würde, wenn perfekte Unabhängigkeit vorliegt.

Beobachtete Häufigkeit:

	Männlich	Weiblich
Netflix Ja	10	13
Netflix Nein	15	14

Erwartete Häufigkeit wenn unabhängig:

	Männlich	Weiblich
Netflix Ja	(23 · 25) / 52 = 11,06	(23 · 27) / 52 = 11,94
Netflix Nein	(29 · 25) / 52 = 13,94	(29 · 27) / 52 = 15,06

Das Chi-Quadrat berechnet sich dann folgendermaßen:

Aus der Chi-Quadrat Tabelle kann man nun wieder den kritischen Wert ablesen und mit dem Ergebnis vergleichen.

Die Voraussetzungen für den Chi-Quadrat-Unabhängigkeitstest sind, dass die Beobachtungen aus einer Zufallsstichprobe stammen und dass die erwarteten Häufigkeiten pro Zelle größer als 5 sind.

Chi-Quadrat-Verteilungstest

Liegt eine Variable mit zwei oder mehreren Ausprägungen vor, können die Unterschiede in der Häufigkeit der einzelnen Ausprägungen untersucht werden.

Der Chi-Quadrat Verteilungstest, oder auch Anpassungstest genannt, prüft, ob die Häufigkeiten der einzelnen Merkmalsausprägungen in der Stichprobe den Häufigkeiten von einer definierten Verteilung entsprechen. Diese definierte Verteilung entspricht in den meisten Fällen jener der Grundgesamtheit. In diesem Fall wird geprüft, ob die Stichprobe aus der jeweiligen Grundgesamtheit stammt.

Hier ein Beispiel: Für Marktforscher könnte von Interesse sein, ob es einen Unterschied in der Marktdurchdringung von den drei Video Streaming Diensten Netflix, Amazon und Disney zwischen Berlin und ganz Deutschland gibt. Die erwartete Häufigkeit ist dann die Verteilung der Streaming Dienste in ganz Deutschland und die beobachtete Häufigkeit resultiert aus einer Umfrage in Berlin. In den folgenden Tabellen sind die fiktiven Ergebnisse für den Chi-Quadrat Anpassungstest dargestellt

Beobachtete Häufigkeit in Berlin:

Video Dienst	Häufigkeit
Netflix	25
Amazon	29
Disney	13
Anderen oder keinen	20

Erwartete Häufigkeit (ganz Deutschland):

Video Dienst	Häufigkeit
Netflix	23
Amazon	26
Disney	16
Anderen oder keinen	22

Das Chi-Quadrat ergibt sich dann zu

Chi-Quadrat-Homogenitätstest

Mit dem Chi-Quadrat-Homogenitätstest kann geprüft werden, ob zwei oder mehr Stichproben aus derselben Grundgesamtheit stammen? Eine Fragestellung könnte sein, ob sich die Abo-Zahlen der drei Video Streaming Dienste Netflix, Amazon und Disney in verschiedenen Altersgruppen unterscheiden. Als fiktives Beispiel wird hierzu eine Umfrage in drei Altersgruppen mit folgendem Ergebnis durchgeführt:

Observed frequency:

Age in years	15-25	25-35	35-45
Netflix	25	23	20
Amazon	29	30	33
Disney	11	13	12
Others or none	16	24	26

Gleich wie beim Chi-Quadrat-Unabhängigkeitstest wird dieses Ergebnis mit der Tabelle verglichen, die sich ergeben würde, wenn die Verteilungen der Streaming-Dienste unabhängig vom Alter sind.

Effektstärke beim Chi-Quadrat Test

Bisher wissen wir nur, ob wir die Nullhypothese ablehnen können oder nicht, es ist jedoch sehr oft auch von großem Interesse zu wissen, wie stark der Zusammenhang der beiden Variablen ist. Dies kann mit Hilfe der Effektstärke beantwortet werden.

Beim Chi-Quadrat Test kann zur Berechnung der Effektstärke Cramers V verwendet werden. Hier gilt ein Wert von 0,1 als klein, einer von 0,3 als mittel und ein Wert von 0,5 als groß. Die Effektstärke berechnet Ihnen natürlich DATAtab ganz einfach mit.

Effektstärke	Cramér’s V
Klein	0.1
Mittel	0.3
Groß	0.5

Effektstärke VS p-Wert

Es ist zu beachten, dass dir der p-Wert nichts über die Stärke des Zusammenhangs bzw. des Effekts aussagt und von der Stichprobengröße abhängt! Folgende Punkte gilt es daher zu bedenken:

Gibt es in der Grundgesamtheit einen Zusammenhang, wird dieser im p-Wert umso deutlicher angezeigt, je größer die Stichprobe ist.
Ist die Stichprobe sehr groß, können auch sehr kleine Zusammenhänge in der Grundgesamtheit nachgewiesen werden.
Diese kleinen Zusammenhänge können unter Umständen gar nicht mehr relevant ein.

Wenn somit einmal eine kleine Stichprobe und einmal eine große Stichprobe vorliegt, und in beiden Stichproben ein gleich großer Effekt besteht, würden sich die p-Werte trotzdem unterscheiden. Je größer die Stichprobe ist, desto kleiner wird der p Wert und damit lassen sich mit einer sehr großen Stichprobe auch sehr kleine Zusammenhänge bestätigen.

Hier kommt nun der Effektstärke eine wichtige Bedeutung zu. Mit der Effektstärke beim Chi-Quadrat Test können Unterschiede über mehrere Studien hinweg vergleichbar gemacht werden.

Beispiel: Chi-Quadrat-Test

Unabhängigkeitstest

Als Beispiel für einen Chi-Quadrat Test bei dem die Unabhängigkeit geprüft wird, wird der Gebrauch von Regenschirmen betrachtet. An einem regnerischen Tag wurde gezählt, wie viele Frauen und wie viele Männer mit einem Regenschirm zur Uni kommen.

Die Ergebnisse dieser Zählung sind in der folgenden Tabelle aufgelistet:

Geschlecht	Schirm mit dabei
weiblich	ja
männlich	ja
weiblich	ja
weiblich	ja
männlich	ja
männlich	nein
weiblich	nein
männlich	nein
weiblich	nein
weiblich	nein
männlich	nein
weiblich	ja
männlich	ja
weiblich	ja
männlich	ja
männlich	ja
männlich	nein
weiblich	nein
männlich	nein
weiblich	nein
weiblich	nein
weiblich	nein

Fragestellung:

Ist der Unterschied in der Verwendung eines Regenschirms bei Frauen und bei Männern statistisch signifikant oder zufällig?

So geht's im Online-Statistik-Rechner: Nachdem du die obenstehende Tabelle in den Hypothesentest Rechner kopiert hast, kannst du den Chi-Quardat Test berechnen. Klicke hierfür einfach auf die beiden Variablen „Geschlecht“ und „Schirm mit dabei“. Als Ergebnis bekommst du die (1) Kreuztabelle, die (2) erwarteten Häufigkeit bei perfekt unabhängigen Variablen und den (3) Chi-Quadrat-Test

		Schirm mit dabei
		ja	nein	Total
Geschlecht	weiblich	5	7	12
	männlich	5	5	10
	Total	10	12	22

Erwartete Häufigkeiten bei perfekt unabhängigen Variablen:

		Schirm mit dabei
		ja	nein	Total
Geschlecht	weiblich	5,455	6,545	12
	männlich	4,545	5,455	10
	Total	10	12	22

Chi-Quadrat-Test
Chi Quadrat	0,153
df	1
p	0,696

Bei einem α-Niveau von 5% und einem Freiheitsgrad von 1 ergibt sich mit der Tabelle der Chi-Quadrat-Werte ein kritischer Wert von 3,841. Da der berechnete Chi-Quadrat-Wert kleiner als der kritische Wert ist, liegt in diesem Beispiel kein signifikanter Unterschied vor. Die Nullhypothese wird somit beibehalten. Inhaltlich bedeutet dies, dass sich Männer und Frauen hinsichtlich der Häufigkeit ihrer Schirmnutzung nicht voneinander unterscheiden.

Verteilungstest

In einem Wiener Stadtteil ist die Parteizugehörigkeit von 22 Personen erhoben worden. Nun soll geprüft werden, ob die BewohnerInnen des Stadtteils (Stichprobe), das gleiche Wahlverhalten haben wie die BewohnerInnen der gesamten Stadt Wien (Grundgesamtheit).

Partei
Partei A
Partei C
Partei A
Partei C
Partei A
Partei C
Partei B
Partei B
Partei C
Partei A
Partei C
Partei A
Partei A
Partei B
Partei B
Partei A
Partei A
Partei B
Partei A
Partei A
Partei C
Partei C

Um für das Beispiel den Chi-Quardat Test zu berechnen, kopierst du einfach die obenstehende Tabelle in den Statistik Rechner von DATAtab. Du erhältst somit nun folgende Ergebnisse:

Die Partei A hat in Wien einen Anteil von 40% und die Partei C von 35%. Sie erhalten somit nun folgende Ergebnisse:

	Kategorie	n	Beobachtete Wahrsch.	Erwartete Wahrsch.
Partei	Partei A	10	45,455%	40%
	Partei C	7	31,818%	35%
	Partei B	5	22,727%
	Total	22	100%

Chi-Quadrat Test
Chi Quadrat	0,264
df	2
p	0,876

Wenn das Signifikanzniveau mit 0,05 festgelegt ist, ist der mit 0,876 berechnete p-Wert größer als das Signifikanzniveau. Somit wird die Nullhypothese beibehalten und es kann davon ausgegangen werden, dass die BewohnerInnen des Stadtteils, das gleiche Wahlverhalten haben wie die BewohnerInnen der gesamten Stadt Wien.

Statistik leichtgemacht

Viele anschauliche Beispiele
Ideal für Prüfungen und Abschlussarbeiten
Statistik leichtgemacht auf 321 Seiten
4. überarbeitete Auflage (April 2024)
Nur 7,99 €

Leseprobe

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

Viele anschauliche Beispiele
Ideal für die Abschlussarbeit
Fragebogen leichtgemacht auf 61 Seiten
3. überarbeitete Auflage (April 2024)
Nur 3,99 €

Leseprobe

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.

Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.

Zum Buch auf Amazon

Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.

Bortz, J. & Schuster, C.

Zum Buch auf Amazon

Chi2-Test

Definition:

Nullhypothese und Alternativhypothese

Anwendungsbereiche des Chi-Quadrat Tests

1) Unabhängigkeitstest

2) Verteilungstest

3) Homogenitätstest

Chi-Quadrat berechnen

Beobachtete Häufigkeit:

Erwartete Häufigkeit:

Chi-Quadrat-Unabhängigkeitstest

Beobachtete Häufigkeit:

Erwartete Häufigkeit wenn unabhängig:

Chi-Quadrat-Verteilungstest

Beobachtete Häufigkeit in Berlin:

Erwartete Häufigkeit (ganz Deutschland):

Chi-Quadrat-Homogenitätstest

Observed frequency:

Effektstärke beim Chi-Quadrat Test

Effektstärke VS p-Wert

Beispiel: Chi-Quadrat-Test

Unabhängigkeitstest

Fragestellung:

Verteilungstest

Statistik leichtgemacht

Fragebogen leichtgemacht

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Literatur

Statistik: Der Weg zur Datenanalyse.

Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.

Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.

Bortz, J. & Schuster, C.

Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.

Grabinger B.

Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.

Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.

evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich

Balzer, L. & Beywl, W.

Basiswissen Medizinische Statistik.

Weiß, C.

Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.

Doring, N. & Bortz, J.

Chi²-Test