Menu

Hypothesentest

Hypothesentests sind statistische Testverfahren, wie z.B. der t-Test oder eine Varianzanalyse, mit denen du ausgehend von gesammelten Daten Hypothesen prüfen kannst.

Wann benötigst du einen Hypothesentest?

Ein Hypothesentest wird immer dann benötigt, wenn du eine Hypothese über die Grundgesamtheit mit Hilfe einer Stichprobe überprüfen möchtest. Hypothesentests werden also immer dann eingesetzt, wenn man mit Hilfe einer Stichprobe etwas über die Grundgesamtheit beweisen oder aussagen möchte.

Grundgesamtheit, Stichprobe und Hypothesentest

Ein mögliches Beispiel wäre, dass die Firma Müsli GmbH wissen möchte, ob ihre produzierten Müsliriegel wirklich 250g wiegen. Hierfür wird eine Stichprobe gezogen, um dann mithilfe eines Hypothesentests auf alle produzierten Müsliriegel zu schließen.

Hypothesentest

Hypothesentests haben also in der Statistik das Ziel, anhand von Stichprobenkennwerten Hypothesen über die Population bzw. Grundgesamtheit zu überprüfen.

Hypothesentests und die Nullhypothese

Wie wir aus dem vorherigen Tutorial über Hypothesen wissen, gibt es immer eine Null und eine Alternativhypothese. In der "klassischen" Inferenzstatistik wird immer die Nullhypothese mittels eines Hypothesentests geprüft. Es wird immer die Hypothese geprüft, ob es keinen Unterschied bzw. keinen Zusammenhang gibt.

Wenn man zu 100% akkurat sein möchte (auch wir bei DATAtab sind es hin und wieder nicht), kann die Nullhypothese H0 mithilfe eines Hypothesentests immer nur abgelehnt oder nicht abgelehnt werden. Die Nicht-Verwerfung von H0 ist kein ausreichender Grund für die Schlussfolgerung, dass H0 wahr ist. Es muss also immer heißen "H0 wurde nicht verworfen" und nicht "H0 wurde beibehalten"

Kurzer Vorgriff auf den p-Wert: Wenn der p-Wert kleiner als 0,05 ist, wird die Nullhypothese abgelehnt, wenn der p-Wert größer als 0,05 ist wird sie nicht abgelehnt.

Die Unsicherheit bei Hypothesentests

Ob eine Annahme bzw. Hypothese über die Grundgesamtheit durch eine Hypothesenprüfung verworfen oder nicht verworfen wird, kann immer nur mit einer bestimmten Irrtumswahrscheinlichkeit ermittelt werden. Aber wieso gibt es die Irrtumswahrscheinlichkeit?

Irrtumswahrscheinlichkeit

Hier erstmal die kurze Antwort: Bei jeder Stichprobenziehung erhält man natürlich eine andere Stichprobe, hierdurch kommen jedes Mal unterschiedliche Ergebnisse heraus. Im schlimmsten Fall wird eine Stichprobe gezogen, die zufällig sehr stark von der Grundgesamtheit abweicht und es wird die falsche Aussage getroffen. Daher gibt es bei jeder Aussage bzw. Hypothese immer eine Irrtumswahrscheinlichkeit.

Signifikanzniveau bzw. Irrtumswahrscheinlichkeit

Ein Hypothesentest kann die Nullhypothese nie mit absoluter Sicherheit verwerfen. Es besteht immer eine gewisse Irrtumswahrscheinlichkeit, dass die Nullhypothese abgelehnt wird, obwohl sie eigentlich wahr ist. Diese Irrtumswahrscheinlichkeit wird Signifikanzniveau oder α genannt.

Mit hilfe des Signifikanzniveaus wird entschieden, ob die Nullhypothese abgelehnt werden soll oder nicht. Ist der p-Wert kleiner als das Signifikanzniveau, ist die Nullhypothese abzulehnen; andernfalls ist sie nicht abzulehnen.

In der Regel wird ein Signifikanzniveau von 5% oder 1% festgelegt. Wird ein Signifikanzniveau von 5% festgelegt, bedeutet dies, dass es zu 5% wahrscheinlich ist, die Nullhypothese abzulehnen, obwohl sie eigentlich wahr ist.

Verdeutlicht am Zweistichproben-t-Test bedeutet dies Folgendes: Die beobachteten Mittelwerte von zwei Stichproben haben einen gewissen Abstand zueinander. Je größer dieser beobachtete Abstand der Mittelwerte ist, desto unwahrscheinlicher wird es, dass beide Stichproben aus derselben Grundgesamtheit stammen. Die Frage ist nun, ab wann ist es "unwahrscheinlich genug", um die Nullhypothese zu verwerfen? Wird ein Signifikanzniveau von 5% festgelegt, ist es ab 5% "unwahrscheinlich genug", um die Nullhypothese abzulehnen.

Wie wahrscheinlich es ist, dass zwei Stichproben aus einer Grundgesamtheit gezogen werden und der beobachtete Mittelwertabstand der Stichproben oder ein noch größerer Abstand auftritt, wird durch den p-Wert angegeben. Dementsprechen ist der p-Wert kleiner als das Signifikanzniveau. Wird die Nullhypothese abgelehnt, ist der p-Wert größer als das Signifikanzniveau, wird die Nullhypothese nicht abgelehnt.

Ergibt sich z.B. ein p-Wert von 0,04, liegt die Wahrscheinlichkeit, dass zwei Gruppen mit einem beobachteten Mittelwertabstand oder einem noch größeren Abstand aus derselben Grundgesamtheit kommen, bei 4%. Der p-Wert ist damit kleiner als das Signifikanzniveau von 5% und somit wird die Nullhypothese abgelehnt.

Wichtig ist, dass das Signifikanzniveau immer vor der Untersuchung festgelegt wird und nicht nachträglich geändert werden darf, um doch noch die "gewünschte" Aussage zu erhalten. Um eine gewisse Vergleichbarkeit zu gewährleisten, liegt das Signifikanzniveau meistens bei 5% oder bei 1%.

  • α ≤ 1% hochsignifikant (h.s.)
  • α ≤ 5% signifikant (s.)
  • α > 5% nicht signifikant (n.s.)

Beispiel Signifikanzniveau und p-Wert

Nullhypothese H0: Männer und Frauen in Österreich unterscheiden sich hinsichtlich ihres durchschnittlichen Monatsnettoeinkommens nicht.

Um diese Hypothese zu prüfen, wird ein Signifikanzniveau von 5% festgelegt und in einer Umfrage werden 600 Frauen und 600 Männer nach ihrem Gehalt gefragt. Ein unabhängiger t-Test ergibt einen p-Wert von 0,04

Der p-Wert 0,04 ist kleiner als das Signifikanzniveau von 0,05, damit wird die Nullhypothese zurückgewiesen. Auf der Grundlage der erhobenen Daten haben wir ausreichende Belege dafür, dass es einen statistisch signifikanten Unterschied im durchschnittlichen Monatsnettoeinkommen von Männern und Frauen in Österreich gibt.

Fehlerarten bei Hypothesentests

Dadurch, dass eine Hypothese immer nur mit einer gewissen Wahrscheinlichkeit abgelehnt werden kann, ergeben sich verschiedene Fehlerarten. Aufgrund der Stichprobenauswahl kann es passieren, dass zufällig die Nullhypothese abgelehnt wird, obwohl es in Wirklichkeit keinen Unterschied gibt, also die Nullhypothese gilt. Umgekehrt kann das Ergebnis vom Hypothesentest auch sein, dass die Nullhypothese nicht abgelehnt wird, obwohl es in Wirklichkeit einen Unterschied gibt und damit eigentlich die Alternativhypothese wahr ist.

Demnach ergeben sich bei der Überprüfung von Hypothesen zwei Fehlerarten:

  • α–Fehler (Fehler 1. Art): Wenn die Alternativhypothese angenommen wird, obwohl die Nullhypothese gilt.
  • β-Fehler (Fehler 2. Art): Wenn die Nullhypothese beibehalten wird, obwohl die Alternativhypothese gilt.

Insgesamt ergeben sich folgende Fälle:

Fehlerarten Hypothesentest

Signifikanz vs Effektstärke

Wir wissen nun, dass wir in der Regel die Alternativhypothese bei einem p-Wert von kleiner als 0,05 akzeptieren. Wir gehen dann davon aus, dass es einen Effekt, z.B. einen Unterschied zwischen zwei Gruppen, gibt.

Wichtig ist aber zu berücksichtigen, dass nur weil ein Effekt statistisch signifikant ist, bedeutet dies nicht, dass der Effekt auch relevant ist.

Wenn eine sehr große Stichprobe genommen wird und die Stichprobe eine sehr kleine Streuung hat, kann auch ein sehr kleiner Unterschied zwischen zwei Gruppen signifikant sein, der unter Umständen aber für dich nicht relevant ist.

Beispiel

Eine Firma vertreibt Tiefkühlpizza und möchte testen, ob ein hochwertigere Verpackung zu steigenden Verkaufszahlen führt.

Ausgehend von den gesammelten Daten geht hervor, dass der p-Wert kleiner als 0,05 ist und es damit einen statistisch signifikanten Anstieg gibt.

Also die Firma kann davon ausgehen, dass die hochwertige Verpackung die Verkaufszahlen statistisch signifikant steigert. Es ist eben weniger als 5% wahrscheinlich, das dieser Anstieg oder ein noch größerer auftreten würde, wenn die Verpackungen keinen Einfluss hätte.

Jetzt ist aber die Frage, ob der Anstieg auch wirtschaftlich relevant ist. Es kann sein, dass die Einnahmen durch die gesteigerten Verkaufszahlen, nicht die höheren Kosten der Verpackung kompensieren.

Daher sollte man immer beides betrachten, ob ein Effekt signifikant ist und ob der Effekt überhaupt relevant ist.

Wie finde Ich den passenden Hypothesentest?

Um nun Hypothesen zu überprüfen, stehen verschiedene Testverfahren bzw. Hypothesentests zur Auswahl. Die Frage nach der Wahl des passenden Hypothesentests hängt von mehreren Faktoren ab und es gibt mehrere Fragen, die du dir stellen musst, um beim richtigen Test zu landen.

Diese werden einerseits nach dem Skalenniveau der interessierenden Merkmale unterteilt

und andererseits danach, wie viele Stichproben vorhanden sind und wie die Stichproben zueinander in Beziehung stehen.

DATAtab unterstützt dich bei der Suche nach dem passenden Test, du brauchst einfach nur die Daten auswählen, die du auswerten möchtest. Je nachdem, welches Skalenniveau deine Daten haben, schlägt dir DATAtab dann den passenden Test vor.

Hypothesentest finden

Je nachdem welche Variablen ausgewählt sind, wird berechnet:

  • Einfacher t-Test
  • Abhängiger t-Test
  • Unabhängiger t-Test
  • Chi Quadrat-Test
  • Binomialtest
  • ANOVA mit/ohne Messwiederholung
  • 2 fakt. ANOVA mit/ohne Messwiederholung
  • Wilcoxon-Test
  • Mann-Whitney U-Test
  • Friedman Test
  • Kruskal-Wallis Test
  • ...

In der folgenden Tabelle sind die relevanten Testverfahren aufgeführt. Wenn du das Skalenniveau der Variablen in deiner Hypothese kennst, kannst du in der Tabelle sehen, welcher Test passen könnte!

Skalenniveau
nominal ordinal metrisch
Binomialtest 1 x nominal
t-test für eine Stichprobe 1 x metrisch
Chi-Quadrat Test 1 x oder 2 x nominal
t-Test für unabhängige Stichproben 1 x nominal mit zwei Ausprägungen 1 x metrisch
U-Test von Mann-Whitney 1 x nominal mit zwei Ausprägungen 1 x ordinal
Einfaktorielle Varianzanalyse 1 x nominal mit mehr als zwei Ausprägungen 1 x metrisch
Kruskal-Wallis-Test 1 x nominal mit mehr als zwei Ausprägungen 1 x ordinal
Pearson Korrelation 2 x metrisch
Spearman Korrelation 2 x ordinal
Punktbiseriale Korrelation 1 x nominal mit zwei Ausprägungen 1 x metrisch
t-Test für abhängige Stichproben 2 x metrisch
Wilcoxon-Test 2 x ordinal
Varianzanalyse für Messwiederholungen mehr als 2 x metrisch
Friedman Test mehr als 2 x ordinal

Soll eine Zusammenhangshypothese geprüft werden, wird eine Korrelationsanalyse berechnet. Hier wird dann entweder die Pearson-Korrelation oder die Spearman-Korrelation verwendet.

Beispiele für Hypothesentests

t-Test für unabhängige Stichproben

Gibt es einen Unterschied in der durchschnittlichen Anzahl von Einbrüchen (abhängige Variable) in Häuser mit und ohne Alarmanlage (unabhängige Variable mit 2 Gruppen)?

t-Test für abhängige Stichproben

Wirkt sich der Konsum von Zigaretten negativ auf den Blutdruck von Studierenden aus? (Vorher-Nachher-Messung)

Einfaktorielle Varianzanalyse

Unterscheiden sich Personen, die in kleinen, mittleren oder großen Städten (unabhängige Variable mit drei Gruppen) wohnen hinsichtlich ihres Gesundheitsbewusstseins (=abhängige Variable).


Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 321 Seiten
  • 4. überarbeitete Auflage (April 2024)
  • Nur 7,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 61 Seiten
  • 3. überarbeitete Auflage (April 2024)
  • Nur 3,99 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2024). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz