t-Test
Der t-Test ist ein statistisches Testverfahren, das prüft, ob es einen signifikanten Unterschied zwischen den Mittelwerten zweier Gruppen gibt.
Bei den beiden Gruppen könnte es sich beispielsweise um Patienten handeln, die einmal das Medikament A und einmal das Medikament B erhalten haben, und man möchte wissen, ob es einen Unterschied im Blutdruck zwischen diesen beiden Gruppen gibt.
Arten des t-Tests
Es gibt drei verschiedene Arten von t-Tests. Den t-Test für eine Stichprobe, den t-Test für unabhängige Stichproben und den t-Test für abhängige Stichproben.
t-Test für eine Stichprobe
Wann verwenden wir den t-Test für eine Stichprobe (einstichproben t-Test)? Wir verwenden den t-Test für eine Stichprobe, wenn wir den Mittelwert einer Stichprobe mit einem bekannten Referenzmittelwert vergleichen wollen.
Beispiel für einen t-Test bei einer Stichprobe
Ein Hersteller von Schokoriegeln behauptet, dass seine Schokoriegel im Durchschnitt 50 Gramm wiegen. Um dies zu überprüfen, wird eine Stichprobe von 30 Riegeln genommen und gewogen. Der Mittelwert dieser Stichprobe liegt bei 48 Gramm.
Wir können nun einen t-Test für eine Stichprobe durchführen, um zu prüfen, ob der Mittelwert von 48 Gramm signifikant von den behaupteten 50 Gramm abweicht.
t-Test für unabhängige Stichproben
Wann wendet man den t-Test für unabhängige Stichproben an? Wir verwenden den t-Test für unabhängige Stichproben, wenn wir die Mittelwerte von zwei unabhängigen Gruppen bzw. Stichproben vergleichen wollen. Wir möchten wissen, ob es einen signifikanten Unterschied zwischen diesen Mittelwerten gibt.
Beispiel eines t-Tests für unabhängige Stichproben
Wir möchten die Wirksamkeit von zwei Schmerzmitteln, Medikament A und Medikament B, vergleichen.
Dazu teilen wir 60 Versuchspersonen nach dem Zufallsprinzip in zwei Gruppen ein. Die erste Gruppe erhält Medikament A, die zweite Gruppe erhält Medikament B. Mit einem unabhängigen t-Test können wir nun prüfen, ob es einen signifikanten Unterschied in der Schmerzlinderung zwischen den beiden Medikamenten gibt.
t-Test für abhängigen Stichproben
Wann verwendet man den t-Test für abhängige Stichproben (gepaarter t-Test)? Der t-Test für abhängige Stichproben wird verwendet, um die Mittelwerte zweier abhängiger Gruppen zu vergleichen.
Beispiel für den t-Test bei abhängigen Stichproben
Wir wollen wissen, wie wirksam eine Diät ist. Dazu wiegen wir 30 Personen vor der Diät und genau die gleichen Personen nach der Diät.
Nun können wir für jede Person sehen, wie groß der Gewichtsunterschied zwischen vorher und nachher ist. Mit einem abhängigen t-Test können wir nun prüfen, ob es einen signifikanten Unterschied gibt.
Abhängige vs. unabhängige Stichprobe
Bei einer abhängigen Stichprobe (gepaarte Stichprobe) liegen die Messwerte paarweise vor. Die Paare entstehen z.B. durch wiederholte Messungen bei den gleichen Personen. Unabhängige Stichproben (ungepaarte Stichprobe) entstehen durch voneinander unabhängige Personen und Messungen.
Hinweis!
Der t-Test für abhängige Stichproben ist dem t-Test für eine Stichprobe sehr ähnlich. Wir können uns den t-Test für abhängige Stichproben auch so vorstellen, dass wir eine Stichprobe haben, die zu zwei verschiedenen Zeitpunkten gemessen wurde. Wir berechnen dann die Differenz zwischen den gepaarten Werten und erhalten so einen Wert für eine Stichprobe.
Einmal erhalten wir -5, einmal +2, einmal -1 und so weiter. Nun wollen wir prüfen, ob der Mittelwert von der soeben berechneten Differenz zu einem Referenzwert abweicht. In diesem Fall Null. Und genau das macht der t-Test für eine Stichprobe.
Voraussetzungen
Was sind die Voraussetzungen, um einen t-Test überhaupt berechnen zu können? Zunächst müssen wir natürlich eine geeignete Stichprobe haben.
- Für dem Einstichproben t-Test brauchen wir eine Stichprobe und einen Referenzwert.
- Bei einem unabhängigen t-Test brauchen wir zwei unabhängige Stichproben.
- Und beim abhängigen t-Test brauchen wir zwei abhängige Stichproben.
Die Variable, für die geprüft werden soll, ob es einen Unterschied zwischen den Mittelwerten gibt, muss metrisch sein. Metrische Variablen sind z.B. Alter, Körpergewicht, Einkommen. Keine metrische Variable ist z.B. der Schulabschluss einer Person (Hauptschule, Realschule,...).
Außerdem muss die metrische Variable in allen drei Varianten des t-Tests normalverteilt sein.
Wie du prüfen kannst, ob deine Daten normalverteilt sind, erfährst du in meinem Tutorial zum Test auf Normalverteilung.
Beim unabhängigen t-Test müssen die Varianzen in den beiden Gruppen noch ungefähr gleich sein. Ob die Varianzen gleich sind, kannst du mit dem Levene-Test prüfen.
Hypothesen
Was sind nun die Hypothesen für den t-Test? Beginnen wir mit dem t-Test für eine Stichprobe.
t-Test für einer Stichprobe
Beim t-Test für einer Stichprobe sind die Nullhypothese und die Alternativhypothese:
- Nullhypothese: Der Stichprobenmittelwert ist gleich dem gegebenen Referenzwert (es gibt also keinen Unterschied).
- Alternativhypothese: Der Stichprobenmittelwert ist ungleich dem gegebenen Referenzwert (es besteht also ein Unterschied).
t-Test für unabhängige Stichproben
Wie sieht es beim t-Test für unabhängige Stichproben aus? Beim unabhängigen t-test ist die Nullhypothese:
- Nullhypothese: Die Mittelwerte der beiden Gruppen sind gleich (es gibt also keinen Unterschied zwischen den beiden Gruppen).
- Alternativhypothese: Die Mittelwerte in den beiden Gruppen sind nicht gleich (es besteht also ein Unterschied zwischen den beiden Gruppen).
t-Test für abhängige Stichproben
Und schließlich der t-Test für abhängige Stichproben. Beim abhängigen t-Test ist die Nullhypothese:
- Nullhypothese: Der Mittelwert der Unterschiede zwischen den Paaren ist Null.
- Alternativhypothese: Der Mittelwert der Unterschiede zwischen den Paarungen ist ungleich Null.
Warum brauchen wir einen t-Test?
Nehmen wir an, wir haben eine Hypothese aufgestellt:
Es gibt einen Unterschied in der Studiendauer zwischen Männern und Frauen in Deutschland.
Unsere Grundgesamtheit sind also alle Absolventen eines Studiums in Deutschland. Da wir natürlich nicht alle Absolventen befragen können, ziehen wir eine möglichst repräsentative Stichprobe.
Mit dem t-Test testen wir nun die Nullhypothese, dass es keinen Unterschied in der Grundgesamtheit gibt.
Wenn es keinen Unterschied in der Grundgesamtheit gibt, dann werden wir sicherlich trotzdem einen Unterschied in der Studiendauer in der Stichprobe sehen. Es wäre sehr unwahrscheinlich, dass wir eine Stichprobe ziehen würden, bei der die Differenz genau Null ist.
Vereinfacht ausgedrückt wollen wir nun wissen, ab welchem in der Stichprobe gemessenen Unterschied wir sagen können, dass sich die Studiendauer von Männern und Frauen signifikant unterscheidet. Und genau darauf gibt der t-Test eine Antwort.
t-Test berechnen
Wie berechnet man nun einen t-Test? Zuerst berechnen wir den t-Wert:
Um den t-Wert zu berechnen, benötigen wir zwei Werte. Zum einen benötigen wir die Differenz der Mittelwerte und zum anderen die Standardabweichung vom Mittelwert. Diesen Wert nennt man Standardfehler.
Beim t-Test für eine Stichprobe berechnen wir die Differenz zwischen dem Mittelwert der Stichprobe und dem bekannten Referenzmittelwert. s ist die Standardabweichung der erhobenen Daten und n ist die Anzahl der Fälle.
s durch die Wurzel aus n ist dann die Standardabweichung vom Mittelwert bzw. der Standardfehler.
Beim t-Test für unabhängige Stichproben wird die Differenz einfach aus der Differenz der beiden Stichprobenmittelwerte berechnet.
Für die Berechnung des Standardfehlers benötigen wir die Standardabweichung und die Fallzahl der ersten und der zweiten Stichprobe.
Je nachdem, ob wir für unsere Daten gleiche oder ungleiche Varianzen annehmen können, gibt es unterschiedliche Formeln für den Standardfehler. Mehr dazu im Tutorial über den t-Test für unabhängige Stichproben
Bei einem t-Test für abhängige Stichproben brauchen wir nur die Differenz der gepaarten Werte zu berechnen und daraus den Mittelwert zu bilden. Der Standardfehler ist dann derselbe wie beim t-Test für eine Stichprobe.
t-Wert Interpretieren
Unabhängig davon, welchen t-Test wir berechnen, wird der t-Wert größer, je größer der Unterschied zwischen den Mittelwerten ist und der t-Wert wird kleiner, wenn der Unterschied zwischen den Mittelwerten kleiner ist.
Andersherum wird der t-Wert kleiner, wenn wir eine größere Streuung der Mittelwerte haben. Je größer also die Streuung der Daten ist, desto weniger fällt ein gegebener Mittelwertunterschied ins Gewicht!
Der t-Wert und die Nullhypothese
Wir wollen nun mit Hilfe des t-Tests herausfinden, ob wir die Nullhypothese verwerfen oder nicht. Dazu können wir den t-Wert auf zwei Arten verwenden. Entweder wir lesen den sogenannten kritischen t-Wert aus einer Tabelle ab oder wir berechnen einfach den p-Wert mit Hilfe des t-Wertes.
Beginnen wir mit dem Weg über den kritischen t-Wert, den wir aus einer Tabelle ablesen können. Dazu benötigen wir zunächst die Tabelle der kritischen t-Werte, die wir auf datatab.de unter, "Tutorials" und "t-Verteilung" finden. Beginnen wir zunächst mit dem zweiseitigen Fall, was eine einseitige oder gerichtete Hypothese ist. Nachfolgend sehen wir die Tabelle.
Zuerst müssen wir festlegen, welches Signifikanzniveau wir verwenden wollen. Wir wählen hier ein Signifikanzniveau von 0,05, also 5%. Dann müssen wir in der Spalte bei 1-0,05 nachschauen, also bei 0,95.
Jetzt brauchen wir noch die Freiheitsgrade. Beim t-Test für eine Stichprobe und beim t-Test für abhängige Stichproben sind die Freiheitsgrade einfach die Fallzahl minus 1. Wenn wir also eine Stichprobe von 10 Personen haben, haben wir 9 Freiheitsgrade. Beim t-Test für unabhängige Stichproben addieren wir die Anzahl der Personen aus den beiden Stichproben und errechnen daraus minus 2, da wir zwei Stichproben haben. Es ist zu beachten, dass die Freiheitsgrade auch auf andere Weise bestimmt werden können, je nachdem, ob man von gleicher oder ungleicher Varianz ausgeht.
Wenn wir also ein Signifikanzniveau von 5% und 9 Freiheitsgrade haben, erhalten wir einen kritischen t-Wert von 2,262.
Auf der einen Seite haben wir nun mit dem t-Test einen t-Wert berechnet, und dann haben wir den kritischen t-Wert. Wenn der berechnete t-Wert größer als der kritische t-Wert ist, lehnen wir die Nullhypothese ab. Angenommen, wir haben einen t-Wert von 2,5 berechnet. Dieser Wert ist größer als 2,262 und somit sind die beiden Mittelwerte so weit voneinander entfernt, dass wir die Nullhypothese ablehnen können.
Andererseits können wir auch den p-Wert für den von uns berechneten t-Wert berechnen. Wenn wir auf der Seite mit der t-Verteilung den t-Wert 2,5 und für die Freiheitsgrade 9 eintragen, erhalten wir einen p-Wert von 0,034. Der p-Wert ist kleiner als 0,05 und damit lehnen wir auch auf diese Weise die Nullhypothese ab.
Zur Kontrolle, wenn wir den t-Wert von 2,262 hier ob rein kopieren, erhalten wir genau einen p-Wert von 0,05, also genau den Grenzwert.
t-Test mit DATAtab berechnen
Wenn du einen t-Test mit DATAtab berechnen möchtest, musst du nur deine eigenen Daten in diese Tabelle kopieren, auf "Hypothesentest" klicken und dann die gewünschten Variablen auswählen.
Wenn du z.B. prüfen möchtest, ob das Geschlecht einen Einfluss auf das Einkommen hat, klickst du einfach beide Variablen an und es wird automatisch ein t-Test für unabhängige Stichproben berechnet. Unten kannst du dann den p-Wert ablesen.
Wenn du noch unsicher bist, wie du die Ergebnisse interpretieren sollst, kannst du einfach auf "Interpretation in Worten" klicken:
Gerichtete und ungerichtete Hypothese
Die letzte Frage, die sich nun noch stellt, ist, was der Unterschied zwischen einer einseitigen bzw. gerichteten Hypothese und einer zweiseitigen bzw. ungerichteten Hypothese ist. Im ungerichteten Fall ist die alternative Hypothese, dass es einen Unterschied gibt, z.B. dass es einen Unterschied zwischen dem Lohn von Männern und Frauen gibt.
In diesem Fall interessiert es uns nicht, wer von beiden mehr verdient, wir wollen nur wissen, ob es einen Unterschied gibt oder nicht. Bei einer gerichteten Hypothese interessiert uns zusätzlich die Richtung des Unterschieds. Die Alternativhypothese lautet dann z.B. Männer verdienen mehr als Frauen oder Frauen verdienen mehr als Männer.
Wenn wir uns das grafisch mit der t-Verteilung anschauen, sehen wir, dass wir im zweiseitigen Fall einmal einen Bereich links und einmal einen Bereich rechts haben. Wir wollen die Nullhypothese verwerfen, wenn wir uns entweder hier oder dort befinden. Bei einem Signifikanzniveau von 5% haben beide Bereiche eine Wahrscheinlichkeit von 2,5%, zusammen also 5%.
Wenn wir einen einseitigen t-Test prüfen, lehnen wir die Nullhypothese nur ab, wenn wir in diesem Bereich liegen, bzw. nach welchem Vorzeichen wir in diesem Bereich prüfen. Bei einem Signifikanzniveau von 5% fallen dann die gesamten 5% in diesen Bereich.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.