Menu

t-Test für unabhängige Stichproben

Was ist ein t-Test für unabhängige Stichproben?

Der t-Test für unabhängige Stichproben (ungepaarten t-Test) überprüft, ob sich zwei unabhängige Gruppen signifikant unterscheiden.

Der t-Test für unabhängige Stichproben wird verwendet, um eine Aussage über die Grundgesamtheit auf Basis zweier unabhängiger Stichproben zu treffen. Dazu wird der Mittelwert der beiden Stichproben verglichen. Wenn der Unterschied der Mittelwerte groß genug ist, wird angenommen, dass sich die beiden Gruppen unterscheiden.

t-Test für unabhängige Stichproben

Wofür braucht man den unabhängigen t-Test?

Nehmen wir an, wir möchten prüfen, ob es einen Unterschied zwischen zwei Gruppen in der Grundgesamtheit gibt, z.B. ob es einen Unterschied im Gehalt zwischen Männern und Frauen gibt.

Da es nicht möglich ist alle Männer und Frauen nach ihrem Gehalt zu fragen, ziehen wir eine Stichprobe. Diese kann beispielsweise 1000 Personen der deutschen Bevölkerung umfassen. Im nächsten Schritt erstellen wir eine Umfrage und senden diese zufällig ausgewählten Personen zu. Um nun anhand dieser Stichprobe eine Aussage über die Grundgesamtheit treffen zu können, benötigen wir den unabhängigen t-Test.

Was macht der unabhängige t-Test?

Der ungepaarte t-Test setzt die Mittelwertdifferenz in Relation zum Standardfehler des Mittelwerts. Der Standardfehler des Mittelwerts gibt an, wie stark der Mittelwert streut. Er zeigt somit an, wie weit der Stichprobenmittelwert der Daten wahrscheinlich vom wahren Populationsmittelwert entfernt ist. Wenn die Schwankung des Mittelwerts groß ist, ist dies ein Hinweis darauf, dass ein großer Unterschied in den Mittelwerten der beiden Gruppen sehr wahrscheinlich ist, auch durch Zufall.

Mittelwertsunterschied ungepaarter t-test

Je größer der Mittelwertsunterschied in den beiden Gruppen ist und je kleiner der Standardfehler des Mittelwerts ausfällt, desto unwahrscheinlicher ist es, dass der gegebene Mittelwertsunterschied in den beiden Stichproben auf Zufall beruht.

Was sind unabhängige Stichproben?

Unabhängige Stichproben liegen vor, wenn kein Fall oder keine Person aus einer Gruppe einem Fall oder einer Person aus der anderen Gruppe zugeordnet werden kann. Dies ist z.B. gegeben, wenn man die Gruppe der Frauen und die Gruppe der Männer oder die Gruppe der Psychologiestudierenden mit jener der Mathematikstudierenden vergleicht.

Gepaarter vs. ungepaarter t-Test

Der Hauptunterschied zwischen dem gepaarten und dem ungepaarten t-Test ist die Form der Stichprobe.

  • Wenn du ein und dieselbe Stichprobe hast, die du zu zwei unterschiedlichen Zeitpunkten befragst, verwendest du einen gepaarten t-Test.
  • Wenn du zwei verschiedene Gruppen vergleichen möchtest, egal ob sie aus einer oder zwei Stichproben stammen, verwendest du einen ungepaarten t-Test.

Beispiele für den ungepaarten t-Test

Für den unabhängigen bzw. ungepaarten t-Test gibt es viele Anwendungsbereiche. Es handelt sich dabei zum Beispiel um einen wichtigen Test in den Bereichen Biostatistik oder Marketing.

Medizinisches Beispiel:

Für eine Pharmafirma möchtest du prüfen, ob das Medikament XY beim Abnehmen hilft oder nicht. Hierzu wird 20 ProbandInnen das Medikament verabreicht und 20 ProbandInnen erhalten ein Placebo.

Sozialwissenschafliches Beispiel:

Du willst herausfinden, ob es einen Unterschied zwischen Personen mit und ohne Studium in Bezug auf deren Gesundheit gibt.

Technisches Beispiel:

Für eine Schraubenfabrik willst du herausfinden, ob zwei Produktionsanlagen Schrauben mit dem gleichen Gewicht produzieren. Um das zu testen, wiegst du 50 Schrauben von der einen Maschine ab und 50 Schrauben von der anderen und vergleichst diese.

Fragestellung und Hypothesen

Möchtest du also wissen, ob sich zwei unabhängige Gruppen unterscheiden, musst du einen t-Test für unabhängige Stichproben berechnen. Bevor der ungepaarter t-Test, ausgehend von den unabhängigen Stichproben, berechnet werden kann, müssen erstmal eine Fragestellung formuliert und die Hypothesen definiert werden.

Fragestellung

Mit der Fragestellung grenzt du deinen Untersuchungsgegenstand ein. Bei einem t-Test für unabhängige Stichproben lautet die Fragestellung allgemein: Gibt es einen statistisch signifikanten Unterschied zwischen den Mittelwerten zweier Gruppen?

Für die oberen ungepaarten t-Test Beispiele ergeben sich die folgenden Fragestellungen:

  • Hilft das Medikament XY beim Abnehmen?
  • Gibt es einen Unterschied zwischen Personen mit und ohne Studium in Bezug auf deren Gesundheit?
  • Produzieren beide Produktionsanlagen Schrauben mit dem gleichen Gewicht?

Hypothesen

Im nächsten Schritt gilt es die zu überprüfenden Hypothesen von der Fragestellung abzuleiten. Bei Hypothesen handelt es sich um Annahmen über die Realität, deren Gültigkeit möglich, aber bisher noch nicht bewiesen ist. Es werden immer zwei Hypothesen formuliert, die genau das Gegensätzliche behaupten. Diese sind die Nullhypothese und die Alternativhypothese.

Nullhypothese H0 Alternativhypothese H1

Es gibt keinen Mittelwertsunterschied zwischen den beiden Gruppen in der Grundgesamtheit.

Die beiden Gruppen kommen aus derselben Grundgesamtheit
Die beiden Populationsmittelwerte sind gleich.
H0: μ1 = μ2

Beispiel: Es gibt keinen Unterschied zwischen dem Gehalt von Männern und Frauen

Es gibt einen Mittelwertsunterschied zwischen den beiden Gruppen in der Grundgesamtheit.

Die beiden Gruppen kommen nicht aus der selben Grundgesamtheit
Die beiden Populationsmittelwerte sind nicht gleich
H1: μ1≠ μ2

Beispiel: Es gibt einen Unterschied zwischen dem Gehalt von Männern und Frauen

Voraussetzungen für den unabhängigen t-Test

Um einen unabhängigen t-Test zu berechnen, muss eine unabhängige Variable (z.B. Geschlecht) vorliegen, die zwei Ausprägungen bzw. Gruppen hat (z.B. männlich und weiblich). Diese beiden Gruppen sollen bei der Analyse verglichen werden. Die Frage ist also, gibt es einen Unterschied zwischen den zwei Gruppen hinsichtlich der abhängigen Variable (z.B. Einkommen).

Die weiteren Voraussetzungen, welche zur Durchführung eines unabhängigen t-Tests erfüllt sein müssen, werden in weitere Folge besprochen.

1. Die beiden Gruppen bzw. Stichproben müssen unabhängig sein

Wie der Name dieses t-Tests schon andeutet, müssen die Stichproben unabhängig sein. Dies bedeutet, dass ein Wert in der einen Stichprobe keinen Einfluss auf einen Wert in der anderen Stichprobe haben darf.

  • Messen des Gewichts von Personen, die eine Diät gemacht haben, und von Personen, die keine Diät gemacht haben.
  • Messen des Gewichts von einer Person vor und nach einer bestimmten Diät.

2. Die abhängige Variable muss metrisch sein

Bei dem t-Test für unabhängige Stichproben muss der Mittelwert der Stichprobe berechnet werden. Diese ist nur dann sinnvoll möglich, wenn die Variable metrisch skaliert ist.

  • Das Gewicht einer Person (in kg)
  • Der Bildungsabschluss einer Person (Hauptschule, Realschule,...).

3. Die Variablen müssen normalverteilt sein

Der t-Test für unabhängige Stichproben liefert die genauesten Ergebnisse, wenn die Daten der Gruppen jeweils normalverteilt sind. Hierzu gibt es in Spezialfällen jedoch auch Ausnahmen.

  • Das Gewicht, Alter oder die Größe einer Person.
  • Die Augenzahl nach dem Werfen eines Würfels (Gleichverteilung, da die Wahrscheinlichkeit jeder Augenzahl 1/6 ist)

4. Die Varianz innerhalb der Gruppen sollte ähnlich sein

Da für die Test-Statistik t die Varianz benötig wird, muss diese innerhalb der Gruppen gleich sein.

  • Gewicht, Alter oder Größe einer Person
  • Die Börsenkurse in "normalen" Zeiten und in einer Rezession

Voraussetzungen nicht erfüllt, was dann?

Sind die Voraussetzungen für den unabhängigen t-Test nicht erfüllt, kann der berechnete p-Wert falsch sein. Wenn die beiden Stichproben gleich groß sind, ist der t-Test jedoch recht robust gegenüber einer leichten Schiefe der Daten. Nicht robust ist der t-Test, wenn sich die Varianzen deutlich unterscheiden. [Oxford Handbook of Medical Statistics]

Sind die Variablen nicht normalverteilt, kann der Mann-Whitney-U-Test verwendet werden. Der Mann-Whitney-U-Test ist das nichtparametrische Gegenstück zum unabhängigen t-Test.

t-Test für unabhängige Stichproben berechnen

Je nachdem, ob die Varianz zwischen den beiden Gruppen als gleich oder ungleich angenommen wird, ergibt sich eine andere Formel für die Test-Statistik t. Die Prüfung ob die Varianzen gleich sind oder nicht, geschieht mit dem Levene-Test. Die Nullhypothese beim Levene-Test ist, dass sich die beiden Varianzen nicht unterscheiden. Ergibt sich also ein p-Wert von kleiner als 5% beim Levene-Test, wird davon ausgegangen, dass es einen Unterschied in den Varianzen der beiden Gruppen gibt.

Gleiche (homogene) Varianz

Ergibt sich bei dem Levene-Test ein p-Wert von größer 5%, wird davon ausgegangen, dass beide Gruppen die gleiche Varianz haben, und die Test-Statistik für den ungepaarten t-Test ergibt sich mit

t Test für unabhängige Stichproben homogene Varianz

Der kritische p-Wert lässt sich dann aus der Tabelle mit der t-Verteilung ermitteln. Der Freiheitsgrad ergibt sich mit

Freiheitsgrad

wobei n1 und n2 wieder die Anzahl der Fälle in den beiden Stichproben angeben.

Ungleiche (heterogene) Varianz

Die Test-Statistik t für einen t-Test für unabhängige Stichproben bei ungleicher Varianz errechnet sich über

t Test für unabhängige Stichproben heterogene Varianz

Der p-Wert folgt dann aus der Tabelle mit der t-Verteilung, wobei sich die Freiheitsgrade über

Freiheitsgrade

ergeben.

Konfidenzintervall für den wahren Mittelwertsunterschied

Der berechnete Mittelwertsunterschied beim unabhängigen t-Test ist mithilfe der Stichprobe berechnet worden. Jetzt ist es natürlich von Interesse, in welchem Bereich der wahre Mittelwertsunterschied liegt. Um festzustellen, innerhalb welcher Grenzen der wahre Unterschied wahrscheinlich liegt, wird das Konfidenzintervall berechnet.

Das 95% Konfidenzintervall für den wahren Mittelwertsunterschied kann durch folgende Formel berechnet werden:

Konfidenzintervall unabhängiger t-Test

wobei t der t-Wert ist, der bei 97,5% liegt und den Freiheitsgraden df ergibt.

Einseitiger und zweiseitiger unabhängiger t-Test

Wie im Artikel über den Hypothesentest erklärt worden ist, gibt es einseitige und zweiseitige Hypothesen (auch gerichtete und ungerichtet Hypothesen genannt). Um dem gerecht zu werden, gibt es auch einen einseitige und zweiseitigen t-Test für unabhängige Stichproben. Standardmäßig wird der zweiseitig ungepaarte t-Test berechnet, welcher auch in DATAtab ausgegeben wird.

Um den einseitigen t-Test für unabhängige Stichproben zu erhalten, muss der p-Wert durch zwei geteilt werden. Nun hängt es davon ab, ob die Daten "in die Richtung" der Hypothese aus tendieren oder nicht. Sagt die Hypothese, dass der Mittelwert von einer Gruppe größer bzw. kleiner als der Mittelwert der anderen Gruppe ist, muss dies auch in dem Ergebnis zu sehen sein. Ist dies nicht der Fall, muss 1 minus dem halbierten p-Wert gerechnet werden.

Ungepaarter t-Test: Effektstärke berechnen

Die Effektstärke bei einem ungepaarten t-Test wird in der Regel mit dem Hedges g, oder auch einfach nur d genannt, berechnet. Im ungepaarten t-Test Rechner auf DATAtab kannst du dir die Effektstärke ganz einfach ausgeben lassen.

Effektstärke Ungepaarter t-Test

Wofür braucht man die Effektstärke?

Der berechnete p-Wert hängt sehr stark von der Stichprobengröße ab. Gibt es z. B. in der Grundgesamtheit einen Unterschied, wird dieser im p-Wert umso deutlicher "angezeigt", je größer die Stichprobe ist. Wird also die Stichprobengröße sehr hoch gewählt, können auch sehr kleine Unterschiede, die unter Umständen gar nicht mehr relevant sind, in der Grundgesamtheit "nachgewiesen" werden. Um dies zu vereinheitlichen wird zusätzlich zum p-Wert die Effektstärke verwendet.

t-Test für unabhängige Stichproben mit DATAtab berechnen

Eine Lehrende möchte wissen, ob die Statistik-Prüfungsergebnisse im Sommersemester von jenen im Wintersemester abweichen. Hierfür erstellst du eine Übersicht mit den erreichten Punkten pro Prüfung.

Fragestellung:

Gibt es einen signifikanten Unterschied zwischen den Prüfungsergebnissen im Sommer- und im Wintersemester?

Nullhypothese H0:

Die beiden Stichproben unterscheiden sich nicht voneinander. Es gibt keinen Unterschied zwischen den Statistik-Prüfungsergebnisse im Sommersemester und im Wintersemester

Alternativhypothese H1:

Die beiden Stichproben unterscheiden sich voneinander. Es gibt einen Unterschied zwischen den Statistik-Prüfungsergebnisse im Sommersemester und im Wintersemester

Semester Punkte
Sommersemester 52
Sommersemester 61
Sommersemester 40
Sommersemester 46
Sommersemester 50
Sommersemester 56
Sommersemester 44
Sommersemester 47
Sommersemester 70
Sommersemester 40
Sommersemester 65
Sommersemester 38
Sommersemester 68
Wintersemester 53
Wintersemester 71
Wintersemester 38
Wintersemester 34
Wintersemester 68
Wintersemester 68
Wintersemester 46
Wintersemester 41
Wintersemester 38
Wintersemester 23
Wintersemester 28

Nachdem die oberen Beispieldaten in den Hypothesentest Rechner kopiert wurden, kannst du dir den t-Test für unabhängige Stichproben ausgeben lassen. Die Ergebnisse für das t Test-Beispiel sehen folgendermaßen aus:

Gruppen-Statistik
N Mittelwert Standardabweichung Standardfehler Mittelwert
Sommersemester 13 52,077 11,026 3,058
Wintersemester 11 46,182 16,708 5,038
Unabhängiger t-Test
t df p-Wert (2-seitig)
Sommersemester & Wintersemester Gleiche Varianz 1,035 22 0,312
Ungleiche Varianz 1 16,824 0,331
95% Konfidenzintervall
Mittelwertdifferenz Standardfehler der Differenz Untere Grenze Obere Grenze
Sommersemester & Wintersemester Gleiche Varianz 5,895 5,893 -6,328 18,118
Ungleiche Varianz 5,895 5,893 -6,55 18,34

Ungepaarten t-Test interpretieren

Um eine Aussage darüber zu treffen, ob Ihre Hypothese signifikant ist oder nicht, wird einer der beiden folgenden Werte verwendet bzw. berechnet:

  • p-Wert (2-Seitig)
  • unteres und oberes Konfidenzintervall der Differenz

In diesem Beispiel für den t-Test ist der p-Wert (2-Seitig) 0,312 also 31%. Das bedeutet, dass die Wahrscheinlichkeit, dass du eine Stichprobe ziehst, bei der sich beide Gruppen stärker unterscheiden als die Gruppen im Beispiel, 31% beträgt. Da das Signifikanzniveau mit 5 % festgelegt wurde, ist es damit deutlich niedriger als 31%. Aus diesem Grund wird von keinem signifikanten Unterschied zwischen den beiden Stichproben ausgegangen und sie kommen daher aus der gleichen Grundgesamtheit.

Der zweite Weg um festzustellen, ob es einen signifikanten Unterschied gibt oder nicht, ist das Konfidenzintervall der Differenz zu verwenden. Verläuft die untere und die obere Grenze durch Null, gibt es keinen signifikanten Unterschied. Ist dies nicht der Fall, gibt es einen signifikanten Unterschied. In diesem ungepaarten t-Test Beispiel ist der untere Wert -6,328 und der obere Wert 18,118. Da der untere und der obere Wert null streifen gibt es keinen signifikanten Unterschied.

Es ist gängige Praxis, zunächst einmal die beiden unabhängigen Stichproben in einem Diagramm darzustellen bevor ein t-Test für unabhängige Stichproben berechnet wird. Dazu eignet sich ein Boxplot welcher die Lagemaße und Streumaße der beiden unabhängigen Stichproben sehr gut visualisiert.

Beispiel t-test unabhängige stichproben

Statistik leichtgemacht

  • Viele anschauliche Beispiele
  • Ideal für Prüfungen und Abschlussarbeiten
  • Statistik leichtgemacht auf 260 Seiten
  • 3. überarbeitete Auflage (Januar 2023)
  • Nur 6,99 €
Leseprobe
Datatab

"Super einfach geschrieben"

"Einfacher geht es nicht"

"Soviele hilfreiche Beispiele"

Fragebogen leichtgemacht

Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,

  • Viele anschauliche Beispiele
  • Ideal für die Abschlussarbeit
  • Fragebogen leichtgemacht auf 59 Seiten
  • 2. überarbeitete Auflage (Januar 2023)
  • Nur 3,49 €
Leseprobe
Datatab

Statistik leichtgemacht

Endlich ohne Probleme Statistik verstehen.

Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.

Datatab
Leseprobe

Literatur

Statistik: Der Weg zur Datenanalyse.
Fahrmeir, L. Heumann, C. Künstler, R. Pigeot, I. & Tutz, G.
Zum Buch auf Amazon
Statistik für Human- und Sozialwissenschaftler: Limitierte Sonderausgabe.
Bortz, J. & Schuster, C.
Zum Buch auf Amazon
Fit fürs Studium – Statistik: Alle Grundlagen verständlich erklärt. Geeignet für Studiengänge mit statistischen Methoden: VWL, BWL, Informatik etc.
Grabinger B.
Zum Buch auf Amazon
Multivariate Analysemethoden: Eine anwendungsorientierte Einführung.
Backhaus, K. Erichson, B. Plinke, P. & Weiber, R.
Zum Buch auf Amazon
evaluiert: erweitertes Planungsbuch für Evaluationen im Bildungsbereich
Balzer, L. & Beywl, W.
Zum Buch auf Amazon
Basiswissen Medizinische Statistik.
Weiß, C.
Zum Buch auf Amazon
Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften.
Doring, N. & Bortz, J.
Zum Buch auf Amazon

DATAtab zitieren: DATAtab Team (2023). DATAtab: Online Statistics Calculator. DATAtab e.U. Graz, Austria. URL https://datatab.de

Kontakt & Support Beratung FAQ & About Us Statistik Software Impressum & Datenschutz