t-Test für unabhängige Stichproben
Was ist ein t-Test für unabhängige Stichproben?
Der t-Test für unabhängige Stichproben (ungepaarten t-Test) überprüft, ob sich zwei unabhängige Gruppen signifikant unterscheiden.
Der t-Test für unabhängige Stichproben wird verwendet, um eine Aussage über die Grundgesamtheit auf Basis zweier unabhängiger Stichproben zu treffen. Dazu wird der Mittelwert der beiden Stichproben verglichen. Wenn der Unterschied der Mittelwerte groß genug ist, wird angenommen, dass sich die beiden Gruppen unterscheiden.
Wofür braucht man den unabhängigen t-Test?
Nehmen wir an, wir möchten prüfen, ob es einen Unterschied zwischen zwei Gruppen in der Grundgesamtheit gibt, z.B. ob es einen Unterschied im Gehalt zwischen Männern und Frauen gibt.
Da es nicht möglich ist alle Männer und Frauen nach ihrem Gehalt zu fragen, ziehen wir eine Stichprobe. Diese kann beispielsweise 1000 Personen der deutschen Bevölkerung umfassen. Im nächsten Schritt erstellen wir eine Umfrage und senden diese zufällig ausgewählten Personen zu. Um nun anhand dieser Stichprobe eine Aussage über die Grundgesamtheit treffen zu können, benötigen wir den unabhängigen t-Test.
Was macht der unabhängige t-Test?
Der ungepaarte t-Test setzt die Mittelwertdifferenz in Relation zum Standardfehler des Mittelwerts. Der Standardfehler des Mittelwerts gibt an, wie stark der Mittelwert streut. Er zeigt somit an, wie weit der Stichprobenmittelwert der Daten wahrscheinlich vom wahren Populationsmittelwert entfernt ist. Wenn die Schwankung des Mittelwerts groß ist, ist dies ein Hinweis darauf, dass ein großer Unterschied in den Mittelwerten der beiden Gruppen sehr wahrscheinlich ist, auch durch Zufall.
Je größer der Mittelwertsunterschied in den beiden Gruppen ist und je kleiner der Standardfehler des Mittelwerts ausfällt, desto unwahrscheinlicher ist es, dass der gegebene Mittelwertsunterschied in den beiden Stichproben auf Zufall beruht.
Was sind unabhängige Stichproben?
Unabhängige Stichproben liegen vor, wenn kein Fall oder keine Person aus einer Gruppe einem Fall oder einer Person aus der anderen Gruppe zugeordnet werden kann. Dies ist z.B. gegeben, wenn man die Gruppe der Frauen und die Gruppe der Männer oder die Gruppe der Psychologiestudierenden mit jener der Mathematikstudierenden vergleicht.
Gepaarter vs. ungepaarter t-Test
Der Hauptunterschied zwischen dem gepaarten und dem ungepaarten t-Test ist die Form der Stichprobe.
- Wenn du ein und dieselbe Stichprobe hast, die du zu zwei unterschiedlichen Zeitpunkten befragst, verwendest du einen gepaarten t-Test.
- Wenn du zwei verschiedene Gruppen vergleichen möchtest, egal ob sie aus einer oder zwei Stichproben stammen, verwendest du einen ungepaarten t-Test.
Beispiele für den ungepaarten t-Test
Für den unabhängigen bzw. ungepaarten t-Test gibt es viele Anwendungsbereiche. Es handelt sich dabei zum Beispiel um einen wichtigen Test in den Bereichen Biostatistik oder Marketing.
Medizinisches Beispiel:
Für eine Pharmafirma möchtest du prüfen, ob das Medikament XY beim Abnehmen hilft oder nicht. Hierzu wird 20 ProbandInnen das Medikament verabreicht und 20 ProbandInnen erhalten ein Placebo.
Sozialwissenschafliches Beispiel:
Du willst herausfinden, ob es einen Unterschied zwischen Personen mit und ohne Studium in Bezug auf deren Gesundheit gibt.
Technisches Beispiel:
Für eine Schraubenfabrik willst du herausfinden, ob zwei Produktionsanlagen Schrauben mit dem gleichen Gewicht produzieren. Um das zu testen, wiegst du 50 Schrauben von der einen Maschine ab und 50 Schrauben von der anderen und vergleichst diese.
Fragestellung und Hypothesen
Möchtest du also wissen, ob sich zwei unabhängige Gruppen unterscheiden, musst du einen t-Test für unabhängige Stichproben berechnen. Bevor der ungepaarter t-Test, ausgehend von den unabhängigen Stichproben, berechnet werden kann, müssen erstmal eine Fragestellung formuliert und die Hypothesen definiert werden.
Fragestellung
Mit der Fragestellung grenzt du deinen Untersuchungsgegenstand ein. Bei einem t-Test für unabhängige Stichproben lautet die Fragestellung allgemein: Gibt es einen statistisch signifikanten Unterschied zwischen den Mittelwerten zweier Gruppen?
Für die oberen ungepaarten t-Test Beispiele ergeben sich die folgenden Fragestellungen:
- Hilft das Medikament XY beim Abnehmen?
- Gibt es einen Unterschied zwischen Personen mit und ohne Studium in Bezug auf deren Gesundheit?
- Produzieren beide Produktionsanlagen Schrauben mit dem gleichen Gewicht?
Hypothesen
Im nächsten Schritt gilt es die zu überprüfenden Hypothesen von der Fragestellung abzuleiten. Bei Hypothesen handelt es sich um Annahmen über die Realität, deren Gültigkeit möglich, aber bisher noch nicht bewiesen ist. Es werden immer zwei Hypothesen formuliert, die genau das Gegensätzliche behaupten. Diese sind die Nullhypothese und die Alternativhypothese.
Nullhypothese H0 | Alternativhypothese H1 |
---|---|
Es gibt keinen Mittelwertsunterschied zwischen den beiden Gruppen in der Grundgesamtheit.
Die beiden Gruppen kommen aus derselben
Grundgesamtheit
Beispiel: Es gibt keinen Unterschied zwischen dem Gehalt von Männern und Frauen |
Es gibt einen Mittelwertsunterschied zwischen den beiden Gruppen in der Grundgesamtheit.
Die beiden Gruppen kommen nicht aus der
selben Grundgesamtheit
Beispiel: Es gibt einen Unterschied zwischen dem Gehalt von Männern und Frauen |
Zweiseitiger und einseitiger t-Test
Es gibt zwei Haupttypen von t-Tests: zweiseitige und einseitige Tests. Einseitige Tests können weiter in linksseitige und rechtsseitige Tests unterteilt werden. Die Entscheidung, ob ein einseitiger oder zweiseitiger Test verwendet wird und ob der Test links- oder rechtsseitig sein sollte, hängt von der spezifischen Forschungsfrage oder Hypothese ab.
Zweiseitiger t-Test
Ein zweiseitiger Test wird verwendet, wenn man prüfen möchte, ob ein Wert sich signifikant in beide Richtungen von einem bestimmten Wert unterscheidet. Er ist nützlich, wenn du Unsicherheiten darüber hast, in welche Richtung die Veränderung gehen könnte oder wenn du daran interessiert bist, einfach nur Unterschiede zu finden, ohne eine spezifische Richtung vorherzusagen.
Einseitiger t-Test
Ein einseitiger Test wird verwendet, wenn eine bestimmte Richtung der Veränderung oder des Unterschieds von Interesse ist.
- Linksseitiger t-Test: Hier überprüft man, ob der beobachtete Wert signifikant kleiner ist als der erwartete oder der Nullhypothese entspricht. Ein linksseitiger Test wird verwendet, wenn man erwartet, dass das Ergebnis kleiner oder niedriger ist als ein bestimmter Wert oder ein Durchschnitt. Beispielsweise könnte ein Forscher einen linksseitigen Test verwenden, wenn er untersucht, ob eine neue Behandlung den Blutdruck signifikant senkt.
- Rechtsseitiger t-Test: Dieser Test überprüft, ob der beobachtete Wert signifikant höher ist als der erwartete. Er wird verwendet, wenn man erwartet, dass das Ergebnis größer oder höher ist als ein bestimmter Wert oder ein Durchschnitt. Beispielsweise könnte ein Forscher einen rechtsseitigen Test verwenden, wenn er untersucht, ob eine neue Trainingsmethode zu einem signifikant höheren Muskelaufbau führt.
Zusammenfassend: Entscheide, ob deine Forschung darauf abzielt, Unterschiede in beide Richtungen (zweiseitig) oder in eine bestimmte Richtung (einseitig) zu testen. Wenn du eine Richtung prüfst, entscheide, ob du erwartest, dass die Werte niedriger oder höher als der Durchschnitt oder der Nullhypothese sind (links- oder rechtsseitig).
Voraussetzungen für den unabhängigen t-Test
Um einen unabhängigen t-Test zu berechnen, muss eine unabhängige Variable (z.B. Geschlecht) vorliegen, die zwei Ausprägungen bzw. Gruppen hat (z.B. männlich und weiblich). Diese beiden Gruppen sollen bei der Analyse verglichen werden. Die Frage ist also, gibt es einen Unterschied zwischen den zwei Gruppen hinsichtlich der abhängigen Variable (z.B. Einkommen).
Die weiteren Voraussetzungen, welche zur Durchführung eines unabhängigen t-Tests erfüllt sein müssen, werden in weitere Folge besprochen.
1. Die beiden Gruppen bzw. Stichproben müssen unabhängig sein
Wie der Name dieses t-Tests schon andeutet, müssen die Stichproben unabhängig sein. Dies bedeutet, dass ein Wert in der einen Stichprobe keinen Einfluss auf einen Wert in der anderen Stichprobe haben darf.
- Messen des Gewichts von Personen, die eine Diät gemacht haben, und von Personen, die keine Diät gemacht haben.
- Messen des Gewichts von einer Person vor und nach einer bestimmten Diät.
2. Die abhängige Variable muss metrisch sein
Bei dem t-Test für unabhängige Stichproben muss der Mittelwert der Stichprobe berechnet werden. Diese ist nur dann sinnvoll möglich, wenn die Variable metrisch skaliert ist.
- Das Gewicht einer Person (in kg)
- Der Bildungsabschluss einer Person (Hauptschule, Realschule,...).
3. Die Variablen müssen normalverteilt sein
Der t-Test für unabhängige Stichproben liefert die genauesten Ergebnisse, wenn die Daten der Gruppen jeweils normalverteilt sind. Hierzu gibt es in Spezialfällen jedoch auch Ausnahmen.
- Das Gewicht, Alter oder die Größe einer Person.
- Die Augenzahl nach dem Werfen eines Würfels (Gleichverteilung, da die Wahrscheinlichkeit jeder Augenzahl 1/6 ist)
4. Die Varianz innerhalb der Gruppen sollte ähnlich sein
Da für die Test-Statistik t die Varianz benötig wird, muss diese innerhalb der Gruppen gleich sein.
- Gewicht, Alter oder Größe einer Person
- Die Börsenkurse in "normalen" Zeiten und in einer Rezession
Voraussetzungen nicht erfüllt, was dann?
Sind die Voraussetzungen für den unabhängigen t-Test nicht erfüllt, kann der berechnete p-Wert falsch sein. Wenn die beiden Stichproben gleich groß sind, ist der t-Test jedoch recht robust gegenüber einer leichten Schiefe der Daten. Nicht robust ist der t-Test, wenn sich die Varianzen deutlich unterscheiden. [Oxford Handbook of Medical Statistics]
Sind die Variablen nicht normalverteilt, kann der Mann-Whitney-U-Test verwendet werden. Der Mann-Whitney-U-Test ist das nichtparametrische Gegenstück zum unabhängigen t-Test.
t-Test für unabhängige Stichproben berechnen
Je nachdem, ob die Varianz zwischen den beiden Gruppen als gleich oder ungleich angenommen wird, ergibt sich eine andere Formel für die Test-Statistik t. Die Prüfung ob die Varianzen gleich sind oder nicht, geschieht mit dem Levene-Test. Die Nullhypothese beim Levene-Test ist, dass sich die beiden Varianzen nicht unterscheiden. Ergibt sich also ein p-Wert von kleiner als 5% beim Levene-Test, wird davon ausgegangen, dass es einen Unterschied in den Varianzen der beiden Gruppen gibt.
Gleiche (homogene) Varianz
Ergibt sich bei dem Levene-Test ein p-Wert von größer 5%, wird davon ausgegangen, dass beide Gruppen die gleiche Varianz haben, und die Test-Statistik für den ungepaarten t-Test ergibt sich mit
Der kritische p-Wert lässt sich dann aus der Tabelle mit der t-Verteilung ermitteln. Der Freiheitsgrad ergibt sich mit
wobei n1 und n2 wieder die Anzahl der Fälle in den beiden Stichproben angeben.
Ungleiche (heterogene) Varianz
Die Test-Statistik t für einen t-Test für unabhängige Stichproben bei ungleicher Varianz errechnet sich über
Der p-Wert folgt dann aus der Tabelle mit der t-Verteilung, wobei sich die Freiheitsgrade über die folgende Gleichung ergeben:
Konfidenzintervall für den wahren Mittelwertsunterschied
Der berechnete Mittelwertsunterschied beim unabhängigen t-Test ist mithilfe der Stichprobe berechnet worden. Jetzt ist es natürlich von Interesse, in welchem Bereich der wahre Mittelwertsunterschied liegt. Um festzustellen, innerhalb welcher Grenzen der wahre Unterschied wahrscheinlich liegt, wird das Konfidenzintervall berechnet.
Das 95% Konfidenzintervall für den wahren Mittelwertsunterschied kann durch folgende Formel berechnet werden:
wobei t der t-Wert ist, der bei 97,5% liegt und den Freiheitsgraden df ergibt.
Einseitiger und zweiseitiger unabhängiger t-Test
Wie im Artikel über den Hypothesentest erklärt worden ist, gibt es einseitige und zweiseitige Hypothesen (auch gerichtete und ungerichtet Hypothesen genannt). Um dem gerecht zu werden, gibt es auch einen einseitige und zweiseitigen t-Test für unabhängige Stichproben. Standardmäßig wird der zweiseitig ungepaarte t-Test berechnet, welcher auch in DATAtab ausgegeben wird.
Um den einseitigen t-Test für unabhängige Stichproben zu erhalten, muss der p-Wert durch zwei geteilt werden. Nun hängt es davon ab, ob die Daten "in die Richtung" der Hypothese aus tendieren oder nicht. Sagt die Hypothese, dass der Mittelwert von einer Gruppe größer bzw. kleiner als der Mittelwert der anderen Gruppe ist, muss dies auch in dem Ergebnis zu sehen sein. Ist dies nicht der Fall, muss 1 minus dem halbierten p-Wert gerechnet werden.
Ungepaarter t-Test: Effektstärke berechnen
Die Effektstärke bei einem ungepaarten t-Test wird in der Regel mit dem Hedges g, oder auch einfach nur d genannt, berechnet. Im ungepaarten t-Test Rechner auf DATAtab kannst du dir die Effektstärke ganz einfach ausgeben lassen.
Wofür braucht man die Effektstärke?
Der berechnete p-Wert hängt sehr stark von der Stichprobengröße ab. Gibt es z. B. in der Grundgesamtheit einen Unterschied, wird dieser im p-Wert umso deutlicher "angezeigt", je größer die Stichprobe ist. Wird also die Stichprobengröße sehr hoch gewählt, können auch sehr kleine Unterschiede, die unter Umständen gar nicht mehr relevant sind, in der Grundgesamtheit "nachgewiesen" werden. Um dies zu vereinheitlichen wird zusätzlich zum p-Wert die Effektstärke verwendet.
t-Test für unabhängige Stichproben mit DATAtab berechnen
Eine Lehrende möchte wissen, ob die Statistik-Prüfungsergebnisse im Sommersemester von jenen im Wintersemester abweichen. Hierfür erstellst du eine Übersicht mit den erreichten Punkten pro Prüfung.
Fragestellung:
Gibt es einen signifikanten Unterschied zwischen den Prüfungsergebnissen im Sommer- und im Wintersemester?
Nullhypothese H0:
Die beiden Stichproben unterscheiden sich nicht voneinander. Es gibt keinen Unterschied zwischen den Statistik-Prüfungsergebnisse im Sommersemester und im Wintersemester
Alternativhypothese H1:
Die beiden Stichproben unterscheiden sich voneinander. Es gibt einen Unterschied zwischen den Statistik-Prüfungsergebnisse im Sommersemester und im Wintersemester
Semester | Punkte |
---|---|
Sommersemester | 52 |
Sommersemester | 61 |
Sommersemester | 40 |
Sommersemester | 46 |
Sommersemester | 50 |
Sommersemester | 56 |
Sommersemester | 44 |
Sommersemester | 47 |
Sommersemester | 70 |
Sommersemester | 40 |
Sommersemester | 65 |
Sommersemester | 38 |
Sommersemester | 68 |
Wintersemester | 53 |
Wintersemester | 71 |
Wintersemester | 38 |
Wintersemester | 34 |
Wintersemester | 68 |
Wintersemester | 68 |
Wintersemester | 46 |
Wintersemester | 41 |
Wintersemester | 38 |
Wintersemester | 23 |
Wintersemester | 28 |
Nachdem die oberen Beispieldaten in den Hypothesentest Rechner kopiert wurden, kannst du dir den t-Test für unabhängige Stichproben ausgeben lassen. Die Ergebnisse für das t Test-Beispiel sehen folgendermaßen aus:
Gruppen-Statistik
n | Mittelwert | Standardabweichung | Standardfehler Mittelwert | |
Sommersemester | 13 | 52,077 | 11,026 | 3,058 |
Wintersemester | 11 | 46,182 | 16,708 | 5,038 |
Unabhängiger t-Test
t | df | p | ||
Sommersemester & Wintersemester | Gleiche Varianz | 1,035 | 22 | 0,312 |
Ungleiche Varianz | 1 | 16,824 | 0,331 |
95% Konfidenzintervall
Mittelwertdifferenz | Standardfehler der Differenz | Untere Grenze | Obere Grenze | ||
---|---|---|---|---|---|
Sommersemester & Wintersemester | Gleiche Varianz | 5,895 | 5,893 | -6,328 | 18,118 |
Ungleiche Varianz | 5,895 | 5,893 | -6,55 | 18,34 |
Ungepaarten t-Test interpretieren
Um eine Aussage darüber zu treffen, ob Ihre Hypothese signifikant ist oder nicht, wird einer der beiden folgenden Werte verwendet bzw. berechnet:
- p-Wert (2-Seitig)
- unteres und oberes Konfidenzintervall der Differenz
In diesem Beispiel für den t-Test ist der p-Wert (2-Seitig) 0,312 also 31%. Das bedeutet, dass die Wahrscheinlichkeit, dass du eine Stichprobe ziehst, bei der sich beide Gruppen stärker unterscheiden als die Gruppen im Beispiel, 31% beträgt. Da das Signifikanzniveau mit 5 % festgelegt wurde, ist es damit deutlich niedriger als 31%. Aus diesem Grund wird von keinem signifikanten Unterschied zwischen den beiden Stichproben ausgegangen und sie kommen daher aus der gleichen Grundgesamtheit.
Der zweite Weg um festzustellen, ob es einen signifikanten Unterschied gibt oder nicht, ist das Konfidenzintervall der Differenz zu verwenden. Verläuft die untere und die obere Grenze durch Null, gibt es keinen signifikanten Unterschied. Ist dies nicht der Fall, gibt es einen signifikanten Unterschied. In diesem ungepaarten t-Test Beispiel ist der untere Wert -6,328 und der obere Wert 18,118. Da Null zwischen den beiden Werten liegt, gibt es keinen signifikanten Unterschied.
Es ist gängige Praxis, zunächst einmal die beiden unabhängigen Stichproben in einem Diagramm darzustellen bevor ein t-Test für unabhängige Stichproben berechnet wird. Dazu eignet sich ein Boxplot welcher die Lagemaße und Streumaße der beiden unabhängigen Stichproben sehr gut visualisiert.
Einen t-Test für unabhängige Stichproben berichten
Bei der Darstellung eines t-Tests für unabhängige Stichproben im APA-Stil (American Psychological Association) müssen Sie die wichtigsten Details Ihres statistischen Tests in klarer und prägnanter Form darstellen. Im Folgenden finden Sie einen allgemeinen Leitfaden, wie Sie die Ergebnisse eines t-Tests für unabhängige Stichproben gemäß APA-Stil darstellen:
Teststatistik:
Geben Sie deutlich an, dass Sie einen t-Test für unabhängige Stichproben verwenden. Geben Sie die Freiheitsgrade in Klammern nach der t"-Statistik an und geben Sie dann den Wert von t an.
Signifikanzniveau:
Dies wird in der Regel als "p" angegeben, gefolgt von dem genauen Wert oder einem Vergleich.
Effektgröße:
Es hat sich bewährt, neben dem Ergebnis des t-Tests auch eine Effektgröße (wie Cohen's d) anzugeben. Dies gibt einen Hinweis auf die Größe des Unterschieds zwischen den Gruppen.
Mittelwerte und Standardabweichungen:
Geben Sie die Mittelwerte und Standardabweichungen für jede Gruppe an. Dies gibt dem t-Test-Ergebnis einen Kontext.
Stichprobengröße:
Sie können auch die Anzahl der Teilnehmer in jeder Gruppe angeben, vor allem, wenn diese zuvor nicht angegeben wurde.
Hier ist eine Vorlage:
Es wurde ein t-Test für unabhängige Stichproben durchgeführt, um [Variable] in [Gruppe 1] und [Gruppe 2] zu vergleichen. Es wurde ein signifikanter Unterschied in den Ergebnissen für [Gruppe 1] (M = [Mittelwert], SD = [Standardabweichung]) und [Gruppe 2] (M = [Mittelwert], SD = [Standardabweichung]) festgestellt; t([Freiheitsgrade]) = [t-Wert], p = [exakter p-Wert] (zweiseitig gebunden). Das Ausmaß der Mittelwertunterschiede (Mittelwertdifferenz = [Mittelwertdifferenz], 95% CI: [Untergrenze, Obergrenze]) war [klein, mittel, groß], mit einem Cohen's d von [d-Wert].
Nehmen wir an, Sie haben einen t-Test für unabhängige Stichproben zum Vergleich der Testergebnisse von Männern und Frauen durchgeführt. Angenommen, Sie haben folgende Ergebnisse erhalten:
- Männer: M = 50, SD = 10, n = 30
- Weibliche Personen: M = 55, SD = 9, n = 30
- t(58) = -2,5, p = .015, Cohen's d = 0,5
Die Ergebnisse würden wie folgt wiedergegeben werden:
Es wurde ein t-Test für unabhängige Stichproben durchgeführt, um die Testergebnisse von Männern und Frauen zu vergleichen. Es bestand ein signifikanter Unterschied zwischen den Ergebnissen der Männer (M = 50, SD = 10) und der Frauen (M = 55, SD = 9); t(58) = -2,5, p = .015 (zweiseitiger Test). Das Ausmaß der Mittelwertunterschiede (Mittelwertdifferenz = -5, 95% CI: [hier sind die Grenzen des Konfidenzintervalls anzugeben]) war mittelgroß, mit einem Cohen's d von 0,5.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.