Deskriptive Statistik und Inferenzstatistik
Bei der Deskriptiven Statistik und der Inferenzstatistik handelt es sich, neben der Explorativen Statistik, um die Hauptbereiche der Statistik. Die Deskriptive Statistik stellt Werkzeuge bereit, um eine Stichprobe zu beschreiben. Ausgehend von der Stichprobe kann nun mit Hilfe der Inferenzstatistik eine Aussage über die Grundgesamtheit getroffen werden.
Deskriptive Statistik vs. Inferenzstatistik
Ein Hauptanwendungsgebiet der Statistik ist es, eine Aussage über eine Grundgesamtheit zu treffen. Da es in den meisten Fällen aber nicht möglich ist, alle Daten der Grundgesamtheit zu erhalten, wird eine Stichprobe gezogen. Diese Stichprobe kann nun mithilfe der Deskriptiven Statistik beschrieben werden, z. B. mit Lageparametern, wie dem Mittelwert und Streuungsparametern wie der Standardabweichung.
Damit kann aber noch keine Aussage über die Grundgesamtheit getroffen werden, das ist Aufgabe der Inferenzstatistik. Die Inferenzstatistik verwendet eine Stichprobe aus der Grundgesamtheit, um mit Hilfe dieser Stichprobe Schlussfolgerungen über die Grundgesamtheit zu ziehen. Ziel der Inferenzstatistik ist es also, von bekannten Parametern einer Stichprobe auf unbekannte Parameter der Grundgesamtheit zu schließen.
Im Gegensatz zur deskriptiven Statistik zielt die Inferenzstatistik daher darauf ab, Schlussfolgerungen zu ziehen, die über die unmittelbaren Daten hinausgehen. Um dies zu erreichen, werden in der Inferenzstatistik Hypothesentests wie der t-Test, die Varianzanalyse oder der Chi2-Test verwendet.
Deskriptive Statistik
Nachdem die Daten gesammelt wurden, besteht einer der ersten Schritte darin, sie grafisch darzustellen, den Mittelwert zu berechnen und einen Überblick über ihre Verteilungen zu gewinnen. Diese Aufgaben fallen in den Bereich der deskriptiven Statistik.
Daher, das Ziel der deskriptiven Statistik ist es, Daten umfassend zu beschreiben. Dazu gehört einen Überblick über ihre Verteilung zu gewinnen, zentrale Kennzahlen wie Mittelwert, Median oder Streuung zu berechnen und die Daten anschaulich darzustellen. Diese Methoden helfen dabei, Muster in den Daten zu erkennen und ihre Eigenschaften verständlich zu machen.
Die deskriptive Statistik wird auch als beschreibende Statistik bezeichnet: Sie hilft dabei Datenmengen zu beschreiben und anschaulich darzustellen.
Definition
Die deskriptive Statistik fasst statistische Methoden zusammen, die zur Beschreibung von Daten anhand von Kennzahlen, Diagrammen, Grafiken und Tabellen verwendet werden.
Wichtig ist, dass in der deskriptiven Statistik nur die Eigenschaften der jeweiligen Stichprobe beschrieben und ausgewertet werden. Es werden dabei keine Schlussfolgerungen über andere Zeitpunkte oder die Grundgesamtheit gezogen – diese Aufgabe übernimmt die Inferenzstatistik, auch schließende Statistik genannt.
Bereiche der deskriptiven Statistik
Die verschiedenen Teilbereiche der deskriptiven Statistik lassen sich folgendermaßen zusammenfassen:
Je nachdem welche Fragestellung und welches Skalenniveau vorliegen, werden unterschiedliche Kennzahlen, Tabellen und Grafiken für die Auswertung verwendet. Am bekanntesten sind hierbei:
- Lagemaße: Mittelwert, Median, Modalwert, Summe
- Streuungsmaße: Standardabweichung, Varianz, Spannweite
- Häufigkeitstabellen: absolute, relative und kumulierte Häufigkeiten
- Diagramme: Histogramme, Balkendiagramme, Boxplots, Streudiagramme, Matrixplots
Die erste Gruppe der deskriptiven Statistik umfasst Lagemaße wie den Mittelwert und den Modalwert. Diese Kennzahlen dienen dazu, die zentrale Tendenz einer Datenmenge auszudrücken, also aufzuzeigen, wo sich das Zentrum einer Stichprobe befindet oder wo ein großer Teil der Werte konzentriert ist.
Die zweite Gruppe bilden die Streuungsmaße. Sie geben an, wie stark die Werte in einer Stichprobe voneinander abweichen. Streuungsmaße beschreiben also, wie weit die Werte einer Variablen vom Mittelwert entfernt sind: Liegen sie eng beieinander und sind somit ähnlich, oder streuen sie weit auseinander? Ein klassisches Beispiel hierfür ist die Standardabweichung.
Welche Lagemaße oder Streuungsmaße zur Beschreibung der Daten geeignet sind, hängt vom jeweiligen Skalenniveau der Variablen ab. Dabei wird zwischen metrischem, ordinalem und nominalem Skalenniveau unterschieden.
Ein weiterer wichtiger Bereich der deskriptiven Statistik sind Diagramme, die zur visuellen Darstellung von Daten genutzt werden. Beispiele dafür sind Balkendiagramme, die sich besonders zur Darstellung diskreter Daten eignen, Kreisdiagramme, die Anteile im Verhältnis zum Ganzen veranschaulichen, und Histogramme, die die Häufigkeitsverteilung von metrischen Daten zeigen. Durch solche grafischen Darstellungen lassen sich Muster, Trends und Auffälligkeiten in den Daten leichter erkennen, was die Interpretation und das Verständnis der Ergebnisse deutlich erleichtert.
Tipp
Mit DATAtab kannst du Diagramme direkt in deinem Browser erstellen, z.B. kannst du ein Balkendiagramm online erstellen oder ein Boxplot online erstellen. Probiere es einfach mal aus!
Beispiel Deskriptive Statistik
Es wird eine Stichprobe von 10 männlichen Basketball Spielern gezogen, bei denen die Körpergröße in Metern gemessen wird.
Spieler | Körpergröße |
---|---|
1 | 1,62 |
2 | 1,72 |
3 | 1,55 |
4 | 1,7 |
5 | 1,78 |
6 | 1,65 |
7 | 1,64 |
8 | 1,64 |
9 | 1,66 |
10 | 1,74 |
Nachdem du die Daten in die Tabelle des Deskriptive Statistik RechnersDeskriptive Statistik Rechners kopiert hast, klicke auf 'deskriptive Statistik' und wähle die Variable 'Körpergröße' aus.
DATAtab gibt dir nun die folgende Tabelle mit deskriptiven Statistiken (die relevanten Streuungsmaße und Lagemaße) zur Körpergröße der Spieler aus.
Inferenzstatistik
Im Gegensatz zur deskriptiven Statistik zielt die Inferenzstatistik darauf ab, Aussagen über die Grundgesamtheit zu treffen. Da es in den meisten Fällen nahezu unmöglich ist, die gesamte Population zu befragen, wird stattdessen eine Stichprobe verwendet – also ein kleiner Datensatz, der aus der Grundgesamtheit entnommen wird. Mithilfe dieser Stichprobe sollen Rückschlüsse auf die gesamte Population gezogen werden. Ein Beispiel für die Inferenzstatistik wäre, wenn aus der Grundgesamtheit aller deutschen StaatsbürgerInnen eine Stichprobe von 1.000 Personen ausgewählt wird.
Je nach der Art der Aussage oder Fragestellung über die Grundgesamtheit werden in der Inferenzstatistik unterschiedliche statistische Verfahren und Hypothesentests angewendet. Die bekanntesten Verfahren sind Hypothesentests zur Überprüfung von Gruppenunterschieden, wie der t-Test, der Chi-Quadrat Test oder die Varianzanalyse. Außerdem gibt es Hypothesentests, die den Zusammenhang zwischen Variablen untersuchen, wie die Korrelationsanalyse und die Regressionsanalyse.
Im Hypothesentest-Rechner von DATAtab kannst du die verschiedenen Tests im Bereich der Inferenzstatistik unkompliziert und direkt online in deinem Browser berechnen.
Inferenzstatistik Definition
Die Inferenzstatistik ist ein Teilgebiet der Statistik, das verschiedene Analyseverfahren nutzt, um aus Stichprobendaten Rückschlüsse auf die Grundgesamtheit zu ziehen. Für eine gegebene Hypothese über die Grundgesamtheit wird eine Stichprobe herangezogen, um anhand der Stichprobendaten Hinweise auf die Gültigkeit der Hypothese zu geben.
Beispiel Inferenzstatistik
Im zuvor besprochenen Beispiel wurde eine Stichprobe von 10 Basketballspielern gezogen und anschließend diese Stichprobe beschrieben – eine Aufgabe der deskriptiven Statistik. Möchte man jedoch eine Aussage über die gesamte Grundgesamtheit treffen, kommt die Inferenzstatistik ins Spiel. Von Interesse könnte beispielsweise die Frage sein, ob Basketballspieler im Durchschnitt größer sind als die männliche Bevölkerung insgesamt. Um diese Hypothese zu prüfen, kann ein t-Test berechnet werden. Dieser vergleicht den Mittelwert der Stichprobe mit dem der Grundgesamtheit.
Darüber hinaus könnte die Frage gestellt werden, ob Basketballspieler größer sind als Fußballspieler. Dazu wird eine Stichprobe von Fußballspielern gezogen, und der Mittelwert der Basketballspieler kann anschließend mithilfe eines unabhängigen t-Tests mit dem der Fußballspieler verglichen werden. Auf dieser Grundlage lässt sich eine Aussage darüber treffen, ob Basketballspieler in der Grundgesamtheit tatsächlich größer sind als Fußballspieler.
Da die Aussage auf Grundlage einer Stichprobe getroffen wird, besteht immer die Möglichkeit, dass der Unterschied zufällig ist und Basketballspieler in dieser Stichprobe nur zufällig größer sind. Daher kann die Aussage immer nur mit einer bestimmten Wahrscheinlichkeit bestätigt oder widerlegt werden.
Statistik leichtgemacht
- Viele anschauliche Beispiele
- Ideal für Prüfungen und Abschlussarbeiten
- Statistik leichtgemacht auf 321 Seiten
- 4. überarbeitete Auflage (April 2024)
- Nur 7,99 €
"Super einfach geschrieben"
"Einfacher geht es nicht"
"Soviele hilfreiche Beispiele"
Fragebogen leichtgemacht
Dieses e-Buch gibt dir die wichtigsten Informationen die du für die Erstellung deines Fragebogens brauchst,
- Viele anschauliche Beispiele
- Ideal für die Abschlussarbeit
- Fragebogen leichtgemacht auf 61 Seiten
- 3. überarbeitete Auflage (April 2024)
- Nur 3,99 €
Statistik leichtgemacht
Endlich ohne Probleme Statistik verstehen.
Mit diesem e-Book verstehst du mit vielen Bilder und einfachen Text die Grundlagen der Statistik.