Statistische Stichproben werden in der Statistik häufig verwendet. In diesem Prozess wollen wir etwas über eine Population herausfinden. Da die Populationen typischerweise groß sind, bilden wir eine statistische Stichprobe, indem wir eine Teilmenge der Population auswählen, die eine vorbestimmte Größe hat. Indem wir die Stichprobe untersuchen, können wir mithilfe von Inferenzstatistiken etwas über die Population herausfinden.
Eine statistische Stichprobe der Größe n beinhaltet eine einzelne Gruppe von n Personen oder Themen, die zufällig aus der Bevölkerung ausgewählt wurden. Eng verwandt mit dem Konzept einer statistischen Stichprobe ist eine Stichprobenverteilung.
Eine Stichprobenverteilung liegt vor, wenn aus einer gegebenen Grundgesamtheit mehr als eine einfache Zufallsstichprobe gleicher Größe gebildet wird. Diese Stichproben gelten als unabhängig voneinander. Wenn sich also eine Person in einer Stichprobe befindet, besteht die gleiche Wahrscheinlichkeit, dass sie sich in der nächsten Stichprobe befindet, die genommen wird.
Für jede Stichprobe berechnen wir eine bestimmte Statistik. Dies kann ein Stichprobenmittelwert, eine Stichprobenvarianz oder ein Stichprobenanteil sein. Da eine Statistik von der Stichprobe abhängt, die wir haben, liefert jede Stichprobe normalerweise einen anderen Wert für die interessierende Statistik. Der Bereich der Werte, die produziert wurden, gibt uns unsere Stichprobenverteilung.
Als Beispiel betrachten wir die Stichprobenverteilung für den Mittelwert. Der Mittelwert einer Population ist ein Parameter, der normalerweise unbekannt ist. Wenn wir eine Stichprobe der Größe 100 auswählen, kann der Mittelwert dieser Stichprobe leicht berechnet werden, indem alle Werte addiert und dann durch die Gesamtzahl der Datenpunkte, in diesem Fall 100, dividiert werden. Eine Stichprobe der Größe 100 kann einen Mittelwert ergeben Eine andere solche Probe kann einen Mittelwert von 49 haben. Eine andere 51 und eine andere Probe könnten einen Mittelwert von 50,5 haben.
Die Verteilung dieser Stichprobenmittel ergibt eine Stichprobenverteilung. Wir möchten mehr als nur vier Beispielmittel betrachten, wie wir oben getan haben. Mit mehreren weiteren Stichprobenmitteln hätten wir eine gute Vorstellung von der Form der Stichprobenverteilung.
Stichprobenverteilungen mögen ziemlich abstrakt und theoretisch erscheinen. Es gibt jedoch einige sehr wichtige Konsequenzen aus der Verwendung dieser. Einer der Hauptvorteile ist, dass wir die in der Statistik vorhandene Variabilität eliminieren.
Angenommen, wir beginnen mit einer Grundgesamtheit mit einem Mittelwert von μ und einer Standardabweichung von σ. Die Standardabweichung gibt uns ein Maß dafür, wie verteilt die Verteilung ist. Wir werden dies mit einer Stichprobenverteilung vergleichen, die durch Bildung einfacher Zufallsstichproben erhalten wird n. Die Stichprobenverteilung des Mittelwerts hat immer noch einen Mittelwert von μ, die Standardabweichung ist jedoch unterschiedlich. Die Standardabweichung für eine Stichprobenverteilung beträgt σ / √ n.
Wir haben also folgendes
In der Statistik bilden wir selten Stichprobenverteilungen. Stattdessen behandeln wir Statistiken, die aus einer einfachen Zufallsstichprobe der Größe abgeleitet sind n als wären sie ein Punkt entlang einer entsprechenden Stichprobenverteilung. Dies unterstreicht erneut, warum wir relativ große Stichprobengrößen wünschen. Je größer die Stichprobe ist, desto weniger Abweichungen können wir in unserer Statistik feststellen.
Beachten Sie, dass wir außer der Mitte und der Streuung nichts über die Form unserer Stichprobenverteilung sagen können. Es hat sich herausgestellt, dass der zentrale Grenzwertsatz unter einigen ziemlich allgemeinen Bedingungen angewendet werden kann, um etwas Erstaunliches über die Form einer Stichprobenverteilung zu sagen.