Der zentrale Grenzwertsatz ist ein Ergebnis der Wahrscheinlichkeitstheorie. Dieser Satz taucht auf dem Gebiet der Statistik an mehreren Stellen auf. Obwohl der zentrale Grenzwertsatz abstrakt und ohne jede Anwendung erscheinen kann, ist dieser Satz für die Statistikpraxis tatsächlich ziemlich wichtig.
Was genau ist also die Bedeutung des zentralen Grenzwertsatzes? Alles hängt mit der Verteilung unserer Bevölkerung zusammen. Mit diesem Theorem können Sie statistische Probleme vereinfachen, indem Sie mit einer ungefähr normalen Verteilung arbeiten.
Die Aussage des zentralen Grenzwertsatzes mag recht technisch erscheinen, kann aber verstanden werden, wenn wir die folgenden Schritte durchdenken. Wir beginnen mit einer einfachen Zufallsstichprobe mit n Personen aus einer interessierenden Bevölkerung. Aus dieser Stichprobe können wir leicht einen Stichprobenmittelwert bilden, der dem Mittelwert der Messung entspricht, auf die wir in unserer Population neugierig sind.
Eine Stichprobenverteilung für den Stichprobenmittelwert wird erzeugt, indem wiederholt einfache Zufallsstichproben aus derselben Grundgesamtheit und derselben Größe ausgewählt und dann der Stichprobenmittelwert für jede dieser Stichproben berechnet wird. Diese Proben sind als unabhängig voneinander anzusehen.
Der zentrale Grenzwertsatz betrifft die Stichprobenverteilung der Stichprobenmittel. Wir können nach der Gesamtform der Stichprobenverteilung fragen. Der zentrale Grenzwertsatz besagt, dass diese Stichprobenverteilung im Allgemeinen als Glockenkurve bezeichnet wird. Diese Annäherung verbessert sich, wenn wir die Größe der einfachen Zufallsstichproben erhöhen, die zur Erstellung der Stichprobenverteilung verwendet werden.
Es gibt ein sehr überraschendes Merkmal bezüglich des zentralen Grenzwertsatzes. Die erstaunliche Tatsache ist, dass dieser Satz besagt, dass eine Normalverteilung unabhängig von der Anfangsverteilung entsteht. Selbst wenn unsere Bevölkerung eine verzerrte Verteilung aufweist, die auftritt, wenn wir beispielsweise Einkommen oder Gewichte von Personen untersuchen, ist eine Stichprobenverteilung für eine Stichprobe mit einer ausreichend großen Stichprobe normal.
Das unerwartete Auftreten einer Normalverteilung aus einer Populationsverteilung, die verzerrt ist (sogar ziemlich stark verzerrt), hat einige sehr wichtige Anwendungen in der statistischen Praxis. Viele Praktiken in der Statistik, z. B. Hypothesentests oder Konfidenzintervalle, gehen von Annahmen über die Grundgesamtheit aus, aus der die Daten stammen. In einem Statistikkurs wird zunächst davon ausgegangen, dass die Populationen, mit denen wir arbeiten, normal verteilt sind.
Die Annahme, dass die Daten aus einer normalen Verteilung stammen, vereinfacht die Sache, erscheint jedoch etwas unrealistisch. Eine kleine Arbeit mit einigen realen Daten zeigt, dass Ausreißer, Schiefe, Mehrfachspitzen und Asymmetrie ziemlich routinemäßig auftreten. Wir können das Problem von Daten aus einer Population umgehen, die nicht normal ist. Die Verwendung einer geeigneten Stichprobengröße und des zentralen Grenzwertsatzes helfen uns, das Problem von Daten aus nicht normalen Populationen zu umgehen.
Obwohl wir die Form der Verteilung, aus der unsere Daten stammen, möglicherweise nicht kennen, besagt der zentrale Grenzwertsatz, dass wir die Stichprobenverteilung so behandeln können, als ob sie normal wäre. Natürlich brauchen wir eine Stichprobengröße, die groß genug ist, damit die Schlussfolgerungen des Satzes Bestand haben. Die explorative Datenanalyse kann uns dabei helfen, festzustellen, wie groß eine Stichprobe für eine bestimmte Situation ist.