Die Standardabweichung der Stichprobe ist eine beschreibende Statistik, die die Ausbreitung eines quantitativen Datensatzes misst. Diese Zahl kann eine beliebige nicht negative reelle Zahl sein. Da Null eine nichtnegative reelle Zahl ist, lohnt es sich zu fragen: „Wann ist die Standardabweichung der Stichprobe gleich Null?“ Dies tritt in einem sehr speziellen und äußerst ungewöhnlichen Fall auf, in dem alle unsere Datenwerte genau gleich sind. Wir werden die Gründe dafür untersuchen.
Zwei wichtige Fragen, die wir normalerweise zu einem Datensatz beantworten möchten, sind:
Es gibt verschiedene Messungen, so genannte deskriptive Statistiken, die diese Fragen beantworten. Zum Beispiel kann das Zentrum der Daten, auch als Durchschnitt bezeichnet, als Mittelwert, Median oder Modus beschrieben werden. Andere Statistiken, die weniger bekannt sind, können verwendet werden, z. B. das Midhinge oder das Trimean.
Für die Verbreitung unserer Daten können wir den Bereich, den Interquartilbereich oder die Standardabweichung verwenden. Die Standardabweichung wird mit dem Mittelwert gepaart, um die Streuung unserer Daten zu quantifizieren. Wir können diese Zahl dann verwenden, um mehrere Datensätze zu vergleichen. Je größer unsere Standardabweichung ist, desto größer ist der Spread.
Überlegen wir uns aus dieser Beschreibung, was es bedeuten würde, eine Standardabweichung von Null zu haben. Dies würde darauf hinweisen, dass in unserem Datensatz überhaupt keine Ausbreitung vorliegt. Alle einzelnen Datenwerte würden zu einem einzigen Wert zusammengefasst. Da es nur einen Wert geben würde, den unsere Daten haben könnten, würde dieser Wert den Mittelwert unserer Stichprobe bilden.
Wenn in dieser Situation alle unsere Datenwerte gleich sind, gibt es keinerlei Abweichungen. Intuitiv ist es sinnvoll, dass die Standardabweichung eines solchen Datensatzes Null ist.
Die Standardabweichung der Stichprobe wird durch eine Formel definiert. Daher sollte jede Aussage wie die obige unter Verwendung dieser Formel bewiesen werden. Wir beginnen mit einem Datensatz, der der obigen Beschreibung entspricht: Alle Werte sind identisch, und es gibt sie n Werte gleich x.
Wir berechnen den Mittelwert dieses Datensatzes und stellen fest, dass dies der Fall ist
x = (x + x +… + x) /n = nx/n = x.
Wenn wir nun die einzelnen Abweichungen vom Mittelwert berechnen, sehen wir, dass alle diese Abweichungen Null sind. Folglich sind sowohl die Varianz als auch die Standardabweichung gleich Null.
Wir sehen, dass wenn der Datensatz keine Variation anzeigt, seine Standardabweichung Null ist. Wir können fragen, ob die Umkehrung dieser Aussage auch wahr ist. Um zu sehen, ob dies der Fall ist, verwenden wir erneut die Formel für die Standardabweichung. Dieses Mal setzen wir jedoch die Standardabweichung auf Null. Wir werden keine Annahmen über unseren Datensatz machen, aber welche Einstellung sehen s = 0 impliziert
Angenommen, die Standardabweichung eines Datensatzes ist gleich Null. Dies würde bedeuten, dass die Stichprobenvarianz s2 ist auch gleich Null. Das Ergebnis ist die Gleichung:
0 = (1 / (n - 1)) ∑ (xich - x )2
Wir multiplizieren beide Seiten der Gleichung mit n - 1 und sehen, dass die Summe der quadratischen Abweichungen gleich Null ist. Da wir mit reellen Zahlen arbeiten, besteht die einzige Möglichkeit darin, dass jede quadratische Abweichung gleich Null ist. Das bedeutet, dass für jeden etwas dabei ist ich, der Begriff (xich - x )2 = 0.
Wir nehmen nun die Quadratwurzel der obigen Gleichung und sehen, dass jede Abweichung vom Mittelwert gleich Null sein muss. Da für alle ich,
xich - x = 0
Dies bedeutet, dass jeder Datenwert dem Mittelwert entspricht. Dieses Ergebnis zusammen mit dem obigen lässt uns sagen, dass die Stichprobenstandardabweichung eines Datensatzes genau dann Null ist, wenn alle Werte identisch sind.