Wenn wir die Variabilität eines Datensatzes messen, gibt es zwei eng damit verbundene Statistiken: die Varianz und die Standardabweichung, die beide angeben, wie verteilt die Datenwerte sind, und ähnliche Schritte in ihre Berechnung einbeziehen. Der Hauptunterschied zwischen diesen beiden statistischen Analysen besteht jedoch darin, dass die Standardabweichung die Quadratwurzel der Varianz ist.
Um die Unterschiede zwischen diesen beiden Beobachtungen der statistischen Streuung zu verstehen, muss man zuerst verstehen, was jede repräsentiert: Die Varianz repräsentiert alle Datenpunkte in einer Menge und wird durch Mitteln der quadratischen Abweichung jedes Mittelwerts berechnet, während die Standardabweichung ein Maß für die Streuung ist um den Mittelwert, wenn die zentrale Tendenz über den Mittelwert berechnet wird.
Infolgedessen kann die Varianz als durchschnittliche quadratische Abweichung der Werte vom Mittelwert oder [Quadratabweichung des Mittels] geteilt durch die Anzahl der Beobachtungen ausgedrückt werden, und die Standardabweichung kann als Quadratwurzel der Varianz ausgedrückt werden.
Um den Unterschied zwischen diesen Statistiken vollständig zu verstehen, müssen wir die Berechnung der Varianz verstehen. Die Schritte zur Berechnung der Stichprobenvarianz lauten wie folgt:
Die Gründe für jeden dieser Schritte lauten wie folgt:
Wie bereits erwähnt, wird die Standardabweichung einfach berechnet, indem die Quadratwurzel dieses Ergebnisses ermittelt wird, die den absoluten Abweichungsstandard unabhängig von der Gesamtzahl der Datenwerte liefert.
Wenn wir die Varianz betrachten, erkennen wir, dass es einen großen Nachteil bei der Verwendung gibt. Wenn wir den Schritten der Varianzberechnung folgen, zeigt dies, dass die Varianz in quadratischen Einheiten gemessen wird, da wir in unserer Berechnung quadrierte Differenzen addiert haben. Wenn beispielsweise unsere Probendaten in Metern gemessen werden, werden die Einheiten für eine Varianz in Quadratmetern angegeben.
Um unser Spread-Maß zu standardisieren, müssen wir die Quadratwurzel der Varianz ziehen. Dies beseitigt das Problem der quadratischen Einheiten und gibt uns ein Maß für die Streuung, die dieselben Einheiten wie unsere ursprüngliche Stichprobe haben wird.
In der mathematischen Statistik gibt es viele Formeln, die besser aussehen, wenn wir sie als Varianz statt als Standardabweichung angeben.