Varianz und Standardabweichung

Varianz und Standardabweichung sind zwei eng verwandte Variationsmaße, von denen Sie in Studien, Zeitschriften oder Statistikklassen viel hören werden. Sie sind zwei grundlegende Konzepte in der Statistik, die verstanden werden müssen, um die meisten anderen statistischen Konzepte oder Verfahren zu verstehen. Nachfolgend werden wir überprüfen, was sie sind und wie die Varianz und die Standardabweichung ermittelt werden.

Wichtige Erkenntnisse: Varianz und Standardabweichung

Die Varianz und die Standardabweichung zeigen uns, um wie viel die Punkte in einer Verteilung vom Durchschnitt abweichen.
Die Standardabweichung ist die Quadratwurzel der Varianz.
Für kleine Datensätze kann die Varianz manuell berechnet werden, für größere Datensätze können Statistikprogramme verwendet werden.

Definition

Per Definition sind Varianz und Standardabweichung beide Maß für die Variation von Intervallverhältnisvariablen. Sie beschreiben, wie vielfältig eine Distribution ist. Sowohl die Varianz als auch die Standardabweichung nehmen zu oder ab, je nachdem, wie eng sich die Punktzahlen um den Mittelwert gruppieren.

Die Varianz ist definiert als der Durchschnitt der quadratischen Abweichungen vom Mittelwert. Um die Varianz zu berechnen, subtrahieren Sie zuerst den Mittelwert von jeder Zahl und quadrieren dann die Ergebnisse, um die quadratischen Differenzen zu ermitteln. Sie finden dann den Durchschnitt dieser quadrierten Differenzen. Das Ergebnis ist die Varianz.

Die Standardabweichung ist ein Maß für die Verteilung der Zahlen in einer Verteilung. Es gibt an, um wie viel jeder der Werte in der Verteilung im Durchschnitt vom Mittelwert oder Zentrum der Verteilung abweicht. Sie berechnet sich aus der Quadratwurzel der Varianz.

Ein konzeptionelles Beispiel

Die Varianz und die Standardabweichung sind wichtig, da sie uns Informationen über den Datensatz liefern, die wir nicht nur anhand des Mittelwerts oder Durchschnitts lernen können. Stellen Sie sich beispielsweise vor, Sie haben drei jüngere Geschwister: ein 13-jähriges Geschwister und zehn-jährige Zwillinge. In diesem Fall wäre das Durchschnittsalter Ihrer Geschwister 11 Jahre. Stellen Sie sich nun drei Geschwister im Alter von 17 und 12 Jahren vor , und 4. In diesem Fall wäre das Durchschnittsalter Ihrer Geschwister immer noch 11 Jahre, aber die Varianz und Standardabweichung wären größer.

Ein quantitatives Beispiel

Angenommen, wir möchten die Varianz und Standardabweichung des Alters unter Ihrer Gruppe von 5 engen Freunden ermitteln. Sie und Ihre Freunde sind 25, 26, 27, 30 und 32 Jahre alt.

Zuerst müssen wir das Durchschnittsalter finden: (25 + 26 + 27 + 30 + 32) / 5 = 28.

Dann müssen wir die Differenzen vom Mittelwert für jeden der 5 Freunde berechnen.

25 - 28 = -3
26 - 28 = -2
27 - 28 = -1
30 - 28 = 2
32 - 28 = 4

Um die Varianz zu berechnen, nehmen wir jede Differenz aus dem Mittelwert, quadrieren sie und mitteln das Ergebnis.

Varianz = ((-3)² + (-2)² + (-1)² + 2² + 4²) / 5

= (9 + 4 + 1 + 4 + 16) / 5 = 6,8

Die Varianz beträgt also 6,8. Und die Standardabweichung ist die Quadratwurzel der Varianz, die 2,61 beträgt. Dies bedeutet, dass Sie und Ihre Freunde im Durchschnitt 2,61 Jahre auseinander sind.

Obwohl es möglich ist, die Varianz für kleinere Datensätze wie diesen manuell zu berechnen, können mit statistischen Softwareprogrammen auch Varianz und Standardabweichung berechnet werden.

Stichprobe versus Population

Bei der Durchführung statistischer Tests ist es wichtig, den Unterschied zwischen a zu kennen Population und ein Stichprobe. Um die Standardabweichung (oder Varianz) einer Population zu berechnen, müssten Sie Messungen für jeden in der Gruppe, die Sie studieren, erfassen. Für eine Stichprobe würden Sie nur Messungen aus einer Teilmenge der Grundgesamtheit erfassen.

Im obigen Beispiel haben wir angenommen, dass die Gruppe von fünf Freunden eine Population ist. Wenn wir es stattdessen als Stichprobe behandelt hätten, wäre die Berechnung der Standardabweichung der Stichprobe und der Stichprobenvarianz leicht unterschiedlich (anstatt durch die Stichprobengröße zu dividieren, um die Varianz zu ermitteln, hätten wir zuerst eine von der Stichprobengröße subtrahiert und dann durch diese dividiert) kleinere Anzahl).

Bedeutung der Varianz und Standardabweichung

Die Varianz und die Standardabweichung sind in der Statistik wichtig, da sie als Grundlage für andere Arten statistischer Berechnungen dienen. Beispielsweise ist die Standardabweichung erforderlich, um Testergebnisse in Z-Ergebnisse umzuwandeln. Die Varianz und Standardabweichung spielen auch bei der Durchführung statistischer Tests wie T-Tests eine wichtige Rolle.

Verweise

Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Sozialstatistik für eine vielfältige Gesellschaft. Thousand Oaks, Kalifornien: Pine Forge Press.

Wissenschaft