Beispiel einer ANOVA-Berechnung

Eine Ein-Faktor-Varianzanalyse, auch als ANOVA bekannt, bietet die Möglichkeit, mehrere Populationsmittelwerte zu vergleichen. Anstatt dies paarweise zu tun, können wir alle betrachteten Mittel gleichzeitig betrachten. Um einen ANOVA-Test durchzuführen, müssen wir zwei Arten von Variationen vergleichen, die Variation zwischen den Stichprobenmitteln sowie die Variation innerhalb jeder unserer Stichproben.

Wir kombinieren all diese Variationen in einer einzigen Statistik, genannt F Statistik, weil es die F-Verteilung verwendet. Wir tun dies, indem wir die Variation zwischen den Proben durch die Variation innerhalb jeder Probe teilen. Die Art und Weise, dies zu tun, wird in der Regel von der Software abgewickelt. Es ist jedoch sinnvoll, eine solche Berechnung zu sehen.

Es wird leicht sein, sich im Folgenden zu verirren. Hier ist die Liste der Schritte, denen wir im folgenden Beispiel folgen werden:

Berechnen Sie den Stichprobenmittelwert für jede unserer Stichproben sowie den Mittelwert für alle Stichprobendaten.
Berechnen Sie die Summe der Fehlerquadrate. Hier innerhalb jeder Stichprobe quadrieren wir die Abweichung jedes Datenwertes vom Stichprobenmittel. Die Summe aller quadrierten Abweichungen ist die Summe der Fehlerquadrate, abgekürzt SSE.
Berechnen Sie die Summe der Behandlungsquadrate. Wir quadrieren die Abweichung jedes Stichprobenmittelwerts vom Gesamtmittelwert. Die Summe aller dieser quadratischen Abweichungen wird mit einer geringeren Anzahl von Stichproben multipliziert. Diese Zahl ist die Summe der Behandlungsquadrate, abgekürzt SST.
Berechnen Sie die Freiheitsgrade. Die Gesamtzahl der Freiheitsgrade ist eins weniger als die Gesamtzahl der Datenpunkte in unserer Stichprobe, oder n - 1. Die Anzahl der Behandlungsfreiheitsgrade ist um eins geringer als die Anzahl der verwendeten Proben m - 1. Die Anzahl der Fehlerfreiheitsgrade ist die Gesamtzahl der Datenpunkte abzüglich der Anzahl der Abtastwerte oder n - m.
Berechnen Sie das mittlere Fehlerquadrat. Dies wird als MSE = SSE / (bezeichnet.n - m).
Berechnen Sie das mittlere Behandlungsquadrat. Dies wird als MST = SST / bezeichnet.m - '1.
Berechne das F Statistik. Dies ist das Verhältnis der beiden von uns berechneten mittleren Quadrate. So F = MST / MSE.

Software macht das alles recht einfach, aber es ist gut zu wissen, was sich hinter den Kulissen abspielt. Im Folgenden wird anhand der oben aufgeführten Schritte ein Beispiel für eine ANOVA erarbeitet.

Daten- und Stichprobenmittel

Angenommen, wir haben vier unabhängige Populationen, die die Bedingungen für eine Einzelfaktor-ANOVA erfüllen. Wir wollen die Nullhypothese testen H₀: μ₁ = μ₂ = μ₃ = μ₄. Für die Zwecke dieses Beispiels verwenden wir eine Stichprobe der Größe drei aus jeder der untersuchten Populationen. Die Daten aus unseren Proben sind:

Stichprobe aus Population # 1: 12, 9, 12. Dies hat einen Stichprobenmittelwert von 11.
Stichprobe aus Population # 2: 7, 10, 13. Dies hat einen Stichprobenmittelwert von 10.
Stichprobe aus Population # 3: 5, 8, 11. Dies hat einen Stichprobenmittelwert von 8.
Stichprobe aus Population # 4: 5, 8, 8. Dies hat einen Stichprobenmittelwert von 7.

Der Mittelwert aller Daten ist 9.

Summe der Fehlerquadrate

Wir berechnen nun die Summe der quadratischen Abweichungen von jedem Stichprobenmittelwert. Dies nennt man die Summe der Fehlerquadrate.

Für die Stichprobe aus Population # 1: (12 - 11)² + (9-11)² +(12 - 11)² = 6
Für die Stichprobe aus Population # 2: (7 - 10)² + (10-10)² +(13 - 10)² = 18
Für die Stichprobe aus Population # 3: (5 - 8)² + (8 - 8)² +(11 - 8)² = 18
Für die Stichprobe aus Population # 4: (5 - 7)² + (8 - 7)² +(8 - 7)² = 6.

Wir addieren dann alle diese Summe der quadratischen Abweichungen und erhalten 6 + 18 + 18 + 6 = 48.

Summe der Behandlungsquadrate

Nun berechnen wir die Summe der Behandlungsquadrate. Hier sehen wir uns die quadratischen Abweichungen jedes Stichprobenmittelwerts vom Gesamtmittelwert an und multiplizieren diese Zahl mit eins weniger als die Anzahl der Populationen:

3 [(11 - 9)² + (10 - 9)² +(8 - 9)² + (7 - 9)²] = 3 [4 + 1 + 1 + 4] = 30.

Freiheitsgrade

Bevor wir mit dem nächsten Schritt fortfahren, brauchen wir die Freiheitsgrade. Es gibt 12 Datenwerte und vier Abtastwerte. Somit beträgt die Anzahl der Freiheitsgrade der Behandlung 4 - 1 = 3. Die Anzahl der Freiheitsgrade der Fehler beträgt 12 - 4 = 8.

Mittlere Quadrate

Wir dividieren nun unsere Quadratsumme durch die entsprechende Anzahl von Freiheitsgraden, um die mittleren Quadrate zu erhalten.

Das mittlere Behandlungsquadrat beträgt 30/3 = 10.
Das mittlere Fehlerquadrat ist 48/8 = 6.

Die F-Statistik

Der letzte Schritt besteht darin, das mittlere Quadrat für die Behandlung durch das mittlere Quadrat für den Fehler zu teilen. Dies ist die F-Statistik aus den Daten. Für unser Beispiel ist also F = 10/6 = 5/3 = 1,667.

Wertetabellen oder Software können verwendet werden, um zu bestimmen, wie wahrscheinlich es ist, dass ein Wert der F-Statistik nur zufällig so extrem wie dieser Wert ist.

Wissenschaft