Eine Ein-Faktor-Varianzanalyse, auch als ANOVA bekannt, bietet die Möglichkeit, mehrere Populationsmittelwerte zu vergleichen. Anstatt dies paarweise zu tun, können wir alle betrachteten Mittel gleichzeitig betrachten. Um einen ANOVA-Test durchzuführen, müssen wir zwei Arten von Variationen vergleichen, die Variation zwischen den Stichprobenmitteln sowie die Variation innerhalb jeder unserer Stichproben.
Wir kombinieren all diese Variationen in einer einzigen Statistik, genannt F Statistik, weil es die F-Verteilung verwendet. Wir tun dies, indem wir die Variation zwischen den Proben durch die Variation innerhalb jeder Probe teilen. Die Art und Weise, dies zu tun, wird in der Regel von der Software abgewickelt. Es ist jedoch sinnvoll, eine solche Berechnung zu sehen.
Es wird leicht sein, sich im Folgenden zu verirren. Hier ist die Liste der Schritte, denen wir im folgenden Beispiel folgen werden:
Software macht das alles recht einfach, aber es ist gut zu wissen, was sich hinter den Kulissen abspielt. Im Folgenden wird anhand der oben aufgeführten Schritte ein Beispiel für eine ANOVA erarbeitet.
Angenommen, wir haben vier unabhängige Populationen, die die Bedingungen für eine Einzelfaktor-ANOVA erfüllen. Wir wollen die Nullhypothese testen H0: μ1 = μ2 = μ3 = μ4. Für die Zwecke dieses Beispiels verwenden wir eine Stichprobe der Größe drei aus jeder der untersuchten Populationen. Die Daten aus unseren Proben sind:
Der Mittelwert aller Daten ist 9.
Wir berechnen nun die Summe der quadratischen Abweichungen von jedem Stichprobenmittelwert. Dies nennt man die Summe der Fehlerquadrate.
Wir addieren dann alle diese Summe der quadratischen Abweichungen und erhalten 6 + 18 + 18 + 6 = 48.
Nun berechnen wir die Summe der Behandlungsquadrate. Hier sehen wir uns die quadratischen Abweichungen jedes Stichprobenmittelwerts vom Gesamtmittelwert an und multiplizieren diese Zahl mit eins weniger als die Anzahl der Populationen:
3 [(11 - 9)2 + (10 - 9)2 +(8 - 9)2 + (7 - 9)2] = 3 [4 + 1 + 1 + 4] = 30.
Bevor wir mit dem nächsten Schritt fortfahren, brauchen wir die Freiheitsgrade. Es gibt 12 Datenwerte und vier Abtastwerte. Somit beträgt die Anzahl der Freiheitsgrade der Behandlung 4 - 1 = 3. Die Anzahl der Freiheitsgrade der Fehler beträgt 12 - 4 = 8.
Wir dividieren nun unsere Quadratsumme durch die entsprechende Anzahl von Freiheitsgraden, um die mittleren Quadrate zu erhalten.
Der letzte Schritt besteht darin, das mittlere Quadrat für die Behandlung durch das mittlere Quadrat für den Fehler zu teilen. Dies ist die F-Statistik aus den Daten. Für unser Beispiel ist also F = 10/6 = 5/3 = 1,667.
Wertetabellen oder Software können verwendet werden, um zu bestimmen, wie wahrscheinlich es ist, dass ein Wert der F-Statistik nur zufällig so extrem wie dieser Wert ist.