Es gibt viele Wahrscheinlichkeitsverteilungen, die in der gesamten Statistik verwendet werden. Beispielsweise ist die Standardnormalverteilung oder die Glockenkurve wahrscheinlich die am weitesten verbreitete. Normalverteilungen sind nur eine Verteilungsart. Eine sehr nützliche Wahrscheinlichkeitsverteilung zur Untersuchung von Populationsvarianzen ist die F-Verteilung. Wir werden einige der Eigenschaften dieser Verteilungsart untersuchen.
Die Wahrscheinlichkeitsdichteformel für die F-Verteilung ist ziemlich kompliziert. In der Praxis müssen wir uns nicht mit dieser Formel befassen. Es kann jedoch hilfreich sein, einige Details der Eigenschaften bezüglich der F-Verteilung zu kennen. Einige der wichtigsten Funktionen dieser Distribution sind nachfolgend aufgeführt:
Dies sind einige der wichtigsten und am einfachsten zu identifizierenden Merkmale. Wir werden uns die Freiheitsgrade genauer ansehen.
Ein gemeinsames Merkmal von Chi-Quadrat-Verteilungen, T-Verteilungen und F-Verteilungen ist, dass es wirklich eine unendliche Familie von jeder dieser Verteilungen gibt. Eine bestimmte Verteilung wird durch die Kenntnis der Anzahl der Freiheitsgrade ausgewählt. Für ein t Verteilung liegt die Anzahl der Freiheitsgrade um eins unter unserer Stichprobengröße. Die Anzahl der Freiheitsgrade für eine F-Verteilung wird anders bestimmt als für eine t-Verteilung oder sogar eine Chi-Quadrat-Verteilung.
Wir werden unten genau sehen, wie eine F-Verteilung entsteht. Im Moment werden wir nur genug berücksichtigen, um die Anzahl der Freiheitsgrade zu bestimmen. Die F-Verteilung wird aus einem Verhältnis abgeleitet, an dem zwei Populationen beteiligt sind. Von jeder dieser Populationen gibt es eine Stichprobe, und daher gibt es für beide Stichproben Freiheitsgrade. Tatsächlich subtrahieren wir einen von beiden Stichprobengrößen, um unsere beiden Freiheitsgrade zu bestimmen.
Statistiken aus diesen Populationen werden für die F-Statistik in einem Bruchteil zusammengefasst. Sowohl der Zähler als auch der Nenner haben Freiheitsgrade. Anstatt diese beiden Zahlen zu einer anderen Zahl zu kombinieren, behalten wir beide bei. Daher müssen wir bei Verwendung einer F-Verteilungstabelle nach zwei verschiedenen Freiheitsgraden suchen.
Die F-Verteilung ergibt sich aus der Inferenzstatistik zu Populationsvarianzen. Insbesondere verwenden wir eine F-Verteilung, wenn wir das Verhältnis der Varianzen zweier normalverteilter Populationen untersuchen.
Die F-Verteilung wird nicht nur verwendet, um Konfidenzintervalle zu erstellen und Hypothesen über Populationsvarianzen zu testen. Diese Art der Verteilung wird auch in einer Ein-Faktor-Varianzanalyse (ANOVA) verwendet. ANOVA beschäftigt sich mit dem Vergleich der Variation zwischen mehreren Gruppen und der Variation innerhalb jeder Gruppe. Um dies zu erreichen, verwenden wir ein Varianzverhältnis. Dieses Varianzverhältnis hat die F-Verteilung. Mit einer etwas komplizierten Formel können wir eine F-Statistik als Teststatistik berechnen.