Der Chi-Quadrat-Güte-Fit-Test ist nützlich, um ein theoretisches Modell mit beobachteten Daten zu vergleichen. Dieser Test ist eine Art des allgemeineren Chi-Quadrat-Tests. Wie bei jedem mathematischen oder statistischen Thema kann es hilfreich sein, ein Beispiel durchzuarbeiten, um zu verstehen, was passiert, und zwar anhand eines Beispiels für den Chi-Quadrat-Test der Anpassungsgüte.
Betrachten Sie ein Standardpaket von Milchschokolade M & Ms. Es gibt sechs verschiedene Farben: Rot, Orange, Gelb, Grün, Blau und Braun. Nehmen wir an, wir sind neugierig auf die Verteilung dieser Farben und fragen, ob alle sechs Farben im gleichen Verhältnis vorkommen. Dies ist die Art von Frage, die mit einem Fitnesstest beantwortet werden kann.
Zunächst notieren wir die Einstellung und warum der Fit-Test für die Güte angemessen ist. Unsere Farbvariable ist kategorisch. Es gibt sechs Stufen dieser Variablen, die den sechs möglichen Farben entsprechen. Wir gehen davon aus, dass die von uns gezählten M & Ms eine einfache Zufallsstichprobe aus der Population aller M & Ms sind.
Die Null- und Alternativhypothesen für unseren Anpassungstest spiegeln die Annahme wider, die wir über die Bevölkerung machen. Da wir testen, ob die Farben in gleichen Anteilen vorkommen, lautet unsere Nullhypothese, dass alle Farben in gleichen Anteilen vorkommen. Genauer gesagt, wenn p1 ist der Bevölkerungsanteil der roten Bonbons, p2 Ist der Bevölkerungsanteil von Orangenbonbons und so weiter, dann lautet die Nullhypothese: p1 = p2 =… = p6 = 1/6.
Die alternative Hypothese lautet, dass mindestens einer der Bevölkerungsanteile ungleich 1/6 ist.
Die tatsächliche Anzahl ist die Anzahl der Bonbons für jede der sechs Farben. Die erwartete Anzahl bezieht sich auf das, was wir erwarten würden, wenn die Nullhypothese wahr wäre. Wir werden lassen n Sei die Größe unserer Stichprobe. Die erwartete Anzahl roter Bonbons ist p1 n oder n/ 6. In diesem Beispiel ist die erwartete Anzahl von Bonbons für jede der sechs Farben einfach n mal pich, oder n/ 6.
Wir werden nun eine Chi-Quadrat-Statistik für ein bestimmtes Beispiel berechnen. Angenommen, wir haben eine einfache Zufallsstichprobe von 600 M & M-Bonbons mit der folgenden Verteilung:
Wenn die Nullhypothese wahr wäre, dann wären die erwarteten Zählwerte für jede dieser Farben (1/6) x 600 = 100. Wir verwenden dies nun bei unserer Berechnung der Chi-Quadrat-Statistik.
Aus jeder Farbe berechnen wir den Beitrag zu unserer Statistik. Jedes ist von der Form (tatsächlich - erwartet)2/Erwartet.:
Wir addieren dann alle diese Beiträge und stellen fest, dass unsere Chi-Quadrat-Statistik 125,44 + 22,09 + 0,09 + 25 + 29,16 + 33,64 = 235,42 beträgt.
Die Anzahl der Freiheitsgrade für einen Anpassungstest ist einfach eins weniger als die Anzahl der Stufen unserer Variablen. Da es sechs Farben gab, haben wir 6 - 1 = 5 Freiheitsgrade.
Die von uns berechnete Chi-Quadrat-Statistik von 235,42 entspricht einer bestimmten Position in einer Chi-Quadrat-Verteilung mit fünf Freiheitsgraden. Wir brauchen jetzt einen p-Wert, um die Wahrscheinlichkeit zu bestimmen, eine Teststatistik zu erhalten, die mindestens so extrem ist wie 235,42, wobei angenommen wird, dass die Nullhypothese wahr ist.
Für diese Berechnung kann Microsoft Excel verwendet werden. Wir stellen fest, dass unsere Teststatistik mit fünf Freiheitsgraden einen p-Wert von 7,29 x 10 hat-49. Dies ist ein extrem kleiner p-Wert.
Wir treffen unsere Entscheidung, ob die Nullhypothese aufgrund der Größe des p-Werts verworfen werden soll. Da wir einen sehr kleinen p-Wert haben, lehnen wir die Nullhypothese ab. Wir schließen daraus, dass M & Ms nicht gleichmäßig auf die sechs verschiedenen Farben verteilt sind. Eine Follow-up-Analyse könnte verwendet werden, um ein Konfidenzintervall für den Bevölkerungsanteil einer bestimmten Farbe zu bestimmen.