Hypothesentests sind eines der Hauptthemen im Bereich der Inferenzstatistik. Es gibt mehrere Schritte, um einen Hypothesentest durchzuführen, und viele von diesen erfordern statistische Berechnungen. Statistische Software wie Excel kann zur Durchführung von Hypothesentests verwendet werden. Wir werden sehen, wie die Excel-Funktion Z.TEST Hypothesen über einen unbekannten Populationsmittelwert testet.
Bedingungen und Annahmen
Wir beginnen mit der Angabe der Annahmen und Bedingungen für diese Art von Hypothesentest. Um auf den Mittelwert schließen zu können, müssen folgende einfache Bedingungen erfüllt sein:
Die Stichprobe ist eine einfache Zufallsstichprobe.
Die Stichprobe ist im Verhältnis zur Bevölkerung klein. Typischerweise bedeutet dies, dass die Populationsgröße mehr als das 20-fache der Stichprobengröße beträgt.
Die untersuchte Variable ist normalverteilt.
Die Populationsstandardabweichung ist bekannt.
Der Bevölkerungsdurchschnitt ist unbekannt.
Es ist unwahrscheinlich, dass all diese Bedingungen in der Praxis erfüllt werden. Diese einfachen Bedingungen und der entsprechende Hypothesentest treten jedoch manchmal früh in einer Statistikklasse auf. Nach dem Erlernen des Prozesses eines Hypothesentests werden diese Bedingungen gelockert, um in einer realistischeren Umgebung zu arbeiten.
Struktur des Hypothesentests
Der spezielle Hypothesentest, den wir betrachten, hat die folgende Form:
Geben Sie die Nullhypothese und die Alternativhypothese an.
Berechnen Sie die Teststatistik, die a ist z-Ergebnis.
Berechnen Sie den p-Wert mit der Normalverteilung. In diesem Fall ist der p-Wert die Wahrscheinlichkeit, mindestens so extrem wie die beobachtete Teststatistik zu werden, vorausgesetzt, die Nullhypothese ist wahr.
Vergleichen Sie den p-Wert mit dem Signifikanzniveau, um zu bestimmen, ob die Nullhypothese verworfen werden soll oder nicht.
Wir sehen, dass die Schritte zwei und drei rechenintensiv sind, verglichen mit den Schritten eins und vier. Die Z.TEST-Funktion führt diese Berechnungen für uns durch.
Z.TEST-Funktion
Die Funktion Z.TEST führt alle Berechnungen aus den obigen Schritten zwei und drei aus. Es führt einen Großteil der für unseren Test ermittelten Zahlen aus und gibt einen p-Wert zurück. In die Funktion müssen drei Argumente eingegeben werden, von denen jedes durch ein Komma getrennt ist. Im Folgenden werden die drei Argumenttypen für diese Funktion erläutert.
Das erste Argument für diese Funktion ist ein Array von Beispieldaten. Wir müssen einen Zellenbereich eingeben, der der Position der Beispieldaten in unserer Tabelle entspricht.
Das zweite Argument ist der Wert von μ, den wir in unseren Hypothesen testen. Also, wenn unsere Nullhypothese H ist0: Μ = 5, dann würden wir für das zweite Argument eine 5 eingeben.
Das dritte Argument ist der Wert der bekannten Populationsstandardabweichung. Excel behandelt dies als optionales Argument
Hinweise und Warnungen
Es gibt ein paar Dinge, die zu dieser Funktion beachtet werden sollten:
Der von der Funktion ausgegebene p-Wert ist einseitig. Wenn wir einen zweiseitigen Test durchführen, muss dieser Wert verdoppelt werden.
Der einseitige p-Wert, der von der Funktion ausgegeben wird, geht davon aus, dass der Mittelwert der Stichprobe größer ist als der Wert von μ, gegen den wir testen. Wenn der Stichprobenmittelwert kleiner als der Wert des zweiten Arguments ist, müssen wir die Ausgabe der Funktion von 1 subtrahieren, um den wahren p-Wert unseres Tests zu erhalten.
Das letzte Argument für die Populationsstandardabweichung ist optional. Wenn dies nicht eingegeben wird, wird dieser Wert in den Berechnungen von Excel automatisch durch die Standardabweichung der Stichprobe ersetzt. In diesem Fall sollte theoretisch ein T-Test verwendet werden.
Beispiel
Wir nehmen an, dass die folgenden Daten aus einer einfachen Zufallsstichprobe einer normalverteilten Population mit unbekanntem Mittelwert und einer Standardabweichung von 3 stammen:
1, 2, 3, 3, 4, 4, 8, 10, 12
Mit einem Signifikanzniveau von 10% möchten wir die Hypothese testen, dass die Stichprobendaten aus einer Population mit einem Mittelwert größer als 5 stammen. Formal haben wir die folgenden Hypothesen: