Manchmal ist es in Statistiken hilfreich, ausgearbeitete Beispiele für Probleme zu sehen. Diese Beispiele können uns helfen, ähnliche Probleme herauszufinden. In diesem Artikel werden wir den Prozess der Durchführung von Inferenzstatistiken für ein Ergebnis in Bezug auf zwei Populationsmittelwerte erläutern. Wir werden nicht nur sehen, wie ein Hypothesentest über die Differenz zweier Populationsmittel durchgeführt wird, sondern auch ein Konfidenzintervall für diese Differenz erstellen. Die von uns verwendeten Methoden werden manchmal als Zwei-Stichproben-Test und Zwei-Stichproben-Konfidenzintervall bezeichnet.
Angenommen, wir möchten die mathematische Eignung von Grundschulkindern testen. Eine Frage, die wir haben können, ist, ob höhere Grade höhere mittlere Testergebnisse haben.
Eine einfache Zufallsstichprobe von 27 Drittklässlern wird einem Mathe-Test unterzogen, ihre Antworten werden bewertet, und die Ergebnisse haben eine durchschnittliche Punktzahl von 75 Punkten mit einer Standardabweichung der Stichprobe von 3 Punkten.
Eine einfache Zufallsstichprobe von 20 Fünftklässlern erhält den gleichen Mathe-Test und ihre Antworten werden gewertet. Die durchschnittliche Punktzahl für die fünften Schüler beträgt 84 Punkte mit einer Standardabweichung von 5 Punkten.
In diesem Szenario stellen wir die folgenden Fragen:
Wir müssen das zu verwendende Verfahren auswählen. Dabei müssen wir sicherstellen und überprüfen, dass die Bedingungen für dieses Verfahren erfüllt sind. Wir werden gebeten, zwei Populationsmittelwerte zu vergleichen. Eine Sammlung von Methoden, die dazu verwendet werden können, sind die für t-Prozeduren mit zwei Stichproben.
Um diese t-Prozeduren für zwei Beispiele verwenden zu können, müssen die folgenden Bedingungen erfüllt sein:
Wir sehen, dass die meisten dieser Bedingungen erfüllt sind. Uns wurde gesagt, dass wir einfache Zufallsstichproben haben. Die Populationen, die wir studieren, sind groß, da Millionen von Schülern in diesen Klassenstufen sind.
Die Bedingung, die wir nicht automatisch annehmen können, ist, dass die Testergebnisse normal verteilt sind. Da wir eine ausreichend große Stichprobe haben, müssen wir aufgrund der Robustheit unserer t-Prozeduren die Variable nicht unbedingt normal verteilen.
Da die Bedingungen erfüllt sind, führen wir einige Vorberechnungen durch.
Der Standardfehler ist eine Schätzung einer Standardabweichung. Für diese Statistik addieren wir die Stichprobenvarianz der Stichproben und nehmen dann die Quadratwurzel. Dies ergibt die Formel:
(s1 2 / n1 + s22 / n2)1/2
Wenn wir die obigen Werte verwenden, sehen wir, dass der Wert des Standardfehlers ist