Inferenzstatistik bezieht sich auf den Prozess, bei dem mit einer statistischen Stichprobe begonnen wird und dann der Wert eines unbekannten Populationsparameters ermittelt wird. Der unbekannte Wert wird nicht direkt ermittelt. Vielmehr erhalten wir eine Schätzung, die in einen Wertebereich fällt. Dieser Bereich ist mathematisch als Intervall von reellen Zahlen bekannt und wird speziell als Konfidenzintervall bezeichnet.
Konfidenzintervalle ähneln sich in einigen Punkten. Zweiseitige Konfidenzintervalle haben alle die gleiche Form:
Schätzen ± Fehlermarge
Ähnlichkeiten in den Konfidenzintervallen erstrecken sich auch auf die Schritte zur Berechnung der Konfidenzintervalle. Wir werden untersuchen, wie ein zweiseitiges Konfidenzintervall für einen Populationsmittelwert bestimmt wird, wenn die Populationsstandardabweichung unbekannt ist. Eine zugrunde liegende Annahme ist, dass wir Stichproben aus einer normalverteilten Population entnehmen.
Prozess für Konfidenzintervall für Mittelwert mit unbekanntem Sigma
Wir werden eine Liste von Schritten durcharbeiten, die erforderlich sind, um das gewünschte Konfidenzintervall zu ermitteln. Obwohl alle Schritte wichtig sind, ist der erste besonders wichtig:
Überprüfen Sie die Bedingungen: Stellen Sie zunächst sicher, dass die Bedingungen für unser Vertrauensintervall erfüllt sind. Wir nehmen an, dass der Wert der Populationsstandardabweichung, der mit dem griechischen Buchstaben sigma σ bezeichnet wird, unbekannt ist und dass wir mit einer Normalverteilung arbeiten. Wir können die Annahme, dass wir eine Normalverteilung haben, lockern, solange unsere Stichprobe groß genug ist und keine Ausreißer oder extreme Schrägstellungen aufweist.
Schätzung berechnen: Wir schätzen unseren Populationsparameter, in diesem Fall den Populationsmittelwert, unter Verwendung einer Statistik, in diesem Fall den Stichprobenmittelwert. Dies beinhaltet die Bildung einer einfachen Zufallsstichprobe aus unserer Bevölkerung. Manchmal können wir annehmen, dass unsere Stichprobe eine einfache Zufallsstichprobe ist, auch wenn sie nicht der strengen Definition entspricht.
Kritischer Wert: Wir erhalten den kritischen Wert t* das entspricht unserem Vertrauensniveau. Diese Werte werden anhand einer Tabelle mit t-Scores oder mithilfe der Software ermittelt. Wenn wir eine Tabelle verwenden, müssen wir die Anzahl der Freiheitsgrade kennen. Die Anzahl der Freiheitsgrade ist eins weniger als die Anzahl der Individuen in unserer Stichprobe.
Fehlermarge: Berechnen Sie die Fehlerquote t*s / √n, wo n ist die Größe der einfachen Zufallsstichprobe, die wir gebildet haben und s ist die Standardabweichung der Stichprobe, die wir aus unserer statistischen Stichprobe erhalten.
Daraus schließen: Stellen Sie abschließend die Schätzung und die Fehlerquote zusammen. Dies kann entweder ausgedrückt werden Schätzen ± Fehlermarge oder als Schätzung - Fehlergrenze zu Schätzung + Fehlergrenze. Bei der Angabe unseres Vertrauensintervalls ist es wichtig, das Vertrauensniveau anzugeben. Dies ist ebenso ein Teil unseres Konfidenzintervalls wie Zahlen für die Schätzung und die Fehlerquote.
Beispiel
Um zu sehen, wie wir ein Konfidenzintervall konstruieren können, werden wir ein Beispiel durcharbeiten. Angenommen, wir wissen, dass die Höhen einer bestimmten Erbsenpflanzenart normal verteilt sind. Eine einfache Zufallsstichprobe von 30 Erbsenpflanzen hat eine durchschnittliche Höhe von 30 cm mit einer Standardabweichung der Stichprobe von 5 cm. Was ist ein 90% -Konfidenzintervall für die mittlere Größe für die gesamte Population von Erbsenpflanzen?
Wir werden die oben beschriebenen Schritte ausführen:
Überprüfen Sie die Bedingungen: Die Bedingungen wurden erfüllt, da die Populationsstandardabweichung unbekannt ist und es sich um eine Normalverteilung handelt.
Schätzung berechnen: Uns wurde gesagt, dass wir eine einfache Zufallsstichprobe von 30 Erbsenpflanzen haben. Die durchschnittliche Höhe für dieses Muster beträgt 30 cm. Dies ist also unsere Schätzung.
Kritischer Wert: Unsere Stichprobe hat eine Größe von 30 und damit 29 Freiheitsgrade. Der kritische Wert für das Konfidenzniveau von 90% ist gegeben durch t* = 1,699.
Fehlermarge: Jetzt verwenden wir die Fehlerquote Formel und erhalten eine Fehlerquote von t*s / √n = (1,699) (2) / √ (30) = 0,620.
Daraus schließen: Abschließend fassen wir alles zusammen. Ein 90% -Konfidenzintervall für die mittlere Körpergröße der Bevölkerung beträgt 12 ± 0,62 Zoll. Alternativ könnten wir dieses Konfidenzintervall als 11,38 Zoll bis 12,62 Zoll angeben.
Praktische Überlegungen
Konfidenzintervalle des oben genannten Typs sind realistischer als andere Typen, die in einem Statistikkurs auftreten können. Es ist sehr selten, die Populationsstandardabweichung zu kennen, aber nicht den Populationsmittelwert. Hier nehmen wir an, dass wir keinen dieser Populationsparameter kennen.