Einer der Hauptbestandteile der Inferenzstatistik ist die Entwicklung von Methoden zur Berechnung von Konfidenzintervallen. Konfidenzintervalle bieten uns eine Möglichkeit, einen Populationsparameter abzuschätzen. Anstatt zu sagen, dass der Parameter einem exakten Wert entspricht, sagen wir, dass der Parameter in einen Wertebereich fällt. Dieser Wertebereich ist in der Regel eine Schätzung, zusammen mit einer Fehlertoleranz, die wir zur Schätzung addieren und von dieser subtrahieren.
Mit jedem Intervall ist ein Vertrauensniveau verbunden. Das Konfidenzniveau gibt an, wie oft die Methode zur Ermittlung unseres Konfidenzintervalls auf lange Sicht den wahren Populationsparameter erfasst.
Es ist hilfreich, wenn Sie sich mit Statistik befassen, um einige Beispiele zu sehen. Im Folgenden werden einige Beispiele für Konfidenzintervalle für einen Populationsmittelwert aufgeführt. Wir werden sehen, dass die Methode, mit der wir ein Konfidenzintervall für einen Mittelwert erstellen, von weiteren Informationen über unsere Population abhängt. Insbesondere hängt unser Ansatz davon ab, ob wir die Populationsstandardabweichung kennen oder nicht.
Feststellung von Problemen
Wir beginnen mit einer einfachen Zufallsstichprobe von 25 Molcharten und messen deren Schwänze. Die mittlere Schwanzlänge unserer Probe beträgt 5 cm.
Wenn wir wissen, dass 0,2 cm die Standardabweichung der Schwanzlängen aller Molche in der Population ist, ist dies ein 90% -Konfidenzintervall für die mittlere Schwanzlänge aller Molche in der Population?
Wenn wir wissen, dass 0,2 cm die Standardabweichung der Schwanzlängen aller Molche in der Population ist, ist dies ein 95% -Konfidenzintervall für die mittlere Schwanzlänge aller Molche in der Population?
Wenn wir feststellen, dass 0,2 cm die Standardabweichung der Schwanzlängen der Molche in unserer Stichprobe der Population ist, was ist dann ein 90% -Konfidenzintervall für die mittlere Schwanzlänge aller Molche in der Population?
Wenn wir feststellen, dass 0,2 cm die Standardabweichung der Schwanzlängen der Molche in unserer Stichprobe der Population ist, was ist dann ein 95% -Konfidenzintervall für die mittlere Schwanzlänge aller Molche in der Population?
Diskussion der Probleme
Wir analysieren zunächst jedes dieser Probleme. In den ersten beiden Problemen kennen wir den Wert der Populationsstandardabweichung. Der Unterschied zwischen diesen beiden Problemen besteht darin, dass das Vertrauensniveau in # 2 größer ist als für # 1.
Bei den zweiten beiden Problemen ist die Populationsstandardabweichung unbekannt. Für diese beiden Probleme werden wir diesen Parameter mit der Standardabweichung der Stichprobe abschätzen. Wie wir in den ersten beiden Problemen gesehen haben, haben wir auch hier unterschiedliche Vertrauensniveaus.
Lösungen
Wir werden Lösungen für jedes der oben genannten Probleme berechnen.
Da wir die Populationsstandardabweichung kennen, verwenden wir eine Tabelle mit Z-Scores. Der Wert von z das entspricht einem 90% -Konfidenzintervall von 1,645. Unter Verwendung der Formel für die Fehlertoleranz haben wir ein Konfidenzintervall von 5 - 1,645 (0,2 / 5) bis 5 + 1,645 (0,2 / 5). (Die 5 im Nenner hier ist, weil wir die Quadratwurzel von 25 genommen haben). Nach Durchführung der Arithmetik haben wir als Konfidenzintervall für den Populationsmittelwert 4,934 cm bis 5,066 cm.
Da wir die Populationsstandardabweichung kennen, verwenden wir eine Tabelle mit Z-Scores. Der Wert von z das entspricht einem 95% -Konfidenzintervall von 1,96. Unter Verwendung der Formel für die Fehlertoleranz haben wir ein Konfidenzintervall von 5 - 1,96 (0,2 / 5) bis 5 + 1,96 (0,2 / 5). Nach Durchführung der Arithmetik haben wir als Konfidenzintervall für den Populationsmittelwert 4,922 cm bis 5,078 cm.
Hier kennen wir nicht die Populationsstandardabweichung, sondern nur die Stichprobenstandardabweichung. Daher werden wir eine Tabelle mit t-Scores verwenden. Wenn wir eine Tabelle von verwenden t Scores müssen wir wissen, wie viele Freiheitsgrade wir haben. In diesem Fall gibt es 24 Freiheitsgrade, dh einen Freiheitsgrad weniger als Stichprobengröße 25. Der Wert von t das entspricht einem 90% -Konfidenzintervall von 1,71. Unter Verwendung der Formel für die Fehlertoleranz haben wir ein Konfidenzintervall von 5 - 1,71 (0,2 / 5) bis 5 + 1,71 (0,2 / 5). Nach Durchführung der Arithmetik haben wir als Konfidenzintervall für den Populationsmittelwert 4,932 cm bis 5,068 cm.
Hier kennen wir nicht die Populationsstandardabweichung, sondern nur die Stichprobenstandardabweichung. Daher werden wir wieder eine Tabelle mit t-Scores verwenden. Es gibt 24 Freiheitsgrade, dh einen Freiheitsgrad weniger als Stichprobengröße 25. Der Wert von t das entspricht einem 95% -Konfidenzintervall von 2,06. Unter Verwendung der Formel für die Fehlertoleranz haben wir ein Konfidenzintervall von 5 - 2,06 (0,2 / 5) bis 5 + 2,06 (0,2 / 5). Nach Durchführung der Arithmetik haben wir als Konfidenzintervall für den Populationsmittelwert 4,912 cm bis 5,082 cm.
Diskussion der Lösungen
Beim Vergleich dieser Lösungen sind einige Punkte zu beachten. Das erste ist, dass mit zunehmendem Vertrauen der Wert von in jedem Fall größer wird z oder t damit endeten wir. Der Grund dafür ist, dass wir ein größeres Intervall benötigen, um sicherer zu sein, dass wir den Populationsmittelwert in unserem Konfidenzintervall tatsächlich erfasst haben.
Die andere zu beachtende Funktion ist die, die für ein bestimmtes Konfidenzintervall verwendet wird t sind breiter als die mit z. Der Grund dafür ist, dass a t Verteilung hat eine größere Variabilität in ihren Schwänzen als eine Standardnormalverteilung.
Der Schlüssel zur korrekten Lösung dieser Art von Problemen ist, dass wir, wenn wir die Populationsstandardabweichung kennen, eine Tabelle von verwenden z-Partituren. Wenn wir die Populationsstandardabweichung nicht kennen, verwenden wir eine Tabelle von t Partituren.