Plus vier Konfidenzintervalle

In der Inferenzstatistik stützen sich die Konfidenzintervalle für die Bevölkerungsanteile auf die Standardnormalverteilung, um unbekannte Parameter einer bestimmten Bevölkerung anhand einer statistischen Stichprobe der Bevölkerung zu bestimmen. Ein Grund dafür ist, dass bei geeigneten Stichprobengrößen die Standardnormalverteilung eine hervorragende Arbeit bei der Schätzung einer Binomialverteilung leistet. Dies ist bemerkenswert, da die erste Verteilung zwar kontinuierlich ist, die zweite jedoch diskret.

Bei der Erstellung von Konfidenzintervallen für Proportionen muss eine Reihe von Aspekten berücksichtigt werden. Eines davon betrifft ein sogenanntes "plus vier" Konfidenzintervall, das zu einem verzerrten Schätzer führt. Dieser Schätzer eines unbekannten Bevölkerungsanteils ist jedoch in einigen Situationen besser als unverzerrte Schätzer, insbesondere in Situationen, in denen die Daten keine Erfolge oder Fehler aufweisen.

In den meisten Fällen ist der beste Versuch, einen Bevölkerungsanteil zu schätzen, die Verwendung eines entsprechenden Stichprobenanteils. Wir nehmen an, dass es eine Population mit einem unbekannten Anteil gibt p von seinen Individuen, die ein bestimmtes Merkmal enthalten, bilden wir dann eine einfache Zufallsstichprobe der Größe n von dieser Bevölkerung.Von diesen n Einzelpersonen zählen wir die Anzahl von ihnen Y. die das Merkmal besitzen, auf das wir neugierig sind. Nun schätzen wir p anhand unserer Stichprobe. Das Stichprobenverhältnis J / n ist ein unvoreingenommener Schätzer von p.

Wann ist das Plus-Vier-Konfidenzintervall zu verwenden?

Wenn wir ein Plus-Vier-Intervall verwenden, ändern wir den Schätzer von p. Dazu addieren wir vier zur Gesamtzahl der Beobachtungen und erklären so den Ausdruck "plus vier". Diese vier Beobachtungen teilen wir dann in zwei hypothetische Erfolge und zwei Misserfolge auf, was bedeutet, dass wir zwei zur Gesamtzahl der Erfolge addieren Das Endergebnis ist, dass wir jede Instanz von ersetzen J / n mit (Y. + 2) / (n + 4), und manchmal wird dieser Bruchteil mit bezeichnet p mit einer Tilde darüber.

Der Stichprobenanteil funktioniert normalerweise sehr gut bei der Schätzung eines Bevölkerungsanteils. Es gibt jedoch einige Situationen, in denen wir unseren Schätzer geringfügig ändern müssen. Die statistische Praxis und die mathematische Theorie zeigen, dass die Modifikation des Intervalls plus vier zur Erreichung dieses Ziels angemessen ist.

Eine Situation, die uns veranlassen sollte, ein Plus-Vier-Intervall in Betracht zu ziehen, ist eine einseitige Stichprobe. Aufgrund des geringen oder hohen Bevölkerungsanteils ist der Stichprobenanteil häufig auch sehr nahe bei 0 oder sehr nahe bei 1. In dieser Art von Situation sollten wir ein Plus-Vier-Intervall in Betracht ziehen.

Ein weiterer Grund für die Verwendung eines Intervalls von plus vier ist, wenn wir eine kleine Stichprobengröße haben. In diesem Fall liefert ein Intervall von plus vier eine bessere Schätzung für einen Bevölkerungsanteil als die Verwendung des typischen Konfidenzintervalls für einen Anteil.

Regeln für die Verwendung des Plus-Vier-Konfidenzintervalls

Das Plus-Vier-Konfidenzintervall ist eine geradezu magische Methode, um die Inferenzstatistik genauer zu berechnen, indem einfach vier imaginäre Beobachtungen zu einem gegebenen Datensatz addiert werden, zwei Erfolge und zwei Fehler, und der Anteil eines Datensatzes, der genauer vorhergesagt wird passt zu den Parametern.

Das Plus-Vier-Konfidenzintervall gilt jedoch nicht immer für jedes Problem. Es kann nur verwendet werden, wenn das Konfidenzintervall eines Datensatzes über 90% liegt und die Stichprobengröße der Grundgesamtheit mindestens 10 beträgt. Der Datensatz kann jedoch eine beliebige Anzahl von Erfolgen und Fehlern enthalten, obwohl er dort besser funktioniert Es gibt entweder keine Erfolge oder keine Misserfolge in den Daten einer bestimmten Population.

Beachten Sie, dass die Berechnungen der Inferenzstatistik im Gegensatz zu den Berechnungen der regulären Statistik auf einer Stichprobe von Daten beruhen, um die wahrscheinlichsten Ergebnisse innerhalb einer Population zu ermitteln. Obwohl das Plus-Vier-Konfidenzintervall eine größere Fehlerspanne korrigiert, muss diese Spanne dennoch berücksichtigt werden, um die genaueste statistische Beobachtung zu liefern.