Eines der Ziele der Inferenzstatistik ist die Schätzung unbekannter Populationsparameter. Diese Schätzung wird durchgeführt, indem Konfidenzintervalle aus statistischen Stichproben konstruiert werden. Die eine Frage lautet: „Wie gut ist unser Schätzer?“ Mit anderen Worten: „Wie genau ist unser statistischer Prozess, auf lange Sicht unsere Populationsparameter zu schätzen. Eine Möglichkeit, den Wert eines Schätzers zu bestimmen, besteht darin, zu prüfen, ob er unvoreingenommen ist. Für diese Analyse müssen wir den erwarteten Wert unserer Statistik ermitteln.
Zunächst betrachten wir Parameter und Statistiken. Wir betrachten Zufallsvariablen aus einem bekannten Verteilungstyp, jedoch mit einem unbekannten Parameter in dieser Verteilung. Dieser Parameter kann Teil einer Grundgesamtheit oder Teil einer Wahrscheinlichkeitsdichtefunktion sein. Wir haben auch eine Funktion unserer Zufallsvariablen, und dies nennt man eine Statistik. Die Statistik (X1, X2,…, Xn) schätzt den Parameter T, und so nennen wir es einen Schätzer von T.
Wir definieren nun unvoreingenommene und voreingenommene Schätzer. Wir möchten, dass unser Schätzer langfristig mit unserem Parameter übereinstimmt. In einer genaueren Sprache möchten wir, dass der erwartete Wert unserer Statistik dem Parameter entspricht. Wenn dies der Fall ist, dann sagen wir, dass unsere Statistik ein unvoreingenommener Schätzer des Parameters ist.
Wenn ein Schätzer kein unverzerrter Schätzer ist, ist er ein verzerrter Schätzer. Obwohl ein verzerrter Schätzer keine gute Übereinstimmung seines erwarteten Wertes mit seinem Parameter aufweist, gibt es viele praktische Fälle, in denen ein verzerrter Schätzer nützlich sein kann. In einem solchen Fall wird ein Konfidenzintervall von plus vier verwendet, um ein Konfidenzintervall für einen Bevölkerungsanteil zu erstellen.
Um zu sehen, wie diese Idee funktioniert, werden wir ein Beispiel untersuchen, das sich auf den Mittelwert bezieht. Die Statistik
(X1 + X2 +… + Xn) / n
wird als Stichprobenmittelwert bezeichnet. Wir nehmen an, dass die Zufallsvariablen eine Zufallsstichprobe aus der gleichen Verteilung mit dem Mittelwert μ sind. Dies bedeutet, dass der erwartete Wert jeder Zufallsvariablen μ ist.
Wenn wir den erwarteten Wert unserer Statistik berechnen, sehen wir Folgendes:
EX1 + X2 +… + Xn) / n] = (E [X1] + E [X2] +… + E [Xn]) / n = (nE [X1]) / n = E [X1] = μ.
Da der erwartete Wert der Statistik mit dem von ihr geschätzten Parameter übereinstimmt, bedeutet dies, dass der Stichprobenmittelwert ein unverzerrter Schätzer für den Populationsmittelwert ist.