Die normale Annäherung an die Binomialverteilung

Zufallsvariablen mit einer Binomialverteilung sind bekanntermaßen diskret. Dies bedeutet, dass es eine abzählbare Anzahl von Ergebnissen gibt, die in einer Binomialverteilung auftreten können, wobei diese Ergebnisse voneinander getrennt sind. Beispielsweise kann eine Binomialvariable einen Wert von drei oder vier annehmen, jedoch keine Zahl zwischen drei und vier.

Bei dem diskreten Charakter einer Binomialverteilung ist es etwas überraschend, dass eine kontinuierliche Zufallsvariable verwendet werden kann, um eine Binomialverteilung anzunähern. Für viele Binomialverteilungen können wir eine Normalverteilung verwenden, um unsere Binomialwahrscheinlichkeiten zu approximieren.

Dies kann beim Betrachten gesehen werden n Münzwürfe und -vermietung X sei die Anzahl der Köpfe. In dieser Situation haben wir eine Binomialverteilung mit Erfolgswahrscheinlichkeit als p = 0,5. Wenn wir die Anzahl der Würfe erhöhen, sehen wir, dass das Wahrscheinlichkeitshistogramm einer Normalverteilung immer ähnlicher wird.

Angabe der Normalen Näherung

Jede Normalverteilung ist vollständig durch zwei reelle Zahlen definiert. Diese Zahlen sind der Mittelwert, der das Zentrum der Verteilung misst, und die Standardabweichung, die die Verteilung misst. Für eine gegebene Binomialsituation müssen wir in der Lage sein, die zu verwendende Normalverteilung zu bestimmen.

Die Auswahl der richtigen Normalverteilung richtet sich nach der Anzahl der Versuche n in der Binomialeinstellung und der konstanten Wahrscheinlichkeit des Erfolgs p für jeden dieser Versuche. Die normale Näherung für unsere Binomialvariable ist ein Mittelwert von np und eine Standardabweichung von (np(1 - p)0,5.

Angenommen, wir haben für jede der 100 Fragen eines Multiple-Choice-Tests eine richtige Antwort aus vier Auswahlmöglichkeiten ermittelt. Die Anzahl der richtigen Antworten X ist eine binomische Zufallsvariable mit n = 100 und p = 0,25. Somit hat diese Zufallsvariable einen Mittelwert von 100 (0,25) = 25 und eine Standardabweichung von (100 (0,25) (0,75)).0,5 = 4,33. Eine Normalverteilung mit einem Mittelwert von 25 und einer Standardabweichung von 4,33 wird diese Binomialverteilung approximieren.

Wann ist die Annäherung angemessen??

Mit etwas Mathematik kann gezeigt werden, dass es einige Bedingungen gibt, die eine normale Annäherung an die Binomialverteilung erfordern. Die Anzahl der Beobachtungen n muss groß genug sein, und der Wert von p damit beide np und n(1 - p) größer oder gleich 10 sind. Dies ist eine Faustregel, die sich an der statistischen Praxis orientiert. Die normale Annäherung kann immer verwendet werden, aber wenn diese Bedingungen nicht erfüllt sind, ist die Annäherung möglicherweise nicht so gut wie eine Annäherung.

Zum Beispiel, wenn n = 100 und p = 0,25, dann sind wir berechtigt, die normale Näherung zu verwenden. Das ist weil np = 25 und n(1 - p) = 75. Da diese beiden Zahlen größer als 10 sind, kann die Binomialwahrscheinlichkeiten mit der entsprechenden Normalverteilung recht gut geschätzt werden.

Warum die Approximation verwenden??

Binomialwahrscheinlichkeiten werden unter Verwendung einer sehr einfachen Formel zum Ermitteln des Binomialkoeffizienten berechnet. Leider kann es aufgrund der Fakultäten in der Formel sehr einfach sein, mit der Binomialformel auf Rechenschwierigkeiten zu stoßen. Die normale Annäherung ermöglicht es uns, jedes dieser Probleme zu umgehen, indem wir mit einem vertrauten Freund zusammenarbeiten, einer Wertetabelle einer Standardnormalverteilung.

Die Bestimmung einer Wahrscheinlichkeit, dass eine binomische Zufallsvariable in einen Wertebereich fällt, ist oft mühsam zu berechnen. Dies liegt daran, die Wahrscheinlichkeit zu finden, dass eine Binomialvariable X größer als 3 und kleiner als 10 ist, müssten wir die Wahrscheinlichkeit finden, dass X entspricht 4, 5, 6, 7, 8 und 9, und addieren Sie dann alle diese Wahrscheinlichkeiten. Wenn die normale Näherung verwendet werden kann, müssen wir stattdessen die Z-Scores entsprechend 3 und 10 bestimmen und dann eine Z-Score-Wahrscheinlichkeitstabelle für die Standardnormalverteilung verwenden.