Was ist die negative Binomialverteilung?

Die negative Binomialverteilung ist eine Wahrscheinlichkeitsverteilung, die mit diskreten Zufallsvariablen verwendet wird. Diese Art der Verteilung betrifft die Anzahl der Versuche, die durchgeführt werden müssen, um eine vorgegebene Anzahl von Erfolgen zu erzielen. Wie wir sehen werden, hängt die negative Binomialverteilung mit der Binomialverteilung zusammen. Zusätzlich verallgemeinert diese Verteilung die geometrische Verteilung.

Die Einstellung

Zunächst betrachten wir sowohl die Umgebung als auch die Bedingungen, die zu einer negativen Binomialverteilung führen. Viele dieser Bedingungen sind einer Binomialeinstellung sehr ähnlich.

  1. Wir haben ein Bernoulli-Experiment. Dies bedeutet, dass jeder Versuch, den wir durchführen, einen genau definierten Erfolg und Misserfolg hat und dass dies die einzigen Ergebnisse sind.
  2. Die Erfolgswahrscheinlichkeit ist konstant, egal wie oft wir das Experiment durchführen. Wir bezeichnen diese konstante Wahrscheinlichkeit mit a p.
  3. Der Versuch wird wiederholt für X unabhängige Studien, dh das Ergebnis einer Studie hat keinen Einfluss auf das Ergebnis einer nachfolgenden Studie. 

Diese drei Bedingungen sind mit denen in einer Binomialverteilung identisch. Der Unterschied besteht darin, dass eine binomische Zufallsvariable eine feste Anzahl von Versuchen aufweist n.  Die einzigen Werte von X sind 0, 1, 2,… , n, Das ist also eine endliche Verteilung.

Bei einer negativen Binomialverteilung handelt es sich um die Anzahl der Versuche X Das muss geschehen, bis wir haben r Erfolge. Die Nummer r ist eine ganze Zahl, die wir auswählen, bevor wir mit der Durchführung unserer Versuche beginnen. Die Zufallsvariable X ist immer noch diskret. Jetzt kann die Zufallsvariable jedoch Werte von annehmen X = r, r + 1, r + 2,… Diese Zufallsvariable ist zählbar unendlich, da es beliebig lange dauern kann, bis wir sie erhalten r Erfolge.

Beispiel

Um eine negative Binomialverteilung besser zu verstehen, lohnt es sich, ein Beispiel zu betrachten. Nehmen wir an, wir werfen eine faire Münze um und stellen die Frage: "Wie groß ist die Wahrscheinlichkeit, dass wir im ersten Fall drei Köpfe bekommen? X Münzwürfe? "Dies ist eine Situation, die eine negative Binomialverteilung erfordert. 

Die Münzwürfe haben zwei mögliche Ergebnisse, die Erfolgswahrscheinlichkeit ist konstant 1/2 und die Versuche sind unabhängig voneinander. Wir fragen nach der Wahrscheinlichkeit, die ersten drei Köpfe danach zu bekommen X Münzwürfe. Wir müssen also mindestens dreimal die Münze werfen. Wir drehen dann weiter, bis der dritte Kopf erscheint.

Um Wahrscheinlichkeiten im Zusammenhang mit einer negativen Binomialverteilung zu berechnen, benötigen wir einige weitere Informationen. Wir müssen die Wahrscheinlichkeitsmassenfunktion kennen.

Wahrscheinlichkeitsmassenfunktion

Die Wahrscheinlichkeitsmassenfunktion für eine negative Binomialverteilung kann mit ein wenig Nachdenken entwickelt werden. Jeder Versuch hat eine Erfolgswahrscheinlichkeit von p.  Da es nur zwei mögliche Ergebnisse gibt, ist die Ausfallwahrscheinlichkeit konstant (1 - p ).

Das rDer Erfolg muss eintreten für die xth und letzte Studie. Der Vorherige x - 1 Versuche müssen genau enthalten r - 1 Erfolge. Die Anzahl der Möglichkeiten, die dies auftreten kann, ergibt sich aus der Anzahl der Kombinationen:

C (x - 1, r -1) = (x - 1)! / [(R - 1)! (x - r)!]. 

Darüber hinaus haben wir unabhängige Ereignisse, sodass wir unsere Wahrscheinlichkeiten miteinander multiplizieren können. Alles zusammen ergibt die Wahrscheinlichkeitsmassenfunktion

f(x) = C (x - 1, r -1) pr(1 - p)x - r.

Der Name der Distribution

Wir sind jetzt in der Lage zu verstehen, warum diese Zufallsvariable eine negative Binomialverteilung hat. Die Anzahl der Kombinationen, auf die wir oben gestoßen sind, kann durch Einstellung unterschiedlich geschrieben werden x - r = k:

(x - 1)! / [(r - 1)! (x - r)!] = (x + k - 1)! / [(R - 1)! k!] = (r + k - 1) (x + k - 2)… (r + 1) (r) /k! = (-1)k(-r) (-r - 1)… (-r - (k + 1) / k!.

Hier sehen wir das Auftreten eines negativen Binomialkoeffizienten, der verwendet wird, wenn wir einen Binomialausdruck (a + b) zu einer negativen Potenz erhöhen.

Bedeuten

Es ist wichtig, den Mittelwert einer Verteilung zu kennen, da dies eine Möglichkeit ist, das Zentrum der Verteilung zu bezeichnen. Der Mittelwert dieser Art von Zufallsvariablen ergibt sich aus ihrem erwarteten Wert und ist gleich r / p.  Wir können dies sorgfältig beweisen, indem wir die Momentgenerierungsfunktion für diese Distribution verwenden.

Die Intuition führt uns auch zu diesem Ausdruck. Angenommen, wir führen eine Reihe von Versuchen durch n1 bis wir erhalten r Erfolge. Und dann machen wir das noch einmal, nur diesmal dauert es n2 Versuche. Wir setzen dies immer wieder fort, bis wir eine große Anzahl von Versuchsgruppen haben N = n1 + n+… +  nk.

Jedes von diesen k Studien enthält r Erfolge, und so haben wir insgesamt kr Erfolge. Wenn ist groß, dann würden wir erwarten, ungefähr zu sehen Np Erfolge. Also setzen wir diese zusammen und haben kr = Np.

Wir machen Algebra und finden das N / k = r / p.  Der Bruchteil auf der linken Seite dieser Gleichung gibt die durchschnittliche Anzahl der Versuche an, die für jeden unserer Versuche erforderlich sind k Gruppen von Studien. Mit anderen Worten, dies ist die erwartete Häufigkeit, mit der das Experiment durchgeführt wird, sodass wir insgesamt haben r Erfolge. Dies ist genau die Erwartung, die wir finden möchten. Wir sehen, dass dies der Formel entspricht r / p.

Varianz

Die Varianz der negativen Binomialverteilung kann auch unter Verwendung der Momentenerzeugungsfunktion berechnet werden. Wenn wir dies tun, sehen wir, dass die Varianz dieser Verteilung durch die folgende Formel gegeben ist:

r (1 - p) /p2

Moment erzeugende Funktion

Die Momenterzeugungsfunktion für diese Art von Zufallsvariablen ist ziemlich kompliziert. Es sei daran erinnert, dass die Momenterzeugungsfunktion als der erwartete Wert E [e definiert isttX]. Durch Verwendung dieser Definition mit unserer Wahrscheinlichkeitsmassenfunktion haben wir:

M (t) = E [etX] = Σ (x - 1)! / [(R - 1)! (x - r)!] etXpr(1 - p)x - r

Nach einer gewissen Algebra wird dies zu M (t) = (pet)r[1- (1- p) et]-r

Beziehung zu anderen Distributionen

Wir haben oben gesehen, wie die negative Binomialverteilung in vielerlei Hinsicht der Binomialverteilung ähnelt. Zusätzlich zu dieser Verbindung ist die negative Binomialverteilung eine allgemeinere Version einer geometrischen Verteilung.  

Eine geometrische Zufallsvariable X zählt die Anzahl der Versuche, die notwendig sind, bevor der erste Erfolg eintritt. Es ist leicht zu erkennen, dass dies genau die negative Binomialverteilung ist, aber mit r gleich eins.

Andere Formulierungen der negativen Binomialverteilung existieren. Einige Lehrbücher definieren X die Anzahl der Versuche sein, bis r Ausfälle auftreten.

Beispiel Problem

Wir werden uns ein Beispielproblem ansehen, um zu sehen, wie man mit der negativen Binomialverteilung arbeitet. Angenommen, ein Basketballspieler ist zu 80% ein Freiwurfschütze. Angenommen, ein Freiwurf ist unabhängig vom nächsten. Wie groß ist die Wahrscheinlichkeit, dass für diesen Spieler der achte Korb beim zehnten Freiwurf fällt??

Wir sehen, dass wir eine Einstellung für eine negative Binomialverteilung haben. Die konstante Erfolgswahrscheinlichkeit beträgt 0,8, die Ausfallwahrscheinlichkeit also 0,2. Wir wollen die Wahrscheinlichkeit von X = 10 bestimmen, wenn r = 8 ist.

Wir fügen diese Werte in unsere Wahrscheinlichkeitsmassenfunktion ein:

f (10) = C (10 & ndash; 1, 8 & ndash; 1) (0,8)8(0,2)2= 36 (0,8)8(0,2)2, das sind ca. 24%.

Wir könnten dann fragen, wie viele Freiwürfe durchschnittlich geschossen wurden, bevor dieser Spieler acht davon macht. Da der erwartete Wert 8 / 0,8 = 10 ist, ist dies die Anzahl der Aufnahmen.