Der Median eines Datensatzes ist der Mittelpunkt, an dem genau die Hälfte der Datenwerte kleiner oder gleich dem Median ist. Auf ähnliche Weise können wir über den Median einer kontinuierlichen Wahrscheinlichkeitsverteilung nachdenken, aber anstatt den Mittelwert in einer Datenmenge zu finden, finden wir die Mitte der Verteilung auf eine andere Weise.
Die Gesamtfläche unter einer Wahrscheinlichkeitsdichtefunktion ist 1, was 100% darstellt, und folglich kann die Hälfte davon durch die Hälfte oder 50% dargestellt werden. Eine der großen Ideen der mathematischen Statistik ist, dass die Wahrscheinlichkeit durch die Fläche unter der Kurve der Dichtefunktion dargestellt wird, die durch ein Integral berechnet wird, und der Median einer kontinuierlichen Verteilung somit der Punkt auf der reellen Zahlenlinie ist, an dem genau die Hälfte liegt der Bereich liegt auf der linken Seite.
Dies kann durch das folgende unkorrekte Integral präzisiert werden. Der Median der stetigen Zufallsvariablen X mit Dichtefunktion f( x) ist der Wert M so, dass:
0,5 = ∫m - ∞f (x) dx0,5 = \ int_ m ^ - \ infty f (x) dx0,5 = ∫m - ∞f (x) dx
Wir berechnen nun den Median für die Exponentialverteilung Exp (A). Eine Zufallsvariable mit dieser Verteilung hat Dichtefunktion f(x) = e-x/EIN/ A für x jede nichtnegative reelle Zahl. Die Funktion enthält auch die mathematische Konstante e, ungefähr gleich 2,71828.
Da die Wahrscheinlichkeitsdichtefunktion für jeden negativen Wert von Null ist x, Alles, was wir tun müssen, ist das Folgende zu integrieren und nach M zu lösen:
0,5 = ~ 0 M f (x) dx
Da das Integral ∫ e-x/EIN/Anzeigex = -e-x/EIN, das Ergebnis ist das
0,5 = -e-M / A + 1
Dies bedeutet, dass 0,5 = e-M / A und nachdem wir den natürlichen Logarithmus beider Seiten der Gleichung genommen haben, haben wir:
ln (1/2) = -M / A
Da 1/2 = 2-1, Nach Eigenschaften von Logarithmen schreiben wir:
- ln2 = -M / A
Das Multiplizieren beider Seiten mit A ergibt das Ergebnis, dass der Median M = A ln2 ist.
Eine Konsequenz dieses Ergebnisses sollte erwähnt werden: Der Mittelwert der Exponentialverteilung Exp (A) ist A, und da ln2 kleiner als 1 ist, folgt, dass das Produkt Aln2 kleiner als A ist. Dies bedeutet, dass der Median der Exponentialverteilung ist ist weniger als der Mittelwert.
Dies ist sinnvoll, wenn wir über den Graphen der Wahrscheinlichkeitsdichtefunktion nachdenken. Aufgrund des langen Schwanzes ist diese Verteilung nach rechts geneigt. Wenn eine Verteilung häufig nach rechts verschoben ist, ist der Mittelwert rechts vom Median.
Für die statistische Analyse bedeutet dies, dass wir häufig vorhersagen können, dass der Mittelwert und der Median nicht direkt korrelieren, wenn die Wahrscheinlichkeit gegeben ist, dass die Daten nach rechts verschoben sind.
Betrachten Sie als Beispiel einen Datensatz, der besagt, dass eine Person in 10 Stunden insgesamt 30 Besucher empfängt, wobei die durchschnittliche Wartezeit für einen Besucher 20 Minuten beträgt, während der Datensatz möglicherweise anzeigt, dass die mittlere Wartezeit irgendwo liegt zwischen 20 und 30 Minuten, wenn mehr als die Hälfte der Besucher in den ersten fünf Stunden kam.