Es ist die Mitternachtsshow des neuesten Erfolgsfilms. Vor dem Theater stehen Leute, die darauf warten, hereinzukommen. Stellen Sie sich vor, Sie werden gebeten, die Mitte der Linie zu finden. Wie würdest du das machen??
Es gibt verschiedene Möglichkeiten, um dieses Problem zu lösen. Am Ende müssten Sie herausfinden, wie viele Leute in der Leitung waren, und dann die Hälfte dieser Zahl nehmen. Wenn die Gesamtzahl gerade ist, liegt die Mitte der Linie zwischen zwei Personen. Wenn die Gesamtzahl ungerade ist, wäre das Zentrum eine einzelne Person.
Sie fragen sich vielleicht: "Was hat das Ermitteln der Mitte einer Linie mit Statistiken zu tun?" Diese Idee, das Zentrum zu finden, wird genau verwendet, wenn der Median eines Datensatzes berechnet wird.
Der Median ist eine der drei wichtigsten Methoden, um den Durchschnitt statistischer Daten zu ermitteln. Es ist schwieriger zu berechnen als der Modus, aber nicht so arbeitsintensiv wie die Berechnung des Mittelwerts. Es ist das Zentrum auf die gleiche Weise wie das Zentrum einer Menschenreihe. Nach der Auflistung der Datenwerte in aufsteigender Reihenfolge ist der Median der Datenwert mit der gleichen Anzahl von Datenwerten darüber und darunter.
Elf Batterien werden getestet, um festzustellen, wie lange sie halten. Ihre Lebensdauer in Stunden wird durch 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131 angegeben. Wie hoch ist die mittlere Lebensdauer? Da es eine ungerade Anzahl von Datenwerten gibt, entspricht dies einer Zeile mit einer ungeraden Anzahl von Personen. Das Zentrum wird der mittlere Wert sein.
Es gibt elf Datenwerte, der sechste befindet sich also in der Mitte. Daher ist die mittlere Batterielebensdauer der sechste Wert in dieser Liste oder 105 Stunden. Beachten Sie, dass der Median einer der Datenwerte ist.
Zwanzig Katzen werden gewogen. Ihre Gewichte in Pfund sind gegeben durch 4, 5, 5, 5, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Was ist das mittlere Katzengewicht? Da es eine gerade Anzahl von Datenwerten gibt, entspricht dies der Zeile mit einer geraden Anzahl von Personen. Der Mittelpunkt liegt zwischen den beiden Mittelwerten.
In diesem Fall liegt die Mitte zwischen dem zehnten und elften Datenwert. Um den Median zu ermitteln, berechnen wir den Mittelwert dieser beiden Werte und erhalten (7 + 8) / 2 = 7,5. Hier ist der Median nicht einer der Datenwerte.
Die einzigen beiden Möglichkeiten sind eine gerade oder ungerade Anzahl von Datenwerten. Die obigen zwei Beispiele sind also die einzigen möglichen Methoden, um den Median zu berechnen. Entweder ist der Median der Mittelwert, oder der Median ist der Mittelwert der beiden Mittelwerte. In der Regel sind die Datensätze viel größer als die oben gezeigten, aber der Vorgang zum Ermitteln des Medians ist derselbe wie in diesen beiden Beispielen.
Mittelwert und Modus reagieren sehr empfindlich auf Ausreißer. Dies bedeutet, dass die Anwesenheit eines Ausreißers beide Maßnahmen des Zentrums dramatisch beeinflusst. Ein Vorteil des Medians ist, dass er nicht so stark von einem Ausreißer beeinflusst wird.
Betrachten Sie dazu den Datensatz 3, 4, 5, 5, 6. Der Mittelwert ist (3 + 4 + 5 + 5 + 6) / 5 = 4,6, und der Median ist 5. Behalten Sie nun denselben Datensatz bei. Addieren Sie jedoch den Wert 100: 3, 4, 5, 5, 6, 100. 100 ist eindeutig ein Ausreißer, da er viel größer ist als alle anderen Werte. Der Mittelwert der neuen Menge ist jetzt (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Der Median der neuen Menge ist jedoch 5. Obwohl die
Aus den oben genannten Gründen ist der Median das bevorzugte Maß für den Durchschnitt, wenn die Daten Ausreißer enthalten. Ein typischer Ansatz bei der Meldung von Einkommen ist die Angabe des Medianeinkommens. Dies geschieht, weil das Durchschnittseinkommen von einer kleinen Anzahl von Menschen mit sehr hohem Einkommen verzerrt wird (siehe Bill Gates und Oprah)..