Das erste und dritte Quartil sind beschreibende Statistiken, bei denen es sich um Positionsmessungen in einem Datensatz handelt. Ähnlich wie der Median den Mittelpunkt eines Datensatzes angibt, kennzeichnet das erste Quartil den Viertel- oder 25% -Punkt. Ungefähr 25% der Datenwerte sind kleiner oder gleich dem ersten Quartil. Das dritte Quartil ist ähnlich, jedoch für die oberen 25% der Datenwerte. Wir werden uns im Folgenden eingehender mit diesen Ideen befassen.
Es gibt verschiedene Möglichkeiten, die Mitte eines Datensatzes zu messen. Mittelwert, Median, Modus und Mitteltöner haben alle ihre Vor- und Nachteile, wenn sie die Mitte der Daten ausdrücken. Von all diesen Möglichkeiten, den Durchschnitt zu ermitteln, ist der Median am widerstandsfähigsten gegenüber Ausreißern. Es markiert die Mitte der Daten in dem Sinne, dass die Hälfte der Daten kleiner als der Median ist.
Es gibt keinen Grund, bei der Suche nach der Mitte aufzuhören. Was wäre, wenn wir diesen Prozess fortsetzen würden? Wir könnten den Median der unteren Hälfte unserer Daten berechnen. Die Hälfte von 50% beträgt 25%. Somit würde die Hälfte oder ein Viertel der Daten darunter liegen. Da es sich um ein Viertel der ursprünglichen Menge handelt, wird dieser Median der unteren Hälfte der Daten als erstes Quartil bezeichnet und mit bezeichnet Q.1.
Es gibt keinen Grund, warum wir uns die untere Hälfte der Daten angesehen haben. Stattdessen hätten wir uns die obere Hälfte ansehen und die gleichen Schritte wie oben ausführen können. Der Median dieser Hälfte, den wir bezeichnen werden Q.3 teilt den Datensatz auch in Viertel auf. Diese Zahl gibt jedoch das oberste Viertel der Daten an. Damit liegen drei Viertel der Daten unter unserer Nummer Q.3. Deshalb rufen wir an Q.3 das dritte Quartil.
Schauen wir uns ein Beispiel an, um dies zu verdeutlichen. Es kann hilfreich sein, zunächst zu überprüfen, wie der Median einiger Daten berechnet wird. Beginnen Sie mit folgendem Datensatz:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 17, 17, 18, 20
Der Satz enthält insgesamt zwanzig Datenpunkte. Wir beginnen damit, den Median zu finden. Da es eine gerade Anzahl von Datenwerten gibt, ist der Median der Mittelwert aus dem zehnten und elften Wert. Mit anderen Worten ist der Median:
(7 + 8) / 2 = 7,5.
Betrachten Sie nun die untere Hälfte der Daten. Der Median dieser Hälfte liegt zwischen dem fünften und sechsten Wert von:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Somit ist das erste Quartil gleich Q.1 = (4 + 6) / 2 = 5
Um das dritte Quartil zu finden, sehen Sie sich die obere Hälfte des Originaldatensatzes an. Wir müssen den Median von:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Hier ist der Median (15 + 15) / 2 = 15. Somit ist das dritte Quartil Q.3 = 15.
Quartile helfen uns dabei, ein vollständigeres Bild unseres gesamten Datensatzes zu erhalten. Das erste und dritte Quartil geben Auskunft über die interne Struktur unserer Daten. Die mittlere Hälfte der Daten liegt zwischen dem ersten und dritten Quartil und ist um den Median zentriert. Der Unterschied zwischen dem ersten und dem dritten Quartil, der als Interquartilbereich bezeichnet wird, zeigt, wie die Daten über den Median angeordnet sind. Ein kleiner Interquartilbereich gibt Daten an, die über den Median gruppiert sind. Ein größerer Interquartilbereich zeigt, dass die Daten weiter verteilt sind.
Ein detaillierteres Bild der Daten kann erhalten werden, indem der höchste Wert, der als Maximalwert bezeichnet wird, und der niedrigste Wert, der als Minimalwert bezeichnet wird, bekannt sind. Das Minimum, das erste Quartil, der Median, das dritte Quartil und das Maximum sind ein Satz von fünf Werten, die als Fünf-Zahlen-Zusammenfassung bezeichnet werden. Eine effektive Möglichkeit, diese fünf Zahlen anzuzeigen, ist ein Boxplot oder ein Box-Whisker-Diagramm.