Es gibt verschiedene beschreibende Statistiken. Zahlen wie Mittelwert, Median, Modus, Schiefe, Kurtosis, Standardabweichung, erstes und drittes Quartil, um nur einige zu nennen, geben jeweils Auskunft über unsere Daten. Anstatt diese deskriptiven Statistiken einzeln zu betrachten, hilft es uns manchmal, sie zu kombinieren, um ein vollständiges Bild zu erhalten. Zu diesem Zweck bietet die Zusammenfassung mit fünf Zahlen eine praktische Möglichkeit, fünf deskriptive Statistiken zu kombinieren.
Es ist klar, dass es in unserer Zusammenfassung fünf Zahlen geben soll, aber welche fünf? Die ausgewählten Zahlen sollen uns helfen, das Zentrum unserer Daten sowie die Verteilung der Datenpunkte zu erkennen. In diesem Sinne besteht die fünfstellige Zusammenfassung aus folgenden Elementen:
Der Mittelwert und die Standardabweichung können auch zusammen verwendet werden, um die Mitte und die Streuung eines Datensatzes zu übermitteln. Beide Statistiken sind jedoch anfällig für Ausreißer. Der Median, das erste und das dritte Quartil werden nicht so stark von Ausreißern beeinflusst.
Anhand der folgenden Daten werden wir die fünf Zahlen zusammenfassen:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 17, 17, 18, 20
Der Datensatz enthält insgesamt zwanzig Punkte. Der Median ist somit der Durchschnitt der zehnten und elften Datenwerte oder:
(7 + 8) / 2 = 7,5.
Der Median der unteren Hälfte der Daten ist das erste Quartil. Die untere Hälfte ist:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Also rechnen wirQ.1= (4 + 6) / 2 = 5.
Der Median der oberen Hälfte des Originaldatensatzes ist das dritte Quartil. Wir müssen den Median von:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Also rechnen wirQ.3= (15 + 15) / 2 = 15.
Wir setzen alle obigen Ergebnisse zusammen und berichten, dass die Fünf-Zahlen-Zusammenfassung für den obigen Datensatz 1, 5, 7,5, 12, 20 ist.
Fünf Zahlenzusammenfassungen können miteinander verglichen werden. Wir werden feststellen, dass zwei Sätze mit ähnlichen Mitteln und Standardabweichungen sehr unterschiedliche Fünf-Zahlen-Zusammenfassungen haben können. Um zwei Fünf-Zahlen-Zusammenfassungen auf einen Blick zu vergleichen, können wir ein Boxplot oder ein Box- und Whisker-Diagramm verwenden.