Was ist die 5-Zahlen-Zusammenfassung?

Es gibt verschiedene beschreibende Statistiken. Zahlen wie Mittelwert, Median, Modus, Schiefe, Kurtosis, Standardabweichung, erstes und drittes Quartil, um nur einige zu nennen, geben jeweils Auskunft über unsere Daten. Anstatt diese deskriptiven Statistiken einzeln zu betrachten, hilft es uns manchmal, sie zu kombinieren, um ein vollständiges Bild zu erhalten. Zu diesem Zweck bietet die Zusammenfassung mit fünf Zahlen eine praktische Möglichkeit, fünf deskriptive Statistiken zu kombinieren.

Welche fünf Zahlen??

Es ist klar, dass es in unserer Zusammenfassung fünf Zahlen geben soll, aber welche fünf? Die ausgewählten Zahlen sollen uns helfen, das Zentrum unserer Daten sowie die Verteilung der Datenpunkte zu erkennen. In diesem Sinne besteht die fünfstellige Zusammenfassung aus folgenden Elementen:

  • Das Minimum - das ist der kleinste Wert in unserem Datensatz.
  • Das erste Quartil - diese Zahl wird angegeben Q.1 und 25% unserer Daten liegen unter dem ersten Quartil.
  • Der Median - Dies ist die Mitte der Daten. 50% aller Daten liegen unter dem Median.
  • Das dritte Quartil - diese Zahl wird angegeben Q.3 und 75% unserer Daten liegen unter dem dritten Quartil.
  • Das Maximum - das ist der größte Wert in unserem Datensatz.

Der Mittelwert und die Standardabweichung können auch zusammen verwendet werden, um die Mitte und die Streuung eines Datensatzes zu übermitteln. Beide Statistiken sind jedoch anfällig für Ausreißer. Der Median, das erste und das dritte Quartil werden nicht so stark von Ausreißern beeinflusst.

Ein Beispiel

Anhand der folgenden Daten werden wir die fünf Zahlen zusammenfassen:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 17, 17, 18, 20

Der Datensatz enthält insgesamt zwanzig Punkte. Der Median ist somit der Durchschnitt der zehnten und elften Datenwerte oder:

(7 + 8) / 2 = 7,5.

Der Median der unteren Hälfte der Daten ist das erste Quartil. Die untere Hälfte ist:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Also rechnen wirQ.1= (4 + 6) / 2 = 5.

Der Median der oberen Hälfte des Originaldatensatzes ist das dritte Quartil. Wir müssen den Median von:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Also rechnen wirQ.3= (15 + 15) / 2 = 15.

Wir setzen alle obigen Ergebnisse zusammen und berichten, dass die Fünf-Zahlen-Zusammenfassung für den obigen Datensatz 1, 5, 7,5, 12, 20 ist.

Grafische Darstellung

Fünf Zahlenzusammenfassungen können miteinander verglichen werden. Wir werden feststellen, dass zwei Sätze mit ähnlichen Mitteln und Standardabweichungen sehr unterschiedliche Fünf-Zahlen-Zusammenfassungen haben können. Um zwei Fünf-Zahlen-Zusammenfassungen auf einen Blick zu vergleichen, können wir ein Boxplot oder ein Box- und Whisker-Diagramm verwenden.