Was ist ein Bereich in der Statistik?

In Statistik und Mathematik ist der Bereich die Differenz zwischen den Maximal- und Minimalwerten eines Datensatzes und dient als eines von zwei wichtigen Merkmalen eines Datensatzes. Die Formel für einen Bereich ist der Maximalwert abzüglich des Minimalwerts im Datensatz, wodurch Statistiker besser verstehen, wie unterschiedlich der Datensatz ist.

Zwei wichtige Merkmale eines Datensatzes sind die Mitte der Daten und die Verbreitung der Daten. Die Mitte kann auf verschiedene Arten gemessen werden: Die beliebtesten sind der Mittelwert, der Median, der Modus und der mittlere Bereich, jedoch in In ähnlicher Weise gibt es verschiedene Methoden, um die Streuung des Datensatzes zu berechnen, und das einfachste und gröbste Maß für die Streuung wird als Bereich bezeichnet.

Die Berechnung der Reichweite ist sehr einfach. Alles, was wir tun müssen, ist die Differenz zwischen dem größten Datenwert in unserer Menge und dem kleinsten Datenwert zu finden. Kurz gesagt, wir haben die folgende Formel: Bereich = Maximaler Wert - Minimaler Wert. Beispielsweise hat der Datensatz 4, 6, 10, 15, 18 ein Maximum von 18, ein Minimum von 4 und einen Bereich von 18-4 = 14.

Reichweitenbeschränkungen

Der Bereich ist ein sehr grobes Maß für die Verbreitung von Daten, da er äußerst empfindlich für Ausreißer ist. Infolgedessen gibt es bestimmte Einschränkungen für die Nützlichkeit eines echten Bereichs eines Datensatzes für Statistiker, da sich ein einzelner Datenwert erheblich auswirken kann der Wert des Bereichs.

Betrachten Sie zum Beispiel den Datensatz 1, 2, 3, 4, 6, 7, 7, 8. Der Maximalwert ist 8, der Minimalwert ist 1 und der Bereich ist 7. Betrachten Sie dann denselben Datensatz nur mit der Wert 100 enthalten. Der Bereich wird jetzt 100-1 = 99 wobei das Hinzufügen eines einzelnen zusätzlichen Datenpunkts den Wert des Bereichs stark beeinflusste. Die Standardabweichung ist ein weiteres Maß für die Streuung, das weniger anfällig für Ausreißer ist. Der Nachteil ist jedoch, dass die Berechnung der Standardabweichung viel komplizierter ist.

Der Bereich sagt auch nichts über die internen Merkmale unseres Datensatzes aus. Als Beispiel betrachten wir den Datensatz 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10, in dem der Bereich für diesen Datensatz liegt 10-1 = 9. Wenn wir dies dann mit dem Datensatz von 1, 1, 1, 2, 9, 9, 9, 10 vergleichen. Hier ist der Bereich jedoch wieder neun für diesen zweiten Satz und im Gegensatz zum ersten Satz die Daten ist um das Minimum und das Maximum gruppiert. Andere Statistiken, wie das erste und dritte Quartil, müssten verwendet werden, um einen Teil dieser internen Struktur zu ermitteln.

Reichweitenanwendungen

Der Bereich ist eine gute Möglichkeit, um ein grundlegendes Verständnis der tatsächlichen Verteilung von Zahlen im Datensatz zu erhalten, da die Berechnung einfach ist, da nur eine grundlegende arithmetische Operation erforderlich ist. Es gibt jedoch auch einige andere Anwendungen des Bereichs von ein Datensatz in der Statistik.

Der Bereich kann auch verwendet werden, um ein anderes Maß für die Streuung zu schätzen, die Standardabweichung. Anstatt eine ziemlich komplizierte Formel zu durchlaufen, um die Standardabweichung zu finden, können wir stattdessen die sogenannte Bereichsregel verwenden. Der Bereich ist bei dieser Berechnung von grundlegender Bedeutung.

Der Bereich tritt auch in einem Boxplot oder einem Box- und Whisker-Plot auf. Die Maximal- und Minimalwerte werden beide am Ende der Whisker des Diagramms grafisch dargestellt, und die Gesamtlänge der Whisker und der Box entspricht dem Bereich.