Was ist die Ungleichung von Chebyshev?

Chebyshevs Ungleichung besagt, dass mindestens 1-1 /K2 von Daten aus einer Stichprobe muss innerhalb liegen K Standardabweichungen vom Mittelwert (hier K ist eine positive reelle Zahl größer als eins).

Jeder Datensatz, der normalverteilt ist oder die Form einer Glockenkurve hat, weist mehrere Merkmale auf. Eine davon befasst sich mit der Streuung der Daten relativ zur Anzahl der Standardabweichungen vom Mittelwert. Bei einer Normalverteilung wissen wir, dass 68% der Daten eine Standardabweichung vom Mittelwert sind, 95% zwei Standardabweichungen vom Mittelwert sind und ungefähr 99% innerhalb von drei Standardabweichungen vom Mittelwert liegen.

Wenn der Datensatz jedoch nicht in Form einer Glockenkurve verteilt ist, kann eine andere Menge innerhalb einer Standardabweichung liegen. Die Ungleichung von Chebyshev bietet eine Möglichkeit, den Anteil der Daten zu ermitteln K Standardabweichungen vom Mittelwert für irgendein Datensatz.

Fakten über die Ungleichung

Wir können die obige Ungleichung auch ausdrücken, indem wir den Ausdruck „Daten aus einer Stichprobe“ durch die Wahrscheinlichkeitsverteilung ersetzen. Dies liegt daran, dass die Ungleichung von Chebyshev ein Ergebnis der Wahrscheinlichkeit ist, die dann auf Statistiken angewendet werden kann.

Es ist wichtig anzumerken, dass diese Ungleichung ein Ergebnis ist, das mathematisch bewiesen wurde. Es ist nicht wie die empirische Beziehung zwischen Mittelwert und Modus oder die Faustregel, die den Bereich und die Standardabweichung verbindet.

Illustration der Ungleichung

Um die Ungleichung zu veranschaulichen, werden wir sie für einige Werte von betrachten K:

  • Zum K = 2 wir haben 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Die Ungleichung von Chebyshev besagt also, dass mindestens 75% der Datenwerte einer Verteilung innerhalb von zwei Standardabweichungen des Mittelwerts liegen müssen.
  • Zum K = 3 wir haben 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Die Ungleichung von Chebyshev besagt also, dass mindestens 89% der Datenwerte einer Verteilung innerhalb von drei Standardabweichungen vom Mittelwert liegen müssen.
  • Zum K = 4 wir haben 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93,75%. Die Ungleichung von Chebyshev besagt also, dass mindestens 93,75% der Datenwerte einer Verteilung innerhalb von zwei Standardabweichungen vom Mittelwert liegen müssen.

Beispiel

Angenommen, wir haben die Gewichte von Hunden im örtlichen Tierheim untersucht und festgestellt, dass unsere Probe einen Mittelwert von 20 Pfund mit einer Standardabweichung von 3 Pfund aufweist. Unter Verwendung der Chebyshev-Ungleichung wissen wir, dass mindestens 75% der von uns beprobten Hunde Gewichte aufweisen, die zwei Standardabweichungen vom Mittelwert sind. Die zweifache Standardabweichung ergibt 2 x 3 = 6. Subtrahieren und addieren Sie dies vom Mittelwert von 20. Dies zeigt, dass 75% der Hunde ein Gewicht von 14 bis 26 Pfund haben.

Verwendung der Ungleichung

Wenn wir mehr über die Verteilung wissen, mit der wir arbeiten, können wir in der Regel garantieren, dass mehr Daten eine bestimmte Anzahl von Standardabweichungen vom Mittelwert aufweisen. Wenn wir beispielsweise wissen, dass wir eine Normalverteilung haben, sind 95% der Daten zwei Standardabweichungen vom Mittelwert. Chebyshevs Ungleichung besagt, dass wir das in dieser Situation wissen mindestens 75% der Daten sind zwei Standardabweichungen vom Mittelwert. Wie wir in diesem Fall sehen können, könnte es viel mehr als diese 75% sein.

Der Wert der Ungleichung besteht darin, dass es sich um ein „Worst-Case“ -Szenario handelt, bei dem wir nur den Mittelwert und die Standardabweichung über unsere Stichprobendaten (oder die Wahrscheinlichkeitsverteilung) kennen. Wenn wir nichts anderes über unsere Daten wissen, liefert die Ungleichung von Chebyshev einen zusätzlichen Einblick in die Verteilung des Datensatzes.

Geschichte der Ungleichung

Die Ungleichung ist nach dem russischen Mathematiker Pafnuty Chebyshev benannt, der die Ungleichung erstmals 1874 ohne Beweis aussprach. Zehn Jahre später wurde die Ungleichung von Markov in seiner Doktorarbeit bewiesen. Dissertation. Aufgrund von Abweichungen in der Darstellung des russischen Alphabets in Englisch wird Tschebyschew auch als Tschebyschew geschrieben.