Definition der Glockenkurve und der Normalverteilung

Der Begriff Glockenkurve wird verwendet, um das mathematische Konzept zu beschreiben, das als Normalverteilung bezeichnet wird, manchmal auch als Gauß-Verteilung bezeichnet. "Glockenkurve" bezieht sich auf die Glockenform, die erzeugt wird, wenn eine Linie unter Verwendung der Datenpunkte für ein Element gezeichnet wird, das die Kriterien der Normalverteilung erfüllt.

In einer Glockenkurve enthält das Zentrum die größte Zahl eines Werts und ist daher der höchste Punkt auf dem Bogen der Linie. Dieser Punkt wird als Mittelwert bezeichnet, ist jedoch in einfachen Worten die höchste Anzahl von Vorkommen eines Elements (in statistischen Begriffen der Modus)..

Normalverteilung

Das Wichtige an einer Normalverteilung ist, dass die Kurve in der Mitte konzentriert ist und auf beiden Seiten abnimmt. Dies ist insofern von Bedeutung, als die Daten im Vergleich zu anderen Verteilungen weniger dazu neigen, ungewöhnlich extreme Werte zu erzeugen, die als Ausreißer bezeichnet werden. Die Glockenkurve zeigt auch an, dass die Daten symmetrisch sind. Dies bedeutet, dass Sie angemessene Erwartungen hinsichtlich der Möglichkeit, dass ein Ergebnis in einem Bereich links oder rechts von der Mitte liegt, erstellen können, wenn Sie den Betrag der in den Daten enthaltenen Abweichung gemessen haben. Dies wird in Form von Standardabweichungen gemessen.

Ein Glockenkurvendiagramm hängt von zwei Faktoren ab: dem Mittelwert und der Standardabweichung. Der Mittelwert kennzeichnet die Position des Mittelpunkts und die Standardabweichung bestimmt die Höhe und Breite der Glocke. Beispielsweise erzeugt eine große Standardabweichung eine kurze und breite Glocke, während eine kleine Standardabweichung eine hohe und schmale Kurve erzeugt.

Glockenkurvenwahrscheinlichkeit und Standardabweichung

Um die Wahrscheinlichkeitsfaktoren einer Normalverteilung zu verstehen, müssen Sie die folgenden Regeln verstehen:

  1. Die Gesamtfläche unter der Kurve ist gleich 1 (100%)
  2. Etwa 68% der Fläche unter der Kurve liegen innerhalb einer Standardabweichung.
  3. Etwa 95% der Fläche unter der Kurve liegen innerhalb von zwei Standardabweichungen.
  4. Etwa 99,7% der Fläche unter der Kurve liegen innerhalb von drei Standardabweichungen.

Die obigen Punkte 2, 3 und 4 werden manchmal als empirische Regel oder 68-95-99.7-Regel bezeichnet. Sobald Sie festgestellt haben, dass die Daten normal verteilt sind (Glockenkurve) und den Mittelwert und die Standardabweichung berechnen, können Sie die Wahrscheinlichkeit bestimmen, dass ein einzelner Datenpunkt in einen bestimmten Bereich von Möglichkeiten fällt.

Beispiel einer Glockenkurve

Ein gutes Beispiel für eine Glockenkurve oder Normalverteilung ist das Würfeln von zwei Würfeln. Die Verteilung ist um die Zahl sieben zentriert und die Wahrscheinlichkeit nimmt ab, wenn Sie sich von der Mitte entfernen.

Hier ist die prozentuale Wahrscheinlichkeit der verschiedenen Ergebnisse, wenn Sie zwei Würfel werfen.

  • Zwei: (1/36) 2,78%
  • Drei: (2/36) 5,56%
  • Vier: (3/36) 8,33%
  • Fünf: (4/36) 11,11%
  • Sechs: (5/36) 13,89%
  • Sieben: (6/36) 16,67% = wahrscheinlichstes Ergebnis
  • Acht: (5/36) 13,89%
  • Neun: (4/36) 11,11%
  • Zehn: (3/36) 8,33%
  • Elf: (2/36) 5,56%
  • Zwölf: (1/36) 2,78%

Normalverteilungen haben viele günstige Eigenschaften, weshalb in vielen Fällen, insbesondere in der Physik und Astronomie, zufällige Variationen mit unbekannten Verteilungen häufig als normal angesehen werden, um Wahrscheinlichkeitsberechnungen zu ermöglichen. Obwohl dies eine gefährliche Annahme sein kann, ist es oft eine gute Annäherung aufgrund eines überraschenden Ergebnisses zentraler Grenzwertsatz.

Dieser Satz besagt, dass der Mittelwert jeder Menge von Varianten mit einer Verteilung mit einem endlichen Mittelwert und einer Varianz dazu neigt, in einer Normalverteilung aufzutreten. Viele gemeinsame Attribute wie Testergebnisse oder Körpergröße folgen ungefähr normalen Verteilungen, mit wenigen Mitgliedern am oberen und unteren Ende und vielen in der Mitte.

Wenn Sie die Glockenkurve nicht verwenden sollten

Es gibt einige Datentypen, die keinem normalen Verteilungsmuster folgen. Diese Datensätze sollten nicht gezwungen werden, eine Glockenkurve anzupassen. Ein klassisches Beispiel wären die Noten von Schülern, die häufig zwei Modi haben. Andere Arten von Daten, die der Kurve nicht folgen, umfassen Einkommen, Bevölkerungswachstum und mechanische Ausfälle.