Bei der Erstellung eines Histogramms müssen mehrere Schritte ausgeführt werden, bevor wir unser Diagramm tatsächlich zeichnen. Nachdem wir die zu verwendenden Klassen eingerichtet haben, ordnen wir jeden unserer Datenwerte einer dieser Klassen zu, zählen dann die Anzahl der Datenwerte, die in jede Klasse fallen, und zeichnen die Höhen der Balken. Diese Höhen können auf zwei verschiedene Arten bestimmt werden, die miteinander zusammenhängen: Frequenz oder relative Frequenz.
Die Häufigkeit einer Klasse gibt an, wie viele Datenwerte in eine bestimmte Klasse fallen, wobei Klassen mit höheren Frequenzen höhere Balken und Klassen mit niedrigeren Frequenzen niedrigere Balken aufweisen. Andererseits erfordert die relative Häufigkeit einen zusätzlichen Schritt, da dies das Maß dafür ist, wie viel Prozent der Datenwerte in eine bestimmte Klasse fallen.
Bei einer einfachen Berechnung wird die relative Häufigkeit aus der Häufigkeit ermittelt, indem alle Häufigkeiten der Klassen addiert und die Anzahl durch jede Klasse durch die Summe dieser Häufigkeiten dividiert wird.
Um den Unterschied zwischen Frequenz und relativer Frequenz zu sehen, betrachten wir das folgende Beispiel. Angenommen, wir sehen uns die Geschichtsnoten der Schüler der 10. Klasse an und lassen die Klassen den Buchstabennoten entsprechen: A, B, C, D, F. Die Anzahl jeder dieser Noten gibt uns eine Häufigkeit für jede Klasse:
Um die relative Häufigkeit für jede Klasse zu bestimmen, addieren wir zunächst die Gesamtzahl der Datenpunkte: 7 + 9 + 18 + 12 + 4 = 50. Als nächstes dividieren wir jede Häufigkeit durch diese Summe 50.
Der oben angegebene anfängliche Datensatz mit der Anzahl der Schüler, die in die einzelnen Klassen fallen (Buchstabennote), gibt die Häufigkeit an, während der Prozentsatz im zweiten Datensatz die relative Häufigkeit dieser Noten darstellt.
Eine einfache Möglichkeit, den Unterschied zwischen Häufigkeit und relativer Häufigkeit zu bestimmen, besteht darin, dass die Häufigkeit von den tatsächlichen Werten jeder Klasse in einem statistischen Datensatz abhängt, während die relative Häufigkeit diese einzelnen Werte mit den Gesamtsummen aller betroffenen Klassen in einem Datensatz vergleicht.
Für ein Histogramm können entweder Frequenzen oder relative Frequenzen verwendet werden. Obwohl sich die Zahlen entlang der vertikalen Achse unterscheiden, bleibt die Gesamtform des Histogramms unverändert. Dies liegt daran, dass die Höhen relativ zueinander gleich sind, unabhängig davon, ob wir Frequenzen oder relative Frequenzen verwenden.
Relative Frequenzhistogramme sind wichtig, da die Höhen als Wahrscheinlichkeiten interpretiert werden können. Diese Wahrscheinlichkeitshistogramme bieten eine grafische Darstellung einer Wahrscheinlichkeitsverteilung, mit deren Hilfe die Wahrscheinlichkeit bestimmt werden kann, dass bestimmte Ergebnisse in einer bestimmten Grundgesamtheit auftreten.
Histogramme sind nützliche Hilfsmittel, um die Bevölkerungsentwicklung schnell zu beobachten, damit Statistiker, Gesetzgeber und Organisatoren der Gemeinschaft die beste Vorgehensweise bestimmen können, um die meisten Menschen in einer bestimmten Bevölkerung zu treffen.