Ein Histogramm ist ein Diagrammtyp, der in der Statistik breite Anwendung findet. Histogramme bieten eine visuelle Interpretation numerischer Daten, indem sie die Anzahl der Datenpunkte angeben, die innerhalb eines Wertebereichs liegen. Diese Wertebereiche werden Klassen oder Klassen genannt. Die Häufigkeit der Daten, die in die einzelnen Klassen fallen, wird durch die Verwendung eines Balkens dargestellt. Je höher der Balken, desto häufiger sind die Datenwerte in diesem Bin.
Auf den ersten Blick sehen Histogramme Balkendiagrammen sehr ähnlich. In beiden Diagrammen werden vertikale Balken zur Darstellung von Daten verwendet. Die Höhe eines Balkens entspricht der relativen Häufigkeit der Datenmenge in der Klasse. Je höher der Balken, desto höher ist die Häufigkeit der Daten. Je niedriger der Balken, desto niedriger die Datenfrequenz. Aber Blicke können täuschen. Hier enden die Ähnlichkeiten zwischen den beiden Arten von Graphen.
Der Grund dafür, dass diese Art von Grafiken unterschiedlich ist, hängt mit dem Messniveau der Daten zusammen. Einerseits werden Balkendiagramme für Daten auf der nominalen Messebene verwendet. Balkendiagramme messen die Häufigkeit kategorialer Daten, und die Klassen für ein Balkendiagramm sind diese Kategorien. Auf der anderen Seite werden Histogramme für Daten verwendet, die mindestens auf der ordinalen Messebene liegen. Die Klassen für ein Histogramm sind Wertebereiche.
Ein weiterer wichtiger Unterschied zwischen Balkendiagrammen und Histogrammen liegt in der Reihenfolge der Balken. In einem Balkendiagramm ist es üblich, die Balken in der Reihenfolge abnehmender Höhe neu anzuordnen. Die Balken in einem Histogramm können jedoch nicht neu angeordnet werden. Sie müssen in der Reihenfolge angezeigt werden, in der die Klassen auftreten.
Das obige Diagramm zeigt ein Histogramm. Angenommen, vier Münzen werden geworfen und die Ergebnisse aufgezeichnet. Die Verwendung der entsprechenden Binomialverteilungstabelle oder einfache Berechnungen mit der Binomialformel zeigen, dass die Wahrscheinlichkeit, dass keine Köpfe angezeigt werden, 1/16 und die Wahrscheinlichkeit, dass ein Kopf angezeigt wird, 4/16 beträgt. Die Wahrscheinlichkeit von zwei Köpfen ist 6/16. Die Wahrscheinlichkeit von drei Köpfen ist 4/16. Die Wahrscheinlichkeit von vier Köpfen ist 1/16.
Wir bauen insgesamt fünf Klassen mit jeweils einer Breite. Diese Klassen entsprechen der Anzahl der möglichen Köpfe: null, eins, zwei, drei oder vier. Über jeder Klasse zeichnen wir einen vertikalen Balken oder ein Rechteck. Die Höhen dieser Balken entsprechen den Wahrscheinlichkeiten für unser Wahrscheinlichkeitsexperiment, vier Münzen zu werfen und die Köpfe zu zählen.
Das obige Beispiel zeigt nicht nur die Erstellung eines Histogramms, sondern auch, dass diskrete Wahrscheinlichkeitsverteilungen mit einem Histogramm dargestellt werden können. Tatsächlich kann eine diskrete Wahrscheinlichkeitsverteilung durch ein Histogramm dargestellt werden.
Um ein Histogramm zu erstellen, das eine Wahrscheinlichkeitsverteilung darstellt, wählen wir zunächst die Klassen aus. Dies sollten die Ergebnisse eines Wahrscheinlichkeitsexperiments sein. Die Breite jeder dieser Klassen sollte eine Einheit sein. Die Höhen der Balken des Histogramms sind die Wahrscheinlichkeiten für jedes der Ergebnisse. Bei einem so konstruierten Histogramm sind auch die Bereiche der Balken Wahrscheinlichkeiten.
Da diese Art von Histogramm uns Wahrscheinlichkeiten gibt, unterliegt es einer Reihe von Bedingungen. Eine Bedingung ist, dass nur nichtnegative Zahlen für die Skala verwendet werden können, die die Höhe eines bestimmten Balkens des Histogramms angibt. Eine zweite Bedingung ist, dass, da die Wahrscheinlichkeit gleich der Fläche ist, sich alle Flächen der Balken zu einer Summe von 1 summieren müssen, was 100% entspricht..
Die Balken in einem Histogramm müssen keine Wahrscheinlichkeiten sein. Histogramme sind in anderen Bereichen als der Wahrscheinlichkeit hilfreich. Wann immer wir die Häufigkeit des Auftretens quantitativer Daten vergleichen möchten, kann ein Histogramm zur Darstellung unseres Datensatzes verwendet werden.