Was ist Normalverteilung?

Bei einer normalen Datenverteilung sind die meisten Datenpunkte relativ ähnlich, dh sie treten in einem kleinen Wertebereich mit weniger Ausreißern am oberen und unteren Ende des Datenbereichs auf.

Wenn Daten normal verteilt sind, führt das Zeichnen in einem Diagramm zu einem glockenförmigen und symmetrischen Bild, das häufig als Glockenkurve bezeichnet wird. Bei einer solchen Datenverteilung sind Mittelwert, Median und Modus alle der gleiche Wert und fallen mit der Spitze der Kurve zusammen.

In der Sozialwissenschaft ist eine Normalverteilung jedoch eher ein theoretisches Ideal als eine gemeinsame Realität. Das Konzept und die Anwendung als Linse zum Untersuchen von Daten erfolgt mithilfe eines nützlichen Tools zum Identifizieren und Visualisieren von Normen und Trends in einem Datensatz.

Eigenschaften der Normalverteilung

Eine der auffälligsten Eigenschaften einer Normalverteilung ist ihre Form und perfekte Symmetrie. Wenn Sie ein Bild einer Normalverteilung genau in der Mitte falten, erhalten Sie zwei gleiche Hälften, von denen jede ein Spiegelbild der anderen ist. Dies bedeutet auch, dass die Hälfte der Beobachtungen in den Daten auf beiden Seiten der Verteilungsmitte liegt.

Der Mittelpunkt einer Normalverteilung ist der Punkt mit der maximalen Häufigkeit, dh die Anzahl oder Antwortkategorie mit den meisten Beobachtungen für diese Variable. Der Mittelpunkt der Normalverteilung ist auch der Punkt, an dem drei Maße fallen: der Mittelwert, der Median und der Modus. In einer vollkommen normalen Verteilung sind diese drei Takte alle die gleiche Zahl.

Bei allen Normal- oder Fast-Normalverteilungen liegt ein konstanter Anteil der Fläche unter der Kurve zwischen dem Mittelwert und einem gegebenen Abstand vom Mittelwert, gemessen in Standardabweichungseinheiten. Beispielsweise liegen in allen Normalkurven 99,73 Prozent aller Fälle innerhalb von drei Standardabweichungen vom Mittelwert, 95,45 Prozent aller Fälle innerhalb von zwei Standardabweichungen vom Mittelwert und 68,27 Prozent der Fälle innerhalb einer Standardabweichung vom Mittelwert.

Normalverteilungen werden häufig in Standardwerten oder Z-Werten dargestellt. Hierbei handelt es sich um Zahlen, die den Abstand zwischen einem tatsächlichen Wert und dem Mittelwert in Form von Standardabweichungen angeben. Die Standardnormalverteilung hat einen Mittelwert von 0,0 und eine Standardabweichung von 1,0.

Beispiele und Verwendung in der Sozialwissenschaft

Obwohl eine Normalverteilung theoretisch ist, gibt es mehrere Variablen, die Forscher untersuchen und die einer Normalkurve sehr ähnlich sind. Beispielsweise ähneln standardisierte Testergebnisse wie SAT, ACT und GRE normalerweise einer Normalverteilung. Größe, sportliche Fähigkeiten und zahlreiche soziale und politische Einstellungen einer bestimmten Bevölkerung ähneln ebenfalls in der Regel einer Glockenkurve.

Das Ideal einer Normalverteilung ist auch als Vergleichspunkt nützlich, wenn Daten nicht normal verteilt sind. Beispielsweise gehen die meisten Menschen davon aus, dass die Verteilung des Haushaltseinkommens in den USA eine Normalverteilung ist, und ähneln der Glockenkurve, wenn sie in einem Diagramm dargestellt werden. Dies würde bedeuten, dass die meisten US-Bürger im mittleren Einkommensbereich verdienen, oder mit anderen Worten, dass es eine gesunde Mittelschicht gibt. In der Zwischenzeit wären die Zahlen der unteren Wirtschaftsklassen ebenso gering wie die der oberen Klassen. Die reale Verteilung des Haushaltseinkommens in den USA ähnelt jedoch überhaupt nicht einer Glockenkurve. Die Mehrheit der Haushalte fällt in den unteren bis mittleren Bereich, was bedeutet, dass es mehr arme Menschen gibt, die um ihr Überleben kämpfen als Menschen, die ein komfortables Leben in der Mittelklasse führen. In diesem Fall ist das Ideal einer Normalverteilung nützlich, um die Einkommensungleichheit zu veranschaulichen.