Parametrische und nichtparametrische Methoden in der Statistik

In der Statistik gibt es einige Themenbereiche. Eine Unterteilung, die schnell in den Sinn kommt, ist die Unterscheidung zwischen deskriptiver und inferentieller Statistik. Es gibt andere Möglichkeiten, die Disziplin der Statistik zu trennen. Eine dieser Möglichkeiten besteht darin, statistische Methoden als parametrisch oder nichtparametrisch zu klassifizieren.

Wir werden herausfinden, worin der Unterschied zwischen parametrischen und nichtparametrischen Methoden besteht. Die Art und Weise, wie wir dies tun, besteht darin, verschiedene Instanzen dieser Arten von Methoden zu vergleichen.

Parametrische Methoden

Die Methoden werden nach dem, was wir über die untersuchte Population wissen, klassifiziert. Parametrische Methoden sind in der Regel die ersten Methoden, die in einem einführenden Statistikkurs untersucht wurden. Die Grundidee ist, dass es eine Reihe von festen Parametern gibt, die ein Wahrscheinlichkeitsmodell bestimmen.

Parametrische Methoden sind oft diejenigen, für die wir wissen, dass die Population ungefähr normal ist, oder wir können eine Normalverteilung verwenden, nachdem wir den zentralen Grenzwertsatz aufgerufen haben. Für eine Normalverteilung gibt es zwei Parameter: den Mittelwert und die Standardabweichung.

Letztendlich hängt die Einstufung einer Methode als parametrisch von den Annahmen ab, die über eine Grundgesamtheit getroffen werden. Einige parametrische Methoden umfassen:

  • Konfidenzintervall für einen Populationsmittelwert mit bekannter Standardabweichung.
  • Konfidenzintervall für einen Populationsmittelwert mit unbekannter Standardabweichung.
  • Konfidenzintervall für eine Populationsvarianz.
  • Konfidenzintervall für die Differenz zweier Mittelwerte mit unbekannter Standardabweichung.

Nichtparametrische Methoden

Im Gegensatz zu parametrischen Methoden definieren wir nichtparametrische Methoden. Hierbei handelt es sich um statistische Techniken, für die wir keine Parameter für die untersuchte Population annehmen müssen. Tatsächlich hängen die Methoden nicht von der interessierenden Population ab. Der Parametersatz ist nicht mehr festgelegt und die von uns verwendete Verteilung auch nicht. Aus diesem Grund werden nichtparametrische Methoden auch als verteilungsfreie Methoden bezeichnet.

Nichtparametrische Methoden gewinnen aus einer Reihe von Gründen an Popularität und Einfluss. Der Hauptgrund ist, dass wir nicht so stark eingeschränkt sind wie bei der Verwendung einer parametrischen Methode. Wir müssen nicht so viele Annahmen über die Population machen, mit der wir arbeiten, wie wir mit einer parametrischen Methode machen müssen. Viele dieser nichtparametrischen Methoden sind einfach anzuwenden und zu verstehen.

Einige nichtparametrische Methoden umfassen:

  • Vorzeichentest für Bevölkerungsmittelwert
  • Bootstrapping-Techniken
  • U-Test für zwei unabhängige Mittel
  • Spearman-Korrelationstest

Vergleich

Es gibt mehrere Möglichkeiten, Statistiken zu verwenden, um ein Konfidenzintervall für einen Mittelwert zu ermitteln. Eine parametrische Methode würde die Berechnung einer Fehlertoleranz mit einer Formel und die Schätzung des Populationsmittelwerts mit einem Stichprobenmittelwert umfassen. Eine nichtparametrische Methode zur Berechnung eines Konfidenzmittels würde die Verwendung von Bootstrapping beinhalten.

Warum brauchen wir für diese Art von Problem sowohl parametrische als auch nichtparametrische Methoden? Oft sind parametrische Methoden effizienter als die entsprechenden nichtparametrischen Methoden. Obwohl dieser Unterschied in der Effizienz normalerweise kein so großes Problem darstellt, müssen wir in einigen Fällen überlegen, welche Methode effizienter ist.