Was ist ein P-Wert?

Bei Hypothesentests oder Signifikanztests wird eine als p-Wert bekannte Zahl berechnet. Diese Zahl ist für den Abschluss unseres Tests sehr wichtig. P-Werte beziehen sich auf die Teststatistik und geben uns ein Maß für die Evidenz gegen die Nullhypothese.

Null und alternative Hypothesen

Tests mit statistischer Signifikanz beginnen alle mit einer Null- und einer Alternativhypothese. Die Nullhypothese ist die Aussage über keine Wirkung oder eine Aussage über den allgemein anerkannten Sachverhalt. Die alternative Hypothese versuchen wir zu beweisen. Die Grundannahme in einem Hypothesentest ist, dass die Nullhypothese wahr ist.

Teststatistik

Wir gehen davon aus, dass die Bedingungen für den jeweiligen Test, mit dem wir arbeiten, erfüllt sind. Eine einfache Zufallsstichprobe gibt uns Beispieldaten. Aus diesen Daten können wir eine Teststatistik berechnen. Die Teststatistiken variieren stark, je nachdem, welche Parameter unser Hypothesentest betrifft. Einige gängige Teststatistiken umfassen:

  • z - Statistik für Hypothesentests zum Populationsmittelwert, wenn die Populationsstandardabweichung bekannt ist.
  • t - Statistik für Hypothesentests bezüglich der Grundgesamtheit bedeutet, wenn wir die Grundgesamtheitsstandardabweichung nicht kennen.
  • t - Statistik für Hypothesentests bezüglich der Differenz zweier unabhängiger Populationen Mittelwert, wenn wir die Standardabweichung einer der beiden Populationen nicht kennen.
  • z - Statistik für Hypothesentests zu einem Bevölkerungsanteil.
  • Chi-Quadrat - Statistik für Hypothesentests bezüglich der Differenz zwischen einer erwarteten und einer tatsächlichen Anzahl für kategoriale Daten.

Berechnung von P-Werten

Teststatistiken sind hilfreich, aber es kann hilfreicher sein, diesen Statistiken einen p-Wert zuzuweisen. Ein p-Wert ist die Wahrscheinlichkeit, dass wir, wenn die Nullhypothese wahr wäre, eine Statistik beobachten würden, die mindestens so extrem ist wie die beobachtete. Zur Berechnung eines p-Wertes verwenden wir die entsprechende Software oder statistische Tabelle, die unserer Teststatistik entspricht.

Zum Beispiel würden wir bei der Berechnung von a eine Standardnormalverteilung verwenden z Teststatistik. Werte von z mit großen absoluten Werten (wie jenen über 2,5) sind nicht sehr verbreitet und würden einen kleinen p-Wert ergeben. Werte von z die näher an Null liegen, sind häufiger und würden viel größere p-Werte ergeben.

Interpretation des P-Wertes

Wie wir bemerkt haben, ist ein p-Wert eine Wahrscheinlichkeit. Dies bedeutet, dass es sich um eine reelle Zahl von 0 bis 1 handelt. Während eine Teststatistik ein Weg ist, um zu messen, wie extrem eine Statistik für eine bestimmte Stichprobe ist, sind p-Werte ein anderer Weg, um dies zu messen.

Wenn wir eine statistische Stichprobe erhalten, lautet die Frage, die wir immer stellen sollten: „Ist diese Stichprobe nur zufällig mit einer wahren Nullhypothese oder ist die Nullhypothese falsch?“ Wenn unser p-Wert klein ist, dann Dies könnte eines von zwei Dingen bedeuten:

  1. Die Nullhypothese ist richtig, aber wir hatten nur großes Glück, unsere beobachtete Stichprobe zu erhalten.
  2. Unsere Stichprobe beruht auf der Tatsache, dass die Nullhypothese falsch ist.

Je kleiner der p-Wert ist, desto mehr Beweise haben wir im Allgemeinen gegen unsere Nullhypothese.

Wie klein ist klein genug??

Wie klein ist ein p-Wert, um die Nullhypothese abzulehnen? Die Antwort auf diese Frage lautet: „Es kommt darauf an.“ Eine gängige Faustregel lautet, dass der p-Wert kleiner oder gleich 0,05 sein muss, aber dieser Wert ist nicht universell.

In der Regel wählen wir vor der Durchführung eines Hypothesentests einen Schwellenwert aus. Wenn wir einen p-Wert haben, der kleiner oder gleich diesem Schwellenwert ist, lehnen wir die Nullhypothese ab. Andernfalls lehnen wir die Nullhypothese nicht ab. Diese Schwelle wird als Signifikanzniveau unseres Hypothesentests bezeichnet und mit dem griechischen Buchstaben alpha bezeichnet. Es gibt keinen Alpha-Wert, der immer die statistische Signifikanz definiert.