Nicht alle Ergebnisse von Hypothesentests sind gleich. Ein Hypothesentest oder ein Test mit statistischer Signifikanz ist typischerweise mit einem Signifikanzniveau verbunden. Dieses Signifikanzniveau ist eine Zahl, die typischerweise mit dem griechischen Buchstaben alpha bezeichnet wird. Eine Frage, die in einer Statistikklasse gestellt wird, lautet: „Welcher Alpha-Wert sollte für unsere Hypothesentests verwendet werden?“
Die Antwort auf diese Frage lautet wie bei vielen anderen Fragen in der Statistik: „Es hängt von der Situation ab.“ Wir werden untersuchen, was wir damit meinen. Viele Fachzeitschriften definieren, dass statistisch signifikante Ergebnisse diejenigen sind, für die Alpha gleich 0,05 oder 5% ist. Der wichtigste Punkt ist jedoch, dass es keinen universellen Alpha-Wert gibt, der für alle statistischen Tests verwendet werden sollte.
Die durch Alpha dargestellte Zahl ist eine Wahrscheinlichkeit, daher kann sie einen Wert einer nichtnegativen reellen Zahl kleiner als eins annehmen. Obwohl theoretisch jede Zahl zwischen 0 und 1 für Alpha verwendet werden kann, ist dies in der statistischen Praxis nicht der Fall. Von allen Signifikanzstufen werden die Werte 0,10, 0,05 und 0,01 am häufigsten für Alpha verwendet. Wie wir sehen werden, kann es Gründe dafür geben, andere Alpha-Werte als die am häufigsten verwendeten Zahlen zu verwenden.
Eine Überlegung gegen einen "one size fits all" -Wert für Alpha hat mit der Wahrscheinlichkeit dieser Zahl zu tun. Das Signifikanzniveau eines Hypothesentests entspricht genau der Wahrscheinlichkeit eines Fehlers vom Typ I. Ein Fehler vom Typ I besteht darin, die Nullhypothese fälschlicherweise abzulehnen, wenn die Nullhypothese tatsächlich wahr ist. Je kleiner der Wert von alpha ist, desto unwahrscheinlicher ist es, dass wir eine echte Nullhypothese ablehnen.
Es gibt verschiedene Fälle, in denen ein Fehler vom Typ I akzeptabler ist. Ein größerer Wert von Alpha, sogar ein Wert größer als 0,10, kann angemessen sein, wenn ein kleinerer Wert von Alpha zu einem weniger wünschenswerten Ergebnis führt.
Berücksichtigen Sie beim medizinischen Screening auf eine Krankheit die Möglichkeiten eines Tests, der fälschlicherweise positiv auf eine Krankheit testet, und eines Tests, der fälschlicherweise negativ auf eine Krankheit testet. Ein falsches Positiv führt zu Ängsten für unseren Patienten, führt aber zu anderen Tests, die feststellen, dass das Urteil unseres Tests tatsächlich falsch war. Ein falsches Negativ gibt unserem Patienten die falsche Annahme, dass er tatsächlich keine Krankheit hat. Das Ergebnis ist, dass die Krankheit nicht behandelt wird. Wenn wir die Wahl haben, hätten wir lieber Bedingungen, die zu einem falsch positiven als zu einem falsch negativen Ergebnis führen.
In dieser Situation würden wir gerne einen höheren Wert für Alpha akzeptieren, wenn dies zu einem Kompromiss mit einer geringeren Wahrscheinlichkeit für ein falsches Negativ führen würde.
Ein Signifikanzniveau ist ein Wert, den wir festlegen, um die statistische Signifikanz zu bestimmen. Dies ist der Standard, an dem wir den berechneten p-Wert unserer Teststatistik messen. Zu sagen, dass ein Ergebnis auf der Ebene Alpha statistisch signifikant ist, bedeutet nur, dass der p-Wert kleiner als Alpha ist. Wenn zum Beispiel für einen Wert von Alpha = 0,05 der p-Wert größer als 0,05 ist, können wir die Nullhypothese nicht ablehnen.
Es gibt einige Fälle, in denen wir einen sehr kleinen p-Wert benötigen, um eine Nullhypothese abzulehnen. Wenn es sich bei unserer Nullhypothese um etwas handelt, das allgemein als wahr anerkannt wird, muss es ein hohes Maß an Beweisen für die Ablehnung der Nullhypothese geben. Dies wird durch einen p-Wert bereitgestellt, der viel kleiner ist als die üblicherweise für Alpha verwendeten Werte.
Es gibt keinen Alpha-Wert, der die statistische Signifikanz bestimmt. Obwohl Zahlen wie 0,10, 0,05 und 0,01 häufig für Alpha verwendet werden, gibt es keinen übergeordneten mathematischen Satz, der besagt, dass dies die einzigen Signifikanzniveaus sind, die wir verwenden können. Wie bei vielen statistischen Dingen müssen wir überlegen, bevor wir rechnen und vor allem den gesunden Menschenverstand anwenden.