Beispiel eines Permutationstests

Eine Frage, die in der Statistik immer wichtig ist, lautet: „Ist das beobachtete Ergebnis nur zufällig oder statistisch signifikant?“ Eine Klasse von Hypothesentests, die als Permutationstests bezeichnet werden, ermöglicht es uns, diese Frage zu testen. Die Übersicht und die Schritte eines solchen Tests sind:

  • Wir teilen unsere Probanden in eine Kontroll- und eine Versuchsgruppe auf. Die Nullhypothese lautet, dass zwischen diesen beiden Gruppen kein Unterschied besteht.
  • Wenden Sie eine Behandlung auf die Versuchsgruppe an.
  • Messen Sie die Reaktion auf die Behandlung
  • Berücksichtigen Sie jede mögliche Konfiguration der Versuchsgruppe und die beobachtete Reaktion.
  • Berechnen Sie einen p-Wert basierend auf unserer beobachteten Reaktion in Bezug auf alle potenziellen experimentellen Gruppen.

Dies ist ein Überblick über eine Permutation. Um diesen Umriss zu verdeutlichen, werden wir uns ein ausgearbeitetes Beispiel eines solchen Permutationstests genauer ansehen.

Beispiel

Angenommen, wir untersuchen Mäuse. Insbesondere interessiert uns, wie schnell die Mäuse ein Labyrinth fertigstellen, dem sie noch nie begegnet sind. Wir möchten Belege für eine experimentelle Behandlung vorlegen. Ziel ist es zu zeigen, dass Mäuse in der Behandlungsgruppe das Labyrinth schneller lösen als unbehandelte Mäuse. 

Wir beginnen mit unseren Themen: sechs Mäuse. Der Einfachheit halber werden die Mäuse mit den Buchstaben A, B, C, D, E, F bezeichnet. Drei dieser Mäuse werden für die experimentelle Behandlung zufällig ausgewählt, und die anderen drei werden in eine Kontrollgruppe eingeteilt, in der Die Probanden erhalten ein Placebo.

Als nächstes wählen wir zufällig die Reihenfolge, in der die Mäuse ausgewählt werden, um das Labyrinth zu betreiben. Die für alle Mäuse aufgewendete Zeit zum Fertigstellen des Labyrinths wird notiert und ein Mittelwert für jede Gruppe wird berechnet.

Angenommen, unsere zufällige Auswahl enthält Mäuse A, C und E in der Versuchsgruppe und die anderen Mäuse in der Placebo-Kontrollgruppe. Nachdem die Behandlung durchgeführt wurde, wählen wir zufällig die Reihenfolge, in der die Mäuse durch das Labyrinth rennen sollen. 

Die Laufzeiten für jede der Mäuse sind:

  • Maus A führt das Rennen in 10 Sekunden aus
  • Maus B führt das Rennen in 12 Sekunden aus
  • Maus C führt das Rennen in 9 Sekunden
  • Maus D führt das Rennen in 11 Sekunden
  • Maus E führt das Rennen in 11 Sekunden
  • Maus F führt das Rennen in 13 Sekunden.

Die durchschnittliche Zeit zur Fertigstellung des Labyrinths für die Mäuse in der Versuchsgruppe beträgt 10 Sekunden. Die durchschnittliche Zeit, um das Labyrinth für diejenigen in der Kontrollgruppe zu vervollständigen, beträgt 12 Sekunden.

Wir könnten ein paar Fragen stellen. Ist die Behandlung wirklich der Grund für die schnellere Durchschnittszeit? Oder hatten wir bei der Auswahl der Kontroll- und Versuchsgruppe einfach Glück? Die Behandlung hatte möglicherweise keine Wirkung und wir haben zufällig die langsameren Mäuse ausgewählt, um das Placebo zu erhalten, und die schnelleren Mäuse, um die Behandlung zu erhalten. Ein Permutationstest hilft bei der Beantwortung dieser Fragen.

Hypothesen

Die Hypothesen für unseren Permutationstest sind:

  • Die Nullhypothese ist die Aussage, dass keine Wirkung vorliegt. Für diesen speziellen Test haben wir H0: Es gibt keinen Unterschied zwischen den Behandlungsgruppen. Die mittlere Zeit, um das Labyrinth für alle Mäuse ohne Behandlung zu betreiben, ist dieselbe wie die mittlere Zeit für alle Mäuse mit der Behandlung.
  • Die alternative Hypothese ist das, wofür wir Beweise erbringen wollen. In diesem Fall hätten wir Hein: Die mittlere Zeit für alle Mäuse mit der Behandlung ist schneller als die mittlere Zeit für alle Mäuse ohne die Behandlung.

Permutationen

Es gibt sechs Mäuse und drei Plätze in der Versuchsgruppe. Dies bedeutet, dass die Anzahl der möglichen Versuchsgruppen durch die Anzahl der Kombinationen C (6,3) = 6! / (3! 3!) = 20 gegeben ist. Die verbleibenden Individuen wären Teil der Kontrollgruppe. Es gibt also 20 verschiedene Möglichkeiten, Einzelpersonen nach dem Zufallsprinzip in unsere beiden Gruppen aufzunehmen.

Die Zuordnung von A, C und E zur Versuchsgruppe erfolgte zufällig. Da es 20 solcher Konfigurationen gibt, hat die spezifische mit A, C und E in der Versuchsgruppe eine Wahrscheinlichkeit von 1/20 = 5% des Auftretens.