Eines der Ziele der Statistik ist die sinnvolle Anordnung der Daten. Zwei-Wege-Tabellen sind eine wichtige Möglichkeit, einen bestimmten Typ gepaarter Daten zu organisieren. Wie bei der Erstellung von Grafiken oder Tabellen in Statistiken ist es sehr wichtig, die Variablentypen zu kennen, mit denen wir arbeiten. Wenn wir quantitative Daten haben, sollte ein Diagramm wie ein Histogramm oder ein Stiel-Blatt-Diagramm verwendet werden. Wenn wir kategoriale Daten haben, ist ein Balkendiagramm oder ein Kreisdiagramm angemessen.
Bei der Arbeit mit gepaarten Daten müssen wir vorsichtig sein. Es gibt ein Streudiagramm für gepaarte quantitative Daten, aber welche Art von Grafik gibt es für gepaarte kategoriale Daten? Wann immer wir zwei kategoriale Variablen haben, sollten wir eine Zwei-Wege-Tabelle verwenden.
Zunächst erinnern wir uns, dass sich kategoriale Daten auf Merkmale oder Kategorien beziehen. Es ist nicht quantitativ und hat keine numerischen Werte.
Bei einer bidirektionalen Tabelle werden alle Werte oder Ebenen für zwei kategoriale Variablen aufgelistet. Alle Werte für eine der Variablen werden in einer vertikalen Spalte aufgelistet. Die Werte für die andere Variable werden in einer horizontalen Zeile aufgelistet. Wenn die erste Variable hat m Werte und die zweite Variable hat n Werte, dann wird es insgesamt sein mn Einträge in der Tabelle. Jeder dieser Einträge entspricht einem bestimmten Wert für jede der beiden Variablen.
Entlang jeder Zeile und entlang jeder Spalte werden die Einträge summiert. Diese Summen sind wichtig für die Bestimmung von Rand- und Bedingungsverteilungen. Diese Summen sind auch wichtig, wenn wir einen Chi-Quadrat-Test für die Unabhängigkeit durchführen.
Als Beispiel betrachten wir eine Situation, in der wir mehrere Abschnitte eines Statistikkurses an einer Universität betrachten. Wir möchten eine Zwei-Wege-Tabelle erstellen, um festzustellen, welche Unterschiede zwischen Männern und Frauen im Kurs bestehen. Um dies zu erreichen, zählen wir die Anzahl der Buchstaben, die von Mitgliedern jedes Geschlechts verdient wurden.
Wir stellen fest, dass die erste kategoriale Variable das Geschlecht ist und es bei der Untersuchung von Männern und Frauen zwei mögliche Werte gibt. Die zweite kategoriale Variable ist die der Buchstabenklasse, und es gibt fünf Werte, die durch A, B, C, D und F angegeben werden. Dies bedeutet, dass wir eine Zweiwegetabelle mit 2 x 5 = 10 Einträgen plus einem haben zusätzliche Zeile und eine zusätzliche Spalte, die zum Tabellieren der Zeilen- und Spaltensummen benötigt werden.
Unsere Untersuchung zeigt, dass:
Diese Informationen werden in die nachstehende Zwei-Wege-Tabelle eingetragen. Die Summe jeder Zeile gibt an, wie viele von jeder Sorte erreicht wurden. Die Spaltensummen geben Auskunft über die Anzahl der Männchen und die Anzahl der Weibchen.
Beidseitige Tabellen helfen bei der Organisation unserer Daten, wenn zwei kategoriale Variablen vorhanden sind. Diese Tabelle kann verwendet werden, um den Vergleich zwischen zwei verschiedenen Gruppen in unseren Daten zu erleichtern. Zum Beispiel könnten wir die relative Leistung von Männern im Statistikkurs gegen die Leistung von Frauen im Kurs abwägen.
Nach dem Bilden einer Zweiwegetabelle kann der nächste Schritt darin bestehen, die Daten statistisch zu analysieren. Wir können fragen, ob die Variablen in der Studie unabhängig voneinander sind oder nicht. Um diese Frage zu beantworten, können wir einen Chi-Quadrat-Test für den Zwei-Wege-Tisch verwenden.
Männlich | Weiblich | Gesamt | |
EIN | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Gesamt | 280 | 260 | 540 |