Eine der vielen Möglichkeiten, Variablen in Statistiken zu klassifizieren, besteht darin, die Unterschiede zwischen Erklärungs- und Antwortvariablen zu berücksichtigen. Obwohl diese Variablen zusammenhängen, gibt es wichtige Unterschiede zwischen ihnen. Nachdem Sie diese Variablentypen definiert haben, werden Sie feststellen, dass die korrekte Identifizierung dieser Variablen einen direkten Einfluss auf andere Aspekte der Statistik hat, z. B. die Erstellung eines Streudiagramms und die Steigung einer Regressionslinie.
Zunächst betrachten wir die Definitionen dieser Arten von Variablen. Eine Antwortvariable ist eine bestimmte Größe, zu der wir in unserer Studie eine Frage stellen. Eine erklärende Variable ist ein beliebiger Faktor, der die Antwortvariable beeinflussen kann. Während es viele erklärende Variablen geben kann, werden wir uns in erster Linie mit einer einzelnen erklärenden Variablen befassen.
In einer Studie ist möglicherweise keine Antwortvariable vorhanden. Die Benennung dieser Art von Variablen hängt von den Fragen ab, die ein Forscher stellt. Die Durchführung einer Beobachtungsstudie wäre ein Beispiel für einen Fall, in dem es keine Antwortvariable gibt. Ein Experiment hat eine Antwortvariable. Die sorgfältige Gestaltung eines Experiments versucht festzustellen, dass die Änderungen in einer Antwortvariablen direkt durch Änderungen in den erklärenden Variablen verursacht werden.
Um diese Konzepte zu untersuchen, werden wir einige Beispiele untersuchen. Nehmen Sie als erstes Beispiel an, dass ein Forscher daran interessiert ist, die Stimmung und die Einstellungen einer Gruppe von College-Studenten im ersten Jahr zu untersuchen. Alle Studienanfänger erhalten eine Reihe von Fragen. Diese Fragen sollen den Grad des Heimwehs eines Schülers beurteilen. Die Schüler geben in der Umfrage auch an, wie weit ihre Hochschule von zu Hause entfernt ist.
Ein Forscher, der diese Daten untersucht, interessiert sich möglicherweise nur für die Art der Antworten der Schüler. Möglicherweise liegt der Grund dafür darin, ein umfassendes Gefühl für die Zusammensetzung eines neuen Studienanfängers zu haben. In diesem Fall gibt es keine Antwortvariable. Dies liegt daran, dass niemand sieht, ob der Wert einer Variablen den Wert einer anderen beeinflusst.
Ein anderer Forscher könnte die gleichen Daten verwenden, um zu versuchen, zu beantworten, ob Studenten, die von weiter weg kamen, ein höheres Maß an Heimweh hatten. In diesem Fall sind die Daten zu den Heimwehfragen die Werte einer Antwortvariablen, und die Daten, die die Entfernung von zu Hause angeben, bilden die erklärende Variable.
Für das zweite Beispiel sind wir vielleicht neugierig, ob sich die Anzahl der Stunden, die mit Hausaufgaben verbracht werden, auf die Note auswirkt, die ein Schüler bei einer Prüfung verdient. In diesem Fall gibt es eine erklärende und eine Antwortvariable, da gezeigt wird, dass der Wert einer Variablen den Wert einer anderen ändert. Die Anzahl der untersuchten Stunden ist die erklärende Variable und die Punktzahl für den Test ist die Antwortvariable.
Wenn wir mit gepaarten quantitativen Daten arbeiten, ist es angebracht, ein Streudiagramm zu verwenden. Der Zweck dieser Art von Grafik besteht darin, Beziehungen und Trends innerhalb der gepaarten Daten zu veranschaulichen. Wir brauchen nicht sowohl eine erklärende als auch eine Antwortvariable. Ist dies der Fall, kann jede Variable entlang einer der beiden Achsen gezeichnet werden. Für den Fall, dass eine Antwort- und Erklärungsvariable vorhanden ist, wird die Erklärungsvariable immer entlang der aufgetragen x oder horizontale Achse eines kartesischen Koordinatensystems. Die Antwortvariable wird dann entlang der aufgetragen y Achse.
Die Unterscheidung zwischen Erklärungs- und Antwortvariablen ähnelt einer anderen Klassifikation. Manchmal bezeichnen wir Variablen als unabhängig oder abhängig. Der Wert einer abhängigen Variablen hängt von dem einer unabhängigen Variablen ab. Somit entspricht eine Antwortvariable einer abhängigen Variablen, während eine erklärende Variable einer unabhängigen Variablen entspricht. Diese Terminologie wird in der Statistik normalerweise nicht verwendet, da die erklärende Variable nicht wirklich unabhängig ist. Stattdessen nimmt die Variable nur die Werte an, die beobachtet werden. Wir haben möglicherweise keine Kontrolle über die Werte einer erklärenden Variablen.