In den Bereichen Statistik und Ökonometrie ist der Begriff instrumentelle Variablen kann sich auf eine von zwei Definitionen beziehen. Instrumentelle Variablen können sich beziehen auf:
Als Schätzmethode werden instrumentelle Variablen (IV) in vielen wirtschaftlichen Anwendungen häufig verwendet, wenn ein kontrolliertes Experiment zur Prüfung des Vorliegens eines Kausalzusammenhangs nicht durchführbar ist und eine gewisse Korrelation zwischen den ursprünglichen erklärenden Variablen und dem Fehlerterm vermutet wird. Wenn die erklärenden Variablen mit den Fehlertermen in einer Regressionsbeziehung korrelieren oder irgendeine Form von Abhängigkeit zeigen, können instrumentelle Variablen eine konsistente Schätzung liefern.
Die Theorie der instrumentellen Variablen wurde erstmals von Philip G. Wright in seiner Veröffentlichung von 1928 mit dem Titel eingeführt Der Zoll auf tierische und pflanzliche Öle aber hat sich seitdem in seinen Anwendungen in der Wirtschaft entwickelt.
Es gibt mehrere Umstände, unter denen erklärende Variablen eine Korrelation mit den Fehlertermen aufweisen und eine instrumentelle Variable verwendet werden kann. Erstens können die abhängigen Variablen tatsächlich eine der erklärenden Variablen verursachen (auch als Kovariaten bekannt). Oder relevante erklärende Variablen werden im Modell einfach weggelassen oder übersehen. Es kann sogar sein, dass die erklärenden Variablen einen Messfehler aufwiesen. Das Problem bei jeder dieser Situationen ist, dass die herkömmliche lineare Regression, die normalerweise in der Analyse verwendet wird, inkonsistente oder voreingenommene Schätzungen erzeugen kann. Hier würden dann instrumentelle Variablen (IV) verwendet und die zweite Definition instrumenteller Variablen wird wichtiger.
Instrumentelle Variablen sind nicht nur der Name der Methode, sondern auch die Variablen, die verwendet werden, um mit dieser Methode konsistente Schätzungen zu erhalten. Sie sind exogen, was bedeutet, dass sie außerhalb der erklärenden Gleichung existieren, aber als instrumentelle Variablen mit den endogenen Variablen der Gleichung korreliert sind. Über diese Definition hinaus gibt es eine weitere Hauptanforderung für die Verwendung einer Instrumentenvariablen in einem linearen Modell: Die Instrumentenvariable darf nicht mit dem Fehlerterm der erklärenden Gleichung korreliert werden. Dies bedeutet, dass die Instrumentalvariable nicht dasselbe Problem wie die Originalvariable darstellen kann, für die sie aufgelöst werden soll.
Sehen wir uns ein Beispiel an, um die instrumentellen Variablen besser zu verstehen. Angenommen, man hat ein Modell:
y = Xb + e
Hier ist y ein T x 1-Vektor abhängiger Variablen, X ist eine T x k-Matrix unabhängiger Variablen, b ist ein k x 1-Vektor zu schätzender Parameter und e ist ein k x 1-Vektor von Fehlern. OLS kann man sich vorstellen, aber man nehme an, dass in der modellierten Umgebung die Matrix der unabhängigen Variablen X mit den e korreliert werden kann. Dann kann unter Verwendung einer T x k -Matrix von unabhängigen Variablen Z, die mit den X korreliert, aber nicht mit den e korreliert sind, ein IV-Schätzer konstruiert werden, der konsistent ist:
bIV = (Z'X)-1Z'y
Der zweistufige Schätzer der kleinsten Quadrate ist eine wichtige Erweiterung dieser Idee.
In dieser obigen Diskussion werden die exogenen Variablen Z instrumentelle Variablen genannt und die Instrumente (Z'Z)-1(Z'X) sind Schätzungen des Teils von X, der nicht mit den e korreliert ist.