Zuverlässigkeit ist der Grad, in dem ein Messgerät bei jeder Verwendung die gleichen Ergebnisse liefert, vorausgesetzt, dass sich das zugrunde liegende Messobjekt nicht ändert.
Stellen Sie sich vor, Sie versuchen, die Zuverlässigkeit eines Thermometers in Ihrem Zuhause zu beurteilen. Wenn die Temperatur in einem Raum gleich bleibt, liefert ein zuverlässiges Thermometer immer den gleichen Messwert. Ein Thermometer, dem es an Zuverlässigkeit mangelt, würde sich ändern, selbst wenn die Temperatur dies nicht tut. Beachten Sie jedoch, dass das Thermometer nicht genau sein muss, um zuverlässig zu sein. Es könnte zum Beispiel immer drei Grad zu hoch sein. Der Grad der Zuverlässigkeit hängt stattdessen mit der Vorhersagbarkeit der Beziehung zu dem zusammen, was getestet wird.
Um die Zuverlässigkeit zu beurteilen, muss das Messobjekt mehrmals gemessen werden. Wenn Sie beispielsweise die Länge eines Sofas messen möchten, um sicherzustellen, dass es durch eine Tür passt, messen Sie es möglicherweise zweimal. Wenn Sie zweimal eine identische Messung erhalten, können Sie sicher sein, dass Sie zuverlässig gemessen haben.
Es gibt vier Verfahren zur Beurteilung der Zuverlässigkeit eines Tests. (Der Begriff "Test" bezieht sich hier auf eine Gruppe von Aussagen in einem Fragebogen, auf die quantitative oder qualitative Bewertung eines Beobachters oder auf eine Kombination aus beiden.)
Hier wird derselbe Test zwei- oder mehrmals durchgeführt. Sie können beispielsweise einen Fragebogen mit zehn Aussagen erstellen, um das Vertrauen zu bewerten. Diese zehn Aussagen werden dann zweimal zu zwei verschiedenen Zeitpunkten einem Subjekt gegeben. Wenn der Befragte beide Male ähnliche Antworten gibt, können Sie davon ausgehen, dass die Fragen die Antworten des Probanden zuverlässig bewertet haben.
Ein Vorteil dieser Methode ist, dass für dieses Verfahren nur ein Test entwickelt werden muss. Das Test-Retest-Verfahren weist jedoch einige Nachteile auf. Zwischen den Testzeiten können Ereignisse auftreten, die sich auf die Antworten der Befragten auswirken. Die Antworten können sich im Laufe der Zeit ändern, weil sich die Menschen im Laufe der Zeit ändern und wachsen. und das Subjekt könnte sich beim zweiten Mal auf den Test einstellen, tiefer über die Fragen nachdenken und ihre Antworten neu bewerten. Im obigen Beispiel könnten einige Befragte zwischen der ersten und der zweiten Testsitzung sicherer geworden sein, was die Interpretation der Ergebnisse des Test-Retest-Verfahrens erschwert.
In der Prozedur für alternative Formulare (auch Zuverlässigkeit für parallele Formulare genannt) werden zwei Tests angegeben. Beispielsweise können Sie zwei Sätze von fünf Anweisungen erstellen, um die Zuverlässigkeit zu messen. Die Probanden werden gebeten, jeden der fünf Fragebögen zu beantworten. Wenn die Person für beide Tests ähnliche Antworten gibt, können Sie davon ausgehen, dass Sie das Konzept zuverlässig gemessen haben. Ein Vorteil ist, dass das Cueing weniger wichtig ist, da die beiden Tests unterschiedlich sind. Es ist jedoch wichtig sicherzustellen, dass beide alternativen Versionen des Tests tatsächlich dasselbe messen.
Bei diesem Verfahren wird ein einzelner Test einmal durchgeführt. Jeder Hälfte wird separat eine Note zugewiesen, und die Noten werden aus jeder Hälfte verglichen. Beispielsweise könnten Sie einen Satz von zehn Aussagen in einem Fragebogen haben, um das Vertrauen zu beurteilen. Die Befragten nehmen an dem Test teil und die Fragen werden in zwei Untertests mit jeweils fünf Punkten aufgeteilt. Wenn der Wert in der ersten Hälfte dem Wert in der zweiten Hälfte entspricht, können Sie davon ausgehen, dass der Test das Konzept zuverlässig gemessen hat. Auf der positiven Seite spielen Geschichte, Reifung und Cueing keine Rolle. Die Bewertungen können jedoch stark variieren, je nachdem, wie der Test in zwei Hälften unterteilt wird.
Hier wird derselbe Test einmal durchgeführt, und die Bewertung basiert auf der durchschnittlichen Ähnlichkeit der Antworten. Beispielsweise kann in einem Fragebogen mit zehn Aussagen zur Messung des Vertrauens jede Antwort als Untertest mit einer Aussage angesehen werden. Die Ähnlichkeit der Antworten auf jede der zehn Aussagen wird zur Beurteilung der Zuverlässigkeit herangezogen. Wenn der Befragte nicht alle zehn Aussagen auf ähnliche Weise beantwortet, kann man davon ausgehen, dass der Test nicht zuverlässig ist. Eine Möglichkeit, wie Forscher die interne Konsistenz beurteilen können, besteht darin, Cronbachs Alpha mithilfe einer statistischen Software zu berechnen.
Bei der internen Konsistenzprozedur spielen Historie, Reifung und Cueing keine Rolle. Die Anzahl der Aussagen im Test kann jedoch die Beurteilung der Zuverlässigkeit bei der internen Beurteilung beeinflussen.