Skalierte Punkte sind eine Art Prüfungspunktzahl. Sie werden häufig von Testunternehmen verwendet, die Prüfungen mit hohem Einsatz durchführen, z. B. Zulassungs-, Zertifizierungs- und Lizenzprüfungen. Skalierte Punktzahlen werden auch für K-12 Common Core-Tests und andere Prüfungen verwendet, mit denen die Fähigkeiten der Schüler bewertet und der Lernfortschritt bewertet werden.
Der erste Schritt, um skalierte Scores zu verstehen, besteht darin, zu lernen, wie sie sich von rohen Scores unterscheiden. Eine rohe Punktzahl gibt die Anzahl der Prüfungsfragen an, die Sie richtig beantworten. Wenn eine Prüfung beispielsweise 100 Fragen enthält und Sie 80 Fragen richtig beantwortet haben, beträgt Ihre Rohpunktzahl 80. Ihre prozentual korrekte Punktzahl, die eine Art Rohpunktzahl darstellt, beträgt 80% und Ihre Note ist B-.
Eine skalierte Punktzahl ist eine Rohpunktzahl, die angepasst und in eine standardisierte Skala konvertiert wurde. Wenn Ihre Rohpunktzahl 80 beträgt (weil Sie 80 von 100 Fragen richtig beantwortet haben), wird diese Punktzahl angepasst und in eine skalierte Punktzahl umgewandelt. Rohwerte können linear oder nichtlinear konvertiert werden.
Die ACT ist ein Beispiel für eine Prüfung, bei der eine lineare Transformation verwendet wird, um Rohwerte in skalierte Werte zu konvertieren. Das folgende Konversationsdiagramm zeigt, wie Rohwerte aus jedem Abschnitt der ACT in skalierte Werte umgewandelt werden.
Raw Score Englisch | Raw Score Math | Raw Score Reading | Raw Score Science | Skalierte Punktzahl |
---|---|---|---|---|
75 | 60 | 40 | 40 | 36 |
72-74 | 58-59 | 39 | 39 | 35 |
71 | 57 | 38 | 38 | 34 |
70 | 55-56 | 37 | 37 | 33 |
68-69 | 54 | 35-36 | - | 32 |
67 | 52-53 | 34 | 36 | 31 |
66 | 50-51 | 33 | 35 | 30 |
65 | 48-49 | 32 | 34 | 29 |
63-64 | 45-47 | 31 | 33 | 28 |
62 | 43-44 | 30 | 32 | 27 |
60-61 | 40-42 | 29 | 30-31 | 26 |
58-59 | 38-39 | 28 | 28-29 | 25 |
56-57 | 36-37 | 27 | 26-27 | 24 |
53-55 | 34-35 | 25-26 | 24-25 | 23 |
51-52 | 32-33 | 24 | 22-23 | 22 |
48-50 | 30-31 | 22-23 | 21 | 21 |
45-47 | 29 | 21 | 19-20 | 20 |
43-44 | 27-28 | 19-20 | 17-18 | 19 |
41-42 | 24-26 | 18 | 16 | 18 |
39-40 | 21-23 | 17 | 14-15 | 17 |
36-38 | 17-20 | 15-16 | 13 | 16 |
32-35 | 13-16 | 14 | 12 | 15 |
29-31 | 11-12 | 12-13 | 11 | 14 |
27-28 | 8-10 | 11 | 10 | 13 |
25-26 | 7 | 9-10 | 9 | 12 |
23-24 | 5-6 | 8 | 8 | 11 |
20-22 | 4 | 6-7 | 7 | 10 |
18-19 | - | - | 5-6 | 9 |
15-17 | 3 | 5 | - | 8 |
12-14 | - | 4 | 4 | 7 |
10-11 | 2 | 3 | 3 | 6 |
8-9 | - | - | 2 | 5 |
6-7 | 1 | 2 | - | 4 |
4-5 | - | - | 1 | 3 |
2-3 | - | 1 | - | 2 |
0-1 | 0 | 0 | 0 | 1 |
Der Skalierungsprozess erstellt eine Basisskala, die als Referenz für einen anderen Prozess dient, der als Gleichsetzen bezeichnet wird. Der Gleichsetzungsprozess ist erforderlich, um Unterschiede zwischen mehreren Versionen desselben Tests zu berücksichtigen.
Obwohl die Tester versuchen, den Schwierigkeitsgrad eines Tests von einer Version zur nächsten gleich zu halten, sind Unterschiede unvermeidlich. Durch Gleichsetzen kann der Tester die Ergebnisse statistisch anpassen, sodass die durchschnittliche Leistung in Version 1 des Tests der durchschnittlichen Leistung in Version 2 des Tests, Version 3 des Tests usw. entspricht.
Nachdem sowohl die Skalierung als auch die Gleichstellung durchgeführt wurden, sollten die skalierten Bewertungen austauschbar und leicht vergleichbar sein, unabhängig davon, welche Version des Tests durchgeführt wurde.
Schauen wir uns ein Beispiel an, um zu sehen, wie sich der Gleichsetzungsprozess auf skalierte Scores bei standardisierten Tests auswirkt. Stellen Sie sich vor, Sie und ein Freund nehmen am SAT teil. Sie werden beide die Prüfung im selben Testzentrum ablegen, aber Sie werden die Prüfung im Januar ablegen und Ihr Freund wird die Prüfung im Februar ablegen. Sie haben unterschiedliche Testtermine und es gibt keine Garantie, dass Sie beide dieselbe SAT-Version verwenden. Möglicherweise sehen Sie eine Form des Tests, während Ihr Freund eine andere sieht. Obwohl beide Tests einen ähnlichen Inhalt haben, sind die Fragen nicht genau gleich.
Nachdem Sie den SAT abgelegt haben, kommen Sie und Ihr Freund zusammen und vergleichen Ihre Ergebnisse. Sie haben beide eine rohe Punktzahl von 50 in der mathematischen Sektion, aber Ihre skalierte Punktzahl ist 710 und die skalierte Punktzahl Ihres Freundes ist 700. Ihr Kumpel fragt sich, was passiert ist, da Sie beide die gleiche Anzahl von Fragen richtig gestellt haben. Aber die Erklärung ist ziemlich einfach. Sie nahmen jeweils eine andere Version des Tests und Ihre Version war schwieriger als seine. Um die gleiche Punktzahl für den SAT zu erhalten, hätte er mehr Fragen richtig beantworten müssen als Sie.
Tester, die einen Gleichstellungsprozess verwenden, verwenden eine andere Formel, um eine eindeutige Skala für jede Version der Prüfung zu erstellen. Dies bedeutet, dass für jede Version der Prüfung kein einziges Raw-to-Scale-Score-Umrechnungsdiagramm verwendet werden kann. Aus diesem Grund wurde in unserem vorherigen Beispiel ein Rohwert von 50 an einem Tag in 710 und an einem anderen Tag in 700 umgewandelt. Denken Sie daran, wenn Sie Übungstests durchführen und Umrechnungstabellen verwenden, um Ihre Rohpunktzahl in eine skalierte Punktzahl umzuwandeln.
Raw Scores sind definitiv einfacher zu berechnen als skalierte Scores. Die Testunternehmen möchten jedoch sicherstellen, dass die Testergebnisse auch dann fair und genau verglichen werden können, wenn die Testteilnehmer zu verschiedenen Terminen unterschiedliche Versionen oder Formen des Tests verwenden. Skalierte Scores ermöglichen genaue Vergleiche und stellen sicher, dass Personen, die einen schwierigeren Test absolviert haben, nicht bestraft werden und Personen, die einen weniger schwierigen Test absolviert haben, keinen unfairen Vorteil erhalten.