اختبار مرجعي المعيار
الاختبار مرجعي المعيار (NRT) هو أحد أنواع الاختبار أو التقدير أو التقييم يعني بتوفير تقييم يحدد وضع الفرد الذي يُجرى له الاختبار ضمن مجموعة من الأشخاص المحددة مسبقًا، بالنسبة للصفة التي يُجرى قياسها. ويتم تحديد هذا التقدير بناءً على تحليل نتائج الاختبار وربما بعض البيانات الأخرى ذات الصلة والتي تم إجراؤها على عينة مأخوذة من مجموعة من الأفراد.[1] وهذا يعني، أن هذا النوع من الاختبار يحدد ما إذا كان الشخص الذي أُجري عليه الاختبار قدم أداءً أفضل أو أسوأ مقارنةً بالأفراد الآخرين المشاركين في هذا الاختبار، وبالتالي لا يعني هذا الاختبار ما إذا كان الشخص الخاضع للاختبار يعرف مواد أكثر أو أقل من اللازم لغرض ما.
ويشير مصطلح التقييم المعياري إلى عملية يتم من خلالها مقارنة أحد الأشخاص الخاضعين لاختبار ما بأقرانه أو أقرانها.[1]
وقد يتعارض مصطلح الاختبار مرجعي المعيار مع مصطلحي الاختبار محكي المرجع والتقييم الذاتي. ففي مفهوم الاختبار محكي المرجع، تشير النتيجة إلى ما إذا أبلى الخاضعون للاختبار بلاءً حسنًا أم سيئًا في مهمة معينة، غير أنها لا تهتم بمقارنة أدائه هذا مع أداء الآخرين المشاركين في الاختبار؛ أما التقييم الذاتي فيقارن بين أداء الفرد الحالي وبين أدائه في الماضي.
أنواع أخرى
كبديل للاختبار المعياري، قد تكون الاختبارات ذاتية, حيث يتم من خلالها مقارنة تقييم الفرد بنفسه أو نفسها ورصد تطوره عبر الزمن.[2][3]
وعلى الجانب الآخر، يتم وصف الاختبار بأنه من النوع محكي المرجع عندما يتم اتخاذ إجراءات تحضيرية لترجمة نتائج الاختبار إلى بيان يكشف عن السلوك المتوقع من هذا الفرد في ظل هذه النتيجة. ويمكن إجراء نفس الاختبار باستخدام كلتا الطريقتين.[4] ويرجع الأصل في صياغة المصطلحين الاختبار مرجعي المعيار والاختبار محكي المرجع إلى روبرت جلاسر.[5]
يرتكز مفهوم إصلاح التعليم القائم على المعايير على الإيمان بفكرة أن التعليم العام يلزم أن يحدد الأشياء التي ينبغي على كل طالب تعلمها وفي نفس الوقت يكون قادرًا على تعلمها.[6] ويلزم أن يتم اختبار الطلاب على أساس مقياس ثابت، بدلًا من الاختبار من خلال مقارنة بعضهم البعض أو تصنيفهم على شكل منحنى جرسي رياضي.[7] ومن خلال إجراء التقييم على أساس ضرورة اجتياز كل طالب تلك المعايير الجديدة وعالية المستوى، فيعتقد مسؤولو التعليم أن جميع الطلاب سيحصلون على الشهادة التي ستؤهلهم لتحقيق نجاح في القرن الواحد والعشرين.[8]
الاستعمال الشائع
تعد معظم اختبارات التحصيل التي تجريها الدولة من نوع الاختبارات محكية المرجع. وبعبارة أخرى، يتم وضع مستوى الأداء المقبول المحدد سلفًا ثم رصد نجاح أو فشل الطلاب في إنجاز أو عدم إنجاز هذا المستوى. ويُشار إلى الاختبارات التي تحدد الأهداف للطلاب على أساس متوسط أداء الطلاب باسم الاختبارات مرجعية المعيار. أما بالنسبة للاختبارات التي تحدد الأهداف بالنسبة للطلاب بناءً على مجموعة من المعايير (على سبيل المثال، تهجئة 80 كلمة بطريقة صحيحة) فيُشار إليه باسم الاختبارات محكية المرجع.
تستخدم معظم اختبارات قبول دخول الجامعة والاختبارات المدرسية التي يتم إجراؤها على المستوى المحلي نوع الاختبارات مرجعية المعيار. يقوم اختبار سات, واختبار تحديد مستوى القبول للدراسات العليا (GRE), واختبار وكسلر لقياس معدل الذكاء للأطفال (WISC) على أساس المقارنة بين مستوى أداء الطالب وبين مستوى أداء العينة المعيارية. فلا يمكن أن «يفشل» الخاضع للاختبار في اختبار مرجعي المعيار، حيث يحصل كل خاضع للاختبار على درجة يتم من خلالها مقارنة الفرد بالآخرين الذين خضعوا للاختبار، وعادةً ما تكون الدرجة بالنسبة المئوية. ويعتبر هذا الاختبار مفيدًا عندما يكون هناك مجموعة واسعة من النتائج المقبولة ولكن تختلف نسبتها من كلية لأخرى.
على الجانب الآخر، يلزم اجتياز حوالي ثلثي الطلاب من المدرسة الثانوية الأمريكية اختبار التخرج من المرحلة الثانوية محكي المرجع. ويتم تحديد درجة ثابتة عالية واحدة عند مستوى يلائم قبول الالتحاق بالجامعة سواء كان خريج المدرسة الثانوية ملتحقًا بكلية أم لا. وتجري كل ولاية اختبارها الخاص بها وتحدد مستوى الاجتياز الخاص بها، فتتميز ولايات مثل ماساتشوستس على سبيل المثال بمعدلات اجتياز عالية، بينما في ولاية واشنطن، حتى الطلاب العاديين لا يمكنهم اجتياز الاختبار، فضلًا عن 80 بالمائة من بعض الجماعات الأقلية. ويعارض الكثير من العاملين بحقل التعليم أمثال ألفي كوهين هذه الممارسة باعتبارها غير عادلة بالنسبة للأفراد والجماعات الذين لم يتمكنوا من إحراز نتيجة عالية كالآخرين.
المزايا والقيود
من العيوب الجلية للاختبارات مرجعية المعيار أنها لا يمكنها قياس التقدم المحرز من الجماعة ككل؛ فلا يمكنها قياس سوى التقدم المحرز من الأفراد الداخلين في نطاق المجموعة. وبالتالي، لا يمكن استخدام القياس بناءً على هدف ثابت في قياس مدى نجاح برنامج إصلاح تعليمي والذي يسعى إلى زيادة مستوى التحصيل عند الطلاب جميعًا مقارنةً بالمعايير الجديدة التي تسعى لتقييم المهارات من خلال الاختيار من متعدد. ومع ذلك، وبينما قد يبدو هذا الأمر جذابًا من الناحية النظرية، ولكن من الناحية العملية كثيرًا ما يكون هذا عائقًا في مواجهة معدلات الفشل المفرطة، وفي بعض الأحيان يحدث تحسن فقط لمجرد الإلمام بمضمون الاختبار نفسه أو تعليمه.
عند إجراء اختبار مرجعي المعيار، يتم تحديد مستوى المرحلة الدراسية بديهيًا على المستوى الذي تحدده نسبة 50 بالمائة التي تتوسط الدرجات.[9] وعلى الجانب الآخر، ترى المؤسسة الوطنية لدعم القراءة عند الأطفال أنه من الضروري ضمان أن جميع أطفالنا يستطيعون القراءة عند مستوى المرحلة الدراسية من الصف الثالث فما فوق، ذلك الهدف الذي لا يمكن تحقيقه باستخدام التعريف مرجعي المعيار لمستويات المرحلة الدراسية.[10]
من بين مزايا هذا النوع من التقييم أن الطلاب والمعلمين على حد سواء يدركون ما يمكن توقعه من هذا الاختبار وكيف سيتم إجراء الاختبار وكيفية وضع الدرجات على أساسه. وبالمثل، تجري كل مدرسة من المدارس الاختبار بنفس الطريقة مما يقلل حالات عدم الدقة نتيجة الفوارق الزمنية أو الفوارق البيئية التي قد تتسبب في إرباك الطلاب. علاوةً على ذلك، قد يجعل ذلك مثل هذه التقييمات دقيقة إلى حد كبير بقدر ما كانت النتائج مدرجة، وهو بمثابة ميزة كبيرة للاختبار.
ويشير نقاد الاختبارات محكية المرجع أن القائمين على الاختبار يضعون إشارات مرجعية حول العناصر التي تكتنفها صعوبات متنوعة دون الأخذ في الاعتبار ما إذا كانت تلك العناصر متوافقة فعليًا مع معايير محتوى مستوى المرحلة الدراسية أو أنها ملائمة تنمويًا.[11] وهكذا، تضمنت مشاكل عينة 1997 الأصلية التي نُشرت في إطار تقييم واشنطن لتعليم الطلبة مادة الرياضيات للصف الرابع على بعض المواد التي اتسمت بالصعوبة بالنسبة لكبار خريجي الكلية، أو تم حلها بسهولة بالاعتماد على الأساليب الواردة في الصف العاشر مثل المثلثات المتشابهة.[12]
كذلك، يتغير مستوى صعوبة المواد نفسها، شأنها شأن الدرجات الفاصلة التي تحدد مستويات اجتياز الاختبار من عام لعام.[13] علاوةً على ذلك، تختلف معدلات النجاح في اختبارات التخرج من الصف الرابع إلى السابع والعاشر في بعض الدول بشكل كبير.[14]
ومن بين القيود المفروضة على قانون إلزامية التعليم للأطفال أنه يمكن لكل ولاية أن تختار أو تُجري اختبارها الخاص بها ولكن دون أن يكون شبيهًا بالاختبار الخاص بأي دولة أخرى.[15] وقد أشارت نتائج الدراسة التي أجرتها راند على منطقة كنتاكي إلى وجود مؤشرات على زيادة غير طبيعية في معدلات الاجتياز والتي لم تنعكس على الدرجات العالية بالنسبة للاختبارات الأخرى مثل اختبار التقييم الوطني للتقدم التعليمي (NAEP) أو اختبار سات (SAT) والتي تم إجراؤها على نفس المجموعة الطلابية خلال نفس الفترة.[16]
وعادةً ما يتم تحديد معايير اختبار التخرج عند مستوى يتوافق مع المتقدمين للالتحاق بالجامعة مدة 4 سنوات من الموطن الأصلي [بحاجة لمصدر]. ويكمن أحد الآثار الجانبية في أنه عندما تقبل الكلية بانضمام المهاجرين إليها والذين يتمتعون بمهارات رياضية قوية للغاية ولكن قد يعانون قصورًا في اللغة الإنجليزية، فلن تكون لديهم مثل هذه المرونة في اختبارات التخرج من المدرسة الثانوية، والتي تتطلب عادةً اجتياز كافة الأقسام، بما في ذلك اللغة. وبالتالي، فمن المعتاد بالنسبة للمؤسسات مثل جامعة واشنطن أن تقبل الطلاب الأمريكيين من أصل آسيوي أو الطلاب اللاتينيين الذين لم يتمكنوا من اجتياز القسم الخاص بالكتابة من اختبار تقييم واشنطن لتعليم الطلاب (WASL) الحكومي، غير أن هؤلاء الطلاب لن يحصلوا حتى على شهادة حتى يتم استيفاء شروط الاختبار.
وعلى الرغم من أن الاختبارات أمثال اختبار تقييم واشنطن لتعليم الطلاب (WASL) تهدف إلى أن تكون بمثابة حد أدنى بالنسبة لطلاب المدرسة الثانوية، إلا أن 27 بالمائة من طلاب الصف العاشر المتقدمين لبرنامج الانطلاق نحو البدء في ولاية واشنطن فشلوا في اجتياز الجزء الخاص بمادة الرياضيات من اختبار تقييم واشنطن لتعليم الطلاب. فهؤلاء الطلاب تقدموا لأخذ دورات تدريبية على مستوى الكلية في المدرسة الثانوية، وحققوا مستويات أعلى بكثير عن الطلاب العاديين. وقد خلصت الدراسة إلى أن درجة صعوبة هذا الاختبار مماثلة، أو أكبر من تلك الاختبارات التي تهدف إلى إلحاق الطلاب المقبولين بالفعل في الكلية.[17]
في نفس الوقت، ليس لدى نظام الاختبار مرجعي المعيار أيٍ من هذه المشاكل حيث أنه لا يسعى لفرض أي توقعات على ما يجب على كل الطلاب معرفته أو ما هم قادرون على فعله بخلاف ما يظهره الطلاب الفعليون. ويتم اعتبار المستويات الحالية من الأداء وتفاوت المستويات أمرًا مسلمًا به، وليس كعيوب يلزم إزالتها بواسطة نظام مُعاد تصميمه. ولا يتم رفع مستوى الأهداف الخاصة بأداء الطلاب كل عام حتى يتم التأكد من إتقان جميع الطلاب لها. ولا يلزم توفر الدرجات لإظهار مدى التحسن المستمر من خلال أنظمة إدارة الجودة الشاملة. وتتمثل مساوئ الاختبار في أن التقييمات القائمة على المعايير تقيس المستوى الذي عليه الطلاب حاليًا من خلال قياس المستوى الذي يتميز به أقرانهم بالفعل بدلًا من مقارنة مستواهم بالمستوى الذي يجب أن يكون عليه كل الطلاب.
يعمل النظام القائم على التصنيف على إخراج البيانات التي تكشف أي الطلاب العاديين الذين يمكنهم الأداء عند المستوى المتوسط، وأي الطلاب يمكنهم الأداء بشكل أفضل، وأي الطلاب يمكنهم الأداء بشكل أسوأ. وهذا يتعارض بالضرورة مع المعتقدات الأساسية، سواء التي تدعو للتفاؤل أو التي لا أساس لها، والتي تقضي بوصول الجميع إلى مستوى واحد عالٍ من الأداء بشكل موحد في النظام القائم على المعايير في حالة ما إذا تم وضع حوافز وعقوبات كافية في إطار التنفيذ العملي. ويرتكز هذا الاختلاف في المعتقدات على الاختلاف الأكثر أهمية بين نظام التعليم التقليدي وبين نظام التعليم القائم على المعايير.
أمثلة
- تعد اختبارات نسبة الذكاء اختبارات مرجعية المعيار، حيث يكمن هدفها في معرفة أي ممتحن أكثر ذكاءً من الممتحن الآخر.
- كذلك، تعد اختبارات أداء الممثلين على المسرح ومقابلات العمل من نوع الاختبارات مرجعية المعيار، حيث أنها تهدف إلى تحديد أفضل مرشح مقارنةً بالمرشحين الآخرين، وليس تحديد عدد المرشحين الذين يمكنهم استيفاء مجموعة ثابتة من المعايير.
المراجع
- "Assessment Guided Practices". مؤرشف من الأصل في 2012-02-04. اطلع عليه بتاريخ 2013-06-18.
- Assessment نسخة محفوظة 12 سبتمبر 2013 على موقع واي باك مشين.
- PDF presentation نسخة محفوظة 24 سبتمبر 2015 على موقع واي باك مشين.
- Cronbach, L. J. (1970). Essentials of psychological testing (3rd ed.). New York: Harper & Row.
- Glaser، R. (1963). "Instructional technology and the measurement of learning outcomes". American Psychologist. ج. 18: 510–522.
- Illinois Learning Standards نسخة محفوظة 15 يناير 2017 على موقع واي باك مشين.
- stories 5-01.html Fairtest.org: Times on Testing "criterion referenced" tests measure students against a fixed yardstick, not against each other. [وصلة مكسورة] نسخة محفوظة 10 يناير 2020 على موقع واي باك مشين.
- By the Numbers: Rising Student Achievement in Washington State by Terry Bergesn "She continues her pledge ... to ensure all students achieve a diploma that prepares them for success in the 21st century." "نسخة مؤرشفة". مؤرشف من الأصل في 2016-03-13. اطلع عليه بتاريخ 2018-08-02.
{{استشهاد ويب}}
: صيانة الاستشهاد: BOT: original URL status unknown (link) - NCTM: News & Media: Assessment Issues (Newsbulletin April 2004) "by definition, half of the nation's students are below grade level at any particular moment" نسخة محفوظة 10 ديسمبر 2007 على موقع واي باك مشين.
- National Children's Reading Foundation website نسخة محفوظة 11 مارس 2007 على موقع واي باك مشين.
- نسخة محفوظة 26 مارس 2007 على موقع واي باك مشين. HOUSE BILL REPORT HB 2087 "A number of critics ... continue to assert that the mathematics WASL is not developmentally appropriate for fourth grade students." [وصلة مكسورة] "نسخة مؤرشفة" (PDF). مؤرشف من الأصل (PDF) في 2007-03-26. اطلع عليه بتاريخ 2013-06-18.
- Prof Don Orlich, Washington State University
- [وصلة مكسورة] Panel lowers bar for passing parts of WASL By Linda Shaw, Seattle Times May 11, 2004 "A blue-ribbon panel voted unanimously yesterday to lower the passing bar in reading and math for the fourth- and seventh-grade exam, and in reading on the 10th-grade test"
- نسخة محفوظة 12 مارس 2007 على موقع واي باك مشين. Seattle Times December 06, 2002 Study: Math in 7th-grade WASL is hard By Linda Shaw "Those of you who failed the math section ... last spring had a harder test than your counterparts in the fourth or 10th grades." "نسخة مؤرشفة". مؤرشف من الأصل في 2007-03-12. اطلع عليه بتاريخ 2020-05-11.
{{استشهاد ويب}}
: صيانة الاستشهاد: BOT: original URL status unknown (link) - New Jersey Department of Education: "But we already have tests in New Jersey, why have another test? Our statewide test is an assessment that only New Jersey students take. No comparisons should be made to other states, or to the nation as a whole. "نسخة مؤرشفة". مؤرشف من الأصل في 2006-02-16. اطلع عليه بتاريخ 2013-06-18.
{{استشهاد ويب}}
: صيانة الاستشهاد: BOT: original URL status unknown (link) - Test-Based Accountability Systems (Rand) "NAEP data are particularly important ...Taken together, these trends suggest appreciable inflation of gains on KIRIS. ... "نسخة مؤرشفة". مؤرشف من الأصل في 2018-01-16. اطلع عليه بتاريخ 2018-01-29.
{{استشهاد ويب}}
: صيانة الاستشهاد: BOT: original URL status unknown (link) - نسخة محفوظة 5 فبراير 2012 على موقع واي باك مشين. Relationship of the Washington Assessment of Student Learning (WASL) and Placement Tests Used at Community and Technical Colleges By: Dave Pavelchek, Paul Stern and Dennis Olson Social & Economic Sciences Research Center, Puget Sound Office, WSU "The average difficulty ratings for WASL test questions fall in the middle of the range of difficulty ratings for the college placement tests." "نسخة مؤرشفة". مؤرشف من الأصل في 2012-02-05. اطلع عليه بتاريخ 2013-06-18.
وصلات خارجية
- A webpage about instruction that discusses assessment
- بوابة علم النفس
- بوابة تربية وتعليم