لماذا تعتبر موثوقية الاختبار وصلاحيته مهمة

"موثوقية الاختبار" و "الصلاحية" هما من أكثر المصطلحات التي يساء فهمها في اختبار اللغة. كلاهما مهم جدا في تحديد ما إذا كان اختبار معين مناسبا في حالة معينة.

تعريف موثوقية الاختبار

ببساطة ، تعني الموثوقية أنه إذا أعطيت نفس الاختبار لنفس الطالب ، فسيحصل على نفس الدرجة. هذا ليس من السهل تحقيقه. بالنسبة للأسئلة (العناصر) المسجلة بالكمبيوتر في القراءة والاستماع ، يحتاج مطور الاختبار إلى إجراء تحليل إحصائي للعناصر. وتسمى هذه العملية التحليل النفسي. يتم إجراء التحليل على بيانات من عدد من المتقدمين للاختبار ، الذين لديهم بشكل مثالي مجموعة واسعة من مستويات المهارة. إذا كان العنصر جيدا ، فسيؤكد التحليل أنه يميز باستمرار المستوى الدقيق للمتقدم للاختبار. بمعنى آخر ، إذا كان عنصرا متوسطا منخفضا ، فإن المتقدمين للاختبار على مستوى المبتدئين سوف يخطئون باستمرار ، وسيفهمه المتقدمون للاختبار المتوسطون وما فوق بشكل صحيح. كلما كان أداء العنصر أكثر اتساقا بهذه الطريقة ، كان ذلك أفضل في التمييز بين المهارات اللغوية للمتقدم للاختبار. سيضع التحليل كل عنصر على طيف من السهل إلى الصعب. ستظهر نتيجة هذا الجهد أنه لا يتم إنشاء جميع العناصر المتوسطة - المنخفضة على قدم المساواة مع كون بعض العناصر في نفس المستوى أصعب من غيرها. يجب أن تؤخذ هذه الدرجة من الصعوبة داخل المستوى في الاعتبار عند بناء الاختبار. يجب أن يكون الاختبار الذي يتم تسجيله بواسطة الكمبيوتر والذي يتكون من مجموعة جيدة من العناصر التي تم تحديدها نفسيا على أنها عناصر جيدة اختبارا موثوقا للغاية لتلك المهارات.

لماذا تعتبر مصنفات الاختبار مهمة

على الرغم من وجود بعض اختبارات الكتابة والتحدث التي يتم تسجيلها بواسطة الكمبيوتر ، إلا أن إنشاء اختبار موثوق للتحدث والكتابة يتطلب عموما تسجيلا بشريا متسقا للغاية. بادئ ذي بدء ، يجب أن يكون هناك العديد من المقيمين الذين يسجلون الاختبارات حتى تكون هناك أي طريقة لقياس موثوقية التصنيف. يتم تحديد درجة اتساق التصنيف عن طريق حساب ما يسمى "الموثوقية بين المقيمين" (IRR). بمعنى آخر ، ما مدى اتساق الدرجات بين المقيمين المختلفين. إذا كان معدل العائد الداخلي مرتفعا ، فإن موثوقية الاختبار عالية ويمكنك الاعتماد على درجة الاختبار لتكون دقيقة.

تعريف صلاحية الاختبار

الصلاحية هي شيء أقل دقة أو علمية. ببساطة ، يكون الاختبار صالحا إذا كان يقيس الأشياء المناسبة للاستخدام الذي يتم وضعه فيه. إذا أراد المعلم معرفة ما إذا كان المتعلمون قد حفظوا واجباتهم المدرسية للمفردات الفرنسية ، فسيعطيهم مجموعة من الأسئلة حول الواجب المنزلي. لن يسألهم عن تاريخ الصين. إذا كنت ترغب في قياس مستويات كفاءة المتعلمين ، فيجب أن تطرح عليهم أسئلة واقعية لم يستعدوا لها على وجه التحديد ، على مجموعة متنوعة من المستويات لمعرفة ما يمكنهم فعله حقا باللغة.  سيكون هذا نهجا صالحا لقياس قدرة المتقدم للاختبار على إنجاز مهام العالم الحقيقي (= الكفاءة).

حول تقييم أفانت

Avant’s mission is to improve the teaching and learning of language in the US and around the world through effective language proficiency testing and professional development. Our products are not only for educators but also for business and government agencies that see the significant positive impact from bilingual team members.

انقر هنا للبدء في طريقك إلى الكفاءة

مقالات قد تعجبك أيضا: