什么是计算机自适应测试?

计算机自适应测试可根据应试者的回答动态调整试题难度。Avant STAMP 与固定形式的测试不同,在固定形式的测试中,每个应试者都回答同样的问题,而计算机自适应测试则根据个人的能力水平实时调整测试。这种个性化的方法确保了 "更准确、更高效的能力评估"(Hendrickson,2007 年)。

它是如何工作的? 

Avant STAMP 采用多阶段适应性测试(MST) 设计。

Avant STAMP 测试从中级题目开始。随着测试的进行,试题会根据应试者的技能水平进行调整,根据他们的表现变难或变简单。

这种自适应方法提高了测量精度,改善了测试体验。与线性测试不同的是,在线性测试中,考生可能会遇到感觉太容易或太难的问题,而Avant STAMP 可将问题保持在最佳水平,从而提供更具吸引力和更准确的评估。

综合能力跟踪

在Avant STAMP 中,阅读部分的熟练程度为写作提示提供依据,而听力部分的熟练程度则为口语提示提供指导。

阅读影响写作,听力影响口语
阅读分数会影响写作提示,听力分数会影响口语提示。

在Avant STAMP WS 中,应试者通过一系列阅读和听力的 CAN-DO 语句进行自我评估,以确定写作和口语的提示等级。 

图 1 显示了 STAMP 评估所采用的 MST 设计:

STAMP 4S 阅读和听力部分的视觉效果。
图 1.STAMP 多阶段测试 (MST) 设计。

为什么选择计算机自适应测试而不是固定格式测试?

1.精度和效率

  • 自适应出题:STAMP 可根据考生以往的答题情况调整试题难度,以提高考生的真实能力。
  • 精确测量:通过根据个人表现不断校准测试,STAMP 可以更精确地评估个人的能力。

2.增强考生体验

  • 减少考试焦虑:考生不太可能遇到太难或太容易的问题,从而为他们创造了一个既能接受挑战又不会导致挫败感的环境。
  • 缩短测试时间:STAMP 通常只需较少的问题就能准确评估能力,从而在不影响准确性的情况下缩短了整体测试时间。

3.数据驱动的洞察力

  • 实时反馈:即时结果和见解可帮助教育工作者调整教学,满足学生的具体需求。
  • 详细报告:有关个人和团体绩效的全面数据有助于做出明智的决策和有针对性的改进。

阅读白皮书全文: 开发 STAMP 测试:支持测试有效性

计算机自适应测试的挑战与解决方案

尽管计算机自适应测试具有众多优势,但它也面临着一系列挑战。以下是四种常见挑战及其解决方案,其灵感来自于行业见解:

1.技术问题和数字鸿沟

  • 挑战:应试者可能会遇到技术困难或无法获得可靠的技术。
  • 解决方案: Avant 评估确保提供强大的技术支持,并提供离线评估功能和与各种设备兼容等解决方案,以弥合数字鸿沟。

2.安全性和完整性

  • 挑战:在数字环境中维护测试的安全性和完整性可能非常复杂。
  • 解决方案: Avant 采用先进的安全措施,包括安全浏览器环境、加密数据传输和实时监控,以防止作弊并确保测试结果的有效性。

3.测试的公平性和偏差

  • 挑战:确保自适应算法公平地评估所有应试者,无论其背景如何。
  • 解决方案: Avant,对评估的公平性和偏差进行严格测试,并对自适应算法进行持续监控和更新,以确保对所有用户进行公平评估。

4.数据隐私问题

  • 挑战:保护考生的个人数据。
  • 解决方案: Avant 致力于数据隐私保护,严格遵守数据保护法规,并实施全面的数据安全协议来保护个人信息。

为什么选择Avant ?

在Avant ,我们在开发和提供卓越的语言能力评估方面处于行业领先地位。以下是我们脱颖而出的原因:

1.创新技术

  • STAMP:我们的旗舰测评 STAMP(基于标准的语言能力测评)是世界上第一个在线自适应四技能语言能力测试。STAMP 是与俄勒冈大学合作开发的,为准确性和可靠性设定了标准。

2.全面的技能覆盖范围

  • 四项技能评估:STAMP 评估阅读、写作、听力和口语,全面考察语言能力。

3.实际应用

  • 基于能力:我们的测评旨在衡量真实世界的语言使用情况,确保应试者为在不同环境中进行实际交流做好准备。
  • 全球认可: Avant的评估结果深受全球教育机构、企业和政府组织的信赖。

4.专家支持和培训

  • Avant MORE 学习:我们提供专业发展和培训,支持教育工作者提高教学成果和语言能力。

参考资料

Hendrickson, A. (2007).关于多阶段测试的 NCME 教学模块。教育测量:Issues and Practice, 26(2), 44-52.

已更新: