考生样本量对项目反应理论(IRT)等值稳定性的影响


作者:马洪超       发布时间:2011-04-01        来源《考试研究》


【作者简介】  马洪超,博士,讲师,北京语言大学汉语速成学院。北京,100083。

【摘要】  测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。

【关键词】  分数等值;样本量;锚题


 


阅读全文请下载