现代测量理论中,很多测量模型的建立都基于被试在整个测验过程中保持努力作答状态这一假设。然而,研究发现,被试不努力作答行为在教育测验中非常常见,如果直接使用传统测量模型对数据拟合,往往会得到有偏差的估计结果。为了消除不努力作答对估计结果的不利影响,许多学术组织已经开始提倡在数据分析前识别不努力作答。例如,美国心理学协会和国家教育测量委员会制定的《教育和心理测验标准》要求“测验开发者和使用者在评价测验质量和基于分数做出推断前,记录不努力作答的情况作为与结构无关变异的来源”。
不努力作答行为一个重要特点是反应时短。近年来,随着计算机测试的普及,研究者利用在测验中获得的反应时等信息,提出了各种方法识别不努力作答,以提高测量模型参数估计结果的准确性。然而,已有的识别方法都存在不同程度的局限性。
针对传统的标准化反应时残差法在数据污染严重时表现较差的缺陷,近期,我院青年教师刘玥博士提出了固定参数迭代标准化残差法以识别不努力作答。该方法包含两个阶段,在第一阶段同时利用作答反应和反应时信息建立混合模型,区分努力作答和不努力作答的被试。再基于努力作答被试群体估计得到较为准确的题目参数,并将其固定用于第二阶段的反应时残差计算。在第二阶段利用标准化反应时残差识别不努力作答,并通过迭代净化过程不断提高识别结果的准确性。
研究采用了模拟研究和实证研究相结合的方式验证了上述方法的有效性。模拟的因素包括:样本量、题目数、不努力作答规模、不努力作答严重性和两种作答反应时差异。结果证明,新提出的方法能够明显降低题目参数和被试参数估计偏差,尤其在数据污染严重的情况下相比于传统方法体现出更大的优势,新方法的思想也可以推广应用于其他异常作答(如作弊等)的识别。该成果第一作者为本院教师刘玥博士,通讯作者为北京师范大学心理学部刘红云教授。

图1 不努力作答严重性高,两种作答反应时差异大的情况下,新提出的方法(ICSR)相对于传统方法(OSR)和不识别直接估计参数的方法(original),能够明显减小区分度参数估计偏差
参考文献
Liu, Y., & Liu, H. (2021). Detecting Non-effortful Responses Based on a Residual Method Using an Iterative Purifying Approach. Journal of Educational and Behavioral Statistics, online. https://doi.org/10.3102/1076998621994366
编辑:脑与心理科学研究院