教育部人文社会科学研究基金(11YJC190016)
- 作品数:4 被引量:28H指数:3
- 相关作者:刘红云骆方王珊刘源张平平更多>>
- 相关机构:北京师范大学香港中文大学更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金北京市与中央在京高校共建项目更多>>
- 相关领域:哲学宗教更多>>
- 分类数据测量等价性检验方法及其比较:项目阈值(难度)参数的组间差异性检验被引量:3
- 2012年
- 测量工具满足等价性是进行多组比较的前提,测量等价性的检验方法主要有基于CFA的多组比较法和基于IRT的DIF检验两类方法。文章比较了单维测验情境下基于CCFA的DIFFTEST检验方法和基于IRT模型的IRT-LR检验方法,以及多维测验情境下DIFFTEST和基于MIRT的卡方检验方法的差异。通过模拟研究的方法,比较了几种方法的检验力和第一类错误,并考虑了样本总量、样本量的组间均衡性、测验长度、阈值差异大小以及维度间相关程度的影响。研究结果表明:(1)在单维测验下,IRT-LR是比DIFFTEST更为严格的检验方法;多维测验下,在测验较长、测验维度之间相关较高时,MIRT-MG比DIFFTEST更容易检验出项目阈值的差异,而在测验长度较短、维度之间相关较小时,DIFFTEST的检验力反而略高于MIRT-MG方法。(2)随着阈值差值增加,DIFFTEST、IRT-LR和MIRT-MG三种方法的检验力均在增加,当阈值差异达到中等或较大时,三种方法都可以有效检验出测验阈值的不等价性。(3)随着样本总量增加,DIFFTEST、IRT-LR和MIRT-MG方法的检验力均在增加;在总样本量不变,两组样本均衡情况下三种方法的检验力均高于不均衡的情况。(4)违背等价性题目个数不变时,测验越长DIFFTEST的检验力会下降,而IRT-LR和MIRT-MG检验力则上升。(5)DIFFTEST方法的一类错误率平均值接近名义值0.05;而IRT-LR和MIRT-MG方法的一类错误率平均值远低于0.05。
- 刘红云李冲张平平骆方
- 关键词:分类数据验证性因素分析项目功能差异
- 多阶段混合增长模型的影响因素:距离与形态被引量:18
- 2014年
- 通过模拟研究,考察潜类别距离和发展形态等因素对多阶段混合增长模型的模型选择和参数估计的影响:(1)潜类别距离越大,模型选择和分类效果越好。(2)混合模型的选择,应以一定样本量(至少200)为前提,首先考虑BIC选出正确的分类模型,再通过熵值、ARI等选择分类确定性较高的模型。(3)多阶段的发展形态对正确模型的选择和分类的确定性均有一定程度影响。(4)潜类别距离和样本量越大,参数估计精度越高。(5)在判断分类准确性的指标中,ARI的选择更偏向于真实的模型。
- 刘源骆方刘红云
- 迫选式人格测验的传统计分与IRT计分模型被引量:9
- 2014年
- 迫选测验的传统计分方式会产生自模式数据,不能进行传统的信效度检验、因素分析和方差分析等。近年来研究者提出了一些基于项目反应理论的计分模型,如瑟斯顿IRT模型和MUPP模型等,它们可以规避自模式数据的弊端。瑟斯顿IRT模型方便进行参数估计,模型定义灵活;而MUPP模型的拓展性较差,参数估计的方法有待提高。另一方面,已有研究者基于MUPP模型开发了一些抗作假的迫选测验,而瑟斯顿IRT模型距离这种应用还比较远。此外,两个模型的适用性和有效性都有待更多的实证研究来检验。
- 王珊骆方刘红云
- 神经质人格迫选量表的开发及其抗作假效果研究被引量:2
- 2013年
- 传统的迫选量表得分是自模式数据,最近提出的Thurstone IRT模型建构了被试对迫选量表反应的数学模型,能够更精确地度量被试的特质水平。研究自编了神经质人格迫选量表,与常用的测量神经质的Likert量表一起,在无压力、模拟应聘和实际应聘三种情境下进行施测。结果发现,迫选量表的实测数据能够较好地拟合Thurstone IRT模型,该模型估计的特质得分不具有自模式数据的性质,比传统计分更能够抵抗作假。无论采用哪种计分方式,迫选量表都比Likert量表更能够抵抗作假。
- 骆方刘红云张东王珊