内容发布更新时间 : 2024/12/31 4:13:44星期一 下面是文章的全部内容请认真阅读。
30.单维性假设 【】
是指假定同一测验都在测单一向度,即测验中的每一个项目都测量到同一种共同的潜在特质。 得 分 评卷人 复查人 四、判断改错题(本大题共5小题,每小题3分,共15分)
判断下列各题正误,正确的在题后括号内打“√”,错误的 打“×”,并将错误的地方改正过来。
31.测量误差指的是在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确的效果。 【】(×)(1分)
测量误差指的是在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确或者不一致的效果。 (2分)
32.在CTT中,基本假设主要有潜在特质空间的多维性假设,局部独立性假设,项目特征曲线假设,非速度限制假设。 【】(×)(1分)
在IRT中,基本假设主要有潜在特质空间的单维性假设,局部独立性假设,项目特征曲线
假设,非速度限制假设。(2分)
33.在选拔测验中,受测者为了给人留下好的印象,在回答时可能会考虑施测者期望或社会道德等因素,而不按自己的真实情况作答,从而给测验带来的误差是受测者的反应倾向影响的。 【】(×)(1分) 在选拔测验中,受测者为了给人留下好的印象,在回答时可能会考虑施测者期望或社会道德等因素,而不按自己的真实情况作答,从而给测验带来的误差是受测者的应试动机影响的。
(2分)
34. 真分数模型和潜在特质理论的核心部分都是数学模型,其共同之处是把可观察到的被试的反应和无法观察的被试的潜在特质联系起来了,且采用了线性概率模型。
【】(×)(1分)
真分数模型和潜在特质理论的核心部分都是数学模型,其共同之处是把可观察到的被试的反
应和无法观察的被试的潜在特质联系起来了,但CTT采用了线性确定性模型,而潜在特质理论采用了非线性概率模型。(2分)
35.行为样本测查的部分心理特质与特定的行为,而非全部。这于质检、水检不一样,行为样本涉及了抽样问题。 【】(×)(1分) 行为样本测查的部分心理特质与特定的行为,而非全部。这于质检、水检一样,涉及了抽样问题。(2分) 得 分 评卷人 复查人
36.请简述误差的来源。 【】
五、简答题(本大题共3小题,31题6分,32、33题10分,共26分)
答:①来源于测量工具。项目取样;表达的清晰与准确;及其可操作性;信度与效度的问题。(答对2项即可)(2分)
②来源于测量对象。被试的情绪、技能与技巧、学习、发展与教育、练习疲劳、反应倾向等。(答对2项即可)(2分)
③来源于测量过程。测试环境、主试因素、意外干扰、评分计分等。答对2项即可)(2分)
37.请简述IRT比CTT的优越性。 【】
①IRT在估计被试能力或潜力特质时,同时考虑被试的反应组型,因此对于原始得分相同但反应组型不同的个体,往往能够提供不同的能力估计值。(2分)
②IRT可以针对每一个被试提出其能力估计值的测量误差指标,而不是以一个笼统的标准误来代表测量误差,能够比较精确地断定每一个被试能力估计值的误差范围。(2分)
③IRT所采用的项目参数,不依赖于被试样本,也不依赖于项目库。(2分)
④IRT可以由同质性比较高的分测验中计算出被试的能力估计值,主试在时间、精力有限的情境下,可以较快而又不失精确地获得所需要的信息。(2分)
⑤IRT提出的项目信息函数和测验信息函数的概念,可以作为评定个别项目或整份测验的测量误差的指标,完全可以取代传统的“信度”概念。(2分)
38.随着计算机技术的发展,CTT逐渐被淘汰,请简述CTT的缺点与不足并详细说明。【】
①统计量的样本依赖性,抽样变动大。CTT所采用的统计量,诸如难度、区分度和信度等,都是一种样本依赖的指标,即指标会随着样本的特性而改变。(2分)
②能力与难度量表的不一致,测量误差大。在CTT中,被试能力量表时测验的卷面总分,其参照系是全部项目,项目难度量表是被试群体的得分率,其参照系是被试群体。(2分)
③信度估计的不精确性,复本施测难。CTT中对信度的估计很不精确,估计值具有笼统性,每个测验都只有一个信度值。(2分)
④测验结果拓宽的有限性,预测力缺乏。CTT主要应用于标准化技术和随机化技术来控制变量误差,但是在这种技术下获得的结果只能在相同条件下成立,却不能将其推广到非标准化情境中去,使得测验的应用范围受到限制。(2分)
⑤测量分数的测验依赖性,分数难比较。用CTT来解释测验分数时,必须依赖原测验来做解释,故难以比较不同的测验。(2分) 得 分 评卷人 复查人 六、论述题(本大题共1小题,每小题15分,共15分)
39.请论述误差控制的方法并举例。 【】
答:①测量内容的标准化,测量内容是对所有受测者施测相同的或等值的题目。(1分)列如,测数学补习是否有限,小明考数学,小红考英语,即测量内容不一致。(2分)
②测量编制的标准化,即在测验编制时,要注意搜集材料的丰富性和普遍性。(1分)列如,测试中小学生的恋爱观,却用测验成人婚恋观的题来给中小学生做。(2分)
③施测条件的标准化,即所有的受测者在相同的条件下接受测试。(1分)列如做EPT403亮点闪烁实验,今天天气好,今天的被试就在室外做测试,明天天气一般,被试就在室内做测试。(2分)
④评分的客观性,即两个或两个以上的评分者对同一测验试卷的评定是一致的。(1分)列如,两个评分者的评定结果一个是60分,一个是90分,两者结果不一致。(2分)
⑤对测验结果解释的标准化,即对施测过程的解释时一致的。(1分)列如,两个人有完全相同的病症,可医生却说他们得的病不一样。(2分)
相关描述酌情给分,总分不超过15分。