现代教育测量与评价小题目(精) 下载本文

内容发布更新时间 : 2024/11/6 8:26:10星期一 下面是文章的全部内容请认真阅读。

1、测量:从广义上来讲,测量是根据法则给事物分派数字。此定义包含了三个方面特性:法则、事物、 数字。 法则是测量的标准, 也就是测量的依据和准则, 即我们根据什么来进行测量; 事物是测量的对象, 也就是对什么进行测量;数字是测量结果的表现形式。

2、测量的三要素:单位(如米、克,教育测量的单位不能直接加减乘除 ;参照点(计算的起点,有绝 对零点和相零点 ;量表(测量工具 。

3、将量表从低级到高级排列主要有四种量表水平:类别量表水平、顺序量表水平、等距量表水平、比 率量表水平。

4、教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。它主要包括对学 生的内在精神属性的测量,教育测量主要是一种间接的测量。

5、教育测量对象的复杂性:首先它是内在的,不能直接测量;其次它是多变的;另外有些主客观因素 也会影响测量的结果。

6、哲学史上三种价值观:客观主义价值观;主观主义价值观;辩证唯物主义价值观。

7、信度:是测量结果的稳定性或可靠的程度,即测量的结果是否真实、客观地反映了考生的实际水平。 可从三方面理解:实测值与真值相差程度;统计量与参数之间接近程度;两次重复测量或等值测量之间 的关联程度。信度系数以多大为宜:对于学科测验,信度系数要达到 0.9以上,智力测验要达到 0.8以 上,品德测验要达到 0.6以上。

8、校标关联效度:又叫经验效度和统计效度,是以测验分数和校标之间的相关系数来表示测验的效度 的高低的。

9、教育测量的历史知识:①《学记》记载中国在西周实行了教育考评;② 1702年英国剑桥大学首先用 笔试代替口试;③ 1845年美国在初等教育中以笔试代替口

试;④ 1864年英国费舍收集学生成绩样本汇 成《量表集》开启了标准化测量的萌芽;⑤ 1897年莱斯的拼字测验推动教育测验的发展;⑥冯特的测 量方法和高尔顿的统计方法对教育测量产生重大影响;⑦ 1905年法国比纳 -西蒙智力量表具有经典型; ⑧ 1904年美国的桑代克为教育测量之父,其名言:“凡是存在的东西都有数量,凡是有数量的东西都可 以测量” 。 1904桑代克发表的《精神与社会测验学导论》 ,标志着教育测验运动的开始;⑨美国的教育 测验运动分为三个时期:1904-1915开拓期, 1915-1930兴盛期, 1930-1940批判期。① 1931年塞蒙兹 主张人格测量应用评定法、问卷法、交谈法、轶事记录法等。②泰勒主持了课程设置和成绩测试的“八 年研究” (1933-1940 ,首次提出“教育评价”的概念,并发表了《史密斯 -泰勒报告》 ,此报告誉为“划 时代的教育评价宣言” , 泰勒被称为 “教育评价之父” 。 ③ 1963年克龙巴赫发表了 《通过评价改革课程》 ; 1967年斯克里芬发表了《评价方法论》第一次对形成性和终结性评价等不同类型的评价之间做了区分。 10、难度:是测验试题的难易程度,是试题对学生知识和能力水平的适合程度的指标。公式:P=R/N; P 表示难度指标, N 表示参加考试的总人数, R 表示答对某道客观题的人数。在常模参照性测验中要求试 题难度适中,即大多数题目的难度在 0.3-0.7之间,整个试卷平均难度在 0.5左右。

11、区分度:指测验对考生实际水平的区分程度。公式:D=PH-PL; D 代表区分度, Ph 代表高分组的难 度; Pl 表示低分组的难度, D>0为正区分, D<0为负区分, D=0为零区。

12、提高区分度的方法:使题目的难度适中,使整个考试的难度适中;着重考察复杂的学习效果。 13、测验目标:测验所要达到的某种具体目的,它明确规定测验所要达到的预期结果或标准。是编制测 验的出发点和依据。

14、布鲁姆把教育目标分为认知领域、情感领域、动作技能领域的目标。他把认知领域的教育目标分为 知识、应用、理解、分析、综合、评价。 1964年,布鲁姆等人发表了《教育目标分类学:第二分册:情感学习领域》 。

15、 1977年,加涅在《学习的条件》的第三版中将认知领域分为言语信息、智力技能、认知策略三种。 智力技能分为辨别、概念、规则、高级规则四类。学习的结果分为智力技能、认知策略、言语信息、运 动技能、态度五种。日本的梶田叡一在他的《教育评价》分为三大目标:基础目标、提高目标、体验目 标。

16、测验题型可分为封闭式、开放式。

17、测验编制中,设计试卷的蓝图是命题双向细目表。进行教育测验的编制时,一套试题中的客观题约 60%,主观题约 40%,测验试题难度的掌握一般情况下,较容易的试题占 20%左右。

18、教育评价指标从达标水平去考察,可分为必达指标和期望指标。教育评价指标从精确度去考察,可 分为硬指标和软指标两种。 硬指标指 “硬件” , 是固定的精确的指标。 软指标指 “软件” , 是伸缩性较大, 不精确的指标。

19、社会标准:以社会对教育的现象要求为依据,要求达标过程社会化规范化。 20、科学标准:根据客观规定和原则为依据,要求符合教育的客观规律。 21、行为目标评价法:指采用可观测的行为目标作为评价的依据的一种评价方法。行为目标的表达要注 意两点:应设立可能观察行为的场合;应容易表示出行动的程度或阶段。

22、加权平均法:是通过自评、专家组评、社会群众等不同方面的评价,或者学生、教师、领导等不同 阶层的评价者的评价来综合评定被评者的分数。

23、 评价信息收集的标准主要有准确性、 可靠性、 时限性。 准确性指收集到的信息与评价目标的一致性, 只采集到的材料是评价目标真正需要的资料。可靠性指收集到的资料的真实可靠,是信得过的资料,这 些资料所反映的情况完全符合客观实际。时限性指严格按照评价工作所规定的时限去采集评价信息。 24、处理评价信息的方法:定性分析描述法(包括等级评定、评语鉴定、写实分析法 ,定量评定法(包 括统计分析评判法、模糊综合评判法 。