教育测量与评价考研知识点.pdf

上传人:postpastor181 文档编号:1269075 上传时间:2019-09-07 格式:PDF 页数:23 大小:473.36KB
下载 相关 举报
教育测量与评价考研知识点.pdf_第1页
第1页 / 共23页
教育测量与评价考研知识点.pdf_第2页
第2页 / 共23页
教育测量与评价考研知识点.pdf_第3页
第3页 / 共23页
教育测量与评价考研知识点.pdf_第4页
第4页 / 共23页
教育测量与评价考研知识点.pdf_第5页
第5页 / 共23页
点击查看更多>>
资源描述

1、教育测量与评价 考研知识点 第一章 教 育 测评 概 述 第 一节 教育 测量 概述 一、什 么是 测量 (一) 测量 的定 义 一般认 为, 测量 是根 据法 则给事 物分 派数 字。 具体 来说, 是指 根据 一定 的法 则和程序 , 对事物 或现 象在 数量 上的 规定性 加以 描述 和确 定的 过程。 这里包 含了 测量 应有 的三 个特性 :1 、法 则。2 、事 物。3 、数 字。 (二) 测量 的三 要素 :1 、 单位。2、 参照 点。3 、量 表。 二、什 么是 教育 测量 (一) 教育 测量 的定 义 教育测 量是 根据 测量 学的 原理和 方法 对教 育现 象及 其属性

2、从量 的规 定性 上予 以确定 和 描述的 过程 。 (二) 教育 测量 的特 点 1 、测 量结 果的 间接 性。 2 、度 量单 位的 相对 性。 3 、测 量对 象的 复杂 性。 4 、测 量目 的的 针对 性。 第 二节 教育 评价 概述 一、什 么是 评价 评价就 是根 据某 种价 值观 对事物 及其 属性 进行 判断 、 衡 量, 或者 说是 衡量 、 判 断人或 事 物的价 值。 二、什 么是 教育 评价 教育评 价是 根据 一定 的价 值观或 价值 标准 , 运用 可行 的科学 手段 ( 包括 测量 或非 测量 ) , 通过系 统地 搜集 信息 、 分 析解释 , 对教 育现象

3、 进行 价值判 断 , 从 而为不 断优 化教育 和教 育 决 策提供 依据 的过 程。 三、教 育评 价与 教育 测量 的关系 测量是 依据 一定 的法 则和 程序 , 对 事物 或现 象在 数量 上的规 定性 加以 描述 和确 定的过 程 ; 评价是 泛指 根据 一定 的观 念和标 准衡 量、 判断 人物 或事物 的价 值。 测量 的结 果只有 通过 评价的解释 才能 揭示 其实 际意 义。 测量 是依 据, 评价 是 测量的 具体 体现 。 测 量关 心的是 数量 的多 少, 评 价关 心的 是价 值的 高 低; 测 量是 纯客 观的, 评价 带有主 观性 ; 测 量是 一种 单 一的活

4、 动, 评价则 是一 种综 合的 活动 。 教育测 量就 是借 助一 定的 工具 , 给 教育 现象赋 值 , 来获取 评价 对象 数量 的方 法。 教育 测 量是教 育评 价获 得数 据资 料的重 要手 段 。 教 育测 量可 以为教 育评 价提 供价 值判 断的基 本数 量 事实 , 是 教育 评价的 基础 ; 教 育评 价是 教育测 量过 程的延 续 , 是 对教育 测量 结果的 解释 与 应 用。 值得 指出 的是 , 教 育 评价并 非一 定以 教育 测量 为基础 , 有时 教育评 价和 教育测 量是 同义 词。比 如, 当教 师对 学生 的成绩 进行 测验 时, 可以 说是测 量学

5、 生的 成绩 或评 价学生 的成绩 。 四、教 育评 价的 种类 (一 ) 根 据评 价对 象和 范围 不同 , 可 分为 宏观 教育 评价 、 中 观教 育评 价和 微观 教育 评价 。 (二) 根据 评价 的时 间和 作用不 同, 可分 为定 位性 评价、 诊断 性评 价、 形成 性评价 和总 结性评 价 (三) 根据 评价 的基 准不 同,可 分为 相对 评价 、绝 对评价 个体 内差 异评 价 (四) 根据 评价 的性 质不 同,可 分为 需要 性评 价、 可行性 评价 和配 置性 评价 (五) 根据 评价 的主 客体 不同, 可分 为自 我 评 价和 他人评 价 (六 ) 按 被评

6、价对象 的变 量关系 不同 , 分为被 评价 对象整 体的 水平 评价 、 被 评价对 象 相 对的水 平评 价、 被评 价对 象特殊 相关 的评 价、 被评 价对象 专项 差异 的评 价。 第 三节 教育 测量 与评价 的发 展 一、教 育测 量的 发展 阶段 科举制 度的 特点 : 第 一, 要经过 严格 的政 治条 件方 面审查 ; 第 二, 要进 行严 格的文 化考 查;第 三, 历代 对考 生都 有健康 方面 的标 准。 科举制 度可 取之 处: 第一 , 政治 理论 考试 是最 主要 的考试 项目 ; 第 二, 文化 素养特 别是 写作能 力是 必考 项目 ;第 三,注 意考 查分

7、 析问 题和 解决问 题的 能力 。 科举制 度实 际上 就是 一个 关于学 生学 力检 测、 评价 制度 , 但 是它 缺乏对 人全 面的 、 科 学 的考察 ,并 且存 在着 许多 弊端。 在 18 世纪 以前 的西 方各 国 , 由 于学 校尚 未普 及 , 学 校考试 主要 是口 试 。1702 年, 英国 剑桥大 学首 先以 笔试 代替 口试, 开西 方学 校考 试先 河。 1864 年英 国格 林威 治医 院 附属学 校一 位名 叫费 舍的 教师收 集了 许多 学生 成绩 样本, 汇 集了一 本 量表 集 ,作 为度量 学生 各科 成绩 的标 准。可 以说 是客 观标 准化 测量的

8、 萌芽 。 1895 年, 比纳 等设 计了 一 套智力 测验 的方 法,1905 年在西 蒙(Simon) 的 协助 下 , 制 成了 著名的 比纳 西 蒙智 力量 表。 现代教 育测 量在 以下 方面 有了新 的发 展: 第一 ,开 始重视 学生 智力 和思 想品 德的测量 。 第二, 现代 教育 测量 量表 的编制 突破 了过 去单 一答 案的求 同式 思维 题, 发展 为包括 多种 答案 的求异 式思 维题 和论 文式 试题。 第三 ,教 育测 量的 范围由 过去 偏重 于学 生学 习成绩 的测量 , 发展到 涉及 到课 程设 置、 教材、 教育 改革 方案 等效 益方面 的测 量。

9、第四 , 现 代的教 育测 量由 过去单 一的 常模 参照 性测 验模式 发展 到常 模参 照性 测验与 目标 参照 性测 验相 结合的 模式 。 第 五,教 育测 量本 身的 理论 研究与 技术 开发 更加 深入 与完善 。 二、教 育评 价的 发展 阶段 1940 年, 泰勒 教授 提出 了 第一个 报告 ,第 一次 提出 了 “教 育评 价 ” 这个 概念 ,认为 实 施教育 评价 首先 必须 分析 教育应 达到 的目 标, 再用 这个目 标来 评价 教育 的效 果, 运 用评 价来 促进教 育活 动向 理想 的目 标逼近 。 被 人们 称为 “划 时代的 教育 评价 宣言 ”。 教育评

10、 价产 生的 标志是 “八 年研 究 ” ;泰 勒被称 为 “ 教育 评价 鼻祖 ”。 第二章 教 育 测量 的 质 量 指 标 第 一节 信度 一、信 度的 概念 信度指 测量 结果 的稳 定性 或可靠 性程 度, 亦即 测量 的结果 是否 真实 , 是 否客 观反映 了考 生的实 际水 平。 信度 的取 值范围 为0,1 。 在实际 测量 中主 要采 用计 算信度 系数 的方 法估 计信 度。 依 照计 算方 法的 不同, 可将信 度 分为4 种: 再测信 度 : 用一种 测验 对同 一被 试组 施测两 次 , 根 据两次 测验 分数计 算其 相关 系数 。 此 种信 度能表 示两 次测验

11、 结果 有无 变动 , 反 映测验 分数 的稳 定程 度, 故又称 稳定 性 系 数。在 没有 复本 可用 ,而 现实条 件又 允许 重复 施测 时,一 般采 用这 种再 测法 来估计 其信度 。 复本 信度 : 用一 种测 验的 两个等 值复 本施 测于 同一 被试组 , 然后 计算 两次 得分 的相关 系数 。 一般说 来, 复本 法是 考查 测验信 度最 好的 方法 。 内部一 致性 信度 : 测 验的 同质性 程度 。 如 果测验 中各 测题 得分 有正 相关 , 则 测验 是同 质的 。 考 查测验 内部 一致 性的 常用 方法有 分半 法、 库德尔 理查 森公 式和 克龙巴 赫 系

12、 数。 这样 求 得的信 度系 数也 叫做 内部 一致性 系数 。 分半法 是考 查测 验信 度最 常用的 方法 , 在 测验 没有 复本且 只能 实施 一次 时, 常用此 法估 计信 度, 即 把测 验题 分成 对等 的两半 (一 般按 奇数 题和 偶数题 分) , 根 据各 人在 这两半 测验 所得 分数计 算其 相关 系数 , 即 得分半 信度 。 但分半 法实 际只求 得半 个测 验的 信度 , 由 于在 其他 条件相等 的情 况下 , 测 验越 长, 信 度越 高, 因此 必须 使用斯 皮尔 曼 布 朗公 式加以 校正 , 以 估计整 个测 验的 信度 。 库 德尔 理 查森 公式

13、以测 验各个 项目 的正 确反 应为 基础, 或根 据各 人总分 的平 均数 和标 准差 计算信 度系 数, 即得 库德 尔 理查 森信 度。 它代 表一切 可能 的分 半信度 系数 的平 均数 。 但库 德 尔 理 查森 公式 只适 用于答 对一 题得 一分 、 答错 无分的 测验 。 克龙巴 赫 系 数则 适用 于 多重记 分的 测验 信度 估计 。 评 分者 信度 :随 机抽 取数份 试卷 , 由两位 或两 位以 上评 分者 分别评 分, 然后 计算 每份 试卷所 评各 分数 之间 的相 关系数 。 在 两人 评阅数 份试 卷 (或1 人 先 后两次 评阅 数份 试卷 ) 时 , 用 斯

14、皮 尔曼 等级 相关 公 式求相 关 ; 在3 人以上 评阅 数份 试卷 时, 则需计 算肯 德尔 和谐 系数 。 对 一些 无法 完全客 观记 分的测 验 , 常 需 考查评 分者 信度 。 以 上计 算信度 系数 的各 种方 法是 以不同 的假 定和 前提 条件 为基础 的, 故所 求得的 数值 意义 不尽 相同 ,因而 不能 单以 数值 来比 较其信 度高 低。 二、提 高测 验信 度的 方法 1 、适 当增 加测 验题 目的 数 量; 2 、测 验的 难度 要适 中; 3 、测 验的 内容 应尽 量同 质 ; 4 、测 验的 程序 应统 一; 5 、测 验的 时间 要充 分; 6 、评

15、 分要 尽量 做到 客观 化 、减少 评分 误差 。 第 二节 效度 一、效 度的 概念 效度指 测量 结果 的准 确性 和有效 性的 程度 ,亦 即测 量是否 达到 了预 期目 的。 二、效 度的 理论 公式 三、效 度的 分类 及估 计 与信度 计算 的理 论公 式一 样, 根 据效 度的 理论 公式 是不能 计算 出效 度的 大小 的。 在 实践 中常采 用以 下几 种方 法计 算效度 。 (一) 内容 效度 1 、内 容效 度的 定义 指测验 目的 代表 所欲 测量 的内容 和引 起预 期反 应所 达到的 程度 , 即测 量内 容的 代表性 程 度。 2 、内 容效 度的 估计 方法

16、: (1) 逻辑 判断 法。 一般 是 由本学 科的 专家 根据 所欲 测量的 属性 之定 义和 测量 内容范 围 的界定 , 依据 教育学 和心 理学的 理论 , 根据教 学大 纲要求 , 勾画 出学生 掌握 知识内 容的 范 围 和深度 , 提 出应 形成 的技 能名称 , 然 后以 逻辑 分析 的方法 估计 测验 在多 大程 度上代 表了 这些 内容, 在多 大程 度上 能够 测量出 所要 测量 的特 性和 功能。 (2) 比较 平均 数差 异的 显 著性 对同一 组被 试用 一个 测验 的两个 复本 在某 一学 科教 学或训 练前 后实 施测 验 , 该 测验内 容 的有效 性可 以由

17、 两次 测验 成绩差 异的 显著 性 来 加以 判断 。 若 两次 测验 分数 的平 均数有 显著 性 差异, 且教 学后 优于 教学 前, 则 表明 测验 所测 得的 内容正 是教 学或 训练 的内 容。 因 此, 可以 认为测 验的 内容 具有 有效 性。 若 两次 测验 分数 的平 均数无 显著 性差 异, 则表 明测验 所测 得的 内容与 教学 或训 练的 内容 不相符 合 。 因 此可 以认 为测 验的内 容效 度缺 乏有 效性 或内容 效度 较 低。 检验 两个 复本 测验 分数 平均数 之差 的显 著性 时 , 可 用相关 样本 平均 数之 差的 检验统 计 量 。 (3) 相关

18、 法 测验的 内容 效度 也可 以用 反映同 一内 容范 围的 两个 不同测 验 , 对 同一 组被 试施 测结果 的 相关系 数来 表示 。 若 相关 高, 表 明测 验的 内容 效度 较高; 若相 关 低 , 表 明测 验的内 容效 度较 低。 (二) 效标 关联 效度 效标就 是足 以显 示测 验所 欲测量 的特 性的 变量 或足 以显示 测验 所欲 测量 的特 性的变量 , 作为检 定效 度的 参照 尺度 。 效标 关联 效度 又称 经验 效度或 统计 效度 , 是 以测 验分数 和效 标之 间的相 关系 数来 表示 测验 的效度 高低 的。 效标 关联 效度又 可分 为同 时效 度和

19、 预测效 度。 同时 效度指 测验 与当 前效 标之 间的关 系程 度; 预测 效度 指测验 与将 来的 效标 之间 的关联 程度 。 如 用全国 高考 的成 绩作 为效 标来检 验高 中毕 业会 考的 成绩 , 计 算两 者的 相关 系数 就是会 考的 同 时效度 ; 而 用大 学一 年级 的成绩 作为 效标 来检 验高 考的成 绩, 两者 的相 关系 数就是 高考 的预 测效度 。 效 标是 用来 衡量 测验效 度的 尺度 。 具 体而 言, 效 标是 辨别 真伪 的尺 度, 当 事物 满足 该原则 要求 时, 才 能存 在 。 效标 是不能 违反 的。 当 然, 标准 可以 提高, 也可

20、 以降低。 效标 不 仅随着 测验 的种 类不 同而 不同, 也可 能随 时间 而改 变。 (三) 提高 效度 的办 法 1 、控 制系 统误 差。 2 、精 心编 制量 表。 3 、妥 善组 织测 验 4 、扩 充样 本的 容量 和代 表 性。 5 、合 理处 理效 度和 信度 的 关系。 6 、适 当增 加测 验的 长度 第 三节 难度 一、难 度的 概念 难度指 测验 试题 的难 易程 度。 在教育 测量 中 , 客 观题 的难 度一般 用正 确回 答试 题的 人数与 参加 测验 的 总 人数 的比值 来 表示。 二、难 度的 计算 1 、用 极端 分组 法计 算客 观 题的难 度 具体

21、步 骤如 下: (1) 先按 测验总 分的 高低 , 按 由高 到低依 次排 列试 卷; (2) 从得分 最 高的一 分试 卷开 始向 下依 次选出 全部 试卷 的27% 作 为高分 组; (3 )从 得分 最 低的一 份试 卷 向上依 次选 出全 部试 卷 的27%作 为低 分组 ;(4 )按 下列公 式计 算难 度。P(PHPL )/2 其中 PH 为 高分 组难 度,PL 为低 分组 难度 。高 低分 组的难 度按 基本 公式 计算 。 2 、用 极端 分组 法计 算主 观 题的难 度 论文式 试题 一般 不能 简单 地判定 对与 错或 通过 与不 通过, 难度 计算 比较 复杂。 具体

22、步 骤 如下: (1) 按测 验得 分排 列试 卷 , 确 定高 分组 与低 分组 , 各占总 人 数 25% ( 具体 办法 同前 ) ; (2) 分别 为高 分组 与低 分 组编制 每道 试题 的分 析表 ;(3 )按 下列 公式 计算 难 度。P (XH XL2nL )/2n(H-L) 其中XH 代 表高 分组 得分 总和 ,XL 代表 低分 组得 分总 和,n 代表总 人数 的25% ,H 为这 道题 的最 高 得分,L 为 这道 题的 最低 得分。 第 四节 区分 度 区分度 的定 义 区分度 指测 验对 考生 实际 水平的 区分 程度 , 用符 号 D 来表示 。 具有 良好 的区

23、 分度 的测验 , 实际水 平高 的应 该得 高分 ,实际 水平 低的 应该 得低 分,所 以区 分度 又叫 鉴别 力。 第三章 教育测 验的编制与实施 我国教 育工 作者 在吸 收布 卢姆目 标分 类法 合理 部分 的基础 上创 用的 认知 领域 目标有 五 分法 (知 识 、 理 解 、 应 用 、 分析综 合 、 创 造 ) 和 四分 法 (识 记 、 理 解 、 简 单应 用 、 综合运 用 ) 。 1 、识 记。 通过 牢记 、再 现 、再认 ,能 准确 地表 述所 学过的 基本 概念 、基 本原 理和基 本 知识, 能说 出它 们的 含义 或具体 内容 。 2 、理 解。 能用 自

24、己 的语 言 简述所 学过 的基 本概 念、 基本原 理, 掌握 有关 概念 、原理 的 区别和 联系 ,并 能辨 别或 判断最 基本 的问 题的 真伪 。 3 、简 单应 用。 4 、综 合运 用。 教育测 量中 的量 表一 般没 有绝对 零点 和相 等单 位, 所测的 原始 分数 没有 明确 的 意义 , 为 了正确 理解 与解 释由 测验 而来的 原始 分数 , 还须 把它 与可资 参考 的数 据或 行为 标准进 行比 较 , 才会显 示分 数的 含义 。 一、常 模的 含义 在教育 测量 学中 , 测 验的 常模 , 简 称常 模, 是指 一 个有代 表性 的样 组在 某种 测验上 的

25、表 现情况 。 二、常 模的 类型 测验的 常模 有二 类: 一是 发展常 模; 二是 组内 常模 1 、发 展常 模: 是指 某类 个 体正常 发展 过程 中各 个特 定阶段 的一 般水 平。 包括 年级常 模 和年龄 常模 二种 。 2 、组 内常 模: 是关 于一 个 与被试 同类 的群 体, 在某 种测验 所测 特性 上的 一般 表现水 平 的常模 资料 , 可 以反 映每 一个体 在其 同类 群体 中的 相对位 置。 包括 百分 等级 常模和 标准 分数 常模两 种。 三、常 模的 建立 方法 1 、年 龄常 模 如果人 的某 些能 力特 性在 不同年 龄阶 段表 现出 来的 差异具

26、 有统 计学 上的 显著 意义 , 那 么 就可以 为不 同年 龄组 建立 一个有 意义 的常 模。 2 、年 级常 模 所谓年 级常 模, 是指 不同 年级学 生在 某种 测验 上的 正常的 一般 的表 现水 平。 这样便 可用 某年级 学生 在该 测验 上的 平均分 和相 应的 年级 当量 之间的 对应 关系 来描 述某 一测验 的年 级 常模。 3 、百 分等 级常 模 百分等 级常 模是 指, 基于 某个常 模团 体, 为某 种测 验的原 始分 数与 百分 等级 之间建 立起 对应关 系的 组内 常模 。 4 、标 准分 数常 模 标准分 数是 以标 准差 为单 位 表示 测验 成绩

27、与平 均分 数之间 的距 离 。 它 是以 标准 差为单 位 度量原 始分 数离 开平 均数 的量数 , 表 示一 个原 始分 数在团 体中 所处 的相 对位 置, 亦 即在 平均 数之上 或之 下多 少标 准差 的位置 。 第四章 教 育 评价 方 案 的 编 制 与实 施 第 一节 教育 评价 的基本 原则 一、方 向性 原则 二、公 平性 原则 三、客 观性 原则 四、科 学性 原则 五、可 行性 原则 六、指 导性 原则 第 二节 教育 评价 方案的 制订 一、确 定教 育评 价指 标权 重的方 法 关键 特征 调查 法 两两 比较 法 专家 评判 平均 法 倍数 比较 法 第五章 教

28、 育 评价 信 息 收 集 与 处理 的 方 法 第 一节 收集 教育 评 价信 息的 方法 一、评 价信 息的 收集 标准 (一) 准确 性 是指采 集到 的资 料与 评价 目标的 一致 性 , 即 采集 到的 评价资 料是 否是 评价 目标 真正需 要 的资料 。 (二) 可靠 性 指收集 到的 资料 真实 可靠 , 用以 说明 评价 指标 的资 料是信 得过 的资 料, 这些 资料反 映的 情况完 全符 合客 观实 际。 (三) 时限 性 指严格 按评 价工 作所 规定 的时限 去采 集评 价信 息。 防止动 态资 料因 时间 变化 而失真 。 二、评 价信 息的 收集 方法 较常用 的

29、采 集评 价信 息的 方法有 观察 、 听 汇报 、 调 查访问 、 座 谈会 、 收 集文 字资料 、 发 问卷、 测试 等七 种。 第 二节 处理 教育 评价信 息的 方法 一、教 育评 价信 息 的 定性 分析描 述法 定性分 析描 述法 有等 级判 定法、 评语 鉴定 法和 写实 分析法 三种 。 (一) 等级 评定 法 目前有 五分 法、 四分 法、 三分法 、二 分法 等。 (二) 评语 鉴定 法 就是用 简明 的评 语来 表述 评价结 果的 方法 。 (三) 写实 分析 法 根据一 定的 评价 目标 和要 求, 对 评价 对象 的情 况进 行较为 详细 的描 述, 并在 此基础

30、上作 出恰当 评价 。 二、教 育评 价信 息的 定量 分析评 判法 可分为 统计 分析 法和 模糊 综合评 判法 。 (一) 统计 分析 法 主要用 常用 的统 计量 进行 分析, 包括 平均 数、 标准 差、标 准分 数、T 分 数、 参数估 计 (parameterestimation , 是根据 从总 体中 抽取 的样 本估计 总体 分布 中包 含的 未知参 数的 方 法)和 统计 检验 (统 计检 验是将 抽样 结果 和抽 样分 布相对 照而 作出 判断 的工 作)。 (二) 模糊 综合 评判 法 模糊综 合评 判是 将模 糊数 学应用 于教 育评 价 , 以 解决 在多因 素前 提

31、下 对模 糊数 据进行 综 合的问 题。 其基 本步 骤是 : 1 、确 定评 判的 因素 集 U 可根据 评价 指标 体系 的末 级指标 的性 质特 征和 需要 确定评 判的 因素 集 U 。 2 、确 定因 素权 数 给每个 因素 分派 一个 权数 。 3 、确 定评 价等 级 评价等 级的 划分 应允 许充 分考虑 指标 的性 质特 点。 4 、建 立因 素集 的模 糊矩 阵 在模糊 数学 中, 把矩 阵的 每一行 叫做 一个 模糊 子集 , 而每 一行 表示 一个 评价 因素的 每个 等级的 隶属 度。 将各 个模 糊子集 组合 起来 ,构 成模 糊矩阵 。 在教育 评价 中, 有的

32、现象 的外延 是模 糊的 , 如 “教 学组织 好 ” 就不 是 “ 非此 即彼 ” 的现 象, 而是 一个 模糊的 概念 。 模 糊的 现象 只能用 不精 确的方 法加 以描 述。 隶属 度就是 模糊 数 学 中用来 度量 事物 对集 合的 隶属程 度, 它可 以把 模糊 的教育 现象 数量 化。 5 、选 择评 判模 型 模糊数 学中 的评 判模 型较 多,目 前教 育测 量与 评价 领域中 常选 用的 模糊 评判 模型为 M( , )。 6 、计 算综 合评 判值 。 第 六 章 标 准 化考 试 标准化 考试 要做 到以 下四 个方面 的标 准化 :(1) 试题 编制 过 程的 标准

33、化;(2) 考 试实施 过 程的标 准化 ;(3) 评 分、 计 分过程 的标 准化 ;(4) 分 数 合成和 解释 过程 的标 准化 。 第 一节 主观 经验 性考试 的弊 端 我国是 考试 的故 乡, 目前 国际上 都公 认现 在的 考试 起源于 我国 公 元 606 年开 始实行的 , 直至本 世纪 初(1905 年) 才 废止的 科举 考试 制度 第 二节 标准 化考 试的特 点 标准化 考试 有以 下四 个主 要特点 ,凡 不具 备其 中之 一者, 就不 能称 之为 标准 化考试 。 一、试 题编 制过 程的 标准 化 标准化 考试 的试 题是 由有 关专家 组成 的班 子集 体编

34、制的。 在编 题前 ,要 明确 考试目的 , 拟出考 试大 纲, 制定 编题 计划。 然后 , 命 题人 员根 据计划 编写 好试 题, 由有 关人员 对试 题进 行初步 筛选 后组 织预 测, 并根据 预测 的结 果来 进行 统计分 析 , 取 得题目 的难 度、 区分 度等 数 据资料 , 经 预测 、 筛 选和 修改过 的符 合要 求的 题目 可以存 人题 库备 用。 最后 , 按考 试要 求从 题库中 取出 题目 拼配 试卷 。 二、考 试实 施过 程的 标准 化 标准化 考试 对考 试的 要求 是极其 严格 的, 包括 对考 试的实 施环 境、 考试 时间 以及考 试中 可能发 生的

35、 偶然 事件 的处 理方法 、 监 考人 员的 要求 等各个 方面 都要 尽量 做到 标准化 。 只 有这 样,才 能保 证公 平合 理地 对待所 有考 生, 提高 考试 的信度 。 三、标 准化 考试 的评 分、 计分方 法要 标准 化 评分、 计分 方法 是导 致考 试结果 误差 的一 个极 其重 要的因 素, 是考 试的 一个 十分重 要的 环节。 这一过 程如 达不 到标 准化 水平, 考试 也就 等于 前功 尽弃了 。 非 标准 化考 试正 是在这 一点 上不如 标准 化考 试, 从而 大大影 响了 其考 试的 质量 水平。 标准化 考试 的评 分都 可以 用机器 或采 用记 分键

36、来进 行, 机 器阅 卷只 要编 程没 有问题 , 是 绝对不 会出 现错 误的 。 因 为电脑 属于 “爆 破性 机器 ”, 一 旦出 现故 障, 评卷 就停止 了, 只要 是正常 运行 ,就 不会 出现 问题。 四、标 准化 考试 必须 编制 常模 所谓常 模, 指的 是标 准化 考试的 大样 本团 体的 成绩 的平均 数, 亦即 大样 本团 体分数 的一 般水平 。它 是我 们比 较 考 生相对 水平 的参 照点 。 到目前 为止 , 标准化 考试 还多用 于常 模参 照性 测验 , 即 注重 考生 之间的 相互 比较 , 而 常 模往往 是最 常用 的比 较标 准, 因 此, 在标 准

37、化 的常 模参照 性考 试中 , 必 须编 制常模 , 作 为解 释分数 的依 据。 第 三节 标准 化考 试的优 缺点 一、 标 准化 考试 的优 点 :1. 试卷 编制 的科 学性 ;2.试 题取样 的代 表性 ;3. 评分 的客 观 性 二、 标 准化 考试 的缺 点 :1. 能力 测试 的片 面性 ;2.题 型的僵 化性 ;3. 防止 考生 舞弊的 困 难性 ;4. 各 项质 量指 标也 存在不 完善 性。 首先 , 是 效度指 标问 题。 其次 , 是 各项指 标的 误差 问题。 再次 ,是 对猜 测的 校正问 题。 第 七 章 学 生 评价 一、学 生评 价的 涵义 学生评 价是

38、以学 生为 对象 的教育 评价 , 它 是依 据一 定的价 值标 准对 学生 的学 业成就 、 个 性发展 、 品德 状况 、 体 质 体能等 方面 进行 价值 判断 , 并 把判 断结 果反馈 于教 育实践 以改 进教 学,是 对学 生学 习进 展与 行为变 化的 评价 。 二、学 生评 价的 功能 (一) 学生 评价 是教 师评 价和学 校评 价的 重要 组成 部分 (二) 学生 评价 是促 进学 生自我 成长 与发 展的 重要 手段 (三) 学生 评价 是老 师了 解教学 得失 ,改 进教 学方 法,提 高教 学质 量的 重要 路径 (四) 学生 评价 是教 师了 解学生 的学 习困 难

39、, 帮助 学生找 出存 在问 题的 重要 方法 三、学 生评 价的 主体 和方 法 (一) 学生 自我 评价 1. 学生 自我 评价 的意 义 (1) 有利 于学 生认 识自 我 、激励 自我 、调 整自 我等 自我教 育能 力的 不断 提高 。 (2) 有利 于学 生人 格的 完 善。 (3) 有利 于学 生进 行自 我 管理。 (4) 有利 于学 生的 发展 与 提高。 2. 学生 自我 评价 的方 法 : (1) 利用 老师 提供 的评 价 项目清 单进 行自 评, 然后 写个人 总 结。 (2) 写学 习日 记。 (3)建 立学 生档 案袋 。 (二) 学生 小组 评价 1. 学生 小

40、组 评价 的意 义 (1) 是培 养学 生协 作能 力 和合作 精神 的重 要途 径。 (2) 有利 于促 进学 生自 主 学习、 自我 发展 和自 我评 价。 (3) 有利 于促 进同 伴之 间 的信息 交流 与共 同提 高。 2. 学生 小组 评价 的一 般方 法 (1) 构建 评价 小组 。应 注 意小组 成员 在性 别、 学业 成绩、 智力 水平 、个 性特 征等方 面 的合理 差异 ,一 般情 况下 ,每小 组 5-8 人。 (2) 合理 设置 评价 问题 和 内容。 小组 评价 内容 的选 择和问 题的 设计 要鼓 励所 有学生 参 与, 其 内容 不仅 应该 包括 学习活 动,

41、还应 包括 学习 以外的 内容 。 评 价时 , 先 让每个 学生 自我 评价, 然后 让评 价小 组成 员评价 ,给 每个 评价 对象 写出评 语。 评价 次数 以 3-4 周一 次 为宜 。 此外 , 开 展学 生小组 评价 , 教 师首 先要 做好充 分的 准备工 作 , 以 便对小 组评 价活动 进 行 必要的 指导 。尤 其注 重学 生之间 人际 关系 的建 立, 创造和 谐的 小组 评价 氛围 。 (三) 教师 对学 生的 评价 1. 教师 评价 学生 的优 越性 (1) 教师 具有 评价 者与 执 教者的 双重 身份 ,能 把教 学目标 与评 价目 标统 一起 来,有 利 于调节

42、 教学 ,充 分发 挥课 堂教学 的功 效。 (2) 教 师了 解学 生在 接受 知识中 智能 、 性 格、 态 度表 现出的 各种 差异 , 使 评价 更客观 , 更符合 学生 实际 ,有 利于 针对性 地诱 导与 鼓励 学生 。 (3) 教师 对学 生的 评价 是 教师帮 助、 激励 和引 导学 生自我 发展 、自 我完 善的 有效手 段 之一。 2. 教师 评价 学生 的一 般方 法 (1) 学业 成绩 测试 。要 注 意笔试 、口 试和 操作 测验 相结合 ,平 时成 绩与 终结 性测验 相 结合。 考试 的结 果最 好是 等级+ 评语 ,杜 绝利 用考 试 成绩给 学生 排序 。 (

43、2) 观察 与调 查法 。 (3) 评语 评价 法。 (4) 表现 性评 价法 。 (5) 档案 袋评 价法 。 学生学 业的 质性 评价 表现性 评价 和档 案袋 评价 是典型 的质 性评 价。 一、表 现性 评价 (一) 表现 性评 价的 概念 运用真 实的 生活 或模 拟的 评价练 习来 引发 最初 的反 应, 由高 水平 评定 者按 照一 定的标 准 进行直 接的 观察 、 评 判, 其形式 主要 包括 建构 式反 应题、 书面 报告、 作文、 演说、 操作、 实 验、资 料收 集、 作品 展示 。 (二) 表现 性评 价的 特点 主要特 点为 : 1. 表现 性评 价的 目的 既可

44、以是给 学生 评分 , 也 可以 是对学 生的 学习 情况 进行 诊断, 但其 重点是 在后 者; 2. 表现 性评 价比 较擅 长与 关注的 评价 领域 不是 知识 和技能 的回 忆与 再认 , 而是 知识和 技 能的应 用和 非智 力因 素的 发展; 3. 表现 性评 价的 问题 情境 是比较 真实 的, 需要 学生 解决的 问题 是现 实中 的问 题, 而 不是 脱离现 实情 境的 抽象 问题 ; 4. 表现 性评 价中 需要 学生 完成的 任务 一般 是比 较复 杂的 , 需 要学 生综 合运 用多 学科的 知 识和技 能来 加以 解决 ; 5. 表现 性评 价鼓 励学 生的 发散性

45、思维 ,允 许甚 至追 求答案 的多 样性 ; 6. 表现 性评 价比 较费 时费 力,需 要付 出的 时间 代价 较高; 7. 表现 性评 价容 易受 评价 主体主 观因 素的 影响 , 导致 评价结 论的 主观 性较 强 , 信 度较 低 。 二、档 案袋 评价 (一) 档案 袋评 价的 概念 学生档 案袋 评价 是一 种新 的记录 学生 成长 的评 价方 法。一 般来 说, 它根 据学 生的反应 , 以及教 师的 评价 、 观 察、 考 查、 成 绩测 验等, 得出 有关 学生进 步和 发展 的系 统而 持续的 记 录 。 (二) 档案 袋评 价的 特性 :1.目 标性 、 计 划性 与

46、组 织性 ;2.成 长性 与表 现性 ;3.整 合性 与多样 性 ;4.主 题性 与反 思性 。 第 八 章 学 生 品德 测 评 第 一节 品德 测评 概述 一、品 德测 评 品德测 评是 指根 据一 定的 目标, 运用 科学 的手 段, 对学 生 的政 治品 质、 道德 品质、 思想 品质( 包括 知、 情、 意、 行)的测 试和 评定 。 二、品 德测 评的 基本 要求 (一) 外显 行为 测评 与道 德认识 测评 相结 合 ( 二) 单项 测评 与整 体测 评相结 合 ( 三) 定性 测评 与定 量测 评相结 合 第 二节 品德 测评 的指标 体系 一、品 德测 评指 标体 系确 立的

47、依 据 ( 一)依 据社 会的 需要 ( 二)依 据德 育大 纲 ( 三)依 据品 德结 构理 论 ( 四)依 据学 生年 龄特 征 (五) 依据 成功 的德 育实 践 二、中 小学 生品 德测 评指 标体系 ( 一)构 建中 小学 生品 德测 评指标 体系 的基 本要 求 1. 重视 指标 体系 的开 放性 2. 重视 指标 体系 的教 育性 3. 处理 好普 遍性 与特 殊性 的关系 4. 处理 好稳 定性 和发 展性 的关系 5. 处理 好统 一性 和灵 活性 的关系 试构建 中小 学生 品德 测评 指标体 系。 第 三节 品德 测评 的方法 一、定 时考 核法 根据德 育的 要求 ,

48、拟 定德 育 试题, 指定 考试 地点, 在规 定的时 间内 , 按 一定 的考 试 要求, 对学生 进行 考核 。 二、问 卷测 评法 问卷测 评法 是通 过使 用问 卷或量 表测 试学 生思 想品 德的一 种方 法 。 它 包括 自编 问卷法 和 自陈量 表法 两种 。 三、项 目评 分法 项目评 分法 是设 置一 些测 试的项 目, 每一 项目 都给 予一定 的分 值, 然后 参照 这些项目 , 对学生 的思 想和 行为 表现 进行测 量。 四、情 境测 验法 这种方 法是 由教 师先 巧妙 地设计 一种 情境 , 让 学生 在这种 情境 中开 展活 动, 教师对 学生 在该条 件下 活

49、动 或反 应进 行全面 的考 察和 分析 ,据 此来对 其思 想行 为加 以衡 鉴。 五、社 会关 系测 量法 这里所 说的 社会 关系 是指 学生在 班级 或学 校社 团中 的人际 关系 。 六、意 向测 评法 意向测 评法 是测 评人 的心 理意向 的一 种方 法 。 在 品德 测评中 , 心理 意向 主要 指思 想观点 、 意见、 态度 、兴 趣、 爱好 等方面 的内 容。 七、行 为观 测法 第 九 章 教 师 评价 一、教 师评 价 教师评 价是 对教 师活 动进 行描述 和价 值判 断的 过程 。 它以 教师 行为 为目 标, 从 行为的 角 度对教 师在 教育 活动 中的 行为 进 行判 断 、 分析 和比 较。 教师 评价 与教师 考核 是有区 别的 。 教 师考核 是教 师评 价中 对教 师某项 活动 采用 的形 式。 二、教 师评 价的 主体 :1 、 教育行 政部 门 ;2、 学生 参 评 ;3 、家 长参 评 ;4 、教师 自 评 。 三、教 师评 价模 式 (一) 行为 目标 评价 模式 目标评价 模式 由早期 的教 育评价之 父泰 勒(Tyler ) 提出,因 而又 称为泰 勒模 式。其 理 论基础 是行 为主 义心 理学 。 所谓行 为目 标评 价法 就是 采用可 观

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 考研笔记

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1