ImageVerifierCode 换一换
格式:PDF , 页数:23 ,大小:473.36KB ,
资源ID:1269075      下载积分:5000 积分
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝扫码支付 微信扫码支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【http://www.mydoc123.com/d-1269075.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(教育测量与评价考研知识点.pdf)为本站会员(postpastor181)主动上传,麦多课文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知麦多课文库(发送邮件至master@mydoc123.com或直接QQ联系客服),我们立即给予删除!

教育测量与评价考研知识点.pdf

1、教育测量与评价 考研知识点 第一章 教 育 测评 概 述 第 一节 教育 测量 概述 一、什 么是 测量 (一) 测量 的定 义 一般认 为, 测量 是根 据法 则给事 物分 派数 字。 具体 来说, 是指 根据 一定 的法 则和程序 , 对事物 或现 象在 数量 上的 规定性 加以 描述 和确 定的 过程。 这里包 含了 测量 应有 的三 个特性 :1 、法 则。2 、事 物。3 、数 字。 (二) 测量 的三 要素 :1 、 单位。2、 参照 点。3 、量 表。 二、什 么是 教育 测量 (一) 教育 测量 的定 义 教育测 量是 根据 测量 学的 原理和 方法 对教 育现 象及 其属性

2、从量 的规 定性 上予 以确定 和 描述的 过程 。 (二) 教育 测量 的特 点 1 、测 量结 果的 间接 性。 2 、度 量单 位的 相对 性。 3 、测 量对 象的 复杂 性。 4 、测 量目 的的 针对 性。 第 二节 教育 评价 概述 一、什 么是 评价 评价就 是根 据某 种价 值观 对事物 及其 属性 进行 判断 、 衡 量, 或者 说是 衡量 、 判 断人或 事 物的价 值。 二、什 么是 教育 评价 教育评 价是 根据 一定 的价 值观或 价值 标准 , 运用 可行 的科学 手段 ( 包括 测量 或非 测量 ) , 通过系 统地 搜集 信息 、 分 析解释 , 对教 育现象

3、 进行 价值判 断 , 从 而为不 断优 化教育 和教 育 决 策提供 依据 的过 程。 三、教 育评 价与 教育 测量 的关系 测量是 依据 一定 的法 则和 程序 , 对 事物 或现 象在 数量 上的规 定性 加以 描述 和确 定的过 程 ; 评价是 泛指 根据 一定 的观 念和标 准衡 量、 判断 人物 或事物 的价 值。 测量 的结 果只有 通过 评价的解释 才能 揭示 其实 际意 义。 测量 是依 据, 评价 是 测量的 具体 体现 。 测 量关 心的是 数量 的多 少, 评 价关 心的 是价 值的 高 低; 测 量是 纯客 观的, 评价 带有主 观性 ; 测 量是 一种 单 一的活

4、 动, 评价则 是一 种综 合的 活动 。 教育测 量就 是借 助一 定的 工具 , 给 教育 现象赋 值 , 来获取 评价 对象 数量 的方 法。 教育 测 量是教 育评 价获 得数 据资 料的重 要手 段 。 教 育测 量可 以为教 育评 价提 供价 值判 断的基 本数 量 事实 , 是 教育 评价的 基础 ; 教 育评 价是 教育测 量过 程的延 续 , 是 对教育 测量 结果的 解释 与 应 用。 值得 指出 的是 , 教 育 评价并 非一 定以 教育 测量 为基础 , 有时 教育评 价和 教育测 量是 同义 词。比 如, 当教 师对 学生 的成绩 进行 测验 时, 可以 说是测 量学

5、 生的 成绩 或评 价学生 的成绩 。 四、教 育评 价的 种类 (一 ) 根 据评 价对 象和 范围 不同 , 可 分为 宏观 教育 评价 、 中 观教 育评 价和 微观 教育 评价 。 (二) 根据 评价 的时 间和 作用不 同, 可分 为定 位性 评价、 诊断 性评 价、 形成 性评价 和总 结性评 价 (三) 根据 评价 的基 准不 同,可 分为 相对 评价 、绝 对评价 个体 内差 异评 价 (四) 根据 评价 的性 质不 同,可 分为 需要 性评 价、 可行性 评价 和配 置性 评价 (五) 根据 评价 的主 客体 不同, 可分 为自 我 评 价和 他人评 价 (六 ) 按 被评

6、价对象 的变 量关系 不同 , 分为被 评价 对象整 体的 水平 评价 、 被 评价对 象 相 对的水 平评 价、 被评 价对 象特殊 相关 的评 价、 被评 价对象 专项 差异 的评 价。 第 三节 教育 测量 与评价 的发 展 一、教 育测 量的 发展 阶段 科举制 度的 特点 : 第 一, 要经过 严格 的政 治条 件方 面审查 ; 第 二, 要进 行严 格的文 化考 查;第 三, 历代 对考 生都 有健康 方面 的标 准。 科举制 度可 取之 处: 第一 , 政治 理论 考试 是最 主要 的考试 项目 ; 第 二, 文化 素养特 别是 写作能 力是 必考 项目 ;第 三,注 意考 查分

7、 析问 题和 解决问 题的 能力 。 科举制 度实 际上 就是 一个 关于学 生学 力检 测、 评价 制度 , 但 是它 缺乏对 人全 面的 、 科 学 的考察 ,并 且存 在着 许多 弊端。 在 18 世纪 以前 的西 方各 国 , 由 于学 校尚 未普 及 , 学 校考试 主要 是口 试 。1702 年, 英国 剑桥大 学首 先以 笔试 代替 口试, 开西 方学 校考 试先 河。 1864 年英 国格 林威 治医 院 附属学 校一 位名 叫费 舍的 教师收 集了 许多 学生 成绩 样本, 汇 集了一 本 量表 集 ,作 为度量 学生 各科 成绩 的标 准。可 以说 是客 观标 准化 测量的

8、 萌芽 。 1895 年, 比纳 等设 计了 一 套智力 测验 的方 法,1905 年在西 蒙(Simon) 的 协助 下 , 制 成了 著名的 比纳 西 蒙智 力量 表。 现代教 育测 量在 以下 方面 有了新 的发 展: 第一 ,开 始重视 学生 智力 和思 想品 德的测量 。 第二, 现代 教育 测量 量表 的编制 突破 了过 去单 一答 案的求 同式 思维 题, 发展 为包括 多种 答案 的求异 式思 维题 和论 文式 试题。 第三 ,教 育测 量的 范围由 过去 偏重 于学 生学 习成绩 的测量 , 发展到 涉及 到课 程设 置、 教材、 教育 改革 方案 等效 益方面 的测 量。

9、第四 , 现 代的教 育测 量由 过去单 一的 常模 参照 性测 验模式 发展 到常 模参 照性 测验与 目标 参照 性测 验相 结合的 模式 。 第 五,教 育测 量本 身的 理论 研究与 技术 开发 更加 深入 与完善 。 二、教 育评 价的 发展 阶段 1940 年, 泰勒 教授 提出 了 第一个 报告 ,第 一次 提出 了 “教 育评 价 ” 这个 概念 ,认为 实 施教育 评价 首先 必须 分析 教育应 达到 的目 标, 再用 这个目 标来 评价 教育 的效 果, 运 用评 价来 促进教 育活 动向 理想 的目 标逼近 。 被 人们 称为 “划 时代的 教育 评价 宣言 ”。 教育评

10、 价产 生的 标志是 “八 年研 究 ” ;泰 勒被称 为 “ 教育 评价 鼻祖 ”。 第二章 教 育 测量 的 质 量 指 标 第 一节 信度 一、信 度的 概念 信度指 测量 结果 的稳 定性 或可靠 性程 度, 亦即 测量 的结果 是否 真实 , 是 否客 观反映 了考 生的实 际水 平。 信度 的取 值范围 为0,1 。 在实际 测量 中主 要采 用计 算信度 系数 的方 法估 计信 度。 依 照计 算方 法的 不同, 可将信 度 分为4 种: 再测信 度 : 用一种 测验 对同 一被 试组 施测两 次 , 根 据两次 测验 分数计 算其 相关 系数 。 此 种信 度能表 示两 次测验

11、 结果 有无 变动 , 反 映测验 分数 的稳 定程 度, 故又称 稳定 性 系 数。在 没有 复本 可用 ,而 现实条 件又 允许 重复 施测 时,一 般采 用这 种再 测法 来估计 其信度 。 复本 信度 : 用一 种测 验的 两个等 值复 本施 测于 同一 被试组 , 然后 计算 两次 得分 的相关 系数 。 一般说 来, 复本 法是 考查 测验信 度最 好的 方法 。 内部一 致性 信度 : 测 验的 同质性 程度 。 如 果测验 中各 测题 得分 有正 相关 , 则 测验 是同 质的 。 考 查测验 内部 一致 性的 常用 方法有 分半 法、 库德尔 理查 森公 式和 克龙巴 赫 系

12、 数。 这样 求 得的信 度系 数也 叫做 内部 一致性 系数 。 分半法 是考 查测 验信 度最 常用的 方法 , 在 测验 没有 复本且 只能 实施 一次 时, 常用此 法估 计信 度, 即 把测 验题 分成 对等 的两半 (一 般按 奇数 题和 偶数题 分) , 根 据各 人在 这两半 测验 所得 分数计 算其 相关 系数 , 即 得分半 信度 。 但分半 法实 际只求 得半 个测 验的 信度 , 由 于在 其他 条件相等 的情 况下 , 测 验越 长, 信 度越 高, 因此 必须 使用斯 皮尔 曼 布 朗公 式加以 校正 , 以 估计整 个测 验的 信度 。 库 德尔 理 查森 公式

13、以测 验各个 项目 的正 确反 应为 基础, 或根 据各 人总分 的平 均数 和标 准差 计算信 度系 数, 即得 库德 尔 理查 森信 度。 它代 表一切 可能 的分 半信度 系数 的平 均数 。 但库 德 尔 理 查森 公式 只适 用于答 对一 题得 一分 、 答错 无分的 测验 。 克龙巴 赫 系 数则 适用 于 多重记 分的 测验 信度 估计 。 评 分者 信度 :随 机抽 取数份 试卷 , 由两位 或两 位以 上评 分者 分别评 分, 然后 计算 每份 试卷所 评各 分数 之间 的相 关系数 。 在 两人 评阅数 份试 卷 (或1 人 先 后两次 评阅 数份 试卷 ) 时 , 用 斯

14、皮 尔曼 等级 相关 公 式求相 关 ; 在3 人以上 评阅 数份 试卷 时, 则需计 算肯 德尔 和谐 系数 。 对 一些 无法 完全客 观记 分的测 验 , 常 需 考查评 分者 信度 。 以 上计 算信度 系数 的各 种方 法是 以不同 的假 定和 前提 条件 为基础 的, 故所 求得的 数值 意义 不尽 相同 ,因而 不能 单以 数值 来比 较其信 度高 低。 二、提 高测 验信 度的 方法 1 、适 当增 加测 验题 目的 数 量; 2 、测 验的 难度 要适 中; 3 、测 验的 内容 应尽 量同 质 ; 4 、测 验的 程序 应统 一; 5 、测 验的 时间 要充 分; 6 、评

15、 分要 尽量 做到 客观 化 、减少 评分 误差 。 第 二节 效度 一、效 度的 概念 效度指 测量 结果 的准 确性 和有效 性的 程度 ,亦 即测 量是否 达到 了预 期目 的。 二、效 度的 理论 公式 三、效 度的 分类 及估 计 与信度 计算 的理 论公 式一 样, 根 据效 度的 理论 公式 是不能 计算 出效 度的 大小 的。 在 实践 中常采 用以 下几 种方 法计 算效度 。 (一) 内容 效度 1 、内 容效 度的 定义 指测验 目的 代表 所欲 测量 的内容 和引 起预 期反 应所 达到的 程度 , 即测 量内 容的 代表性 程 度。 2 、内 容效 度的 估计 方法

16、: (1) 逻辑 判断 法。 一般 是 由本学 科的 专家 根据 所欲 测量的 属性 之定 义和 测量 内容范 围 的界定 , 依据 教育学 和心 理学的 理论 , 根据教 学大 纲要求 , 勾画 出学生 掌握 知识内 容的 范 围 和深度 , 提 出应 形成 的技 能名称 , 然 后以 逻辑 分析 的方法 估计 测验 在多 大程 度上代 表了 这些 内容, 在多 大程 度上 能够 测量出 所要 测量 的特 性和 功能。 (2) 比较 平均 数差 异的 显 著性 对同一 组被 试用 一个 测验 的两个 复本 在某 一学 科教 学或训 练前 后实 施测 验 , 该 测验内 容 的有效 性可 以由

17、 两次 测验 成绩差 异的 显著 性 来 加以 判断 。 若 两次 测验 分数 的平 均数有 显著 性 差异, 且教 学后 优于 教学 前, 则 表明 测验 所测 得的 内容正 是教 学或 训练 的内 容。 因 此, 可以 认为测 验的 内容 具有 有效 性。 若 两次 测验 分数 的平 均数无 显著 性差 异, 则表 明测验 所测 得的 内容与 教学 或训 练的 内容 不相符 合 。 因 此可 以认 为测 验的内 容效 度缺 乏有 效性 或内容 效度 较 低。 检验 两个 复本 测验 分数 平均数 之差 的显 著性 时 , 可 用相关 样本 平均 数之 差的 检验统 计 量 。 (3) 相关

18、 法 测验的 内容 效度 也可 以用 反映同 一内 容范 围的 两个 不同测 验 , 对 同一 组被 试施 测结果 的 相关系 数来 表示 。 若 相关 高, 表 明测 验的 内容 效度 较高; 若相 关 低 , 表 明测 验的内 容效 度较 低。 (二) 效标 关联 效度 效标就 是足 以显 示测 验所 欲测量 的特 性的 变量 或足 以显示 测验 所欲 测量 的特 性的变量 , 作为检 定效 度的 参照 尺度 。 效标 关联 效度 又称 经验 效度或 统计 效度 , 是 以测 验分数 和效 标之 间的相 关系 数来 表示 测验 的效度 高低 的。 效标 关联 效度又 可分 为同 时效 度和

19、 预测效 度。 同时 效度指 测验 与当 前效 标之 间的关 系程 度; 预测 效度 指测验 与将 来的 效标 之间 的关联 程度 。 如 用全国 高考 的成 绩作 为效 标来检 验高 中毕 业会 考的 成绩 , 计 算两 者的 相关 系数 就是会 考的 同 时效度 ; 而 用大 学一 年级 的成绩 作为 效标 来检 验高 考的成 绩, 两者 的相 关系 数就是 高考 的预 测效度 。 效 标是 用来 衡量 测验效 度的 尺度 。 具 体而 言, 效 标是 辨别 真伪 的尺 度, 当 事物 满足 该原则 要求 时, 才 能存 在 。 效标 是不能 违反 的。 当 然, 标准 可以 提高, 也可

20、 以降低。 效标 不 仅随着 测验 的种 类不 同而 不同, 也可 能随 时间 而改 变。 (三) 提高 效度 的办 法 1 、控 制系 统误 差。 2 、精 心编 制量 表。 3 、妥 善组 织测 验 4 、扩 充样 本的 容量 和代 表 性。 5 、合 理处 理效 度和 信度 的 关系。 6 、适 当增 加测 验的 长度 第 三节 难度 一、难 度的 概念 难度指 测验 试题 的难 易程 度。 在教育 测量 中 , 客 观题 的难 度一般 用正 确回 答试 题的 人数与 参加 测验 的 总 人数 的比值 来 表示。 二、难 度的 计算 1 、用 极端 分组 法计 算客 观 题的难 度 具体

21、步 骤如 下: (1) 先按 测验总 分的 高低 , 按 由高 到低依 次排 列试 卷; (2) 从得分 最 高的一 分试 卷开 始向 下依 次选出 全部 试卷 的27% 作 为高分 组; (3 )从 得分 最 低的一 份试 卷 向上依 次选 出全 部试 卷 的27%作 为低 分组 ;(4 )按 下列公 式计 算难 度。P(PHPL )/2 其中 PH 为 高分 组难 度,PL 为低 分组 难度 。高 低分 组的难 度按 基本 公式 计算 。 2 、用 极端 分组 法计 算主 观 题的难 度 论文式 试题 一般 不能 简单 地判定 对与 错或 通过 与不 通过, 难度 计算 比较 复杂。 具体

22、步 骤 如下: (1) 按测 验得 分排 列试 卷 , 确 定高 分组 与低 分组 , 各占总 人 数 25% ( 具体 办法 同前 ) ; (2) 分别 为高 分组 与低 分 组编制 每道 试题 的分 析表 ;(3 )按 下列 公式 计算 难 度。P (XH XL2nL )/2n(H-L) 其中XH 代 表高 分组 得分 总和 ,XL 代表 低分 组得 分总 和,n 代表总 人数 的25% ,H 为这 道题 的最 高 得分,L 为 这道 题的 最低 得分。 第 四节 区分 度 区分度 的定 义 区分度 指测 验对 考生 实际 水平的 区分 程度 , 用符 号 D 来表示 。 具有 良好 的区

23、 分度 的测验 , 实际水 平高 的应 该得 高分 ,实际 水平 低的 应该 得低 分,所 以区 分度 又叫 鉴别 力。 第三章 教育测 验的编制与实施 我国教 育工 作者 在吸 收布 卢姆目 标分 类法 合理 部分 的基础 上创 用的 认知 领域 目标有 五 分法 (知 识 、 理 解 、 应 用 、 分析综 合 、 创 造 ) 和 四分 法 (识 记 、 理 解 、 简 单应 用 、 综合运 用 ) 。 1 、识 记。 通过 牢记 、再 现 、再认 ,能 准确 地表 述所 学过的 基本 概念 、基 本原 理和基 本 知识, 能说 出它 们的 含义 或具体 内容 。 2 、理 解。 能用 自

24、己 的语 言 简述所 学过 的基 本概 念、 基本原 理, 掌握 有关 概念 、原理 的 区别和 联系 ,并 能辨 别或 判断最 基本 的问 题的 真伪 。 3 、简 单应 用。 4 、综 合运 用。 教育测 量中 的量 表一 般没 有绝对 零点 和相 等单 位, 所测的 原始 分数 没有 明确 的 意义 , 为 了正确 理解 与解 释由 测验 而来的 原始 分数 , 还须 把它 与可资 参考 的数 据或 行为 标准进 行比 较 , 才会显 示分 数的 含义 。 一、常 模的 含义 在教育 测量 学中 , 测 验的 常模 , 简 称常 模, 是指 一 个有代 表性 的样 组在 某种 测验上 的

25、表 现情况 。 二、常 模的 类型 测验的 常模 有二 类: 一是 发展常 模; 二是 组内 常模 1 、发 展常 模: 是指 某类 个 体正常 发展 过程 中各 个特 定阶段 的一 般水 平。 包括 年级常 模 和年龄 常模 二种 。 2 、组 内常 模: 是关 于一 个 与被试 同类 的群 体, 在某 种测验 所测 特性 上的 一般 表现水 平 的常模 资料 , 可 以反 映每 一个体 在其 同类 群体 中的 相对位 置。 包括 百分 等级 常模和 标准 分数 常模两 种。 三、常 模的 建立 方法 1 、年 龄常 模 如果人 的某 些能 力特 性在 不同年 龄阶 段表 现出 来的 差异具

26、 有统 计学 上的 显著 意义 , 那 么 就可以 为不 同年 龄组 建立 一个有 意义 的常 模。 2 、年 级常 模 所谓年 级常 模, 是指 不同 年级学 生在 某种 测验 上的 正常的 一般 的表 现水 平。 这样便 可用 某年级 学生 在该 测验 上的 平均分 和相 应的 年级 当量 之间的 对应 关系 来描 述某 一测验 的年 级 常模。 3 、百 分等 级常 模 百分等 级常 模是 指, 基于 某个常 模团 体, 为某 种测 验的原 始分 数与 百分 等级 之间建 立起 对应关 系的 组内 常模 。 4 、标 准分 数常 模 标准分 数是 以标 准差 为单 位 表示 测验 成绩

27、与平 均分 数之间 的距 离 。 它 是以 标准 差为单 位 度量原 始分 数离 开平 均数 的量数 , 表 示一 个原 始分 数在团 体中 所处 的相 对位 置, 亦 即在 平均 数之上 或之 下多 少标 准差 的位置 。 第四章 教 育 评价 方 案 的 编 制 与实 施 第 一节 教育 评价 的基本 原则 一、方 向性 原则 二、公 平性 原则 三、客 观性 原则 四、科 学性 原则 五、可 行性 原则 六、指 导性 原则 第 二节 教育 评价 方案的 制订 一、确 定教 育评 价指 标权 重的方 法 关键 特征 调查 法 两两 比较 法 专家 评判 平均 法 倍数 比较 法 第五章 教

28、 育 评价 信 息 收 集 与 处理 的 方 法 第 一节 收集 教育 评 价信 息的 方法 一、评 价信 息的 收集 标准 (一) 准确 性 是指采 集到 的资 料与 评价 目标的 一致 性 , 即 采集 到的 评价资 料是 否是 评价 目标 真正需 要 的资料 。 (二) 可靠 性 指收集 到的 资料 真实 可靠 , 用以 说明 评价 指标 的资 料是信 得过 的资 料, 这些 资料反 映的 情况完 全符 合客 观实 际。 (三) 时限 性 指严格 按评 价工 作所 规定 的时限 去采 集评 价信 息。 防止动 态资 料因 时间 变化 而失真 。 二、评 价信 息的 收集 方法 较常用 的

29、采 集评 价信 息的 方法有 观察 、 听 汇报 、 调 查访问 、 座 谈会 、 收 集文 字资料 、 发 问卷、 测试 等七 种。 第 二节 处理 教育 评价信 息的 方法 一、教 育评 价信 息 的 定性 分析描 述法 定性分 析描 述法 有等 级判 定法、 评语 鉴定 法和 写实 分析法 三种 。 (一) 等级 评定 法 目前有 五分 法、 四分 法、 三分法 、二 分法 等。 (二) 评语 鉴定 法 就是用 简明 的评 语来 表述 评价结 果的 方法 。 (三) 写实 分析 法 根据一 定的 评价 目标 和要 求, 对 评价 对象 的情 况进 行较为 详细 的描 述, 并在 此基础

30、上作 出恰当 评价 。 二、教 育评 价信 息的 定量 分析评 判法 可分为 统计 分析 法和 模糊 综合评 判法 。 (一) 统计 分析 法 主要用 常用 的统 计量 进行 分析, 包括 平均 数、 标准 差、标 准分 数、T 分 数、 参数估 计 (parameterestimation , 是根据 从总 体中 抽取 的样 本估计 总体 分布 中包 含的 未知参 数的 方 法)和 统计 检验 (统 计检 验是将 抽样 结果 和抽 样分 布相对 照而 作出 判断 的工 作)。 (二) 模糊 综合 评判 法 模糊综 合评 判是 将模 糊数 学应用 于教 育评 价 , 以 解决 在多因 素前 提

31、下 对模 糊数 据进行 综 合的问 题。 其基 本步 骤是 : 1 、确 定评 判的 因素 集 U 可根据 评价 指标 体系 的末 级指标 的性 质特 征和 需要 确定评 判的 因素 集 U 。 2 、确 定因 素权 数 给每个 因素 分派 一个 权数 。 3 、确 定评 价等 级 评价等 级的 划分 应允 许充 分考虑 指标 的性 质特 点。 4 、建 立因 素集 的模 糊矩 阵 在模糊 数学 中, 把矩 阵的 每一行 叫做 一个 模糊 子集 , 而每 一行 表示 一个 评价 因素的 每个 等级的 隶属 度。 将各 个模 糊子集 组合 起来 ,构 成模 糊矩阵 。 在教育 评价 中, 有的

32、现象 的外延 是模 糊的 , 如 “教 学组织 好 ” 就不 是 “ 非此 即彼 ” 的现 象, 而是 一个 模糊的 概念 。 模 糊的 现象 只能用 不精 确的方 法加 以描 述。 隶属 度就是 模糊 数 学 中用来 度量 事物 对集 合的 隶属程 度, 它可 以把 模糊 的教育 现象 数量 化。 5 、选 择评 判模 型 模糊数 学中 的评 判模 型较 多,目 前教 育测 量与 评价 领域中 常选 用的 模糊 评判 模型为 M( , )。 6 、计 算综 合评 判值 。 第 六 章 标 准 化考 试 标准化 考试 要做 到以 下四 个方面 的标 准化 :(1) 试题 编制 过 程的 标准

33、化;(2) 考 试实施 过 程的标 准化 ;(3) 评 分、 计 分过程 的标 准化 ;(4) 分 数 合成和 解释 过程 的标 准化 。 第 一节 主观 经验 性考试 的弊 端 我国是 考试 的故 乡, 目前 国际上 都公 认现 在的 考试 起源于 我国 公 元 606 年开 始实行的 , 直至本 世纪 初(1905 年) 才 废止的 科举 考试 制度 第 二节 标准 化考 试的特 点 标准化 考试 有以 下四 个主 要特点 ,凡 不具 备其 中之 一者, 就不 能称 之为 标准 化考试 。 一、试 题编 制过 程的 标准 化 标准化 考试 的试 题是 由有 关专家 组成 的班 子集 体编

34、制的。 在编 题前 ,要 明确 考试目的 , 拟出考 试大 纲, 制定 编题 计划。 然后 , 命 题人 员根 据计划 编写 好试 题, 由有 关人员 对试 题进 行初步 筛选 后组 织预 测, 并根据 预测 的结 果来 进行 统计分 析 , 取 得题目 的难 度、 区分 度等 数 据资料 , 经 预测 、 筛 选和 修改过 的符 合要 求的 题目 可以存 人题 库备 用。 最后 , 按考 试要 求从 题库中 取出 题目 拼配 试卷 。 二、考 试实 施过 程的 标准 化 标准化 考试 对考 试的 要求 是极其 严格 的, 包括 对考 试的实 施环 境、 考试 时间 以及考 试中 可能发 生的

35、 偶然 事件 的处 理方法 、 监 考人 员的 要求 等各个 方面 都要 尽量 做到 标准化 。 只 有这 样,才 能保 证公 平合 理地 对待所 有考 生, 提高 考试 的信度 。 三、标 准化 考试 的评 分、 计分方 法要 标准 化 评分、 计分 方法 是导 致考 试结果 误差 的一 个极 其重 要的因 素, 是考 试的 一个 十分重 要的 环节。 这一过 程如 达不 到标 准化 水平, 考试 也就 等于 前功 尽弃了 。 非 标准 化考 试正 是在这 一点 上不如 标准 化考 试, 从而 大大影 响了 其考 试的 质量 水平。 标准化 考试 的评 分都 可以 用机器 或采 用记 分键

36、来进 行, 机 器阅 卷只 要编 程没 有问题 , 是 绝对不 会出 现错 误的 。 因 为电脑 属于 “爆 破性 机器 ”, 一 旦出 现故 障, 评卷 就停止 了, 只要 是正常 运行 ,就 不会 出现 问题。 四、标 准化 考试 必须 编制 常模 所谓常 模, 指的 是标 准化 考试的 大样 本团 体的 成绩 的平均 数, 亦即 大样 本团 体分数 的一 般水平 。它 是我 们比 较 考 生相对 水平 的参 照点 。 到目前 为止 , 标准化 考试 还多用 于常 模参 照性 测验 , 即 注重 考生 之间的 相互 比较 , 而 常 模往往 是最 常用 的比 较标 准, 因 此, 在标 准

37、化 的常 模参照 性考 试中 , 必 须编 制常模 , 作 为解 释分数 的依 据。 第 三节 标准 化考 试的优 缺点 一、 标 准化 考试 的优 点 :1. 试卷 编制 的科 学性 ;2.试 题取样 的代 表性 ;3. 评分 的客 观 性 二、 标 准化 考试 的缺 点 :1. 能力 测试 的片 面性 ;2.题 型的僵 化性 ;3. 防止 考生 舞弊的 困 难性 ;4. 各 项质 量指 标也 存在不 完善 性。 首先 , 是 效度指 标问 题。 其次 , 是 各项指 标的 误差 问题。 再次 ,是 对猜 测的 校正问 题。 第 七 章 学 生 评价 一、学 生评 价的 涵义 学生评 价是

38、以学 生为 对象 的教育 评价 , 它 是依 据一 定的价 值标 准对 学生 的学 业成就 、 个 性发展 、 品德 状况 、 体 质 体能等 方面 进行 价值 判断 , 并 把判 断结 果反馈 于教 育实践 以改 进教 学,是 对学 生学 习进 展与 行为变 化的 评价 。 二、学 生评 价的 功能 (一) 学生 评价 是教 师评 价和学 校评 价的 重要 组成 部分 (二) 学生 评价 是促 进学 生自我 成长 与发 展的 重要 手段 (三) 学生 评价 是老 师了 解教学 得失 ,改 进教 学方 法,提 高教 学质 量的 重要 路径 (四) 学生 评价 是教 师了 解学生 的学 习困 难

39、, 帮助 学生找 出存 在问 题的 重要 方法 三、学 生评 价的 主体 和方 法 (一) 学生 自我 评价 1. 学生 自我 评价 的意 义 (1) 有利 于学 生认 识自 我 、激励 自我 、调 整自 我等 自我教 育能 力的 不断 提高 。 (2) 有利 于学 生人 格的 完 善。 (3) 有利 于学 生进 行自 我 管理。 (4) 有利 于学 生的 发展 与 提高。 2. 学生 自我 评价 的方 法 : (1) 利用 老师 提供 的评 价 项目清 单进 行自 评, 然后 写个人 总 结。 (2) 写学 习日 记。 (3)建 立学 生档 案袋 。 (二) 学生 小组 评价 1. 学生 小

40、组 评价 的意 义 (1) 是培 养学 生协 作能 力 和合作 精神 的重 要途 径。 (2) 有利 于促 进学 生自 主 学习、 自我 发展 和自 我评 价。 (3) 有利 于促 进同 伴之 间 的信息 交流 与共 同提 高。 2. 学生 小组 评价 的一 般方 法 (1) 构建 评价 小组 。应 注 意小组 成员 在性 别、 学业 成绩、 智力 水平 、个 性特 征等方 面 的合理 差异 ,一 般情 况下 ,每小 组 5-8 人。 (2) 合理 设置 评价 问题 和 内容。 小组 评价 内容 的选 择和问 题的 设计 要鼓 励所 有学生 参 与, 其 内容 不仅 应该 包括 学习活 动,

41、还应 包括 学习 以外的 内容 。 评 价时 , 先 让每个 学生 自我 评价, 然后 让评 价小 组成 员评价 ,给 每个 评价 对象 写出评 语。 评价 次数 以 3-4 周一 次 为宜 。 此外 , 开 展学 生小组 评价 , 教 师首 先要 做好充 分的 准备工 作 , 以 便对小 组评 价活动 进 行 必要的 指导 。尤 其注 重学 生之间 人际 关系 的建 立, 创造和 谐的 小组 评价 氛围 。 (三) 教师 对学 生的 评价 1. 教师 评价 学生 的优 越性 (1) 教师 具有 评价 者与 执 教者的 双重 身份 ,能 把教 学目标 与评 价目 标统 一起 来,有 利 于调节

42、 教学 ,充 分发 挥课 堂教学 的功 效。 (2) 教 师了 解学 生在 接受 知识中 智能 、 性 格、 态 度表 现出的 各种 差异 , 使 评价 更客观 , 更符合 学生 实际 ,有 利于 针对性 地诱 导与 鼓励 学生 。 (3) 教师 对学 生的 评价 是 教师帮 助、 激励 和引 导学 生自我 发展 、自 我完 善的 有效手 段 之一。 2. 教师 评价 学生 的一 般方 法 (1) 学业 成绩 测试 。要 注 意笔试 、口 试和 操作 测验 相结合 ,平 时成 绩与 终结 性测验 相 结合。 考试 的结 果最 好是 等级+ 评语 ,杜 绝利 用考 试 成绩给 学生 排序 。 (

43、2) 观察 与调 查法 。 (3) 评语 评价 法。 (4) 表现 性评 价法 。 (5) 档案 袋评 价法 。 学生学 业的 质性 评价 表现性 评价 和档 案袋 评价 是典型 的质 性评 价。 一、表 现性 评价 (一) 表现 性评 价的 概念 运用真 实的 生活 或模 拟的 评价练 习来 引发 最初 的反 应, 由高 水平 评定 者按 照一 定的标 准 进行直 接的 观察 、 评 判, 其形式 主要 包括 建构 式反 应题、 书面 报告、 作文、 演说、 操作、 实 验、资 料收 集、 作品 展示 。 (二) 表现 性评 价的 特点 主要特 点为 : 1. 表现 性评 价的 目的 既可

44、以是给 学生 评分 , 也 可以 是对学 生的 学习 情况 进行 诊断, 但其 重点是 在后 者; 2. 表现 性评 价比 较擅 长与 关注的 评价 领域 不是 知识 和技能 的回 忆与 再认 , 而是 知识和 技 能的应 用和 非智 力因 素的 发展; 3. 表现 性评 价的 问题 情境 是比较 真实 的, 需要 学生 解决的 问题 是现 实中 的问 题, 而 不是 脱离现 实情 境的 抽象 问题 ; 4. 表现 性评 价中 需要 学生 完成的 任务 一般 是比 较复 杂的 , 需 要学 生综 合运 用多 学科的 知 识和技 能来 加以 解决 ; 5. 表现 性评 价鼓 励学 生的 发散性

45、思维 ,允 许甚 至追 求答案 的多 样性 ; 6. 表现 性评 价比 较费 时费 力,需 要付 出的 时间 代价 较高; 7. 表现 性评 价容 易受 评价 主体主 观因 素的 影响 , 导致 评价结 论的 主观 性较 强 , 信 度较 低 。 二、档 案袋 评价 (一) 档案 袋评 价的 概念 学生档 案袋 评价 是一 种新 的记录 学生 成长 的评 价方 法。一 般来 说, 它根 据学 生的反应 , 以及教 师的 评价 、 观 察、 考 查、 成 绩测 验等, 得出 有关 学生进 步和 发展 的系 统而 持续的 记 录 。 (二) 档案 袋评 价的 特性 :1.目 标性 、 计 划性 与

46、组 织性 ;2.成 长性 与表 现性 ;3.整 合性 与多样 性 ;4.主 题性 与反 思性 。 第 八 章 学 生 品德 测 评 第 一节 品德 测评 概述 一、品 德测 评 品德测 评是 指根 据一 定的 目标, 运用 科学 的手 段, 对学 生 的政 治品 质、 道德 品质、 思想 品质( 包括 知、 情、 意、 行)的测 试和 评定 。 二、品 德测 评的 基本 要求 (一) 外显 行为 测评 与道 德认识 测评 相结 合 ( 二) 单项 测评 与整 体测 评相结 合 ( 三) 定性 测评 与定 量测 评相结 合 第 二节 品德 测评 的指标 体系 一、品 德测 评指 标体 系确 立的

47、依 据 ( 一)依 据社 会的 需要 ( 二)依 据德 育大 纲 ( 三)依 据品 德结 构理 论 ( 四)依 据学 生年 龄特 征 (五) 依据 成功 的德 育实 践 二、中 小学 生品 德测 评指 标体系 ( 一)构 建中 小学 生品 德测 评指标 体系 的基 本要 求 1. 重视 指标 体系 的开 放性 2. 重视 指标 体系 的教 育性 3. 处理 好普 遍性 与特 殊性 的关系 4. 处理 好稳 定性 和发 展性 的关系 5. 处理 好统 一性 和灵 活性 的关系 试构建 中小 学生 品德 测评 指标体 系。 第 三节 品德 测评 的方法 一、定 时考 核法 根据德 育的 要求 ,

48、拟 定德 育 试题, 指定 考试 地点, 在规 定的时 间内 , 按 一定 的考 试 要求, 对学生 进行 考核 。 二、问 卷测 评法 问卷测 评法 是通 过使 用问 卷或量 表测 试学 生思 想品 德的一 种方 法 。 它 包括 自编 问卷法 和 自陈量 表法 两种 。 三、项 目评 分法 项目评 分法 是设 置一 些测 试的项 目, 每一 项目 都给 予一定 的分 值, 然后 参照 这些项目 , 对学生 的思 想和 行为 表现 进行测 量。 四、情 境测 验法 这种方 法是 由教 师先 巧妙 地设计 一种 情境 , 让 学生 在这种 情境 中开 展活 动, 教师对 学生 在该条 件下 活

49、动 或反 应进 行全面 的考 察和 分析 ,据 此来对 其思 想行 为加 以衡 鉴。 五、社 会关 系测 量法 这里所 说的 社会 关系 是指 学生在 班级 或学 校社 团中 的人际 关系 。 六、意 向测 评法 意向测 评法 是测 评人 的心 理意向 的一 种方 法 。 在 品德 测评中 , 心理 意向 主要 指思 想观点 、 意见、 态度 、兴 趣、 爱好 等方面 的内 容。 七、行 为观 测法 第 九 章 教 师 评价 一、教 师评 价 教师评 价是 对教 师活 动进 行描述 和价 值判 断的 过程 。 它以 教师 行为 为目 标, 从 行为的 角 度对教 师在 教育 活动 中的 行为 进 行判 断 、 分析 和比 较。 教师 评价 与教师 考核 是有区 别的 。 教 师考核 是教 师评 价中 对教 师某项 活动 采用 的形 式。 二、教 师评 价的 主体 :1 、 教育行 政部 门 ;2、 学生 参 评 ;3 、家 长参 评 ;4 、教师 自 评 。 三、教 师评 价模 式 (一) 行为 目标 评价 模式 目标评价 模式 由早期 的教 育评价之 父泰 勒(Tyler ) 提出,因 而又 称为泰 勒模 式。其 理 论基础 是行 为主 义心 理学 。 所谓行 为目 标评 价法 就是 采用可 观

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1