1、 GY中 华 人 民 共 和 国 广 播 电 影 电 视 行 业 标 准 GY/T 298 2016 音频系统 小损伤主 观评价方 法 Methods for the subjective assessment of small impairments in audio systems (ITU-R BS.1116-3 ,MOD ) 2016 - 03 - 18 发布 2016 - 03 - 18 实施 国家 新 闻 出 版 广 电 总局 发布GY/T 2982016 I 目 次 前言 IV 引言 . V 1 范围 1 2 规 范性 引用 文件 1 3 术 语、 定义 和缩 略语 1 4 测
2、试设 计 4 5 评 价小 组的 选择 4 5.1 专家 评价 员 4 5.2 评价 员的 选择 准则 4 5.3 评价 小组 大小 5 6 测 试方 法 5 6.1 方法 概述 5 6.2 熟悉 或训 练阶 段 6 6.3 等级 评分 阶段 6 7 属性 7 7.1 单声 道系 统 7 7.2 双声 道立 体声 系统 7 7.3 多声 道立 体声 系统 7 7.4 先进 声音 系统 8 8 节 目素 材 8 9 重 放设 备 9 9.1 概要 9 9.2 基准 监听 扬声 器 . 10 9.3 基准 监听 耳机 . 11 10 听 音条 件 11 10.1 概要 11 10.2 基准 听音
3、室 11 10.3 基准 声场 条件 13 10.4 听音 声级 15 10.5 听音 安排 15 11 统 计分 析 18 12 统 计分 析结 果陈 述 19 12.1 概要 19 12.2 绝对 评分 值 19 12.3 评分 差值 19 12.4 显著 性水 平和 置信 区间 19 13 测 试报 告内 容 19 GY/T 2982016 II 附录 A (资 料性 附录 )评 价员后 筛除 的统 计学 考虑 21 附录 B (资 料性 附录 ) 评 价员专 业技 能等 级评 价 23 附录 C (资 料性 附录 )给 评价员 的主 观评 价指 导书 范例 24 GY/T 298201
4、6 III 前 言 本标准 按照GB/T 1.1 2009 给出 的规 则起 草。 本标准 使用 重新 起草 法修 改 采用ITU-R BS.1116-3 音频系 统 小 损伤 主观 评价 方法 。 本标 准 与ITU-R BS.1116-3 相比 变化 如下 : 第 3 章 的3.1 对应 ITU-R BS.1116-3 的附 录4 ; 第 8 章中 允许 的 节 目素 材 最大电 平由 ITU-R BS.1116-3 第 6 章 中规 定的 “高 于校准 电平 9dB ” 修改为 符合 GY/T 282 2014 中 规定 的“ 最大 真峰 值 音频电 平应 不超 过-2dB TP ”。
5、请注意 本标 准的 某些 内容 可能涉 及专 利。 本标 准的 发布机 构不 承担 识别 这些 专利的 责任 。 本标准 由全 国广 播电 影电 视标准 化技 术委 员会 (SAC/TC 239 ) 归口 。 本标准 起草 单位 :国 家 新 闻出版 广电 总局 广播 电视 规划院 。 本标准 主要 起草 人: 张建 东、 覃 毅力 、孙 岩 、 王倩 男 。 GY/T 2982016 IV 引 言 考虑到 : a) ITU-R BT.500 、ITU-R BS.1284、ITU-R BT.710 和 ITU-R BT.811 建议书 已经 建立了 一些 对视 音频系 统质 量进行 主 观评
6、价的 方 法; b) 有用信 号从 源端 传输 至听 众的过 程中 会产 生损 伤, 一类 主 观听 音测 试是对 损 伤带给 听 众的“ 不 悦 ”程 度进 行评 价; c) 传统 的 客观 测量 方法 不足 以评价 先进 音频 编码 系统 的声音 质量 , 因此 开发 了感 知 质量 客观 评 价 方法; d) 使用标 准 化 的方 法 有 利于 测试数 据的 兼容 和交 换, 以及对 测试 数据 的 正 确评 估; e) 一些利 用 心 理声 学 特 性的 先进数 字音 频系 统 的 新近 出现 , 尤 其是 产生 小损 伤的 数字音 频系 统 的 出现, 需要 主观 评 价 方法 的改
7、进 ; f) ITU-R BS.775 规 定的 多至 3/2 声 道的 多声 道立 体声 系统 和 ITU-R BS.2051 描 述的先 进声音 系 统 (无 论是 否伴 随有 图像 )的出 现, 需要 包括 测试 条件在 内的 新的 主观 评价 方法 。 建议: 使用本 标准 规定 的测试 、 评 价和报 告过程 对 包括 多声 道在内 的声音 系统 (无 论是 否伴随 有图 像) 的小损 伤进行 主 观评 价。 进一步 建议 : 适用于 先进 声音 系统 的听 音室和 重放 设备 的特 性有 待于进 一步 研究 , 待研 究 完成 时 , 应 根 据研 究结果 更新 本标 准。 GY/
8、T 2982016 1 音 频系统 小损伤主 观评价 方法 1 范围 本标准 规定 了 音 频系 统小 损伤的 主观 评价 方法 。 本标准 适用 于在 电视 节目 或广播 节目 的收 录、 分配 、 传送 和监 测 等 环节 , 对 小损伤 节目 (与 源节 目 对比 , 源 节目 须 可 获得 ) 或产生 小损 伤的 系统 的声 音质量 进行 主观 评价 , 也 适用于 产生 小损 伤的 编解 码 器等设 备 的 研究 和开 发。 2 规范性 引用 文件 下列文 件对 于本 标准 的应 用是必 不可 少的 。 凡 是注 日期的 引用 文件 , 仅 所注 日期的 版本 适用 于本 标 准。凡
9、 是不 注日 期的 引用 文件, 其最 新版 本( 包括 所有的 修改 单) 适用 于本 标准。 GB/T 6278 2012 声系 统 设备 概述 模 拟节 目信 号 GY/T 192 2003 数 字音 频设备 的满 度电 平 GY/T 2822014 数 字电 视节目 平均 响度 和真 峰值 音频电 平技 术要 求 (ITU-R BS.1864 : 2010 , MOD ) ITU-R BS.645 用于 国际 声音节 目链 路的 测试 信号 和电平 计量 (Test signals and metering to be used on international sound progr
10、amme connections ) ITU-R BS.708 演 播 室 监 听 耳 机 电 声 特 性 测 量 (Determination of the electro-acoustical properties of studio monitor headphones ) ITU-R BS.775 伴随 和不 伴随图像 的多声 道立体 声 声音系统 (Multichannel stereophonic sound system with and without accompanying picture ) ITU-R BS.1284 声音 质量 主观评 价通 用方 法(General
11、methods for the subjective assessment of sound quality ) ITU-R BS.2051 用 于节 目 制作的 先进 声音 系统 (Advanced sound system for programme production ) 3 术语 、 定义 和缩 略语 3.1 术语和 定义 下列术 语和 定义 适用 于本 标准。 3.1.1 片段 excerpt 适于评 价给 定被 测系 统声 音质量 的个性 特 征或 参数 的一段 音乐 、语 音或 其他 声音信 号。 测试片段 通 常为CD、R-DAT 或其他 格式 的 一 段声 音信 号。 3.
12、1.2 属性 attribute 根据给 定的 口头 或书 面定 义,听 音测 试活 动中 可感 知的特 征。 GY/T 2982016 2 3.1.3 小损伤 small impairments 必须通 过严 格控 制的 听音 测试条 件和 适当 的统 计分 析才能 觉察 到的 相比 于源 素材声 音的 微小 区 别。 3.1.4 条目 item 由被测 系统 处理 过的 一段 片段 。 3.1.5 被测对 象 object 被测系 统, 通常 以经 过该 系统处 理后 的一些 测试 片段 来代表 。 3.1.6 参考 reference 未经 被 测对 象 处 理过 的测 试 片段 ,用
13、作损 伤测 试对 比的基 准。 3.1.7 隐藏参 考 hidden reference 未向评 价员 标识 的参 考。 3.1.8 刺激 stimulus 被测对 象条 目 、 隐藏 参考 、参考 与一 个片 段的 部分 或全部 的组 合。 3.1.9 评价员 subject 在听音 测试 中评 价刺 激的 测试人 员。 3.1.10 评价小 组 listening pannel 在一个 听音 测试 中, 给出 听音测 试数 据的 评价 员的 整体。 3.1.11 地点 location 听音测 试的 执行 位置 ,指 听音室 的地 理位 置或 评价 员在听 音室 内的 位置 ,是 测试要
14、素之 一。 3.1.12 盲测 blind test 一种测 试方 法, 在该 种测 试中, 刺激 是向 评价 员提 供的唯 一信 息源 。 GY/T 2982016 3 3.1.13 双盲测 试 double blind test 盲测的 一种 ,在 该种 盲测 中,听 音测 试的 组织 者 和 听音测试 之 间没 有不 受控 制的交 互可能 。 3.1.14 等级评 分 grade 根据给 定的标 度 ,一 个属 性量级 的数 字表 示。 3.1.15 一场测 试 session 需要由 一位 评价 员或 一个 评价小 组在 一个 持续 的时 间段内 评估 的整 组试 验( 试验定 义见
15、下条 )。 3.1.16 试验 trial 一场测 试的 子集 ,该 子集 以一组 刺激 的重 放为 开始 ,以完 成对 它们 的等 级评 分为结 束。 一些定 义之 间的 关系 说明 见图 1 。 图1 一些 定义 间的 关系 GY/T 2982016 4 3.2 缩略语 下列缩 略语 适用 于本 标准 。 ANOVA 方 差分 析 (Analysis of Variance ) SQAM 声音 质量 评价 素材 (Sound Quality Assessment Material ) 4 测试设计 在科学 领域存在 很多 采集 可靠信 息的策 略 。 音频系 统小损 伤的主 观评 价 应采
16、 用最严谨 的测试 方法 , 首先要 严格 把控 测试 条件 ,其次 要把 握好 评价 员的 量化数 据。 主观测试 需 要仔 细 地 设计 和规划 , 以 避 免受 到 不 可控 因素的 影响 而产 生歧 义 。 例 如, 在听 音测 试中 , 如果 音 频条 目的 实际 顺序 对所有 评价 员都 相同 , 则 无 法确定 评价 员所 给出 的 判 断是出 于播 放顺 序 还 是出 于 不同 的损 伤等 级。 因此 ,必须 以揭 示独 立因 素 且 只包括 这些 因素 影响 效果 的方式 安排 测试 条件 。 在整个 听音 测试 中 : 如果 潜在损 伤和 其他 特性 预计 呈均匀 分布 ,
17、 则 可以 采用 真正随 机化 的方 式安 排 测试条 件 ; 如果 预计 呈非 均匀分 布, 则必须 考 虑测 试条件 的安 排方 式。 例如 , 如果 待测 素材 的难 易 程 度 不同, 则刺 激的 出现 顺序 在 一场 测试 以及 不同 场测 试 间均 应满 足随 机分 布。 听音测 试的 设计 还应 保证 提供 给 评价 员的 信息 量不 过载, 从而 避免 降低 评价 员判断 的准 确性 。 除 非 声音和 图像 间关 系十 分重 要,音 频系 统 主 观评 价 首 选无伴 随图 像 的 方式 。 测试 设 计中 还有 一项 重要 考虑 就 是采用 恰 当的 控制 条件。 比如 ,
18、 控 制条 件包 括 以评价 员不 可预 测的 方式出 现的 无损 音频 素材 。 正是从 这些 控制 刺激 与潜 在损伤 刺激 之间 的差异 判断 得出 的等 级评 分才是 真 正对 损 伤的 评价 。 有关测试 设计 的具 体考虑 见本标 准 的后 续部 分。测试 设计 、实施 和统 计分析 问题十 分复杂 ,因 此, 本标准 只能 给出 诸如 此类 的最普 遍的 指导 方针 。 建 议 在 听音 测试 之初 咨询 实验 设计和 统计 分析 相关 专家 或请专 家直 接介 入。 5 评价小 组的 选择 5.1 专家评 价员 音频系 统小 损伤 听音 测试 的 评价 数据 应全 部来 自具
19、备专业 小损 伤探察 技 能的 专家。 待测 系统 达到 的 质量越 高, 越需 要专 家进 行评价 。 5.2 评价员 的选 择 5.2.1 评价员 的选 择准 则 小损伤 声音 系统 的主 观测 试是基于 一 组经 过选 择的 评价员,其 结果 主要 不是 用 于外推 到一 般大 众 的 听音情 况 , 而是 调 查一 组 听测专 家 , 在 特定 的条 件 下, 能否 感知 相对 微弱 的 质量下 降并 给出 损伤 的定 量 估计。 对测 试过 程的 严格 控制是 为了 揭示 被测 系统 一旦投 入使 用后 , 消 费者 在 长期 不同 条件 下的 实际生 活 的使用 中 可能 会发 现
20、的 问题。 有时, 需要 在测 前或 测后 使用一 种筛 除技 术 ( 测试 之前称 为预 筛除 , 测 试之 后称为 后筛 除) , 有 时, 两种筛 除技 术都 需要 。 这 里, 筛除 是指 一种 处理 , 筛除处 理 未 通过 的某 个评 价员的 评价 结果 将全 部 被 忽 略。 任何一 种未经 仔细 分析和 应用的 筛除技 术都 有可能 导致 有 偏差的 结果 ,因此 , 一旦 发生数 据筛 除, 报告中 应清 晰描 述所 用的 筛除准 则, 以便 读者 做出 自己的 判断 。 GY/T 2982016 5 5.2.2 评价员 的预 筛除 预筛除 方法 包括 : 听 觉测 验 、
21、基 于以 往测 试中 的经 验和表 现、 基于 预测 试的 统计分 析结 果。 也可 通 过 训练 过程 进行 预筛 除。 采用 预 筛除 技术 主要 是为了 提高 听音 测试 的效 率, 但同时 会限 制结 果的 普适 性, 因 此 应 在两 者间 进 行 平衡 。 5.2.3 评价员 的后 筛除 后筛除 方法 大致 分为 两类 : 一类 是基 于个 人评 价结 果与平 均结 果 的 不一 致性 ; 另一 类 是 基于 评价 员 做出正 确辨 别的 能力 。 第 一类方 法不够 科学。 若 采 用本标 准规 定的 方法 进行 测试 , 将 自动 生成 第二 类 后 筛除方 法所 需要 的信
22、息。 评价员 后筛 除的 统计 学考 虑 参见附录 A 。 评价 员专 业 技能等 级评 价方 法参 见附 录 B。 后筛除 方法主 要用 来筛除 不能做 出正确 辨别 的评价 员。应 用后筛 除方 法 需在 测试结 果中予以 阐 明。 但是, 评价 员对 不同 类别 的 损伤 的敏 感度 是不 同的 ,筛除 操作 应谨 慎。 5.3 评价小 组大小 如果总体 方差 可 估计 且已 知 实验 精度 ,则 可以 预测 出 评价 小组 的适当 人数 ( 样本容 量) 。 经验表 明,在 听音 测试 条 件从技 术和操 作双 方面得 到严格 控制的 情况 下,20 位评价 员给出 的数 据 通常足
23、以得 出适 当的 结论 。 如果 在测 试进 程中 可进 行数据 分析 , 那 么当 达到 了得出 适当 结论 所需 的 统 计 显著性 ,则 无需 更多 评价 员的继续 参与 。 如果被测 系统 预期 达 到了 近乎透 明 ( 几无 损伤 ) 的 程度, 则需要 更多 的 评价 员, 以 保证 通过 后筛 除 的评价 员的 数目 足够 多。 如果由 于某 种原 因测试 条 件未得 到严 格控 制, 则可 能 需要更 多评 价员 的参 与 以 达到测试 所 要求 的精 度。 评价小 组 的 大小 并不 是实验 精度 的唯 一制 约因 素 。 原则上 , 按照 本标 准进 行 的测试 , 其结
24、果 仅 当实 际参加 测试 的评 价员 为 一 组听测 专家 时才 严格 有效 。 在 此前 提下 , 通 过增 加 评价小 组 的 人数 , 可能 使 测 试结果 因有 更多 听 测 专家 的参与 而显得 更 具说 服力 。 另外 , 考 虑到 存在 评价 员 对不同 类型 的 损 伤敏 感度 不同的 可能 性, 也需 要增 加评价 员的 人数 。 6 测试方 法 6.1 方法概 述 本标准 采用 “带 隐藏 参考 的双盲 三刺 激 ” 方法 ,此 方法 灵 敏、 稳定 , 有 利于 对小损 伤的 准确 探察 。 此方法 的推荐 应 用形 式也 是对损 伤探察 最 为灵 敏的 形式为 : 每
25、 次只有 一 位评 价 员从三 个刺 激 ( “A” 、 “B” 、 “C ” )中 自行 选 择 ,进 行评价 。三个 刺激 中通常 将已知 参考作为 “A” ,隐 藏 参考 和被测 对象 在 每个 试验 中随 机分 配给 “B ” 和“C ”。 测试 时 要求评 价员按 照连 续五级 损伤标 度,分 别评 价 “B ”和“ C” 相 对于 “A ”的损 伤程度 。三 个 刺激中 , “B” 和 “ C” 其 中之一 应 与 “A ”无 区别 , 另一个 刺激 可能 存在 损伤 , 该 刺激 与 “A ” 相 比任 何 可 感知 的区 别均 被解 读为 损伤。 在 这 种 推荐 形式 的测
26、试中 , 评价 员一 旦给 出一 个试 验 的评 分 就 应该 能够 直接 继续 到 下一 个试 验,而 且在做 出评 价前 片段 可重 复 播放 。由 此, 评价 员可 以自行 控制 测试 进度 。 等级 评 分标 度源 于ITU-R BS.1284 中 规定 的五 级损 伤 标度, 应视为 “ 带支 撑点 ”的连 续标 度, 见表 1。 GY/T 2982016 6 表1 ITU 五 级损 伤标 度 损伤程度 评分等级 损伤不可觉察 5.0 损伤可察觉,但不至引起不悦 4.0 损伤稍令人不悦 3.0 损伤令人不悦 2.0 损伤令人非常不悦 1.0 注:使用预定义的中间 支撑点 有可能引入偏
27、差Poulton,1992 , 也 可使用不带支撑点描述的 数字标度,但 必须标示 标度的排列方向 ,这样,可以解决 以不同语言进行的对比测试 中对支撑点描述的翻译问题。 如果不 使用 中间 支撑 点, 必须 将 个体 评价 员的 评价 结果 根 据整 体均值 和 标准 偏差进行 归 一化 处理 。 式 (1 )可 用于 在保 留原 始 标度的 同时 实现 归一 化 。 Z x x s s x i i si si s s (1) 式中 : Z i 归一 化的 结果 ; x i 评价 员 i 的 评分 ; x si 一场 测试 s 中 评价 员 i 的平 均分 ; x s 一场 测试 s 中所
28、有 评价员 的平 均分 ; s s 一场 测试 s 中所 有评价 员评 分的 标准 差 ; s si一场 测试 s 中评 价 员 i 评分 的标 准差 。 使用无 中间 支撑 点的 评分 标度时, 不 允许 以绝 对值 的形式 表示 评价 结果 。 建议评 分标度 精 确到 小数 点后一 位。 测试方 法包 括两 个部 分: 熟悉或 训练 阶段 和等级 评 分阶段 。 6.2 熟悉或 训练 阶段 进行正式 等级 评 分之 前, 评价员 应 ( 通过 训练) 完 全熟悉 测试 工具 、 测 试环 境、 等级 评 分过 程、 评 分标度 以及 评价 方法 , 还应 完全 熟悉 待辨 别 的 损伤
29、。 如 果进 行的 是最 灵敏 形 式的测 试 , 评 价员 应在正式 评分之 前听 过所 有的 测试 素材 。 在熟 悉或 训练 阶段 , 建议 评价 员组 成小 组( 如 3 人 一组 ) , 便于 自由 讨 论 察觉 到的 损伤 情况 。 附录 C 给 出 了一 套面向 评 价员的 指导 书示 例 , 示例 包括“ 带隐 藏参 考的 双盲 三刺激 ” 方 法描 述 等 。 通过正 确的 训练 , 可 以将 一些具备 初级 能 力的 评价 员转变 为适 应测 试的 专家,并 使 其在 随后 的正式等级 评分阶 段所 使用 的评 分标 准趋于 稳定 。 6.3 等级 评 分阶 段 在当天 第
30、一 场正 式等 级评 分 测试 开始 时, 应向 评价 员 口头介绍 主 观评 价 指 导书 ( 最好辅以 书 面材 料) , 还可以 展示 几个 对比 听音 示例。 中 长 期 的听 觉 记忆 并 不可靠 ,测试 过程应完 全 依赖于 短 期 记忆 。 在评 分 阶段 , 最好采用 如 附录 C 所述的 三刺 激系 统 并 结合 准瞬时 切换 的方 法 , 此类 切换要 求刺 激在时 间 线上 严格 对 齐。 注:如果连续刺激的波形不一致 , 完全的瞬时切换 可能产生人工噪声 。 因此, 推荐使用包括渐弱/ 变换/ 渐强过程在 内40ms 的准瞬时切换时间。 在最严 格的 测试 中, 每次
31、只能有 一个 评价 员参 与评 价 , 以 保障 评价 员 拥 有完 全的自 由度 在三 个刺激GY/T 2982016 7 间 随意 切换 , 这 种自 由 度 对 评价员 运用 自身 判断 力充 分 比较 每个 试验 的 刺 激间 的细微 差别 是必 不可 少 的 。 为减少 注意 力的 分散 , 评 价员 应 能够 在没 有视 觉引 导的条 件下 切换 刺激 , 如 果评价 员愿 意 , 他 完全 可以闭 上眼睛 以集 中精力 。切换 系统不 应 产 生可闻 干扰(如 “咔哒 ” 声) ,否则 将严 重影响 评价 员的评 价过程 。 尽管 本 标准 提倡 的评 价员 自行控 制试验 速度
32、 会 导致 不同评 价员 的评 分过 程耗 时不同 , 但 一场 等级 评 分 测试 不应 超 过 20 分 钟30 分钟 ,即 一 场测 试包 含 不超 过 10 次15 次 试验 。评价 员的 疲劳 是严 重影 响其判 断准 确性 的主 要因 素。 为 避免 评价 员疲 劳, 连 续 两场 测试 间的 休息 时间 不得少 于 一 场测 试的 时间。 7 属性 7.1 概述 本章列 出 了 单声 道、 双声 道 立体 声 、 多声 道 立 体声 (多 至 3/2 声道 )和 先进 声音系 统的评 估 属性 。 建议“ 基本 音频 质量 ”属 性为必 选属 性, 其 余 为可 选属性 。 对
33、每个 试验 , 如果 要求 评 价员对 一个 以上 的 属 性做 出评价 , 有可 能给 评价 员 造成应 答负 担 。 对 一个 给定的 刺激 , 如 果 由 于要 求评价 员回 答多 个问 题而 造成 了 负担 过重 , 将 导致 对所有 评价 属性 的评价结果 的 不可 靠 。 7.2 单声道 系统 基本音频质量 唯一的 全程 属性 ,用 于判断 参考 与 被 测对 象之间 一切 可察觉 的 差别 。 7.3 双声道 立体 声系 统 基本音频质量 唯一的 全程 属性 ,用 于判断 参考 与 被 测对 象之间 一切 可察觉 的 差别 。 以下为 可选 的 附 加属 性: 立体声声像质量 本
34、属性 与参考 和 被测 对象 在 音频 事件 的 声 像位 置 、 声像深 度感 和真 实感 方面 的差别 有关 。 虽然一些 研 究发 现立 体声 声像质量 有 可能 受损 , 但 没 有充足 的研究 结果 支持 将 立体声 声像 质量 与基 本音频 质量 的评 价 独 立开 来。 注: 截止到1993 年, 大多数双 声道立体声系统的小损伤主观评 估研究只是使用了基本音频质量属性, 而立体声 声像 质量属性一直是作为一个全程属性隐式或显式地包含于 基本音频质量属性 中。 7.4 多声道 立体 声系 统 基本音频质量 唯一的 全程 属性 ,用 于判断 参考 与 被 测对 象之间 一 切可察
35、觉 的 差别 。 以下为 可选 的 附 加属 性: 前方声源声像质量 本属性 与前方 声源 的 定位 相关, 它包 括立 体声 声像 质量和 清晰 度的 损失 。 环 绕声质量 本属性 与空 间感 ,环 境感 ,或者 特定 方向 的环 绕效 果相关 。 GY/T 2982016 8 7.5 先进声 音系 统 基本音频质量 唯一的 全程 属性 ,用 于判 断参考 与 被 测对 象之间 一 切可察 觉 的 差别 。 先进声 音系 统的 属性 应包 括描述 多声 道系 统的 属性 。 以下 为可 选的 附加 属性 : 音 品- 本属性尤为 重要 音品属性 可 通过 两组 特性 描述。 第一组 与声
36、音的 色彩 相关 ,如, 明亮 度、 音 色 、着 色、清 晰度 、硬 度、 均衡 度和丰 满度 。 第二组 与声 音的 均匀 度相 关, 如 , 稳定 度 、 急 剧度 、 逼真 度 、 保 真度 和动 态。 这些性质 可 以描 述 音 品 ,也 可以 描述 声音 的其 他特性 。 定位 质量 本属性 与 方 向性 声源 的定 位有关 , 包 括立 体声 声像 质量和 清晰 度的 损失 。 本 属性可 分 为 水平 定位 质 量、 垂直 定位 质量 和远 距 离定位 质量 。 在伴随 图 像 的测试 中 , 这些 属 性还 可 分为 显 示器 处的 定位 质量 和 听音 者 处的 定位 质量
37、 。 环境声质量 扩展 了环 绕 声质量 本属性 与空 间感 、 包容 感 、 环 境感 、 声场 扩散 性或者 空间 定向 环绕 效果 相关 。 本 属性 可分 为水 平环 境声质 量、 垂直 环境 声质 量和远 距离 环境 声质 量。 8 节目素 材 为揭示 被测 系统 间的 差异 应采 用 关键 性素 材 。 关键 性 素材 是指 能够 给被测 系 统造成 压力 的素 材。 不 存在可用 于 评估 所有 被测 系统的 普适 性的 节目 素材 , 因此 , 每 次测 试均 应专门为每个 被测 系统 挑选 关键 性 节目 素材。 通常 , 好素 材的挑选 相当 耗时 ,但除非 真正 为每一
38、个被 测 系统 找到 了 关键性 素材 ,否则 , 就不 能 揭示 被测 系统 间的 差 异, 测试 也不 具说 服力 。 当系统 间无 差异 的检 测 结 果可以 被接 受为 有效 之前 , 必须 从经验 上 和统 计 上 说明 , 造成 不能 发现 系 统间差 异的 原因 不是 由于 音频 素 材选 取不 当 或 其他 薄弱环 节 引 起的 测试 不灵 敏 。 极 端情 况下 , 如 果部 分 或全部 系统 的测 试结 果均 为全透 明 , 则 需要 专门 设 计带 低 质量 或中 等质 量支撑 点 (素 材) 的特殊 试验来 检验评 价员 的专 业水 平 ( 见附 录 A) 。 支撑 素
39、 材的质 量必须 是已知 的 ( 如来自 以前 的 研究 结果) , 专家 评价员 可以 察 觉而 非 专业人 员无 法 察觉 。 支撑 素材 作 为测 试 条目 , 不 仅可 用于 对评 价 人员 专 业技 能的检 查 , 还 可以用 于对 测试 环境 其他 方 面灵敏 度的 检 查 。 如果采 用第 六章 规定 的标 准测试 方法 和附 录A 规定 的统计 方法 , 所 有评 价员 均 可 正确 识别 隐式 地嵌 入在 近 乎透 明的 条目 间或 出现于 单独 安排 的测试 中的 支撑 素材,则 这可 作为 评 价员具 备 足 够专 业能 力 以 及测试 环境 其他 方面 也不 存在灵 敏
40、度 缺陷 的证 据。 因此 , 评价 员不能 区 分编 码系统 (条 目) 与未 编 码 系 统 而得出 被 测对 象 近 乎透 明的测 试结 果有效 , 表示 的是真 正的 “透明 ” 。 另一方 面 , 如 果评 价员 未 能正确 识别 出支撑 素材, 则说明 或者 是 评 价员 缺少 专业技 能 , 或者 是 测试 存在灵 敏度 缺陷 , 或 者两 者兼而 有之 。 因此 , “被 测系统 可以 透明 传输 ”的 结论 缺 乏证 据, 需要 替 换 不 能正确 识别 支撑 素材 的评 价员并 进行 有助 于提 高测 试灵敏 度的 其他 改进 ,重 新测试 。 任何可 作为 广播 电视 节
41、目 的 音频 素材 均可 纳入 关键 性素材 的选 取范 围, 但 关 键 性素材 不 应 包括 针对 特定系 统 精 心设 计的 人工 信号。 为避 免分 散评 价员 的专注 力, 节目 素材 的艺 术性和 知识 性内 容 应 既 不 引 人入胜 也不 令人 厌烦 或乏 味 。 选 取 关 键素 材 时 应考 虑 实际 广播 中 各 种素 材类 型出现 的频 率, 还应考虑将 来 广播 素材 的特性 可能 随 着音乐 风格 和大 众偏 好的 变化而 变化 。 可 利用 客观 感 知模型 辅助 进行 关键 性素 材的选 取。 GY/T 2982016 9 选择节目 素 材时 , 明确 待 评价
42、的 属性 很重 要。 应将 素材 选 择的 任务 委派 给一 组对可 能出 现的 损伤 有 基本认 识的 有经 验的 评价 员。素 材 的 初选 范围 应广 泛,还 可延 伸到 专用 的素 材 。 为了准 备主 观比 较测 试 带 , 每段片段 在 录制 到介 质之 前都需 要由 一组 专业 人员 进行主 观 的 响度 调整 , 以保证 在后 续测 试中 介质 上的所有 节 目条 目 均 可在 固定的 增益 下重 放 , 为此 , 该组专 业人 员应就 每 个测 试 片段 的相 对声 级达 成共 识, 还 应就 序列 整体 相对 于校准 电平 信号 的绝 对重 放声 级 达成 共识 。 每 个
43、录 音带的开 头都应 录制 一段 幅度为 校准电 平的 音频脉 冲(例 如 1kHz ,300ms ,-20dB FS), 用 于将其 输出 的校 准电 平 校 准至 重 放声 道要 求的 输入 校准电平 (见 10.4.1 ) 。 采 用数字 方式 录制 时, 校准 电平应 为-20dB FS , 录制 时, 还 应控 制节 目信 号的 峰值幅 度, 使其 不超过 GY/T 282 2014 规 定的 节 目 最大真 峰值 电平 最大 值(-2dB TP ) 。 录制 音频 脉冲 也 有利于 参考 刺激 和测 试刺激 的时 间对 齐。 测试片段 的 数目 取决 于具 体测试,其 最小 值为5
44、, 合 理估算 值为 被测 对象 数目 的 1.5 倍, 一项 测试 中 的片 段数 对每 一 被 测对 象 应 相 同。 音频 片段 的典 型时长 为 10 秒 至 25 秒。 挑选关 键性 素材 任务 复杂 , 应合理 制定 时间 表, 且保 证 被测 对象 随时 可用 。 对于单 声道 和立 体声 系统 的评估 , 如果 片段 选自 易 于获得 的音 频源 ( 如SQAM 激光唱 片) , 则 更方 便 随时进行 测 试带 素材 与原 始素材 的对 比检 查 。 但 是 , 相 比于 音频 源是 否容 易 获得 , 使 用真 正的 关键 性 素 材 才是 更为 重要 的。 在双 声 道重
45、 放条 件下 多声 道系统 的性 能测 试应 使用 参考下 混系 数。 使用 固定 下混系 数, 尽管 有时 会 起 到 限制 作 用, 但 从 长 远来 看 , 无 疑 是广 播业 者 最明 智 的选 择 。参考 下 混 等式 (式 (2 ) ,来 自 建 议书 ITU-R BS.775 ) 为: L 0 =1.00L+0.71C+0.71L S R 0 =1.00R+0.71C+0.71R S (2 ) 测试先 进声 音系 统时 , 先 进声音 系统 下混 至双 声道 或多声 道系 统所 用的 下混 等式 , 或者 是 将 音频 对 象 提供 至具体 声 道的 执行 过程 , 应在 测试
46、报告 中加 以描述 。 对 使 用 参考 下混 等式 生成 的双声 道性 能进行 评估 时, 测试片段 的 预选 应基 于下 混 生成 的双 声道 节目 素材的 重放 。 9 重放设 备 9.1 概要 基准 监 听扬 声器 或耳 机的 选择目 标为 : 所 有声 音节 目信号 或其他 测 试信 号都 能以最 佳效 果重 放。 也 就是说 , 对 任何 重放 都应 产生中 性的 声音 ,并 且可 用于单 声道 ,双 声道 和多 声道立 体声 系统 的评 价。 某些声 音质 量缺 陷在 使用 耳机重 放时 更容 易被 感知 , 另 一 些在 使用 监听 扬声 器时更 容易 被感知。因 此,有 必要
47、通过 主 观预测 试确定 适当的 重放 设备类 型。 特 别是 是 当质 量缺陷 表现在 立体声 声像 特性时 , 应使用 扬声 器重放 。 评价双 声道 立体 声系 统时 , 使 用立 体声 扬声 器和 耳 机; 评价 单声 道系 统时 , 使用一个 中 置扬 声器 和 ( 或) 耳机 。 对 单 个 试验 或成 组试验 来 说, 如 果监 听扬 声器 与耳 机只能 选择 其一 , 那 么 听 音效果 可能 受 到 换能 器 的影响 而 使 评价 员的 有效 人数减少 。 如果 评价 员可 以在监 听扬 声器 与耳 机间 随意切 换, 则可 免受 换 能 器 的影响 。 对于伴随 和 不伴随
48、 图像 的 多声道 声音 系统 和先 进声 音系统 , 如 果 待 评价 项为 所 有声道 同时 重放 时的 影响, 则应 使用 扬声 器。 在相关 频 率 范围 内, 所用 每个 扬声 器都 必须 在声学 特性 上相 匹配 , 以 保证 彼此 间 的固有 音色 差最 小。 GY/T 2982016 10 9.2 基准 监 听扬 声器 9.2.1 概要 基准 监 听扬 声器 是指 高质 量的演 播室 监听 设备 , 由 放 置在特 定尺 寸机 箱内 的配 备专业 均衡 器的 扬声 器系统 集成 单元 、高 质量 功放和 分频 网络 组成 。 监听扬 声器电 声特 性必须 满足如 下最低 要求
49、(测量 于自由 场) 。 如无特 殊规定 ,绝对 声级在 距离 声 中心 1 米处 测量 。 注: 声中心是用于测量用途的 参考点,通常对应扬声器最高频率辐射面的几何中心点,应由生产商标明。 9.2.2 电声要 求 9.2.2.1 幅频响 应 以粉红 噪声 为信 号源 , 在 40Hz 16kHz 范围 内, 主 声轴方 向 ( 方向 角 为 0 ) 处每三 分之 一 倍 频带 上测 量 的幅 频 响 应容 限应 为一个 不超 过4dB 的 通带 ; 10方向 角 ( 与主 声轴 夹 角) 处 测量 的频 响曲 线与 主 声轴 方向 的差 值 ( 仅限 同一水 平面 内) 不应 超 过3dB ;30 方向 角 的差 值不 应超 过4dB 。 不同扬 声器 的幅频 响 应应 一致 , 至少 在250Hz 2kHz 的频 率范 围内 , 不 同扬 声 器 频响 的差 值不 应超 过 1.0dB 。 9.2.2.2 指向性 指数 以三分 之一 倍频 带噪 声测 量的 指 向性 指 数C,在 500Hz 10kHz 频率 范围 内应 满足: 6dB C 12dB 指向性 指数 应随 着频 率平 滑上