1、ICS 01.140.40 A19 CY 中 华 人 民 共 和 国 新 闻 出 版 行 业 标 准 CY/T 188 2019 基于 CNONIX 的数据验证规范 Specifications for data verification based on CNONIX 2019 - 06 - 27 发布 2019 - 07 - 01 实施 国家新闻出版署 发布 CY/T 188 2019 I 目 次 前言 II 1 范围 1 2 规范性引用文件 1 3 术语和定义 1 4 验证原则 2 5 验证内容 2 5.1 英文标签 2 5.2 数据组顺序 2 5.3 数据类型和长度 2 5.4 必选数
2、据 2 5.5 元素关联性 2 5.6 代码值验证 3 6 验证方法及验证流程 3 6.1 验证方法 3 6.2 验证流程 3 7 验证结果 4 7.1 结果形式 4 7.2 实时反馈结果 4 7.3 验证报告 4 附录 A(资料性附录) XSD模版示例 5 附录 B(规范性附录) 验证报告模版 8 附录 C(资料性附录) 数据验证示例 9 CY/T 188 2019 II 前 言 本标准 按照 GB/T 1.1 2009给出的规则起草 。 本标准由全国出版物发行标准化技术委员会( SAC/TC505)提出并归口。 本 标准 起草单位:北方工业大学、 北京拓标卓 越信息技术研究院。 本 标准
3、主要起草人:丁瑜、 唐贾军、姜 莎 、 何丽 、吴洁明 、安秀敏 。CY/T 188 2019 1 基于 CNONIX 的数据验证规范 1 范围 本标准规定了 CNONIX图书产品数据的验证原则、验证内容、验证方法、验证流程和对验证结果的管理。 本标准适用于 CNONIX国家标准应用及相关系统的数据验证工作。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件 , 仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 30330 2013 中国出版物在线信息交 换 图书产品信息格式规范 3 术语和定义 下列术语和
4、定义适用于本文件。 3.1 在线信息交换 online information exchange; ONIX 欧洲电子数据交换组织( EDItERU, European Electronic Data Interchange group)发布的用于出版物产品信息交换的标准。 GB/T 30330 2013, 定义 3.1 3.2 中国出版物在线信息交换 图书产品信息格式规范 China online information exchange for publications; CNONIX 根据国际 ONIX标准研制的、适用于中国国情的出版物在线信息交换的标准。 3.3 复合元素 compos
5、ite 由若干个关联的元 素 组成的数据集合。 GB/T 30330 2013,定义 3.2 3.4 数据组 data group 一组相同业务属性的元素和复合元素。 GB/T 30330 2013,定义 3.4 3.5 CY/T 188 2019 2 XML结构定义 XML Schemas Definition; XSD 描述和定义 XML文档内容的 XML语言。 4 验证原则 CNONIX图书 产品 数据验证应遵循以下原则: a) 有效性原则,验 证数据内容取值在规定范围内; b) 完整性原则, 应有的数据内容不缺失,并且数据之间的关系完备; c) 一致性原则, 验证数据内容描述规范、统一
6、,无歧义性。 5 验证内容 5.1 英文标签 英文标签的 验证 包括: a) 正确性 。英文标签应是 GB/T 30330 2013中 规定的标签 , 拼写无误 ; b) 完整性 。 数据内容不为空 时, 开始标签和结束标签需成对出现 ; 数据内容为空时,用空元素标签表示。 5.2 数据组顺序 验证数据组 的顺序、 数据组中元素 的 顺序 , 顺序 应符合 GB/T 30330 2013的 规定。 5.3 数据类型和长度 依据 GB/T 30330 2013的 规定 , 验 证每一个 数据 元素的取值类型和长度, 数据 元素 取 值 类型 为字符型时 应遵循 GB/T 30330 2013中
7、4.3的相关规定 。 示例: 数据元素 ,按照 可运算实数 类型进行验证 ,且长度不超过 12 位 。 5.4 必选数据 必选数据 元素 的验证 内容如下 : a) 标签必选性 验证。应依据 GB/T 30330 2013规定的标签必选性和可重复性进行验证。 b) 数据必选性 验证。 应 依据 GB/T 30330 2013 中的规定以及被 验证数据在 其业务 阶段的必选性进行验证 。 5.5 元素关联性 应 依据 GB/T 30330 2013中的相关规定,对被验证数 据 元素 进行 关联 性验证 。 数据 元素之间的关联关系 是 指 :当 一个 数据 元素出现时另一个 数据 元素 也必须
8、出现。 示例: 元素出现时, 元素 必须 出现。 数据 元素取值的关联关系包含 2个方面: a) 当 一个 数据 元素取特定值时,另一个 数据 元素应必选 。 示例: 数据元素 ,当其取值为 03 时,应对 、 数据元素 进行必选性验证;当其取值 04 时, 、 数据元素为 可选。 b) 当 一个 数据 元素取特定值时,另一个 数据 元素的取值范围 是 确定 的 。 示例: 数据元素 ,当其 取值为 15 时, 数据元素 ,取值是 9787111421900。数据元素CY/T 188 2019 3 的取 值 是 13 位国际标准书号。 5.6 代码值验证 当 被验证数据 元素 取值是 代码时,
9、应 依据 GB/T 30330 2013的 代码表 验证其取值 范围 的正确性 。 6 验证方法及验证流程 6.1 验证方法 CNONIX数据的语法结构可用 XSD进行验证。附录 A.1是依据 GB/T 30330 2013生成的 数据 元素 验证 模 版 XSD示例 ; 附录 A.2是依据 GB/T 30330 2013生成的 数据 元素 代码值验证 模版 XSD示例。图书 产品 数据的逻辑结构应根据实际情况进行判断 。 数据验证的示例 见 附录 C。 6.2 验证 流程 CNONIX图书 产品 数据验证流程 如下 : a) 数据 元素标签验证,读取 数据 元素标签,加载 XSD模版,验证标
10、签 的 正确 性 ; b) 根据被验证数据的上下文,验证 数据组 标签 顺序 的正确性; c) 解析 数据元素的 标签内容,判断必选 数据元素是否缺失 ; d) 验证 数据 元素的 类型 和 长度 的正确性 ; e) 验证数据 元素 之间应有的 关联性; f) 验证数据元素 代码取 值 范围的正确性 。 验证流程如图 1所示。 CY/T 188 2019 4 开 始读 取 元 素 英 文 标 签数 据 组 顺 序是 否 正 确结 果 记 录是 否 元 素 结 束解 析 元 素 内 容否数 据 类 型 及 长 度 是 否 正 确否是结 果 记 录否元 素 关 联 性 是 否 正 确是X M L
11、是 否 结 束是汇 总 结 果 记 录是结 束否是否标 签 是 否 正 确是否是 否 缺 失 必 填 数 据否是取 值 是 否 为 代 码 表验 证 代 码 表 值是否代 码 表 取 值 是 否 正 确否结 果 记 录是图 1 验证流程 7 验证结果 7.1 结果形式 验证 的 结果 有 实时反馈结果 和 验证报告 两种 。 7.2 实时反馈结果 交互式操作的数据验证应实时反馈验证结果。 7.3 验证报告 数据验证 报告 应 包含: 被验证 数据、验证 日期 、验证结果 和说明 等 。 验证报告模版参见附录 B。 CY/T 188 2019 5 A A 附 录 A (资料性附录) XSD 模版
12、示例 A.1 数据 元素 验证 模版示例 A.2 代码表验证模版示例 通告或更新类型代码表选题预告 CY/T 188 2019 6 出版前发布的选题预告信息的完整记录。 提前通告。 出版前发布的选题预告确认的完整产品记录。出版确 认公告 出版或即将出版时提前发布的被确认的完整产品记录。更新 对更新部分记录的发送。在发送 “ 产品描述、产品营销、产品内容、产品出版、相关资料和产品供应 ” 六部分数据时使用 。 删除 发送删除记录的指令。使用注意事项: 1)当产品取消、绝版或类似原因不再销售时不能使用,应采用供应状态变更处理,由接收方决定是否保留记录; 2)删除指令仅用于由于特殊原因应撤销产品的情
13、况,如发行差错。 出售通知 由出售产品的出版者发送给另一个出版者。 获取通知 由获取产品的出版者发送给另一个出版者。 CY/T 188 2019 7 CY/T 188 2019 8 B B 附 录 B (规范性附录) 验证报告模版 验证报告编号 CNONIX 版本号 验证日期 验证机构名称 验证 数据 验证记录 错误位置 (错误出现的行和列) 错误类型 (标签错误、数据类型和长度错误) 错误建议 (给出修正错误的建议) 验证结果 验证结论 无错误 有错误 错误类型 标签错误 个 数据类型和长度错误 个 数据组顺序错误 个 元素关联性错误 个 代码 值错误 个 CY/T 188 2019 9 C
14、 C 附 录 C (资料性附录) 数据验证示例 C.1 标签验证示例 1 2 3 4 5 S 出版社 6 7 20090408 8 9 10 验证结论: 第 5行 标签没有闭合,没有成对出现,第 7行 不是正确的标签,应为,第 7行标签没有闭合不是成对出现。 C.2 数据类型和长度示例 1 2 3 4 5 S 出版社 6 7 20090408T10:41:32 8 2 9 CN 10 11 CY/T 188 2019 10 12 验证结论: 第 7行时间类型错误,时间允许格式为: g) YYYYMMDD; h) YYYYMMDDTHHMM; i) YYYYMMDDTHHMMZ(国际时间); j
15、) YYYYMMDDTHHMM+HHMM(时区); 第 9行数据长度不正确,应为 3位的字符。 C.3 数据组顺序验证示例 1 2 3 4 5 S 出版社 6 7 20090408T1041 8 CNY 9 2 10 11 12 验证结论: 第 9行元素顺序不正确,应出现在第 8行元素之前。 C.4 必选元素验证示例 1 2 3 4 5 S 出版社 CY/T 188 2019 11 6 7 8 9 验证结论: 缺失必选数据元素 。 C.5 元素关联性验证示例 1 2 3 4 发送方 5 S 出版社 发送方为: S 出版社 6 7 接收方 8 K 接收方为: K 9 10 2 消息序号为: 2
16、11 20090408 消息创建时间为: 2009 年 4 月 8 日 12 13 14 1354 15 03 16 17 01 18 选题号 19 B2100001200900001 20 21 22 15 CY/T 188 2019 12 23 国际标准书号 24 200900001 25 26 27 00 单本图书 28 01 平装 29 30 01 题名类型为正题名 31 32 01 产品层面的题名 33 现代教育技术教程 正题名 34 35 36 37 A01 第一作者,著 38 张三 39 40 41 B16 责任编辑 42 李一 43 44 1 版次 45 46 01 正文语种
17、47 chi 语种 48 Hani 文字 49 50 51 02 字词数 52 200000 CY/T 188 2019 13 53 02 字数 54 2 55 56 57 20 关键词 58 关键词 1 59 教育技术 60 61 青年 读者范围 62 63 64 65 01 出版者角色:出版者 66 S 出版社 出版社名称 67 68 02 69 北京 70 CN 中国 71 72 73 验证结论: 第 24行元素 取值错误,应为 去除分隔符后 13位国际标准书号。由于 15行元素取值为 03, 72行缺少必选元素 。 C.6 代码值验证示例 1 2 3 4 发送方 CY/T 188 20
18、19 14 5 S 出版社 发送方为: S 出版社 6 7 接收方 8 K 接收方为: K 9 10 3 消息序号为: 2 11 20090408 消息创建时间为: 2009 年 4 月 8 日 12 13 14 1235 15 04 16 17 15 18 国际标准书号 19 9787514915686 20 21 22 00 单本图书 23 01 平装 24 25 01 题名类型为正题名 26 27 01 产品层面的题名 28 英雄少年传 正题名 29 30 31 32 33 34 CY/T 188 2019 15 02 35 36 01 37 200904 38 39 40 41 42 09 43 A 出版社 44 45 30 46 47 01 48 05 49 35 50 CNY 51 52 53 54 55 验证结论: 第 47行元素 取值错误, 01不是代码表价格类型代码表中可选值 。 _