1、 ICS 35.240 L 70 DB52 贵州省地方标准 DB52/T 14082019 政府数据 开放数据质量控制过程和要求 Governmental data-The process and requirements for the quality control of open data 2019 - 04 - 30 发布 2019 - 11 - 01 实施 贵州省市场监督管理局 发布 DB52/T 14082019 I 目 次 前言 . . II 1 范围 . . 1 2 规范性引用文件 . . 1 3 术语和定义 . . 1 4 控制环节 . . 2 5 要求 . . 3 6 评价
2、 . . 4 DB52/T 14082019 II 前 言 本标准按照GB/T 1.12009标准化工作导则 第1部分:标准的结构和编写给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由贵阳市大数据发展管理局提出。 本标准由贵州省大数据标准化技术委员会归口。 本标准起草单位:贵阳市信息产业发展中心、贵阳市大数据发展管理局、贵州省机械电子产品质量 监督检验院、中国电子技术标准化研究院、云上贵州大数据产业发展有限公司、贵州中软云上数据技术 服务有限公司、中电科大数据研究院有限公司、贵州师范大学、深圳太极云软技术股份有限公司。 本标准主要起草人
3、:曹谦、黄明峰、林丽建、刘军、李祥、赵小创、尹卓、张群、禹忠、秦晓东、 陈贵平、耿小璐、张智、戚婉君、熊娅孜、刘春泉、王进。 DB52/T 14082019 1 政府数据 开放数据质量控制过程和要求 1 范围 本标准规定了政府数据 开放数据质量的控制环节、要求和评价。 本标准适用于贵州省政府数据 开放数据的质量控制。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 36344 信息技术 数据质量评价指标 DB52/T 1123 政府数据 数据分类分级指南
4、 DB52/T 1125 政府数据资源目录 第2部分:编制工作指南 DB52/T 1126 政府数据 数据脱敏工作指南 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据 data 对事实、概念或指令的一种形式化表示,适用于以人工或自动方式进行通信、解释或处理。 3.2 开放数据 open data 可为其他数据使用的数据。 GB/T 352952017,定义2.1.44 3.3 数据质量 data quality 在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。 GB/T 25000.122017,定义4.3 3.4 完整性 integrity 保护资产准确性和完备性的性
5、质。 DB52/T 14082019 2 3.5 数据字典 data dictionary 收集有关数据的信息,如名称、描述、创建者、所有者、出处、不同语言的翻译以及用法。 3.6 数据模型 data model 对分析的图像和文本表述,该分析识别了组织为完成其使命、功能、目标、目的和战略,以及管理 和评价组织所需要的数据。 注:在从高到低的不同抽象层次表示数据时,通常会区分概念模型(与某些努力相关的概念组成的模型)、逻辑模 型和物理模型。 3.7 数据标准 data standard 数据的命名、定义、结构和取值的规则。 3.8 数据服务 data service 数据资源通过特定的加工后形
6、成可供用户使用的各类服务。 注:数据服务包括数据预览、数据查询、数据下载、数据调用等。 4 控制环节 政府数据开放数据质量控制过程包括数据生成、数据传输、数据清洗加工、数据存储、数据服务和 数据销毁共六个环节,覆盖政府数据开放数据全生命周期的各个环节,政府数据开放数据生命周期图见 图1。 图1 政府数据开放数据生命周期图 数据生成 数据清洗加 工 数据存储 数据服务 数据销毁 数据传输 政府部门 政府数据开放平台 DB52/T 14082019 3 5 要求 5.1 数据生成环节 数据生成环节按下列要求: a) 宜实现数据的电子化、系统化建设及管理; b) 应按 DB52/T 1125 建立数
7、据资源目录; c) 应按 DB52/T 1123 进行数据分类分级; d) 数据的命名、定义和表示应符合已发布的数据模型、数据字典、业务术语、数据项、参考数据 等数据标准的要求; e) 数据应满足业务需求; f) 数据应满足规范性、完整性、准确性、一致性、时效性和安全性等要求。 5.2 数据传输环节 数据传输环节按下列要求: a) 应采取必要的数据安全传输手段,预防数据被篡改、损坏、泄露等恶意攻击; b) 应采取数据异常监测、断点续传等控制方式,并按数据更新频率及时更新数据; c) 数据应满足规范性、完整性、准确性、一致性、时效性和安全性等要求。 5.3 数据清洗加工环节 数据清洗加工环节按下
8、列要求: a) 应按规范流程执行数据清洗加工、标准化、格式化等操作; b) 数据脱敏应按 DB52/T 1126 执行; c) 数据应满足规范性、完整性、准确性、一致性、时效性和安全性等要求; 5.4 数据存储环节 数据存储环节按下列要求: a) 应支持文件的分布式存储机制和分布式数据库系统的存储; b) 应支持结构化数据和非结构化数据的存储; c) 应支持包括批量、交互查询、实时流、内存计算等典型的大数据场景的存储; d) 应支持大数据存储的可靠性、可管理和安全等总体要求; e) 数据应满足规范性、完整性、准确性、一致性、时效性等要求。 5.5 数据服务环节 数据服务环节按下列要求: a) 数据应满足规范性、完整性、准确性、一致性、时效性等要求; b) 数据应满足可访问性要求,确保数据在需要时的可获取; c) 数据应满足可用性要求,确保数据在设定有效生存周期内的可使用。 5.6 数据销毁环节 数据销毁环节按下列要求: a) 数据销毁应符合组织的内外部业务需求和监管需求; b) 数据销毁应兼顾信息技术对存储容量、访问速度、存储成本等需求; DB52/T 14082019 4 c) 应建立数据销毁策略; d) 数据销毁应符合流程规范。 6 评价 政府数据开放数据质量控制过程中的数据质量特性评价应按GB/T 36344的规定进行。 _ DB52/T 1408-2019