1、 ICS 35.240 CCS L 70 37 山东省 地方标准 DB37/T 4274 2020 公共信用信息 数据归集规范 Public credit information Specification for data collection 2020-12-25 发布 2021-01-25 实施 山东省 市场监督管理局 发 布 DB37/T 4274 2020 I 目 次 前言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 缩略语 . 1 5 归集原则 . 1 6 归集流程 . 2 6.1 概述 . 2 6.2 数据采集 . 2 6.3 数据清洗 .
2、 3 6.4 数据比对 . 3 6.5 数据关联 . 3 6.6 数据入库 . 3 7 归集内容 . 3 8 安全措施 . 3 参考文献 . 4 DB37/T 4274 2020 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1部分:标准化文件的结构和起草规则的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由山东省发展和改革委员会提出、归口并组织实施。 本文件起草单位:山东省社会信用中心、山东省计算中心(国家超级计算济南中心)、山东新一代 标准化研究院有限公司、山东省标准化研究院、山东赛宝电子信息工程有限责任公司、浪潮
3、软件集团有 限公司。 本文件主要起草人:燕纪煌、王军、王欢、逄锦山、周才云、张媛、王春梅、王正、杨仁华、马健、 李芸、杜鹃、蒋延花、张琳静、崔爱军、贺志强、东厚伟、高辉、刘永光、隋泽旭、高建英、张逊。 DB37/T 4274 2020 1 公共信用信息 数据归集规范 1 范围 本文件规定了公共信用信息的归集原则、归集流程、归集内容及归集安全措施等内容。 本文件适用于山东省各级公共信用信息的归集,归集后的公共信用信息可用于公共信用档案的建立、 公共信用评价等工作。 2 规范性引用文件 下列文件中的内容通过文中的规 范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适
4、用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 35273 2017 信息安全技术 个人信息安全规范 3 术语和定义 下列术语和定义适用于本文件。 3.1 公共信用信息提供单位 public credit information providing organizations 在依法履行公共管理职责、提供公共服务过程中产生或者获取信用信息的国家机关、法律法规授权 的具有管理公共事务职能的组织以 及人民团体等单位。 3.2 公共信用信息归集单位 public credit information collecting organizations 对法人和
5、其他组织、自然人的公共信用信息进行归集的各级公共信用信息机构。 3.3 公共信用信息归集 collection of public credit information 公共信用信息归集单位对公共信用信息收集、汇总的行为。 4 缩略语 下列缩略语适用于本文件。 CSV:字符分隔值( Comma-Separated Values) FTP:文件传输协议( File Transfer Protocol) XML:可扩展标记语言( Extensible Markup Language) 5 归集原则 公共信用信息的归集应遵循以下原则: a) 合法性:应以符合国家法律、法规的途径归集公共信用信息,不应
6、归集、披露法律法规禁止 的公共信用信息; DB37/T 4274 2020 2 b) 保密性:公共信用信息归集过程,不应泄露国家秘密,不应侵犯商业秘密和个人隐私; c) 完整性:公共信用信息在归集过程中,应保证准确无缺失,不应被非法修改和破坏; d) 可用性:应保证归集的公共信用信息能满足使用需求; e) 客观性:归集的公共信用信息应能客观反映出信用主体的真实信用状况。 6 归集流程 6.1 概述 公共信用信息的归集包括采集、清洗、比对、关联、入库等环节。各环节具体要求参见本文件 6.2-6.6 节。 6.2 数据采集 6.2.1 基本要求 公共信用信息的采集,应满足以下基本要求: a) 公共
7、信用信息归集单位应事先公开信息采集程序,操作过程应透明; b) 公共信用信息归集单位应与提供单位约定被采集公共信用信息的格式; c) 公共信用信息归集单位应记录采集对象、采集时间、采集方式、采集人员等信息; d) 公共信用信息提供单位应对其提供的公共信用信息真实性、准确性负责。 6.2.2 采集方式 6.2.2.1 概述 公共信用信息的采集应基于共享交换平台实现,其采集方式包含但不限于:库表方式、接口方式、 数据文件方式、数据直报方式等,数据经采集后进入原始库。 6.2.2.2 库表方式 库表方式采集信息的具体流程为: a) 在提供单位端、归集单位端前置机部署相关应用程序; b) 双方按照约定
8、的规则,分别创建对应的数据表结构; c) 双方约定采集的内容、时间和频率; d) 公共信用信息提供单位推送公共信用信息至归集单位端前置机,或公共信用信息归集单位通 过视图等方式主动抓取; e) 公共信用信息归集单位接收推送来的公共信用信息; f) 公共信用信息归集单位端前置机 将采集到的数据汇总、质量审核、标准化并存储。 6.2.2.3 接口方式 公共信用信息提供单位将公共信用信息封装为接口,公共信用信息归集单位通过调用接口采集公共 信用信息。 6.2.2.4 数据文件方式 数据文件方式采集的途径包含但不限于: FTP服务、邮件、介质等途径。 6.2.2.5 数据直报方式 DB37/T 427
9、4 2020 3 公共信用信息归集单位将待采集的公共信用信息以网页表单形式发布 ,公共信用信息提供单位填写 表单后,提交至公共信用信息归集单位。 6.3 数据清洗 公共信用信息归集单位应事先约定数据清洗的规则,并按约定规则对采集的信用信息进行规范性、 完整性、合理性校验,包括但不限于缺失值数据 清洗和错误数据清洗。 6.4 数据比对 公共信用信息归集单位应对多个来源的数据进行比对,以识别不同数据源间是否存在差异。 6.5 数据关联 公共信用信息经清洗、比对后,应以自然人身份证件号码、法人和其他组织统一社会信用代码为唯 一关联码,对每一信用主体的信用信息进行关联,形成覆盖多信源的、完整的信用数据
10、链条。 6.6 数据入库 公共信用信息数据经清洗、比对、关联等操作后,应将信用信息推送至信用标准库,并记录操作日 志。 7 归集内容 公共信 用信息归集内容包含法人和其他组织、自然人信用信息,其中法人和其他组织公共信用信息 归集内容参见 DB37/T 4275.1 2020公共信用信息 数据规范 第 1部分:法人和其他组织第 4章, 自然人公共信用信息归集内容参见 DB37/T 4275.2 2020公共信用信息 数据规范 第 2部分:自然人 第 4章。 8 安全措施 个人信息处理应符合 GB/T 35273 2017的规定。 DB37/T 4274 2020 4 参考文 献 1 DB37/T 4275.1 2020 公共信用信息 数据规范 第 1部分:法人和其他组织 2 DB37/T 4275.2 2020 公共信用信息 数据规范 第 2部分:自然人