DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf

上传人:diecharacter305 文档编号:1523609 上传时间:2021-11-28 格式:PDF 页数:20 大小:1.17MB
下载 相关 举报
DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第1页
第1页 / 共20页
DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第2页
第2页 / 共20页
DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第3页
第3页 / 共20页
DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第4页
第4页 / 共20页
DB32 T 4040.1-2021 政务大数据 数据元规范 第1部分:总则.pdf_第5页
第5页 / 共20页
亲,该文档总共20页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 35.020 CCS L72 DB32 江苏省 地 方 标 准 DB 32/T 4040.1 2021 政务大数据 数据元规范 第 1 部分:总则 Big Data of Administrative Specification for Data Elements Part 1:General 2021-05-14 发布 2021-06-14 实施 江苏省市场监督管理局 发布 DB32/T 4040.1-2021 I 目 次 前 言 . II 1 范围 . 1 2 规范性引用文件 . 1 3 术语和定义 . 1 4 数据元和代码集的表示规范 . 2 4.1 数据元的属性概述 . 2 4

2、.2 数据元属性的描述方法 . 3 4.3 数据元标识类属性 . 4 4.4 数据元定义类属性 . 6 4.5 数据元关系类属性 . 6 4.6 数据元表示类属性 . 7 4.7 数据元管理类属性 . 10 4.8 数据元附加类属性 . 11 4.9 代码集标识符 . 12 5 数据元的设计方法 . 12 5.1 数据元和数据元属性的提取 . 12 5.2 数据元的分类规则 . 12 5.3 数据元的命名规则 . 12 6 数据元的维护和扩展方法 . 13 6.1 数据元维护策略 . 13 6.2 新增数据元 . 13 6.3 变更数据元 . 14 6.4 废止数据元 . 14 7 数据元的使

3、用方法 . 14 参考文献 . 16 DB32/T 4040.1-2021 II 前 言 本文件按照 GB/T 1.1 2020标准化工作导则 第 1 部分:标准化文件的结构和起草规则的规 定起草。 DB32/T 4040政务大数据 数据元规范分为 7 个部分: 第 1 部分:总则; 第 2 部分:公共数据元; 第 3 部分:综合人口数据元; 第 4 部分:综合法人数据元; 第 5 部分:社会信用数据元; 第 6 部分:电子证照数据元; 第 7 部分:自然资源和空间地理数据元。 本文件为政务大数据 数据元规范的第 1 部分。 本文件由江苏省大数据管理中心提出。 本文件由江苏省政务服务管理办公室

4、归口。 本文件起草单位:江苏省政务服务管理办公室、江苏省大数据管理中心。 本文件主要起草人:赵明、陈俊、宋裕官、何正庆、王旭、徐建荣、刘瑛、韩骉、邱玉婷、杨坤、 尤慧、朱小燕、朱珠、姚丹、刘伟、王子文、刘晓红、纪雅莉、张献彬、张永丽、张媛媛、张树楠。 DB32/T 4040.1-2021 1 政务大数据 数据元规范 第 1 部分:总则 1 范围 本文件规定了政务数据元(以下简 称数据元)的概念和组成、数据元和代码集的表示规范、数据元 的设计方法、数据元的维护和扩展方法、数据元的使用方法。 本文件适用于政务数据元的编制、使用和扩展。 2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成

5、本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T 18391.1 2009 信息技术 元数据注册系统( MDR) 第一部分:框架 GB/T 19488.1 2004 电子政务数据元 第 1 部 分:设计和管理规范 GB/T 35295 2017 信息技术 大数据 术语 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据 data 信息的可再解释的形式化表示,以适应于通信、解释或处理。 注: 数据可以由人工或自动的方式加工、处理。 来源: GB/T 18391.1 2009, 3.

6、2.6 3.2 大数据 big data 具有体量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含 大量数据集的数据。 注: 国际上,大数据的 4 个特征普遍不加修饰地直接用 volume、 variety、 velocity 和 variability 予以表述,并 分别赋予了它们在大数据语境下的定义: a) 体量 volume:构成大数据的数据集的规模; b) 多样性 variety:数据可能来自多个数据仓库、数据领域或多种数据类型; c) 速度 velocity:单位时间的数据流量; d) 多变性 variability:大数据其他特征,即体量、速度和多样性

7、等特征都处于多变状态。 来源: GB/T 35295 2017, 2.1.1 3.3 数据元 data element 由一组属性规定其定义、标识、表示和允许值的数据单元。 注: 数据元在特定的语义环境中被认为是不可再分的最小数据单元。数据元一般来说由对象类、特性和表示三部分 组成: DB32/T 4040.1-2021 2 a) 对象类:思想、概念或真实世界中的事物的集合,它们具有清晰的边界和含义,其特征和行为遵循同样的 规则。对象类是人们希望研究、搜集和存储它们的相关数据的事物; 示例 1: 汽车、人、房屋、订单等。 b) 特性:对象类中的所有成员共同具有的有别于其他的、显著的特征。特性是

8、用来区分和描述对象的手段; 示例 2: 颜色、性别、年龄、收入、地址等。 c) 表示:描述了数据被表达的方式,表示与数据元的值域关系密切。一个数据元的值域指数据元的所有允许 值的集合。 示例 3: 对于“个人所得税金额”这个数据元,它的值域可以是一系列非负整数(带有货币单位),这是一种 非枚举型的值域,而“个人所得税比率”对收入进行分段划分,并给每一段赋予一个比率,它的值域就 是这些比率的集合,此时称它的值域为枚举型值域。 来源 : GB/T 18391.1 2009, 3.3.8,有修改 3.4 元数据 metadata 定义和描述其他数据的数据。 来源 : GB/T 18391.1 200

9、9, 3.2.16 3.5 属性 attribute 某个对象或实体的一种特性。 来源 : GB/T 18391.1 2009, 3.1.1 3.6 值域 value domain 允许值的集合。 来源 : GB/T 18391.1 2009, 3.3.38 3.7 注册 registration 一个管理项与其管理部门的关系。 来源 : GB/T 18391.1 2009, 3.3.31 3.8 政务部门 administrative organization 政府部门及法律法规授权具有行政职能的事业单位和社会组织。 3.9 管理部门 responsible organization 标准化

10、行政主管部门授权对政务数据元实施注册、维护和管理功能的组织 。 3.10 应用部门 applications organization 因履行职责需要使用其他政务部门 ( 3.8) 的政务信息资源和为其他政务部门 ( 3.8) 提供政务信 息资源的政务部门 ( 3.8) 。 4 数据元和代码集的表示规范 4.1 数据元的属性概述 数据元的表示规范是通过对其一系列属性的描述来实现的,这些属性即是数据元的元数据。表 1 给出了数据元的六大类属性。 DB32/T 4040.1-2021 3 表 1 数据元的六大类属性 属性类别 属性名称 说明 标识类属性 内部标识符 标识类属性是用于标识数据元的一类

11、属性。 中文名称 中文全拼 中文首拼 英文名称 版本 同义名称 定义类属性 定义 定义类属性是描述数据元语义方面的一类属性。 对象类词 特性词 关系类属性 分类方案 关系类属性是描述数据元之间相互关系的一类属性。 分类方案值 关系 表示类属性 表示词 表示类属性是描述数据元表示方面的一类属性。 数据类型 数据格式 值域 计量单位 管理类属性 状态 管理类属性是描述数据元管理与控制方面的属性。 来源部门 管理部门 批准日期 附加类属性 备注 附加类属性是描述上述属性以外的其他属性。 4.2 数据元属性的描述方法 下面的描述符是对数据元属性的描述: a) 名称 赋予数据元属性的标记,名称是唯一的,

12、名称以字符型表示。 b) 定义 属性的描述,可使一种属性与其他属性清晰地区别开来,定义以字符型表示。 c) 约束 显示一个属性是始终还是有时出现的描述符,该描述符有必选和可选两个取值,前者表示该属性必 须出现,后者表示该属性是否出现可选。 d) 出现次数 显示一个属性出现多少次的描述符,该描述符有以下四种情况: 0 1(表示不出现或出现 1 次), 0 n(表示不出现或出现多次), 1 1(表示出现且仅出现 1 次), 1 n(表示出现 1 次或多次)。 e) 类型 描述属性的所有取值的类型。 示例: 字符、数值、日期、时间、日期时间和二进制。 f) 规则 DB32/T 4040.1-2021

13、 4 数据元属性的命名和分配规则。 g) 备注 与属性应用有关的注释。 4.3 数据元标识类属性 4.3.1 名称:内部标识符 定义:在一个管理部门 内由管理部门自行分配的,与语言无关的数据元的唯一标识符 。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: 内部标识符由 14 位阿拉伯数字分 4 个部分组成,规则如下: a) 第一部分为信息资源分类码,用从 01 开始递增的两位阿拉伯数字表示,分为公共、综合人口、 综合法人、社会信用、电子证照、自然资源和空间地理 6 大类,表 2 给出了信息资源分类码; 表 2 信息资源分类码 序号 信息资源分类 代码 1 公共 01 2 综合人口

14、 02 3 综合法人 03 4 社会信用 04 5 电子证照 05 6 自然资源和空间地理 06 b) 第二部分为政务信息资源数据元的一级分类,用从 01 开始递增的 2 位阿拉伯数字表示; c) 第三部分为政务信息资源数据元的二级分类,用从 00001 开始递增的 5 位阿拉伯数字表示; d) 第四部分为二级分类下数据元的顺序码,用从 00001 开始递增的 5 位阿拉伯数字表示。图 1 给 出了内部标识符结构的表示方式; 图 1 内部标识符表示方式 e) 内部标识符一旦赋予,将不被复用。 备注:无。 4.3.2 名称:中文名称 定义:赋 予数据元的单个或多个中文字词的指称 。 DB32/T

15、 4040.1-2021 5 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: a) 在一定语境下数据元的名称应唯一; 中文名称由一个对象类词、一个特性词和一个表示词组成,其顺序为:中文名称对象类词 特性词表示词; b) 中文名称中应只有一个对象类词、特性词和表示词; c) 当表示词与特性词有重复或部分重复时,可将名称中冗余词省略; d) 中文名称尽量与权威名称保持一致。 备注:无。 4.3.3 名称:中文全拼 定义:数据元中文名称的汉语拼音。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: 数据元的中文全拼是用“ -”连接中文名称中的每一个汉字的拼音,全部用小写。 备注

16、:无。 4.3.4 名称:中文首拼 定义:数据元中文名称的汉语拼音的首字母。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:中文首拼全部使用大写字母。 备注:无。 4.3.5 名称:英文名称 定义: 赋予数据元的单个或多个英文字词的指称。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:英文名称优先采用权威来源。 备注:无。 4.3.6 名称:版本 定义:用于本文件在正式发布后和下次修订发布期间,数据元应用部门和管理部门内部版本管理的 标识。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则: a) 版本是由阿拉伯数字字符和小数点字符组成的字符型,本文件实施后,版

17、本定为 1.0。 DB32/T 4040.1-2021 6 b) 版本号变更的原则为: 1) 数据元的必选属性发生变化时,无论非必选属性是否变化,则小数点字符前的数字字符加 1,小数点字符后的数字归 0; 2) 数据元的必选属性不变而非必选属性发生变化时,则小数点字符前的数字字符不变,小数 点字符后的数字加 1。 示例 : 某数据元的版本号为 1.0,当 数据元第一次修订时,其必选属性发生变化而非必选属性不变,则该数据元的 版本为 2.0;当该 数据元第二次修订时,其必选属性不变而非必选属性发生变化,则该数据元的版本为 2.1; 当 数据元第三次修订时,其必选属性和非必选属性同时发生变化,则该

18、数据元的版本为 3.0。 备注:无。 4.3.7 名称:同义名称 定义:一个数据元在不同应用环境下的不同称谓。 约束:必选。 出现次数: 0 n。 类型:字符型。 规则:无。 备注:一个数据元可以有多个同义名称。 4.4 数据元定义类属性 4.4.1 名称:定义 定义:是用描述性的短语或句子对一个数据元所作的解释。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:无。 备注:无。 4.4.2 名称:对象类词 定义:数据元名称成分之一,表达了该数据元所属事物或概念的集合。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:无。 备注:标识出数据元的对象类词,有助于实现对数据元的

19、规范化命名、分析、类比和查询等功能。 4.4.3 名称:特性词 定义:用以表达数据元所属的对象类的某个显著的、有区别的特征。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:无。 备注:标识出数据元的特性词有助于对数据元的规范化命名、分析、类比和查询。 4.5 数据元关系类属性 DB32/T 4040.1-2021 7 4.5.1 名称:分类方案 定义:根据数据元的来源、组成、结构、应用、功能等共同特性,将数据元排列或划分成组的模式。 约束:可选。 出现次数: 0 n。 类型:字符型。 规则:本文件中的数据元的“分类方案”均遵照 4.3.1 给出的分类方案。 备注:数据元可使用多种分

20、类方案进行描述,以便于使用者从不同的角度进行查询和使用。每种分 类方案有一个标识符,不同的标识符代表不同的分类方案;数据元的分类原则和方法见 GB/T 7027。 4.5.2 名称:分类方案值 定义: 某个数据元在一个分类方案中所处的位置,用该数据元在此分类方案中的分类代码表示。 约束:可选。 出现次数: 0 n。 类型:字符型。 规则:本文件中的数据元的“分类方案值”均遵照 4.3.1 给出的分类方案值。 备注: 分类方案和分类方案值之间存在一一对应关系。 4.5.3 名称:关系 定义:关系用以描述当前数据元与其他相关数据元之间的关系。 约束:必选。 出现次数: 0 n。 类型:字符型。 规

21、则:无。 备注:表 3 给出了数据元之间基本关系的数据格式,为更加通俗准确表示数据元的基本关系,其关 系数据格式采用中文描述和表 3 中的关系表示符共同表示。 表 3 数据元基本关系的数据格式 关系 关系表示符 关系描述 示例 派生关系 Derive-from 描述了数据元之间的继承关系,一个 较为专用的数据元是由一个较为通用 的数据元加上某些限定词派生而来。 “ Derive-from B”( B 是数据元的标识符,下同), 表明当前数据元由数据元 B 派生而来。 数据元“参 保人姓名”派生自数据元“姓名”。 组成关系 Compose-of 描述了整体和部分的关系,一个数据元由另外若干个数据

22、元组成。 “ Compose-of B, C, D”,表示当前数据元是由数 据元 B,C,D 共同组成。 数据元“籍贯区划内详细地 址”由数据元“籍贯区划”和数据元“详细地址” 组成。 替代关系 Replace-of 描述了数据元之间的替代关系。 “ Replace-of B”表明当前数据元替代了数据元 B。数据元“学历”替代了数据元“文化水平”。 连用关系 Link-with 描述了一个数据元与另外若干数据元一起使用的情况。 “ Link-with B,C,D”,表明当前数据元需要和数据 元 B,C,D 一起使用。 数据元“护照号码”与数据元 “护照类型”连用。 4.6 数据元表示类属性 4

23、.6.1 名称:表示词 DB32/T 4040.1-2021 8 定义:表示词用于描述数据元值域的表示形式,表示词是数据元名称的组成成分之一。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:无。 备注:标识出数据元的表示词有助于实现数据元的规范化命名、分析、类比和查询。国际范围内认 可的表示词见表 4。 表 4 国际范围内认可的表示词 表示词 含义 金额 货币单位的数量,通常与货币类型有关。 日期 特定的年月日,格式参照 GB/T 7408。 日期时间 特定的年月日中的特定时间点,格式参照 GB/T 7408。 代码 表示一组值中的一个值的字符型(字母、数字、符号)。 描述 表示一

24、个人、客体、地点、事件或概念一系列句子,即可用于定义(通常用一两个句 子),也可用于较长文本。在数据元的中文名称中通常使用“说明”、“备注”、“意见” 等词。 名称 表示一个人、客体、地点、事件或概念指定的一个词或短语。该词或短语是该人、客 体、地点、事件或概念的称谓。 号码 一个特定的值的数字表示,它通常暗示了顺序或一系列中的一个。 百分比 具有相同计量单位的两个值之间的百分数形式的比率。 量 非货币单位数量,通常与计量单位有关。 比率 一个计量的量或金额与另一个计量的量或金额的比值。 指示符 两个且只有两个表明条件的值,如 on/off、 true/false,又称标志。 4.6.2 名称

25、:数据类型 定义:用于表示数据元的符号、字符或其他表示的类型。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:无。 备注:表 5 包括了数据类型的可能取值列表,但不限于下表中所列。 表 5 数据类型的取值 数据类型 说明 字符型( string) 以字符包括字母、数字、汉字和其他字符形式表达的数据元值的类型。 数值型( numeric) 用任意实数表达的数据元值的类型。 年( year) 通过 YYYY 的形式表达的值的类型,符合 GB/T 7408。 年月( month) 通过 YYYY-MM 的形式表达的值的类型,符合 GB/T 7408。 日期型( date) 通过 YYYY

26、-MM-DD 的形式表达的值的类型,符合 GB/T 7408。 日期时间型( datetime) 通过 YYYY-MM-DD hh:mm:ss 的形式表达的值的类型,符合 GB/T 7408。 DB32/T 4040.1-2021 9 表 5 数据类型的取值(续) 数据类型 说明 时间型 (time) 通过 hh:mm:ss 的形式表达的值的类型,符合 GB/T 7408。 时间间隔型( time interval) 通过 nYnMnDnTnHnMns 的形式表达的值的类型,符合 GB/T 7408。 布尔型( boolean) 两个且只有两个表明条件的值,如 on/off、 true/fal

27、se。 二进制型( binary) 上述无法表示的其他数据类型,比如图像、音频等。 注: 字符型采用 GB 13000 中规定的字符,其中每个汉字用 2 个字节表示,其余每个字符用 1 个字节表示。 4.6.3 名称:数据格式 定义:从业务的角度规定的数据元值的格式需求,包括所允许的最大和 /或最小字符长度,数据元 值的表示格式等。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:无。 备注:政务数据元推荐使用的数据格式如表 6,数据格式示例说明见表 7。 表 6 数据格式字符和含义说明 数据格式字符 符号含义 a 英文字符( A-Z,a-z)。 c 包含英文字符、数字字符、中文字符

28、和特殊字符四种字符类型。 n 数字字符( 0-9)。 z 中文字符。 t 除了英文字符、数字字符、中文字符以外的特殊字符。 an 英文字符( A-Z,a-z)和数字字符( 0-9)。 m( m 为自然数) 表示长度为 m 个字符(字符集默认为 GB/T 2312)。 .ul 长度不确定的文本。 .p, q( p, q 均为自然数) 最长 p 个数字字符,小数点后 q 位。 . 从最小长度到最大长度,前面附加最小长度,后面附加最大长度。 ”YYYY“ “MM” “DD” “hh” “mm” “ss” “YYYY” 表示年份, “MM” 表示月份, “DD” 表示日期, “hh” 表示小时, “m

29、m” 表 示分钟, “ss” 表示秒,可视实际情况组合使用。 B 布尔型,是 /否, on/off, true/false。 BY 二进制,图像、音频、 WAN、 RM、 AVI、 MPEG 等二进制流文件格式。 Short 短整数型。 Double 双精度浮点型。 注 :在系统建设中遇到数据格式为“ .”时建议按最大值使用。 DB32/T 4040.1-2021 10 表 7 数据格式示例说明 示例 示例说明 a3 固定长度为 3 位的英文字符。 n3 固定长度为 3 位的数字字符。 c3 固定长度为 3 位的任意字符。 z3 固定长度为 3 位的中文字符。 an3 固定长度为 3 位的英文

30、数字字符。 a.3 最多为 3 位的英文字符。 n.3 最多为 3 位的数字字符。 c.3 最多为 3 位的任意字符。 an.3 最多为 3 位的英文数字字符。 an3.8 表示最大长度为 8,最小长度为 3 的不定长的字母数字字符。 n.5,2 数值型,小数点前最多为 5 位数字,小数点后保留 2 位数字,总长度最多为 8 位的数字字符。 a.ul 长度不确定的英文字符。 YYYY-MM-DD hh:mm:ss 日期时间的某种表示方式。 4.6.4 名称:值域 定义:值域是根据相应属性中规定的数据类型、数据格式而决定的数据元的允许值的集合。 约束:必选。 出现次数: 0 n。 类型:字符型。

31、 规则:该集合可通过以下方式给出: a) 通过名称给出,即直接指出值域的名称,比如数据元“两字母国家代码”的值域是 GB/T 2659 中的全部两字母代码; b) 通过参考资料给出,比如数据元“产品条码”的值域是已经在物品编码中心注册的所有产品的 条形码; c) 通过一一列举的方式给出所有可能的取值以及每一个值对应的实例或含义; d) 通过数据元之间的逻辑关系给出值域范围,比如“结婚日期”的取值范围应大于“出生日期” 小于“死亡日期”; e) 通过真实世界的正常逻辑给出,比如“年龄”的取值范围应为 0-150; f) 无要求。 备注:无。 4.6.5 名称:计量单位 定义:属于数值型的数据元值

32、的计量单位。 约束:必选。 出现次数: 0 1。 类型:字符型。 规则:无。 备注:计量单位的名称应符合 GB/T 17295国际贸易用计量单位代码中的计量单位名称。 4.7 数据元管理类属性 DB32/T 4040.1-2021 11 4.7.1 名称:状态 定义:状态指数据元在其注册的全生存期(即生命周期)内所处状态的标示。 约束:可选。 出现次数: 0 1。 类型:字符型。 规则:本文件中的数据元的“状态”为其注册的全部生存期内所处的阶段。 备注:数据元在其注册的全部生存期内包括四种阶段: a) 草案:该数据元的内容处在草案阶段,相关单位和部门可以广泛提出意见和建议; b) 试用:该数据

33、元的内容经过一定的技术程序,可以在一定范围内进行试用,并反馈实验意见; c) 标准:该数据元的所有内容已经成为各方应当遵守的标准; d) 废止:该数据元的内容即将从标准中删去。 4.7.2 名称:来源部门 定义:产生或管理该数据元的机构或所属部门。 约束:必选。 出现次数: 1 n。 类型:字符型。 规则:无。 备注:无。 4.7.3 名称:管理部门 定义:标准化行政主管部门授权对政务数据元实施注册、维护和管理功能的组织。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则: 管理部门应使用全称,本文件中的数据元的“管理部门”均为标准归口单位。 备注:无。 4.7.4 名称:批准日期 定

34、义:批准日期指数据元进入“标准”状态的日期。 约束:必选。 出现次数: 1 1。 类型:字符型。 规则:无。 备注:当数据元进入“标准”阶段时,该属性必选。日期的表示采用 YYYY-MM-DD 的格式。 4.8 数据元附加类属性 名称:备注。 定义:备注用以描述数据元的附加注释。 约束:必选。 出现次数: 0 1。 类型:字符型。 规则:无。 备注:即上述属性未能描述的其他注释。 DB32/T 4040.1-2021 12 4.9 代码集标识符 代码集标识符由 3 个部分组成,规则如下: a) 第一部分:用“ DM”表示代码集; b) 第二部分:信息资源分类码,用从 01开始递增的 2位数字表

35、示,表 1给出了信息资源分类码; c) 第三部分:顺序码,用从 001开始递增的 3位数字表示。 图 2 给出了代码集标识符的表示方式。 图 2 代码集标识符表示方式 5 数据元的设计方法 5.1 数据元和数据元属性的提取 5.1.1 数据元 的提取 数据元提取应采用面向对象的方法,通过 业务功能建模、业务流程建模、信息建模、数据元的提取 和数据元的提交等步骤, 分析研究各领域的业务流程,建立相应的信息模型,从信息模型中提取其对象 类和特性,再结合实际业务需求细化其表示,以构成完整的数据元。 详细的提取步骤见 GB/T 19488.1 2004 中 6.1.1。 5.1.2 数据元属性的提取

36、对于需新增加的数据元 , 数据元 提交者 需要提交的数据元属性包括 中文名称、英文名称、中文全拼 、 中文首拼、 同义名称 、定义、关系、数据类型、数据格式、值域 、计量单位、来源部门和备注 等。 详细 的提取步骤见 GB/T 19488.1 2004 中 6.1.2。 5.2 数据元的分类规则 数据元常用的分类方法有以下几种: a) 按数据元本身的结构:对象类、特性和表示来划分; b) 按数据元使用的政府职能部门来划分:如教育、海关、公安、工商、税务等; c) 按数据元的应用分类:如基础公共类数据元、日常办公类数据元、人口管理类数据元、法人管 理类数据元、资源管理类数据元、信用管理类数据元等

37、; d) 按电子政务服务的主体进行分类:如政府对政府、政府对企业、政府对公民、企业对政府、公 民对政府等。 5.3 数据元的命名规则 5.3.1 唯一性规则 DB32/T 4040.1-2021 13 在一定语境下数据元名称应该唯一,名称中一般包括对象类词、特性词、表示词和限定词。 示例: 在数据元“资格状态代码”中,“资格”为对象词,“状态”是该数据元的特性词,“代码”是该数据元的 表示词。 5.3.2 语义规则 对象词表示数据元所属的事物或概念,它表示某一语境下一个活动或对象,它是数据元中占支配地 位的部分: a) 数据元名称中应有一个且仅有一个对象词; b) 特性词是表示数据元的对象类的显著的、有区别的特征; c) 数据元名称中应有一个且仅有一个特性词; d) 表示词是数据元名称中描述数据元表示形成的一个成分,它描述了数据元有效值集合的格式; e) 数据元名称中应有一个且仅有一个表示词

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 标准规范 > 地方标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1