1、ICS 35.040 A 24 f占2一非A品.F&1=1 I I.!. 5 部 11: .,.、JC 、E命G/T 18391.5 2001 idt ISO /IEC 11179-5: 1995 情日Information technology一Specification and standardization of data elements-Part 5 :Naming and identification principles for data elements 2001- 07 -16发布4电喃.队f、季运4兔p(挝3-,; . ; 中华人民共和国国家质量监督检验检症总局2002-
2、03 -01实施发布GB!T 18391. 5-2001 目次前言. . . . . . . . . . . . . . . . . . . . . . . . . . . I ISO!IEC 前言. . . . . . . . . . . , . . . . . . . . . E 引言 . . . . . . . . . . . . . . . . . . . . . . . E 1 范围. . . . . . . 1 2 引用标准. . . . . 1 3 定义.,. . . . . . . 1 4 数据的标识结构原则. . . . . . 3 5 数据注册标识的规则.u. 4 6 结构
3、化命名约定指南. . . . . . 4 7 主题词表应用指南. . . . 6 附录A(提示的附录命名约定示例. . . . . . 7 附录(提示的附录)注册标识示例. . . . . 8 附录C(提示的附录)主题词表示例. 9 一-G/T 18391. 5-2001 当一口本标准等同采用国际标准ISO/IEC11179-5:1995(信息技术一一数据元的规范与标准化-一第5部分z数据元的命名和标识原则。GB/T 18391在总标题信息技术数据元的规范与标准化下,包括以下几部分:一-第1部分z数据元的规范与标准化框架3一一第2部分g数据元的分类;一一第3部分:数据元的基本属性,一一第4部分
4、z数据定义的编写规则与指南s一一第5部分z数据元的命名和标识原则;一第6部分:数据元的注册。本标准的附录A、附录B、附录C是提示的附录。本标准由中国标准研究中心提出并归口。本标准起草单位z中国标准研究中心。本标准主要起草人:冯卫、李小林、XiJ植婷、邢立强。前GB/T 18391.5-2001 ISO/IEC前言国际标准化组织(lSO)和国际电工委员会(lEC)是世界性的标准化专门机构。作为ISO或IEC成员的各国家团体机构,通过各类技术委员会参与国际标准的研制。技术委员会由参加各类专业领域技术活动的相关组织组建而成。ISO和IEC的技术委员会在共同感兴趣的领域进行合作。同ISO和IEC有联系
5、的官方与非官方国际组织,也可以参与该项工作。在信息技术领域,ISO和IEC已组建了联合技术委员会,即ISO/IECJTCL由联合技术委员会通过的国际标准草案,提交给各国家团体进行表决。-项国际标准的颁布,至少需要75%参与表决的国家团体投赞成票。国际标准ISO/IEC11179习是由信息技术联合技术委员会(lSO/IECJTCl)下属的数据管理与交换分委员会(SC3Z)负责起草的。E ISO/IEC 11179在总标题信息技术数据元的规范与标准化下,包括以下部分g第1部分g数据元的规范与标准化框架第2部分:数据元的分类一一第3部分:数据元的基本属性一一第4部分z数据定义的编写规则与指南一一第5
6、部分2数据元的命名和标识原则一一第6部分z数据元的注册L 1一一-一-一一一一-一一一GB/T 18391.5 2001 51 司本标准包括原则、规则和指南。原则是建立规则的前提。规则是强制性的,并且是可进行一致性测试的。指南是上述规则在好的示例中的应用。E 一-二GB/T 18391.5-2001 3. 2 相关环境context 对使用或产生名称的应用环境或应用规程的指明或描述。(GB/T18391. 3 6. 1. 6) 3.3 数据元data element 用一组属性描述其定义、标识、表示和允许值的一个数据单元。(GB/T18391. 3) 3. 4 数据元概念data elemen
7、t concept 能以数据元的形式表示,且与其任何特定的表示法无关的一种概念。(GB/T18391. 3) 3.5 数据标识符data identifier 由注册机构赋予数据元的标识符(一串字符或图形符号)。3.6定义definition 表述某人、某事基本特性或人、事类别的词或短i吾2耍,回答X是什么或X属于什么这样的问题:一个词或词组含义的陈述。(韦氏新世界英语大词典,第三版,1986年)3. 7标iR符identifier见数据标识符。3.8词法lexical 有关一种语言的单词或词汇,而非它的语法和结构。3. 9 名称name 人们标识事物和概念的基本方式,3. 10 对象类术!o
8、bject class term 数据元名称的一个成分,在逻辑数据模型中描述的数据元所属的逻辑数据1且,如:雇员。3. 11 特性术!property term 数据元名称的一个成分,表示数据元所属的类别。3.12 限定术语qualifier term 帮助定义和区分数据库中某个名称的一个或几个词。3.13 注册机构registration authority 经授权对数据元进行注册的组织。3. 14 注册机构标识符registration authority identifier 经授权对数据元进行注册的任何组织的标识符,即,含有此标识符的属性。3. 15 表示术语representatio
9、n term 数据元有效值集合的形式,如:总额,姓名。3.16 语义学semantics 有关词义注释的语言学分支学科(韦氏词典)。3.17 分隔符separator 在名称中连接和分隔成分的符号或空梢,又称分界符。3.18 结构设置structure set 在相关环域中放置对象的方法,用以展示与其他对象的关系,如各种实体关系模型、分类法(taxonomies)和本体论法(ontologies)。3. 19旬法syntax 字符或字符组之间的各种关系。这些关系与字符或字符组的含义、解释和使用方式无关。它是语言的表示结构及管理语言结构的规则。3. 20 主题词表thesaurus 按给定顺序排
10、列的受控词汇,其中显示和标识了词汇之间的关系。3. 21 版本标识符version identifier 赋予版本的一个标识符,以此提交和更新数据元注册。2 L GB/T 18391. 5-2001 4 数据的标iR结构原则4. 1 属性标识为了区分不同的数据元,用一组相关的五个属性,对每一个数据元进行命名和标识。这些属性是:-一名称;相关环境;一注册机构标识符;一一数据标识符s一版本标识符。本标准涉及的命名,设定为包括名称和同义名称的属性,这些属性在GB/T18391. 3(包括了对全部属性的描述)中进行了规定。数据标识符也与GB/T18391. 3中的标识符相同。这些属性的原则在下面叙述。
11、4.2 名称和相关环境在注册机构中注册的一个数据元至少应当有一个名称,根据该数据元使用的相关环境,可以分配多个名称。每个名称在某个特定的相关环境中有着特殊的作用。为了便于数据管理,可建立严格结构化的名称;使用者可以规定首选名称;在特定的软件环境(如2一个特定程序语言或数据库管理系统中可以产生简称。在每个相关环境中可以为许多数据元赋予名称,每个相关环境建立一个命名约定(一般是一组规则),用以详细说明在该相关环境中如何规范名称。一个命名约定应包括相关环境的全部有关方丽,这包括:一一命名约定的范围,如行业首选名称一一确定名称的机构;指导名称的用词来源和内容的语义规则,如=由数据模型生成的词汇,规范中
12、常用词汇等等;一一关于用词顺序的语法规则;关于受控单词表、名称长度、字符集、语言词法规则,-制定在同一相关环境中名称是否必须具备唯一性的规则。命名约定的上述内容在第6章起草严格结构化命名约定的指南中进行了详述。4.3 国际注册数据标识符属性注册机构标识符(RAD、数据标识符(DI)和版本标识符(V!)构成了国际注册数据标识符(IRDI)。一个数据元至少需要一个IRDlo数据标识符由注册机构分配;数据标识符在一个注册机构的范围内必须是唯的。由于每个注册机构可以决定其各自的分配方案,因此不能保证用某注册机构的数据标识符能对一个数据元进行唯一标识。例如z如果两个注册机构都用连续的6位号码,就会有组数
13、据元有相同的DI,然而完全有可能,不同的数据元具有相同的DI。相反,如果同一个数据元在两处机构注册,它就有两个DI。因此,一个数据元的标识不仅需要DI还需要RAI.如果数据元的特定属性改变了,就应产生并注册数据元的新版本,在这种情况下就需要VI来完成对数据元的唯一标识。进一步的原则见GB/T18391. 60 一个IRDI是信息系统、组织或其他希望共享一个特定数据元(但不能利用相同的名称和相关环境)的参与者之间交换数据的关键。当IRDI与建立多于一种自然语言的相关环挠有关联时,IRDI也有助于语言的翻译,并且对由不同的注册机构管理的数据元集合之间是一个参考。GB/T 18391没有规定DI的格
14、式或内容。对注册机构的要求及有关IRDI的讨论见GB/T18391. 6。3 5 5. 1 5. 2 5.3 5.4 E G/T 18391.5-2001 数据注册标识的规则在一个注册机构的注册簿中,每个数据元应有一个唯一的数据标识符,注册机构标识符、数据标识符和版本标识符的组合,便构成数据元的唯一标识。需要分配数据标识符的数据元必须是:一一按照GB/T18391. 2形成的;一按照GB/T18391. 3确定属性的;一一按照GB/T18391. 4定义的;一一按照GB/T18391. 5命名的;一一按照GB/T18391. 6注册的.在一个相关环境中,一个数据元应至少有一个名称.结构化命名约
15、定指南下面是在特定相关环境下用来制定命名约定的指商。附录A是一个命名约定的具体示例,它同本章介绍的指南相一致。指南以通用的词语叙述,并附有示例。规则是由制定名称的原则中引出的,这些规则构成了命名约定。按照这些规则形成的名称可以很容易翻译成其他语言,因为它的句法简单。句法、语义和词法的规则随不同的组织(如企业或为业务部门制定标准的团体)而异。每个组织可以在自己的相关环境中确立名称构成的规则。如6.1.1.1巾讨论的,每个数据元是由一组成分构成.它们选自各自相关环境的结构设置。数据元的名称可以由其成分的名称构成,在一个名称中设置每个成分的含义(语义)和相对或绝对的位置(语法)。它们可以从属于词法规
16、则。它们可以,但不是必须,用一个分隔符来分界。每个成分值的集合或范围应当由一个机构(如一个企业中的数据管理者或者一个国际商务部门命名标准的审定委员会)严格管理。一一语义规则使含义能够传达2一一句法规则按一致性和指定顺序来关联成分;一一词法(词形和词汇)规则减少冗余,增加精确性。6. 1 管理名称语义内容的原则语义涉及到名称成分的含义,以及对其界定的分隔符。6. 1. 1 名称成分语义成分由离散术语组成。本标准的名称成分由以下术语描述.一一对象类术语;一一特性术语;表示术语;一一限定术语。6.1.1.1 对象类术语对象类术语是构成数据元名称的一个成分,它表示某一相关环境中的一项行为或一个对象.建
17、模方法的使用(如实体关系图ERD或对象模型)是分别确定所有数据元和与其上一层模型实体的关系位置的一种方法。实体关系模型中实体的属性就等同于数据元,这些数据元通过这种建模方法的进一步应用相互联系起来。在对象模型中,数据元则是通过对象属性表示的。各种模型为数据元提供了一种分类方案。数据元可以用与之相关模型中的实体来标识,将对象类术语映射为模型中的实体的名称即可。GB/T18391. 1提供了对象类术语和实体关系模型ERD、对象模型中的实体之间的映射的示例。4 一-一一一一一一一一二一一一一一一一-一一一一一一一一一一例如,在下面的数据元中z一一雇员的姓氏一一费用预算周期合计总额一树的高度的测量一一
18、成员的姓氏GB/T 18391. 5-2001 成分雇员、费用、树和成员是对象类术语。6.1.1.2 特性术语EF 一组特性术语是由一个特性分类法中的一组名称成分构成的。这个组必须是由离散的(每个定义不能与其他定义相重叠)和完整的(全部的特性,这个组表示了所有说明数据元所需的信息概念)词构成.例如,在数据元中:一一雇员的姓氏一一费用预算周期合计总额一一成员的姓氏一一树的高度的测量成分姓氏、总额和高度是特性术语.特性术语当然要出现在数据元的定义中。使用两个结构设置中的成分,提供了一种分类的补充方法。用数据元对象类和特性两个成分形成的一个名称,包含了有关数据元极为重要的信息,而且排除了当没有约定使
19、用而被采用的不重要的或不合理的元素。6.1.1.3 表示术语表示术语是一个数据元名称中描述数据元表示形成的一个成分。每个表示术语由-个受控单词表或一个分类体系形成。表示术语的类别表现形式如下g名称总额测量数目 数量文本这类术语描述了数据元有效值集合的形式。通常这类表示术语可能与特性术语有部分重复,此时,可以从结构化名称中将一个术语或术语的一部分删除。这点可按命名约定中的规则确定.该过程的应用见附录Ao例如,在数据元中:一一树的高度的测量;一一雇员的姓氏。成分测量和姓氏是表示术语。注意姓氏是一个特性术语,为表达的清楚,冗余的字可以删去。6.1.1.4 限定术语如果必须对一个数据元进行唯一标识,可
20、以将限定术语附加到对象类术语、特性术语和表示术语上。这些限定术语也许是从一个相关环统规定的结构设置中产生的。在命名约定的规则中,建议对限定术语的数量予以限制。例如,在下面的数据元中z一一费用预算周期合计总额成分预算周期是限定术语。注2对允许的限定术语的形式给予一些限制,有助于减少冗余;通过取消一些向义名,扩大数据的使用范围.这点同样也适用于对象类术语、特性术语和表示术语.用一种机制,如主题词表可以更加便捷(见第7章和附录。6.1.2 分隔符i吾义术语的成分由分隔符来界定。它们可以是:一一没有语义含义。可以用一项命名规则说明分隔符由一个空格或一个确切的特定字符(如一个连5 GB/T 18391.
21、 5-2001 字符或下划线)组成,而不管各成分间的语义关系如何。这样的规则简化了名称的生成过程。一一有语义含义。语义含义能由分隔符表达,如将限定术语之间的分隔符和其他成分之间的分隔符设定为不同的分隔符。用这种方法,分隔符就把限定术语从名称的其他部分清楚地标识出来了。例如,在数据元中z费用预算周期合计-总额在限定术语之间的分隔符是下划线;其他名称成分之间的分隔符是连字符。有些语言,如德语和荷兰语,一般是在一个单词中加入语法因素形成(一个词的含义可能相当于英语或法语由名词或形容词组成的短语)。这些语言用的分隔符不是将各个单词从中间断开,如用连字符、空格和下划线,而是把一个单词中每个名称成分的第一
22、个字母大写。6.2 管理名称格式的原则6. 2. 1 句法原则句法原则详细说明了一个名称中各成分的排列。这一排列可能是相对的或者绝对的,或者二者兼有。a)相对排列是依据其他成分确定该成分。如在一个约定中的一项规则可能要求-个限定术语必须总是出现在被限定术语的前面。b)绝对排列是确定该成分的固定位置。如:项规则可能要求特性术语总是一个名称的最后成分。6.2.2 词法原则这些原则涉及到优选词和非优选词、同义词、缩略语、成分的长度、拼写、容许字符集、大小写区分等等。7 主题词表应用指南主题词表是一个非常有用的工具,使用者在其中能够找到各种同义词、近义词和同形异义词作为名称成分。它可以提供名称优选术语
23、和其他术语之间的话义联系。除了同形异义词(单词的拼写一样,表达了不同的概念)的使用指导以外,主题词表可以通过选择以下的方式指导使用者;一一问义:从中优选一个词或术语,使其表达的概念比选其他的词或术语更贴切;一-等级z在表示广义和狭义之间的关系时,可用上、下层级来表示;相关g把两个或更多相同或不同层级的术语,从语义和概念上联系起来。一个注册机构可以制定一个名称成分的主题词表,发给感兴趣的团体。另外,还需要制定专业领域的主题词表。一个主题词表可用文字描述结构,以作为图表的补充。优选术语成为名称的成分,优选术语间的关系表示了成分在结构中的位置。受控词汇是主题词表的一个优点,可以在一个主题词表中控制描
24、述符的范围,通过等价将同义词和近义词联系起来,并消除同形异义词。这些是使用者使用系统时所需要的所有主题词表的功能。6 一一一一一一一一一一一-一一一一一一一一一一一一一一一一一一一一一一一一一一一一, 、飞、飞二GB/T 18391.5-2001 附录A(提示的附录)命名约定示例这些规则出自第6章描述的指南。包指若干示例,可供各种相关环境的名称使用,并由专业领域的机构斟酌采用。A1 语义规则a)对象类表示在一个领域内有关的事物,例如:在某领域的一个模型中发现的事物。示例z费用b)需要有一个且仅有一个对象类术语ac)特性术语应当从特性体系结构设置中产生,并表示出数据的类别。示例g合计总额d)需要
25、有一个且仅有一个特性术语。e)限定应由专业领域机构决定产生,当需要描述一个数据元并使其在特定的相关环境巾唯一时,即可增加上限定术语.限定术语的顺序并不重要。限定术语是可选的。A2 A3 A4 示例:预算周期f)表示数据元的有效值集合由表示术语来描述。g)需要有一个且仅有一个表示术语。示例:总额句法规则a)对象类术语应处于名称的第一(最左位置。b)限定术语应位于被限定成分的前面,限定名称的顺序不应用于区别数据元名称。c)特性术语应处于第二位置。d)表示术语应处于最后位置。假如表示术语中有任何字与特性术语中的字重复,则删去冗余词。示例:费用预算周期合计总额词法规则a)名词仅用单数形式,动词(若有的
26、话)为现在时。b)名称的各个成分闷和多单词术语的单词之间用空格分隔。不允许用特殊字符。c)名称中所有单词是组合在一起的。d)允许使用缩写词、首字母缩略词和大写首字母。帷一性规则同相关环境的所有名称应是唯一的。7 、 GB!T 18391. 5-2001 附录B(提示的附录)注册标识示例数据元内容下面是一个数据元标识结构的示例2相关环境名称版本数据标识符(01) 财务电子数据交换系统美国_G1C5系统工程模型合同报表表头费用预算周期总额价值总额运输费用总额我们的一费用$1 1 1 848575 193847 193847 848575 注册机构标识符(RAl) 150 150 1EEE 1EEE
27、 这是由两个注册机构注册的一个数据元的例子,每个机构都配给它一个数据标识符。在每个机构中该数据元有两个不同的名称。注意,价值总额和我们的费用$是应用系统中两个同义名的示例,这些都是没有按照命名约定产生的传统名称,并将继续沿用下去。这个数据元名称的成分结构(按照第6章的原则如下:对象类:费用表示:总额额定由总限啊啊计-A口酣/跚算预用费称名特性:合计总额一一一一二一一一8 GB/T 18391. 5-2001 附录C (提示的附录)主题词表示例下面是从一个结构术语可能的主题词表中摘选的内容,包括了结构信息,同义词和同形异义词解析。关键字zBT-Broader Term(广义术语)NT-Narro
28、wer Term(狭义术iE)UF-Use For(用于)USE-Use the following term instead(用下列术语替代RT-Related Term(相关术语)SN-Scope Note (范围注释)主题词表中摘选:COST SN一一单位支付货物或服务的总额BT一合同NT一一小额现金UF一-.JtfiJRT一一预算RT一一总额支出USE-费用注意,尽管主题词表的条目能显示费用同预算和总额的关系,但这种关系的实质是不清楚的。斜体字用于表示不赞成的词,这是从同义词中区分优选词的方法。一个或多个层级可以通过列出若干个广义词和狭义词来表示。这是一个主题词表的规定。在GB/T18
29、391. 4中描述了范围注释的定义。FDDN .由问F可3H阁。华人民共国家标准信息技术数据元的规范与标准化第5部分z数据元的命名和标识原则G/T 18391. 5-2001 国和中唾中国标准出版社出版北京复兴门外三里河北街16号邮政编码100015电话,6852391668517548 中国标准出版社秦皇岛印刷厂印刷新华书店北京发行所发行各地新华书店经售印张l字数21千字2002年3月第一次印刷 1/16 开本880X12302002年3月第一版印数1-2 000 书号,155066.1-18078 网址 597-526 版权专有侵权必究举报电话,(010)68533533科目1. 5-2001