GB T 23824.1-2009 信息技术.实现元数据注册系统(MDR)内容一致性的规程 第1部分 数据元.pdf

上传人:rimleave225 文档编号:187203 上传时间:2019-07-14 格式:PDF 页数:102 大小:2.74MB
下载 相关 举报
GB T 23824.1-2009 信息技术.实现元数据注册系统(MDR)内容一致性的规程 第1部分 数据元.pdf_第1页
第1页 / 共102页
GB T 23824.1-2009 信息技术.实现元数据注册系统(MDR)内容一致性的规程 第1部分 数据元.pdf_第2页
第2页 / 共102页
GB T 23824.1-2009 信息技术.实现元数据注册系统(MDR)内容一致性的规程 第1部分 数据元.pdf_第3页
第3页 / 共102页
GB T 23824.1-2009 信息技术.实现元数据注册系统(MDR)内容一致性的规程 第1部分 数据元.pdf_第4页
第4页 / 共102页
GB T 23824.1-2009 信息技术.实现元数据注册系统(MDR)内容一致性的规程 第1部分 数据元.pdf_第5页
第5页 / 共102页
亲,该文档总共102页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、lCS 35040A 24 固园中华人民共和国国家标准GBT 2382412009ISOIEC TR 209431:2003信息技术 实现元数据注册系统(MDR)内容一致性的规程 第1部分:数据元Information technology-Procedures for achieving metadata registrycontent consistency-Part 1:Data elements2009-05-06发布(ISOIEC TR 209431:2003,IDT)2009-1101实施丰瞀粥鬻瓣警糌瞥星发布中国国家标准化管理委员会仅19GBT 238241-2009ISO1EC

2、 TR 20943-1:2003目 次前言。引言-1 范围2规范性引用文件3术语和定义一4数据元提取。5数据元注册-6 自下而上的数据元注册方法-7自上而下的数据元注册示例8复杂数据示例-附录A(资料性附录)示例数据元的属性表附录B(资料性附录)GBT 183912,GBT】83914,GHT 183915和GBT 183916各部分的应用附录C(资料性附录)本部分与GBT 183913元模型的名称对照-附录D(资料性附录)应用自上而下的方法进行数据元完整属性描述注册的示例参考文献,0000弛盯盯”巧盯GBT 238241-2009ISOIEC TR 20943-1:2003前 言GBT 23

3、824(信息技术实现元数据注册系统(MDR)内容一致性的规程分为四个部分:第1部分:数据元;第2部分:xML结构化数据;第3部分:值域;第4部分:综述。本部分为GBT 23824的第1部分,等同采用1SOIEC TR 20943一l:2003信息技术 实现元数据注册系统(MDR)内容一致性的规程第1部分:数据元。为了保持与英文版本的一致性,英文版中斜体表示的内容本部分中也使用斜体表示。本部分的附录A、附录B、附录C和附录D为资料性附录。本部分由全国电子业务标准化技术委员会提出并归口。本部分起草单位:中国标准化研究院。本部分主要起草人:邢立强、孙广芝、娄晓琳、张艳琦、史立武、陈琳、李小林、刘植婷

4、、张荫芬。GBT 238241-2009ISOIEC TR 209431:2003引 言基于GBT 18391信息技术元数据注册系统的元数据注册系统之间的元数据交换,不仅依赖于注册系统软件符合该标准,而且还取决于注册系统之间的元数据内容的可比性。尽管该标准规定了数据的规范和注册,但关于如何将内容注册到系统中还存在一些实际问题。基于相关组织实施该标准的经验,对内容问题的研究将有助于目前和将来的用户。元数据注册系统可用于注册数据元、值域以及适于组织多种数据资源集的相关属性。元数据注册系统中所存储的数据元,可能出现在表格中,表现在企业数据模型中包含于EDI报文集中,来自文件和标准或者是计算机系统应用

5、的一部分。一些组织的注册系统用于记录在现存的应用中如何使用数据元,另一些组织的注册系统则是标准数据元仓库,这些标准数据元被用作应用开发中数据元的模型。GBT 183916专用于元数据注册系统的开发和应用。GBT 183913模型化了数据元及其关联的数据元概念。在生成数据元概念、数据元和值域时,需要把规则和关系概念化并连接。对数据元和数据元概念的各种可能层次及它们关系的说明非常有助于生成可共享的、形式完好的数据。从最泛化数据元到最特化应用数据元的关系和继承需要予以规定。数据值域应能重复使用,并规则化。尽管元数据注册系统可以用来存贮多种元数据项的信息,本部分只针对数据元和关联的元数据项。尽管存在差

6、异,本部分的目的在于确保对数据元属性的内容有一个共同的理解,以便元数据可以在注册系统之间得以共享。本部分的依据是GBT 183913该标准描述了用于管理数据语义的注册系统的组织,并以概念模型的形式规定了注册系统的结构。概念模型的目的不是成为计算机系统的一个逻辑或物理数据模型。GBT 238241-2009ISOIEC TR 209431:2003信息技术 实现元数据注册系统(MDR)内容一致性的规程第1部分:数据元1 范围11背景基于GBT 18391的元数据注册系统(MDR)(以下简称“注册系统”)是管理可共享数据的一种工具,是关于数据参考信息的一个全面的、权威的来源。MDR支持通过记录和分

7、发数据描述的标准化和协同化规程,来促进数据在组织及用户间的共享。MDR提供了与涉及数据元的文件的联系,以及与数据元所应用的信息系统的联系。当与一个数据库联合使用时注册系统能够使用户更好地理解来自该数据库的信息。注册系统不包含数据本身,它包含对清楚描述、编目、分析和分类数据所必要的元数据。它给出关于数据单元含义、表示和标识的理解。本标准识别了用于决定系统之间共享数据元含义时所应有的信息元素。12目的GBT 23824的本部分旨在描述组在注册系统中获得数据元及其属性一致性注册的规程。本部分不是数据手册,而是用户指南,用于概念化数据元及其相关元数据项,以便能够始终建立质量良好的数据元。必要时,组织可

8、以采纳或增加这些规程。13限用范围本部分的范围限定于与一个数据元相关的项:数据元标识符、特定相关环境中的名称和定义及示例;数据元概念;概念域及其值的含义;值域及其允许值;14注册方法数据元和值域在元数据注册系统中注册代码集和其他值域时,一些注册机构将这些集合视为值域,而其他注册机构将之视为数据元。除非明确声明,本部分都将这些集合视为数据元。这种选择,有助于说明注册多种不同数据元的方法,包括将标准代码集作为数据元这样的示例。2规范性引用文件下列文件中的条款通过本部分的引用而成为GBT 23824的本部分的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本部分。

9、然而,鼓励根据本部分达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本部分。GBT 183911信息技术元数据注册系统(MDR) 第1部分:框架(GBT 183911-2009,ISOIEC 11179一l:2004,IDT)GBT 183912信息技术元数据注册系统(MDR) 第2部分:分类(GBT 183912 2009,1SO1EC 111792:2005,IDT)、GBT 183913信息技术 元数据注册系统(MDR) 第3部分:注册系统元模型与基本属性(GBT 1839132009,ISOIEC 11179 3:2003,IDT)GBT 183

10、914信息技术元数据注册系统(MDR)2009ISO1EC 111 794:2004,IDT)GBT 183915信息技术元数据注册系统(MDR)第4部分:数据定义的形成(GBT 183914-第5部分:命名和标识原则(GBT 183915GBT 238241-2009ISOIEC TR 20943-1:20032009,ISoIEC i1179 5:2005,IDT)GBT 183916 信息技术 元数据注册系统(MDR) 第6部分:注册(GBT 18391620091S0IEC 111796:2005,IDT)ISOIEC TR l 5452:2000信息技术数据值域规范3术语和定义GBT

11、 18391(所有部分)和ISOIEC TR 1 5452:2000中确立的术语和定义适用于GBT 23824的本部分。4数据元提取本章给出了在一个注册系统中构造数据元和数据元内容的一个概念上的框架。数据元是一种推导过程中观念上的结果,涉及若干种提取类型,由提取方法产生了一系列彼此关联的“层”。层可以由较一般的衍进为较具体的。提取类型决定了每层各成员间以及各层之间的关系在定义注册系统内容结构方面是很有意义的。这提供了不同注册系统间内容比较以及在一个注册系统中进行检索的一种方法。除了数据元的定义和其他属性外,对派生数据元的提取类型和层次的比较,可以确保数据元内容在系统之间的共享。系统的开发可以分

12、层描述,例如,在业务视图中包含最高层定义,并在系统层实现。层的数量和粒度由用户的需求来驱动。本章将描述两种可以生成层的方法,但每种方法都不是任何实现所必选的,同时给出注册系统实现中最有用的提取类型的示例。41提取类型提取是一种成熟的分析和概念化的工具。它常用于分析模型的过程或功能。“提取”这个术语用于指过程和过程的结果。提取可以用于注册系统的环境中,作为一种手段,可以使数据元的开发及其相互间的关系连贯起来,成为一体。可以由若干种方法,获得从最抽象层到更具体层的分解。从最一般意义上的概念开始,发展为应用中的数据元,这些层可以用从其他层产生它们的提取类型来标记。尽管这种对提取展开程序的描述意味着它

13、经常按照一种方向进行OA一般到具体),但相反的情况肯定也是存在的。同样,与该结构一致是合适的,但不意味着所有关系都是单一方向。实际上,为避免这种假设,抽象类型的名称有意识的包括了两个层次。数据元开发中最常用的三类提取方法是特化泛化、串联分解和聚合。特化泛化是两类之间的一种关系,在此关系中,一个类(子类)中的所有项都存在于另一类(父类);串联(或合成)是源值通过字符串的串联开发出合成值。分解是将值串的组成部分分解为源字符值聚合是对源值做数学运算来派生值。通常不存在该运算的逆运算(称之为派生)来恢复组分部分。此三种类型在注册系统中经常存在。42特化泛化示例特化泛化的机制可以用来表达数据元之间的一种

14、等级结构关系。美国邮政局(USPS)建立了美国的邮政编码。数据元“州USPS代码”(见图1)形成了地址群的一部分。它可以直接映射为应用数据元,也可以作为数据元等级的最高层,按其在结构中的位置,每层都展示出更高程度上的特化。下一层包含了元素“州地理代码”和“州邮政地址代码”。这两个州代码元素现在是两个不同地址群的成员。但是两个元素的概念域是一致的,因此地理地址和邮政地址潜在的有效值集合是相同的。,GBT 238241-20091SOIEC TR 20943-1:2003更进一步的特化出现在再下一层。“州邮政地址代码”分解为“州设施邮政地址代码”和“州用户邮政地址代码”。如前所述,这些元素的地址群

15、不同,此外数据的值域也没有必要包含相同的有效值集合。“州用户邮政地址代码”域可以与“州地理代码”保持一致,但“州设施邮政地址代码”域可能限定在有设施存在的州子集中。在该例中,应用数据元映射为此层的注册系统元素。67描述了以不同名称出现在不同数据库的数据元与一个注册系统数据元之间的关联。这些关系通过确保形式不同的数据元之间语义一致来支持数据交换。众 入八 州设擅 州用户 州设施地理代码 地理代码 邮政地址代码州用户邮政地址代码圈1特化泛化层次第6章、第7章和附录A给出了跟踪特化层次的方法,提取类型的层次作为ClassificationSchemehemcsitypename的值,数据元描述中的C

16、lassificationSchemeItemcsivalue可以是特化、泛化、聚合和串联等值。这些属性显示了在提取结构中该数据元的提取类型。在上述的示例中,数据元“州USPS代码”的属性值ClassificationSchemeItem。csivalue被指定为“泛化”。这一指定表明这个数据元在注册系统数据元的泛化特化结构中处于顶层。下层中的数据元,“州地理代码”和“州邮政地址代码”的该属性值被指定为“特化”。第三层的数据元,即“州设施地理代码”、“州客户地理代码”、“州设施邮政地址代码”和“州客户邮政地址代码”也被指定为“特化”。在注册系统中可能还有其他结构,数据元被置于其他注册系统表项(

17、例如数据元概念)的相对位置。这种情况下,需要其他的属性定位那些结构中的示例数据元。421值域共享示例图1表示了一个泛化特化的层次,此处,“州USPS代码”被看作一个数据元,它被特化为“州地理代码”和“州邮政地址代码”。如果“州地理代码”和“州邮政地址代码”的允许值范围相同,也可以将“州USPS代码”作为一个数据值域,由数据元“州地理代码”和“州邮政地址代码”共享。43串联分解示例用串联分解表达数据元之间的一种关系,即,较高层描述整个序列,较低层则为该序列的组成部分。它们可以是离散的,也可以是非离散的;也就是说,一些较低层的组分在其描述或域上是可以重叠的。该提取类型的一个示例是将邮政地址序列划分

18、为其子组分(见图2),这些划分以ISO 11180为基础。该图显示了数据元集“邮政地址分组”的组分。建筑物犏号 街道名称 州代码 国家名称图2串联分解示例44聚合示倒用聚合表达数据元间的一种关系,即:较高层描述一个整体的某个特性,较低层为影响该特性的要3GBT 238241-20091SOIEC TR 209431:2003素。它们可以是离散的,也可以是非离散的;也就是说,一些较低层的组分在其描述或域上是可以重叠的。该类型提取的示例有:从结束时间减去开始时间或任一临时中断时间段来产生一个运作时间段;从值总体和其计数产生平均值和标准差。应注意的是,聚合运算的逆运算(派生)通常不成立。这是因为,派

19、生过程产生了与原数据示例不同类型的信息。在严格的派生分解中信息常常在过程中有所损失。第6章、第7章和附录A给出了跟踪泛化层次的方法,提取类型的层次作为ClassificationSchemeItemcsitype_name的值,数据元描述中的ClassificationSchemeItemcsivalue可以是特化、泛化、聚合和串联等值。这些属性显示了在提取结构中该数据元的提取类型。在上述的示例中,数据元“邮政地址组”的Classification_SchemeItemesivalue韵属性值被指定为“串联”。这一指定表明此数据元在注册系统数据元的串联分解结构中处于顶层。分解的下层数据元其属性

20、值被赋值为“分解”。在第6章、第7章中,每个示例数据元都给出了提取层的参考。特定层的元素与上下层的关系有助于用户为了特定使用,选择包含适当信息的数据元。在注册系统中可能还有其他结构数据元被置于其他注册系统表项(例如数据元概念)的相对位置。这种情况下,需要其他的属性定位那些结构中的示例数据元。5数据元注册为了能够明确地描述和定义数据元,在注册数据元时,要求记录数据元的一定特征。这些特征作为数据元的属性储存在注册系统中。注册系统既可以包括标准中的数据元,也可以包括应用中的数据元。注册系统中的元数据信息的数量和质量可能是良好、完备的也可能是不完整的。本部分的目的在于描述如何在注册系统中注册数据元,以

21、便生成质量高且一致的元数据。GBT 183913规定了用于记录注册系统中数据元的属性。本部分将给出一些示例来说明注册系统中数据元的注册。它包括必选属性、由元模型给出了完整定义的属性,以及注册机构自己规定的必要属性。数据元构建过程中,常常会出现很多问题,例如,值域中值的定义有些是规范的,有些不是。两个数据元的值可能是交迭的。本部分不解决这类问题。元模型给出了记录注册系统中多个元数据项的管理数据,被称之为管理记录。管理记录应包括一个标识符、项产生的日期、项的注册和管理状态。管理记录应有相关环境下的名称和定义。管理记录还可以包括当与项有关的的数据变更时的日期、有效和终止的日期。解释性备注和项的起源以

22、及管理注解、变更描述和尚未解决的问题都可以被记录。在目前对注册进行描述的GBT 183916中,关于管理记录而非数据元自身的注册状态确定的严格的程序尚未建立。出于本部分的目的,用于决定所有项注册状态的完备和数据质量特性将棱认为与数据元自身的一样。本部分包括了数据元注册的两种方法:白下而上的方法,在注册之前,关于数据元的有限信息是可以获得的;自上而下的方法,事先可以识别概念上的信息。 自下而上的注册程序提供了在定义关于数据元概念信息之前,就完成的关于数据元(例如,定义、名称和允许值)的基本元数据属性。本部分的第6章描述了该方法;在许多情况下,白上而下的方法很实用,尽管它会更需要“向前”尝试,自上

23、而下注册的潜在好处是能够产生更稳定、更统一的元数据。第7章给出了一个自上而下注册的示例,在此,注册由识别数据元的概念开始。值得注意的是,无论什么方法,应用于一个数据元相关元数据项和属性的规则和指南应相同。自下而上和自上而下的程序仅仅是应用者在分析数据元和明确表达其相关项和属性时的顺序不同而已。第6章的语境描述了完整的注册程序。除了描述的顺序外,相同的程序可适用于第7章。46 自下而上的数据元注册方法GBT 238241-2009ISOIEC TR 20943-1:2003在许多情况下,提交者提供注册的数据元仅是一些有限的信息(例如,名称、定义和允许值的集合),其他属性必然由基于对其他一些事实所

24、隐含的潜在数据元和概念的理解来决定。对现有系统进行操作的注册系统操作人员,可能会发现从数据元到数据元概念的操作是合适的。在本部分中称为自下而上方法。当注册系统的目的在于作为一个描述数据产品例如公共数据集、查询结果等元数据的一个发行机制时,也可使用自下而上的方法。本章提供的示例描述了基于自下而上的程序如何编写一个数据元的属性。注册程序按照分析和编写一个数据元属性的逻辑顺序来表述。首先描述注册数据元的一般性程序,其次是四种类型的数据元的注册的示例,包括:一个具有可枚举值域的国际标准;一个信息系统,该系统的应用数据元使用了标准的可枚举值域;一个具有不可枚举值域的国际标准;另一个标准,其中的应用数据元

25、使用了标准的不可枚举值域。本部分的目的在于帮助注册系统实施者系统性地阐明、描述和定义一个数据元的属性。61给出了自下而上的数据元注册系统总体方法的一个示例。注册诸如国际标准、国家标准和信息系统中描述的各种更特化的数据元示例时,可参见62,63,64和65。附录A中的表格简要概括了第6章随后示例中每个数据元需要注册的信息。附录B依据GBT 183912,GBT 183914,GBT 183915和GBT 183916,包含了更详尽的信息和示例,用以帮助数据元注册的操作人员。附录c提供了本部分的示例属性与GBT 183913元模型间的对照。61 注册数据元的一般性程序通常提交注册的数据元的信息是有

26、限的,可能是在文件中或由提交组织提供的名称和定义,也有可能包括允许值的集合。下面的一般性程序目的在于,按照某个特定注册机构的要求,产生一个完整、定义良好的数据元注册。有些数据元的元数据可能永远也会完整。如计算机软件的应用数据元,除了表示属性(例如字段长度和数据类型)外,其他信息很少。对这些数据元,仅注册最基本的属性,数据元的注册状态是“未完成”。611数据元的理解在检测计算机系统时,操作人员不应认为记录中的字段和注册系统中的数据元是一一对应的。随着系统的更新,在不同的情况下,字段可用于不同的目的。这时一个字段可能对应多个数据元,也可能多个字段对应一个数据元。注册程序的第一步是理解个特定数据元。

27、哪类数据可以存储在该数据元中?是否有数据值的定义或描述?是否提供数据的允许值或者示例?数据值是由算法还是统计来决定?数据值的表示是什么?例如,它们可以是事物的名称或描述,可计算的数值,作为标识符的字符串或数字。当提交的文件不足以满足对数据元的理解时,操作人员应咨询该数据元的提交者,以获得必要的信息。第一步的结果是对数据元语义内容的理解。612内容研究注册者在形式化新注册数据元的属性之前,应研究并确定:在现有的国际、国家或组织标准中是否有对该数据元的描述?注册系统中,或者注册系统的联盟中是否存在可再利用的数据元?有必要认识到,在记录元数据于注册系统时,注册操作人员应进行值确认。操作人员将决定是否

28、采用一个数据元以满足新需求,或者是否有某个现有数据元的属性(例如,值域、数据元概念或概念域)可被该新数据元利用。内容研究应包括概念域、数据元概念和值域以及数据元的研究,以识别可能与将被5GBT 238241-2009ISOIEC TR 20943-1:2003注册数据元有关的属性。如果现有的标准数据元可以用作一个典型来满足带有新目的的特定规范,那么一些相关的元数据项可被再利用于该新数据元的注册。该步骤的结果是确认所需的新数据元,或决定是改造还是再利用现有的数据元或它的一些属性。613数据元定义一个数据元的基本语义内容应从数据元的定义中获得。GBT 183914描述编写定义的规则与指南。附录B根

29、据GBT 183914阐明的规则和指南,给出编写定义的示例。定义和名称注册在相关语境中(定义或名称应用于或来源于其中的学科标记)。本部分中许多示例的相关语境记录为“注册系统”。该例中的“注册系统”表明对名称和定义的简洁陈述是依据注册机构为此特定注册系统而建立的规则和指南。除了标记(命名)语境,表示名称和定义的语言也可标记为一种语言标识符。614允许值和值域GBT 183913给出了描述允许值域的属性。数据元的全部允许值构成了该数据元的值域。附录B也包含关于值域属性的详尽信息和这些属性如何用于可枚举值域(即,通过列表来规定)和不可枚举值域(通过公式、规则、规程或参照来规定)的示例。数据类型应与其

30、所来源的模式名称或数据名称相关联。附录B提供了数据类型来源的示例。格式用于表明标点符号的位置,或满足数据项的值的其他编辑需要(例如,YYYYMMDD是日期的一种格式)。不同属性的使用取决于允许值是可枚举还是不可枚举。每个可枚举允许值与规定该允许值含义的一个有效值含义相关联。描述参见618。每个可枚举允许值的起始日期也一起被注册在注册系统中(即,当允许值对于注册系统中的值含义有效时的日期)。对值含义来说,该允许值成为无效的终止日期也将被注册。不可枚举域的值域应包括对数据元有效值的描述。本部分包含了注册具有可枚举域(62和63)和不可枚举域(64和65)的数据元的具体示例。值域是一项管理记录,要求

31、记录值域的管理数据,包括相关语境中的名称和定义、域的起源和任何说明性备注,以及该值域的管理状态和注册状态。615表示类在注册过程的该阶段,适于注册描述如何表示数据元的表示类。在GBT 18391的注册系统中,表示类是一项可选属性。在使用表示类的地方,它是一项管理记录。每个表示类都需要标识符、名称、定义和相关语境及其他属性,如注册状态、管理状态和创建日期。可选属性(例如,解释性备注、来源)也可包含在表示类中。注册数据元时,表示类选自已被管理的表示类列表,并记录在该数据元中。表示类的限定词也可酌情记录。表示类用法的描述及示例参见B23。 616名称和标识符GBT 183915给出了数据元的命名和标

32、识的原则。一个数据元应至少赋予一个名称,并与该名称适用的相关语境关联。可以为一个学科、一个组织、一个特定计算机语言、一个数据库管理系统或其他目的开发一个名称。遵照一个特定名称相关语境的命名协定来开发每个名称。命名协定可以是多样化的,从“无论你想称呼它什么”到一个高度结构化的名称。命名协定的描述应作为一个参考文件保存在元数据注册系统中。GBT 183915没有强制规定命名协定,但说明了如何文档化一个命名协定。附录B通过名称和名称相关语境应用的示例详述了GBT 183915。在注册机构(RA)中注册的每个数据元都由一个唯一的标识符来标识,使之没有歧义。尽管该标准没有规定数据元标识符的格式和内容,但

33、是标识符不应带有关于该数据元的有用信息,例如,它可以是一个自动系统按序赋予的一个号码。如果数据元的属性发生改变,则生成该数据元一个新版本,并重新注册版本标识符(VI)。由于每个注册机构都有各自的标识方案,所以不同的注册机构可能使用了相同的标识符标识不同的数据元。因此,应确定一个注册机构标识符(RAI),并同数据标识符和版本标识符一起唯一的标识一6GBT 238241-2009ISOIEC TR 20943-1:2003个数据元。按照GBT 18391的规定进行注册的数据元拥有国际注册数据标识符(IRDI),它由RAI、DI、VI组成。GBT 183916描述了RA的要求和RAl的构成。RAI由

34、国际代码分配符(ICD)、组织标识符(OI)、组织内部机构标识符(OPI)和OPI来源组成。GBT 183916对IRDI作了进一步的讨论。本部分将RAI的示例标为RAI)。在GBT 18391注册系统中,所有管理记录都将被赋予标识符其方法与上述数据元的相同。617其他元数据属性GBT 183913描述了其他必选和可选的数据元属性。除了613描述的定义属性和616的标识属性,还有用于定义和描述数据元的管理、关系、分类和其他混合属性。用于GBT 18391元数据注册系统的该标准要求数据元应文档化为管理记录。除了GBT 183913规定的必选属性注册机构可以确立特定注册系统的轮廓。规定如下要求:在

35、GBT 183913中为可选属性,但在该注册系统中为必选的属性;在GBT 183913中规定的,但该注册系统中未包括的可选属性;在GBT 183913中未涉及但在该注册系统中要标识并添加的属性。本部分随后的各章描述了通过数据元概念将数据元关联起来(618)和对数据元进行分类(619)的属性。许多信息源没有提供关于数据元的概念和分类信息。6110描述了与注册和管理状态有关的一些管理信息。附录B包括了这些元数据属性的详细信息。对于本部分描述的自下而上注册程序,在此记录的一些管理和混合属性包括:提交组织:提交组织是将要添加的数据元提交给注册系统的组织的名称。提交组织的提交联系在注册系统中也有记录。主

36、管联系:被授权负责数据资源集合的组织是主管联系。主管也可以是组织内部的一个职位,或甚至是热线应答服务。该阶段可以注册关于联系的其他信息,包括电话号码、电子信箱和邮编。数据元解释性备注:数据元的解释性备注可以用来提供该数据元的备注,包括用法、程序和其他不适于包含在该数据元的定义属性中的说明性信息。数据元的起源:数据元可以与任何类型的来源关联,包括文件、标准、系统、团体、表格或消息集。只有一个与数据元关联的来源指明关于该数据元的信息源。关于来源的其他信息在该阶段可以注册的包括摘要和文献信息。系统日期一般由应用软件记录为管理属性:创建日期和最近修改日期。其他管理数据可进行手工注册。618数据元概念在

37、注册数据元阶段,可以通过数据元概念规定关于数据元的概念性信息。数据元概念可以与若干数据元关联,这些数据元用不同的表示记录关于那个概念的数据,例如,表示加拿大各个省的名称和代码具有相同的概念,在该例中就是“加拿大省份标识符”。数据元概念可以用对象类、特性和限定词标识。数据元概念是单一的(仅表示为一个概念)。它可与多个数据元关联,包括其他的名称和代码,但在其名称或定义中不包括表示类术语。下段将要描述到数据元概念仅与唯一的一个概念域关联。概念域规定数据元概念,即,在注册系统中,管理数据项概念的可能有效值含义集合的表示应独立于(但不限于)它们在相应值域中的表示。概念域“加拿大省份”包括有效值含义如“加

38、拿大的省(A1一bertaYukon Territory),”每个值含义标识一个加拿大的省。每个值含义和它的概念域、起始日期(值含义在注册系统的概念域中开始有效的日期)和终止日期(值含义无效的日期)一起注册在注册系统中。依照值域规定的表示,允许值与值含义关联。例如,表示加拿大的两字母字符代码允许值“CA”与命名为“世界各国”这个概念域中“主要地理实体为加拿大”的值含义关联。数据元概念和概念域通常为管理记录应由管理数据规定,如同数据元本身一样。因此,至少有一7GBT 238241-2009SOIEC TR 20943-1:2003个该数据元概念和概念域的名称和定义应记录在相关语境中。还需要记录二

39、者进入注册系统的日期以及它们的注册状态和管理状态。关于数据元概念和概念域的注释、起源和其他管理属性也可储存。附录B详尽地描述了数据元概念和概念域的派生,包括值含义。 。619分类方案在恰当的时候,也记录分类方案的属性。分类有助于增加在定义中不易包含的额外信息组织注册系统的内容并提供路径来支持更有意义的查询。GBT 183912描述了分类的一般种类。每个注册机构都应决定包含在其注册系统中的分类类型。始终要记录分类方案的类名。注册机构可以选择将数据元分为如下几组:用于邮政地址的数据元;用于标识设施的数据元;用于定位地球表面一个点的数据元;列于数据标准中数据元;包含于应用系统的数据元;标识于数据集合

40、表格中的数据元。注册机构可以选择的分类类型的示例按一个或多个关键字对数据元进行分类,例如,高度、日期、设施、行业、组织以及对象类。分类方案经常包含管理数据,并与组织、参考文件、注册机构和联系信息等相关联。本部分仅提供了分类方案类型和这些类型分类值的示例。6110注册和管理状态信息起初,新注册的数据元仅有某些属性被记录。这样的数据元其注册状态指定为“未完成”。当一个数据元所有的必选属性注册在注册系统中,但元数据的质量尚未验证贝0注册状态为“已记录”。通过质量审查程序,一些数据元将被指定为“合格”的,另一些为“标准”的。“标准”的数据元是用于数据共享时所首选的数据元,使得被交换的数据有一致的表示和

41、理解。在GBT 183916中描述的数据元的注册过程和注册状态,可以用于标识元数据的审查和质量。许多数据元可能被注册在一个注册系统中,但其中仅有相当少量数据元被指定为“标准”的注册状态。附录B描述了贯穿注册数据元整个生命周期的注册和管理状态的分配。GBT 183916规定了注册状态的层级,但管理状态由各注册机构确立。尽管GBT 183916没有给出数据元外其他元数据项的注册,但在本部分中其注册过程,与数据元的一致。62具有可枚举域的标准的示例本条中的数据元注册的示例,来源于ISO 31661:1997(EF),其有效值是可枚举的。ISO 3166包含了下列值域:国家名称英文简称、国家(正式)名

42、称英文全称,2字符字母代码、3字符字母代码、2字符数字代码、3字符数字代码、国家名称法语简称、国家名称法语全称。下列各段以国家名称英文简称为例,按照逻辑顺序给出了一个标准的可枚举数据元属性的编写。6212中的表格包含了国际标准中一个可枚举数据元示例的全部元数据属性。621数据元的理解该注册数据元来自一个国际标准,它包括世界各国国家标识符的官方概念域。选择将英文简称标准化是因为其在美国联邦各部门的信息系统中用处最多,私人领域也是如此。美国邮政局(USPS)将英文简称形式的名称用于所有寄出的国际邮件,优先于该标准中包含的其他任何代码或全称。相对于各个国家自己标识的当地名称,(USPS)也优先使用该

43、名称。例如,(USPS)认可“Japan”而不是该国家自己普遍使用的“Nihon”。在以IsO 3166为基础的开发中,也优先使用英文简称,以避免有些情况下全称(即,“人民共和国”“王国”)可能反映国家政治状况。一些注册机构可能选择将英文简称注册为一个值域,而不是一个数据元(注:参见14)。由于1SO 31 66包含了通常不作为国家而作为地区的名称和代码,因此基于IsO 3166的数据元也可能会仅使用表示国家而不含地区的值域子集。RGBT 238241-2009IS0IEC TR 20943-1:2003该标准英文简称在长度上从4个字母字符(例如,Peru)到44个字母字符(即South Ge

44、orgia andthe South Sandwich Islands)。622内容研究其他含有国家标识概念域的标准有:美国商业部、技术局、美国国家标准和技术研究院(NIST)发布的美国联邦信息处理标准(FIPS)。FIPS 10 4由美国国务院开发并使用,并由美国国务院地理学者和全球问题办公室负责维护。FIPS 10-4发布于1995年4月,反映了自1993年5月6日以来的变化。FIPS 1041执行了美国国家标准研究院的标准ANSI Z39271 984并采用了ISO 3166规定的实体、名称和代码并对其作了一些限定。例如,FIPS 1041没有随意地将一些与美国有关联的地区和领土标识为国

45、家,而在ISO 31 66中是标识为国家的。FIPS 1041的上次修订是在1986年5月12日。FIPS1041由美国国家标准局(即现在的NIST)维护,但应与美国国务院、美国地名委员会和ISO 31 66的维护机构协商。目前尚无计划更新FIPS的两项标准,而且两项标准也没有获得国际范围的认可。标识国家的数据元标准应是国际权威的值域源并要对其进行持续的维护。因此,1SO 3166:1997是国家名称数据元的起源。623数据元定义数据元定义的编写依据GBT 183914确立的相应的规则和指南。附录B用示例对其进行了描述。定义是单数的,因为数据元的任何示例仅包含一个值。理解该数据元的实质含义是用

46、英文的一个简称标识国家,数据元的定义可表达为“ISO认可的国家英文简称”。624允许值和值域该数据元的允许值是列在ISO 31 66中的英文简称(即,Atghanistan,AlbaniaZimbabwe)。每个允许值和其在某个特定注册系统中的有效值含义一起注册到这个注册系统中。该例中“起始日期”被定为该标准开始生效的日期:1997年1月10日,此时尚未注册“终止日期”。该数据元允许值的范围包括所有国家的英文简称。值域被定义为允许值的一个集合。在相关语境中它可以用一个名称和一个定义加以标记。在该例中,相关语境为“注册系统”;值域的名称为“国家英文简称”;定义是“ISO认可的国家英文简称”。值域还应有一个标识符和一个版本号,可以通过应用软件赋予。参见附录B22和值域,该例中在此时记录的其他值域属性有:数据类型:国家名称的数据类型是“CHARACTER VARYING”,数据来源是“ANSI ISOSQL”;最大字符:依据621,该值域已知的最大长度为44;格式:该字符串没有要求的格式;值域(vD)来源;可获得允许值的标准是ISO 31661:1997;标识符:RAI)5678:1。625表示类表示类“名称”在以前注

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1