GB T 21336-2008 地理信息.质量评价过程.pdf

上传人:周芸 文档编号:240239 上传时间:2019-07-13 格式:PDF 页数:61 大小:1.42MB
下载 相关 举报
GB T 21336-2008 地理信息.质量评价过程.pdf_第1页
第1页 / 共61页
GB T 21336-2008 地理信息.质量评价过程.pdf_第2页
第2页 / 共61页
GB T 21336-2008 地理信息.质量评价过程.pdf_第3页
第3页 / 共61页
GB T 21336-2008 地理信息.质量评价过程.pdf_第4页
第4页 / 共61页
GB T 21336-2008 地理信息.质量评价过程.pdf_第5页
第5页 / 共61页
亲,该文档总共61页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、ICS 3524070;07040L 67 缮雪中华人民共和国国家标准GBT 2 1 336-2008地理信息质量评价过程Geographic information-Quality evaluation procedures20080 109发布(IS0 19114:2003,MOD)20080801实施宰瞀鹳鬻瓣訾麟瞥星发布中国国家标准化管理委员会仪19GBT 21336-2008目 次前言Il言-1范围12一致性13规范性引用文件14术语和定义15缩略语36数据质量评价过程361概要-362数据质量评价过程的组成部分363数据质量检验基本要求57数据质量评价方法571数据质量评价方法分类

2、572直接评价法573间接评价法674数据质量评价示例68数据质量评价信息的记录781元数据782质量评价报告783综合数据质量结果报告7附录A(规范性附录)抽象测试套件8附录B(资料性附录)质量评价过程的应用9附录C(资料性附录)动态数据集中质量评价过程的应用10附录D(资料性附录)数据质量度量示例一1l附录E(资料性附录)应用于地理数据集的抽样方法指南28附录F(资料性附录)专题准确度和完整性检测示例32附录G(资料性附录)完整性与专题准确度度量和记录示例37附录H(资料性附录)综合数据质量结果的示例44附录I(规范性附录)质量评价报告记录质量信息47附录J(资料性附录)综合数据质量结果5

3、1附录K(资料性附录)数据质量度量组成部分53参考文献56前 言GBT 21336-2008本标准修改(MOD)采用国际标准化组织地理信息技术委员会(ISOTC 211)制定的国际标准IsO 19i14:2003 Geographic Information-Quality evaluation procedures(地理信息质量评价过程),并做了如下改动;a)标准的编写方法执行了国家标准GBT 112000标准化工作导则第1部分:标准的结构和编写规则的要求。b)将“本国际标准”和“IsO 19114”改为“本标准”。c)删除了原国际标准的前言。d)将规范性引用文件和标准文本中的“ISO 19

4、113:2002 Geographic Information-Quality principles”改为“GBT 21337-2008 地理信息 质量原则”,将“ISO 19113”改为“GBT 213372008”将规范性引用文件和标准文本中的“ISO 19115:2003 Geographic Information-Metadata”改为“GBT 19710-2005地理信息 元数据”。将“ISO 19115”改为“GBT 197102005”I增加了规范性引用文件“GBT 19000-2000 质量管理体系 基础和术语”、“GBT 282812003计数抽样检验程序 第1部分t按接收

5、质量限(AQL)检索的逐批检验抽样计划”和“GBT 18316-2001 数字测绘产品检查验收规定和质量评定”。将“ISO 2859”改为“GBT 2828”,并相应将“ISO 28591”改为“GBT 282812003”I将“IsO 8601”改为“GBT 7408”,将“IsO 11404”改为“GBT 18221”。e)将“data quality element”译为“数据质量量化元素”,“data quality subelement”译为“数据质量量化子元素”,“data quality overview element”译为“数据质量非量化元素”。f) 按照GBT 19000-

6、2000增加了术语“质量管理”和“质量控制”及其定义。按照GBT 183162001增加了术语“简单随机抽样”和“分级随机抽样”及其定义。参照GBT 18316-2001增加了术语“检验批”及其定义。参照GBT 282812003增加了术语“接收质量限”及其定义。参照“ISO 19138:2006 Geographic information-Data quality measures”增加了术语“数据质量基本度量”和“被测变量”及其定义。按照全国科学技术名词审定委员会2002年公布的测绘学名称(第二版)定义术语“准确度accuracy”。g)增加了63“数据质量检验基本要求”。h)修改了附录

7、D的表D2表D6中有关示例的“DO-范围”(经纬度或地名)使示例的“范围”在我国国土之内,并将表D3中所有通名“州(state)”改为“省”,将表D6中“名称拼写错误”改为“名称错误”;将附录E的E432中的“UTM”改为“高斯一克吕格投影”,将附录E的E52中的“现行的ISO标准”改为“现行的国家标准和ISO标准”,将附录E的E535中的“相关ISO标准”改为“相关国家标准和ISO标准”删除了附录F的F1中第一自然段内容,将原第二自然段中的“国家地形数据集”改为“国家地形数据库(TDB)”,并将图F4中的英文“realibility”改为“reliability”;将附录G中的“住户姓名(f

8、amily name)”和“居住的人数(humber of OCCupants)”两个属性名分别改为“建筑物名称”和“建筑物层数”,修改了附录G和附录H的图G2图G5、图H3和图H4上的建筑物、道路等名称,并相应修改文本内容,使其更切合我国命名习惯删除了附录H的H1中第一tJ然段的第一句内容;将表I1第一行的约束条件“c子条款92”改为“C子条款82”。将第9、10行的名称(英文)中的“realibility”改为“reliability”。并将第43行的域“ISO 19108”改为“GBT 7408”。i)参照地理信息国际标准ISO 19138:2006 Geographic informa

9、tion-Data quality measures的内IGBT 213362008容,增加了资料性附录K“数据质量度量组成部分”。j)将参考文献“ISO 9001:2000 Quality management systems-Requirements”改为“GBT 190012000质量管理体系要求”、“ISO 11404:1996 Information technology-Programming lan-guages,their environments and system software interfaces-Language-independent datatypes”改为“

10、GBT 18221 2000信息技术程序设计语言、环境与系统软件接口 独立于语言的数据类型”、“IS0 8601 l 2000 Data elements and interchange formats-Information interchange-Representation of dates and times”改为“GBT 7408-2005数据元和交换格式信息交换 日期和时间表示法”I增加了参考文献“ISOTS 19103:2005地理信息概念模式语言”和“Is0Ts 19138:2006地理信息数据质量度量”;删除了参考文献“IsO 19108:2002地理信息时间模式”。本标准附

11、录A、附录I为规范性附录。附录B、附录C、附录D、附录E、附录F、附录G、附录H、附录J和附录K为资料性附录。本标准由全国地理信息标准化技术委员会提出并归口。本标准起草单位:国家基础地理信息中心。本标准主要起草人:蒋景瞳、刘若梅、贾云鹏、周旭。引 言GBT 21336-2008为评价数据集质量,必须按一致的方式采用明确定义的评价过程。这使得数据生产者能够说明他们的产品满足其产品规范规定的程度,也使得数据用户能够确定数据集与他们需求的符合程度。数据集质量由两部分描述,即量化部分与非量化部分。本标准的目的是按照GBT 21337-2008地理信息质量原则说明的质量基本元素。对地理数据量化质量信息的

12、评价程序提供指南。本标准也提供公布质量信息的指南。本标准认为,数据生产者与数据用户可能持不同的观点看待数据质量。一致性的质量水平可以按数据生产者的产品规范或数据用户的数据质量要求确定。如果数据用户要求的数据质量信息比数据生产者提供的多,数据用户可以沿用数据生产者的数据质量评价流程获得补充信息。在这种情况下,数据用户的要求被视为产品规范,以达到使用数据生产者流程的目的。当与GBT 21337-2008一同实施时,本标准阐述的质量评价过程规定了确定和记录数据集质量信息的一致的和标准的方法。地理信息质量评价过程GBT 21336-20081范围本标准规定了确定和评价数字地理数据集质量的主要程序,与G

13、BT 21337-2008定义的数据质量基本元素一致。本标准确立了评价和记录数据集质量结果的内容框架,以作为数据质量元数据的一部分,或作为质量评价报告的内容。本标准可用于数据生产者提供数据集符合相应产品规范程度的质量信息,也可用于数据用户确定数据集是否具有足够好的质量,以满足他们特定的应用要求。本标准适用于所有类型的数字地理数据,其原理也可扩展用于许多其他形式的地理资料,如地图、图表和文档。2一致性本标准定义三类一致性:一类用于质量评价过程,一类用于评价数据质量,另一类用于记录质量信息。这三类一致性的抽象测试套件见附录A。3规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是

14、注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而t鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。GBT 282812003计数抽样检验程序第1部分:按接收质量限(AQL)检索的逐批检验抽样计划(IsO 28591:1999,IDT)GBT 18316-2001数字测绘产品检查验收规定和质量评定GBT 19000-2000质量管理体系基础和术语(idt ISO 9000:2000)GBT 19710-2005地理信息元数据(IsO 19115:2003,MOD)GBT 21337-2008地理信

15、息质量原则(ISO 19113:2002,IDT)4术语和定义GBT 21337-2008和GBT 19710-2005确立的以及下列术语和定义适用于本标准。41质量管理quality management在质量方面指挥和控制组织的协调的活动。GBT 19000-2000注:在质量方面的指挥和控制活动通常包括制定质量方针和质量目标l;及质量策戈!、质量控制、质量保证和质量改进。42质量控制quailty control质量管理的一部分,致力于满足质量要求。rGBT 19000-2000】GBT 21336-200843一致性质量级别conformance quality level数据质量结果

16、的一个或一组阚值,用于确定数据集符合产品规范规定或用户要求的程度。44数据集datasct可以识别的数据集合。EGBT 19710-20051注t通过限定空间覆盖范围或要素类型数据集在物理上可以是更大数据集的一部分。为便于数据质量评价,数据集可以仅仅是更大数据集内的单个要素或要素属性。45数据集系列dataset series符合相同产品规范的数据集集合。GBT 19710-200546直接评价法direct evaluation method以数据集内部检验单元检验为基础的数据集质量评价方法。47间接评价法indirect evaluation method基于外部知识的数据集质量评价方法。

17、注,例如数据志是一种外部知识,它包括数据生产方法或数据源等。48全检full inspection检验数据集内的每个检验单元。注;全检也就是100检验。49检验单元item可单独描述和考察的事物。rGBT 282812003注r检验单元可以是数据集的任何部分,如要素、要素关系、要亲属性或它们的组合。410检验批inspection lot为进行抽样检验而汇集起来的,具有同一性质的检验单元,简称批。4”总体population检验的全部检验单元。-ISO 35342例1t数据集中所有的点。例2:确定的地理范围内所有道路的名称。412参照数据reference data认可的代表论域的数据,用于作

18、为直接外部质量评价方法的参照。2GBT 21336-2008413简单随机抽样simple random sampling从检验批中抽取样本。抽样时,使每一个检验单元都能以相同的概率构成样本。GBT 18316-2001414分级随机抽样multistage random sampling从检验批中抽取样本。抽样时,先根据检验单元的困难类别(复杂程度)、区域特征、作业方法以及作业组(室)或者生产单位评定的优、良、可等级等诸项因素进行分级,再在每一级进行随机抽样,使每一级中的检验单元都能以相同的概率构成样本。-GBT 18316-2001415接收质量限acceptance quality li

19、mit;AQL当一个检验批被提交抽样检验时,可允许的最差质量水平,以不合格品百分数或每百检验单元不合格数表示。416数据质量基本度量data quality basic measure一般的数据质量度量,用作生成特定数据质量度量的基础。注:数据质量基本度量是抽象的数据类型。记录数据质量时不能直接使用。417被测变量measurand度量量化的物理参数。5缩略语ADQR综合数据质量结果(aggregated data quality results)AQL接收质量限(acceptable quality level)GBT 282812003RMSE中误差(root mean square er

20、ror)6数据质量评价过程61概要质量评价过程可以用于产品生命周期的不同阶段,每个阶段有不同的目标。这里所说的生命周期阶段包括制定规范、生产、分发、使用和更新。附录B说明了一些具体的与数据集有关的、可用于质量评价过程的操作。数据质量评价过程是从获取到记录数据质量结果的有序步骤。质量评价过程包括数据集生产者或用户对数据集进行质量评价的一系列操作。数据质量评价过程可用于静态数据集和动态数据集。动态数据集是频繁更新的数据集,对所有实际用途而言,数据是持续变化的。附录c说明了动态数据集质量评价过程的应用。62数据质量评价过程的组成部分621评价流程质量评价过程是产生质量评价结果的顺序步骤。图1所示为评

21、价和记录数据质量结果的流程。3GBT 21336-2008C孥_ l坚,第l步 ll;:盏:;:化元素、第2步确定敷据质量的度量方法 f第3步 【”悬择和应用教据质量评价方法第4步 判矗 教据质量结果 第5步l 判定一致性 I-记录数据质量结果 记录数据质量结果(量化的) (合格不合格) z,_图1 评价与记录数据质量结果的流程622评价步骤表1详细说明了评价的步骤。裹1评价步骤步骤 操 作 说 明1 确定适用的数据质量量化元素、 根据GBT 21337-2008的要求确定要检验的数据质量量化元素、数据数据质量量化子元素和数据质 质量量化子元素和数据质量范围。这一步按照产品规范或用户需求所量范

22、围 要求的不同检验予以重复。2 确定数据质量度量方法 确定检验每一检验单元数据质量的检测(量度)方法、数据质量值类型,以及必要的数据质量值的单位。附录D提供了GBT 21337-2008规定的数据质量量化元素和子元素的数据质量度量方法示例附录K给出了数据质量度量的组成部分通过这些示例和附录为用户选择度量方法提供帮助。3 选择和应用数据质量评价方法 针对确定的每种数据质量度量方法选择数据质量评价方法。注z数据质量结果的空间描述(可通过结果的空间内插、绘豳表达等完成)是有用的,不是与结果相对应,而是与不同的、但相关的数据集相对应4 判定数据质量结果 应用评价方法进行评价输出的结果,包括量化数据质量

23、结果、一个或一组数据质量值、数据质量值单位和日期。5 判定一致性 只要在产品规范或用户要求中详细说明了一致性质量级别,就要将数据质量结果与其对比来确定一致性。一致性数据质量结果(合格不合格)是量化数据质量结果与一致性质量级别的对比。4GBT 21336-200863数据质量检验基本要求数据质量检验一般包括过程检查和最终检查。过程检查应为100的数据全面检查,最终检查宜为100的检查。过程检查和最终检查评定数据质量的结果,分gU编写质量检验报告。7数据质量评价方法71 数据质量评价方法分类数据质量评价过程是通过应用一个或多个数据质量评价方法来完成的。数据质量评价方法分为两个主要类别:直接评价法和

24、间接评价法。直接评价法通过将数据与内部和或外部的参照信息对比确定数据质量。间接评价法利用数据信息如数据志推断或评估数据质量。直接评价法根据执行评价所需要的信息源进一步细分为子类。图2说明该分类结构。囤2数据质量评价方法分类(资料性)72直接评价法721直接评价法类型直接评价法细分为内部与外部两种方法。内部直接数据质量评价方法需要的所有数据都是被评价数据集内部的。例1:为检验边界闭合的拓扑一致性而需要进行逻辑一致性测试的所有数据,位于建立了拓扑关系的数据集内部。外部直接数据质量评价法需要参照被测数据集外部的数据。例2:对数据集中道路名称进行完整性测试。需要另外的道路名称资料。例3:位置准确度测试

25、需要一个参照的数据集或置新测量。722直接评价法的实施对于外部和内部评价方法,都有两种考虑,即自动或非自动、全检或抽样检验。数据质量量化元素和数据质量量化子元素易于用自动方法检验,包括:a)逻辑一致性:格式一致性,如:检验有效条目的数据字段。拓扑一致性如:多边形闭合。域一致性,如:边界错误,标定的域值错误。b)完整性:遗漏,如:对比其他文件检验街道名称。多余,如:对比其他文件检验街道名称。c)时间准确度:时间一致性,如:检验某日期范围的所有记录。723全检全检要求对数据质量范围确定的总体中每一个检验单元进行检验。表2说明全检应使用的程序。GBT 21336-2008表2全检程序评价步骤 说 明

26、确定检验单元 检验单元是要检验的最小单元。一个检验单元可以是一个要素、一个要素属性或一种要素关系。检验数据质量范围内的检验单元 检验数据质量范围内的每个检验单元。注t全检最适合于总体的量不大,或可以用自动方法完成的检验724抽样抽样要求检验总体中足够数量的检验单元,以获得数据质量结果。表3说明应采用的抽样过程。裹3抽样过程步 骤 说 明确定抽样方法 附录E给出了抽样方法的示例。这些方法包括简单随机抽样、分层抽样(如按照要素类型、要素关系或某个区域)、分级随机抽样和非随机抽样。确定检验单元 检验单元是检验的最小单元。检验单元可以是一个要素、一个要素属性或一种要素关系。将数据质量范围(总体)划分为

27、检 检验批是数据质量范围内检验单元的集合,从中抽出样本,并进行检验。每个验批 检验批应尽可能包古相同条件和相同时间产生的检验单元。将检验批划分为抽样单元 抽样单元是检验批的一部分。确定抽样比例或样本量 抽样比例给出从每个检验批平均抽取多少检验单元进行检验的信息。选择抽样单元 确定抽样单元散量,以满足检验单元的抽样比例或样本量。检验抽样单元中的检验单元 检验抽样单元中的每个检验单元。抽样过程应按照本标准第8章规定予以记录。GBT 2828系列和IsO 39511适用于评价与产品规范一致性的抽样。这些标准最初是为非空间数据应用制定的。本标准附录E给出了如何应用GBr 2828系列和ISO 3951

28、1的示例,同时为如何定义样本,以及如何设计考虑数据地理特性的抽样方法提供指南。在抽样时,特别是当样本量小和采用不同于简单随机抽样的方法时,要对数据质量结果的可靠性进行分析。73间接评价法间接评价法是一种基于外部知识的数据集质量评价方法。外部知识可包括但不限于数据质量非量化元素和其他用于生产数据集的数据集质量报告或数据质量报告。注1:仅在直接评价法不能使用时推荐采用该方法注2:数据质量非量化元素中应用信息记录数据集的各种实际应用,这有助于搜寻已经为特定目的生产或使用的数据集。注3t数据质量非量化元素中数据志信息记录有关数据集生产和历史的信息,包括诸如生产数据的原始资料或采用的生产处理过程等,这在

29、确定数据集是否适合特定的用途是有用的。一个例子是与数字地形模型数据有关的数据志元数据。该数字地形模型数据是用立体相关方击从按一定条件获取的影像生产的。经验告诉评价者,此类影像的水平位置中误差为10 m。另一个例子是1 t 25 000比例尺地形圈数字化的数据志元数据说明了与城市规划人员对基本田要求的一致性。注4:数据质量非量化元素中目的信息说明生产数据集的目的。一种目的可以是支持特定的需求或者是适合多种用途的通用数据集。当确定数据集可能的价值时这是有用的。74数据质量评价示例附录F、附录G和附录H给出示例,说明使用的典型方法,以及如何应用这些方法。68数据质量评价信息的记录GBT 21336-

30、200881元数据按照GBT 19710-2005的相关模型和数据字典规定,在元数据中记录量化的质量检验结果。82质量评价报告在下列两种情况下编写质量评价报告:a) 当数据质量结果在元数据中只记录合格不合格时b)当产生综合的质量检验结果时。在后一种情况下,要求质量报告解释如何进行综合和如何理解这种综合的质量检验结果的含义。当然,在其他情况下也可编写质量评价报告,如要求提供比元数据记录更详细的内容时,但不能用它替代元数据中的质量记录。质量评价报告应按照附录I规定编写,该附录包含相关模型和数据字典。83综合数据质量结果报告当将几个质量检验结果综合为单一的质量检验结果,作为数据集质量记录时,综合数据

31、质量结果应在元数据中记录,并包含在数据质量报告中。数据质量结果应作为“综合”类记录。附录J说明如何综合数据质量结果,附录H给出示例。GBT 21336-2008AI概述附录A(规范性附录)抽象测试套件本附录定义了3类一致性质量评价过程(A2),评价数据质量(A3),记录数据质量(A4)。任何声明与本标准一致的质量评价过程都应通过A2规定的所有要求。任何声明与本标准一致的数据质量评价都应通过A3规定的所有要求。任何声明与本标准一致的数据质量报告都应通过A4规定的所有要求。注t所有测试案例的测试类型都是“基本”A2质量评价过程第一类抽象测试套件应为:a)测试目的t保证质量评价过程按照本标准规定进行

32、,b)测试方法t通过A3和A4说明的全部要求。c)引用:A3和A4。A3数据质量评价第二类抽象测试套件应为:a)测试目的t保证质量评价过程按照第6章质量评价过程进行。b)测试方法:将数据质量评价过程与适当的质量评价进行比较。c)引用:本标准第6章。A4数据质量记录第三类抽象测试套件应为:a)测试目的:保证数据质量按照第8章的规定记录。b)测试方法:比较记录的质量评价,确保数据质量结果记录与第8章的规定和适用的附录一致。c)引用:本标准第8章。附录B(资料性附录)质量评价过程的应用CBT 21336-2008B1概述质量评价过程可以在生产周期的不同阶段使用。本附录给出在产品生命周期各阶段应用质量

33、评价过程的示例。B2产品规范或用户需求的制定在制定生产规范或确定用户需求时,可以应用质量评价过程帮助建立最终产品应当达到的一致性质量级别。产品规范或用户需求应包括数据集的一致性质量级别,以及生产和更新时采用的质量评价过程。B3数据集生产阶段的质量控制在生产阶段,生产者可以应用明确建立的,或者生产规范中没有包含的质量评价过程,作为质量控制过程的一部分。在为生产质量控制应用质量评价过程时,应当将质量评价过程的应用说明作为数据志元数据记录,包括采用的质量评价过程、建立的一致性质量级别和质量检验结果等。B4数据集符合产品规范的一致性检验当完成生产时,采用质量评价过程产生和记录数据质量结果。这些结果可以

34、用于决定数据集是否符合产品规范要求。通过检验(由一组质量评价过程组成的)的数据集即可使用。检验操作的结果应当按照第8章的规定记录。数据集质量检验的结果应当是通过或不通过。如果数据集未通过检验,在经过修改之后,需要先通过新的检验,才能认为数据集与产品规范一致。B5数据集符合用户需求的一致性评价采用质量评价过程建立数据集满足用户需求的一致性质量级别。可以用阎接法或直接法分析数据集对用户需求的一致性。对用户需求一致的质量评价结果可以作为该数据集的应用元数据进行记录。B6数据集更新阶段的质量控制用于数据集更新操作的质量评价过程,既包括检验更新的检验单元,也包括检测更新后的数据集质量。附录C是为实施GB

35、T 21337-2008和本标准对动态数据集进行质量评价的指南。GBT 21336-2008C1概述附录C(资料性附录)动态数据集中质量评价过程的应用本附录说明对动态数据集如何使用质量评价过程。这里将动态数据集定义为数据集频繁地进行更新,以至对于所有的实际目的而言,它们均持续地进行更新。例如,在线地籍数据集可能每几分钟就更新一次。一般有两种确定和记录动态数据集质量的方法;分时段检验和持续检验。C2确定和记录动态数据集质量C21分时段质检验程序分时段质量检验程序基于选择适当的记录频率,例如每周或每3个月,并在记录日生成数据集的拷贝。然后将该拷贝作为静态数据集进行检验这种类型的检验和记录给出该数据

36、集在拷贝当日时间的质量。C22持续质量检验程序持续质量检验程序基于检验更新的数据和评价更新数据产生的影响。这等同于将本标准确定的质量评价过程嵌入GBT 19000系列的面向过程的程序。由于该程序仅能提供经过更新的检验单元当前的质量状况,因此,需要擦分时段质量检验与C 3说明的持续质量检验摺结合,以便评价更薪数据集的质量。C3建立持续质量评价过程C31确定质量评价各部分内容按照本标准62说明的步骤,确定适用的数据质量量化元素及其相关的数据质量量化子元素、数据质量范围、数据质量度量和一致性质量级别,以便用于评价和记录质量检验结果。C32选择应用的方法选择采用的数据质量评价方法,然后,对更新的要索,

37、以及这些要素与数据质量范围内其他要素的关系进行质量评价。在持续质量评价过程中仅可以采用间接评价或内部直接评价方法。例如:a)是否依据可靠的数据源进行更新?b)更新是否保持了拓扑一致性?c) 更新要素的位置是否保持了逻辑一致性?C33确定数据集质量参照在持续质量检验期间,采用分时段质量检验程序确定的质量检验范围内要素和要素属性的数据集质量参照值。c34 将持续测试集成为更新过程将持续的质量检验集成到更新流程中,以便每项建议的更新在导人数据集之前都经过检验和认可。C35动态地更新数据质量结果通过将持续的质量检验集成到更薪流程中。每项认可的更新引起对现有质量评价结果进行调整。这将允许数据集质量评价结

38、果一旦产生即进行记录。C4周期地重建数据集质量参照并非数据集质量的所有方面均通过持续的面向过程操作的检验,例如,如果仅仅检验经过更新的检验单元,可能不会发现多余的要素。数据集的质量检验应定期进行。】0附录D(资料性附录)数据质量度量示例GBT 21336-2008D1概述本附录提供几个按照GBT 21337-2008定义的每个数据质量量化元素及其相关的子元素,进行数据质量度量的简单示例,以示范在进行质量评价时,数据质量组成部分之间如何相关。更详细的示例见本标准其他附录。对于每组数据质量量化元素和其子元素,给出示例的数据质量范围及其数据集参数,用3类数据质量度量示范不同的质量评价方法,并给出数据

39、质量日期和一致性质量级别,以使示例尽可能地完整。最后,给出数据质量结果,说明质量结果的含义。虽然本附录给出的示例比较简单,但值得专用标准或其他文档参考。本附录的数据质量度量标识码,与数据质量量化元素及数据质量量化子元素相关联。D2数据质量组成部分间的关系表D1给出数据质量组成部分之间的关系。为节省空间,每个数据质量组成部分均给予一个缩写名,在本附录中使用。表D1 数据质量组成部分间的关系数据质量组成部分 缩写名 组成部分的域 示 例数据质量范围 DqLScope 自由文本 所有检验单元的类型为房屋数据质量量化元素 DqLElement 枚举的域: 1完整性1完整性 描述要素及其属性、关系存2逻

40、辑一致性 在或缺失的数据质量量化3位置准确度 元素4时间准确度5专题准确度数据质量量化子元素 DQ_Subelement 枚举的域: 1多余性错误(取决于数据质量量化 散据集中多余的敬据元素)EXAMPLE数据质量度量 DQ二Measure数据质量度量说明 DQ二MeasureDesc 自由文本 存在多余的检验单元数据质量度量标识码 DQ二MeasureID 枚举的域 10101数据质量评价方法 DQLEvalMethod数据质量评价方法类型 DQ_EvalMethodType 枚举的域: 2外部1内部(直接)2外部(直接)3间接GBT 21336-2008表D1(续)数据质量组成部分 缩写名

41、 组成部分的域 示 例数据质量评价方法说明 DQLEvalMethodDesc 自由文本或引用(取决于 将数据集中的检验单元数与数据质量评价方法类型) 论域中的检验单元散进行比较数据质量结果 DO_QualityResuh数据质量值类型 DQ_ValueType 枚举的域: l布尔变量1布尔变量2数字3比率4百分数5样本6表7二位图像8矩阵9引用(GBT 19710)lO自由文本11其他数据质量值 DqLValue 记录(GBT 18221) 真(取决于数据质量值类型)数据质量值单位 DQValueUnit (取决于数据质量值) 不使用数据质量日期 DqLDate GBT 7408-2005

42、20000305一致性质量级别 DQ_ConformanceLevel 一个值或一组值 数据集中的检验单元数与论域中的检验单元数差额为0a缩写名在本附录中使用。D3数据质量完整性度量示例完整性是指要素及其属性、关系的存在或缺失,其子元素如下多余性错误数据集中有多余的数据;遗漏性错误数据集中有缺失的数据。表D2提供这些子元素的若干示例。表D2数据质量完整性度量示例数据质量组成部分 示例1 示例2 示例3Dq二Scope 所有检验单元在数据 所有检验单元类型为房 所有检验单元类型为房屋,集中的类型为房屋 屋,且限定范围为: 且限定范围为浙江省云和县东经:119z。1194。和北纬2790282。D

43、CLElement 1完整性 1完整性 1完整性DQ二Subelement 1多余性错误 1多余性错误 1多余性错误DQ_Measure表D2(续)GBT 21336-2008数据质量组成部分 示例1 示例2 示例3DQLMeasureDesc 合格不合格 多余检验单元的数目 多余检验单元所占百分数DQLMeasureID 10101 10102 10103DQEvalMethodDqiEvalMethodType 2外部 2外部 2外部DQ_EvalMethodDesc 将数据集中的检验单 将数据集中的检验单元数 用论域中的检验单元数除数元效与论域中的检验 与论域中的检验单元数进 据集中多余

44、的检验单元数单元数进行对比 行对比 再乘以100DO_QualityResultDO_ValueType 1布尔变量 2数字 4百分数DqLValue False 10 10ODQValueUnit 不使用 房屋 百分数DQ二Date 2000一03一05 2000一0306 2000-03-04DQ_ConformanceLevel 数据集中多余的检验 数据集中多余的检验单元 数据集中多余的检验单元数单元数为0 数小于9 所占的百分数小于9示例敷据集参数 数据质量范围内数据 数据质量范围内数据集的 数据质量范围内数据集的检集的检验单元数为 检验单元数为110I范围 验单元数为110;范围内论110;范围内论域的检 内论域的检验单元数 域的检验单元数为100验单元数为100 为100示例的数据质量结果古义 数据集不合格。有多 数据集不合格。数据集中 数据集不合格。数据集中多余的检验单元。数据 多余检验单元的数目超过 余的检验单元数所占的百分集中类型为房屋的检 散据质量一致性质量级别 数超过了数据质量一致性质验单元比论域中的多 的规定 量级月4的规定数据质量组成部分 示例4 示例5 示例6DqiScope 所有的检验单元在数 所有的检验单元的类型为 所有的检验单元的类型为房据集中的类型为房屋

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 标准规范 > 国家标准

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1