1、ICS 03.120.30 A 41 道昌中华人民共和国国家标准化指导性技术文件GB/Z 22553-2010/ISO/TS 21748:2004 利用重复性、再现性和正确度的估计值评估测量不确定度的指南Guidance for the use of repeatability ,reproducibility and trueness estimates in measurement uncertainty estimation CISO/TS 21748:2004 ,IDT) 2010-09-02发布2010-12-01实施数码防伪中华人民共和国国家质量监督检验检菇总局中国国家标准化管理委
2、员会发布GBjZ 22553-20 1 OjISOjTS 21748 :2004 目次前言.n 引言.m 1 范围.2 规范性引用文件.3 术语和定义4 符号.3 5 原理55.1 单结果与测量过程性能5. 2 再现性数据的适用性5.3 基本统计模型5.4 重复性数据-6 利用重复性、再现性和正确度的估计值评定测量不确定度6. 1 测量不确定度的评定程序6.2 预期精密度与实际精密度的差异7 确立某特定测量过程中方法性能数据与测量结果的关系-7.1 概述7.2 偏倚的实验室分量控制表示7.3 重复性确认.8 7.4 性能持续确认.8 8 测试样品的相关处理.8 8.1 概述88.2 抽样.88
3、.3 样品制备和预处理8.4 测试样品类型的变化.8. 5 随响应水平变化的不确定度9 其他因素.9 10 合成标准不确定度的通用表达式.10 11 基于协同试验数据的不确定度来源列表.10 12 合成结果的不确定度评定.13 不确定度信息的表示13.1 一般表示13.2 包含因子的选择.1114 方法性能与不确定度数据的比较.14.1 比较的基本假定.14.2 比较程序14.3 差异原因四附录A(资料性附录)不确定度估计方法.13 附录B(资料性附录)实验不确定度评定.附录c(资料性附录)不确定度计算实例.参考文献.20 GBjZ 22553-201 OjISOjTS 21748: 2004
4、 目lJ1=1 本指导性技术文件等同采用ISOjTS 21748: 2004(利用重复性、再现性和正确度的估计值评估测量不确定度的指南。本指导性技术文件与ISOjTS21748: 2004相比主要差异如下:删除国际标准的前言;用小数点代替作为小数点的逗号,;一将A.2.1中的式A.6 uCy)2 =UCB)2十uCer)2=uE十5?更改为U Cy)2 =u (B)2 +u (er)2 = si + s; ; 一一将附录C的C.2. 2的式(C.2)中的wvN更正为WmN。本指导性技术文件的附录A、附录B和附录C均为资料性附录。本指导性技术文件由全国统计方法应用标准化技术委员会(SACjTC2
5、1)提出并归口。本指导性技术文件起草单位:辽宁出入境检验检疫局、中国标准化研究院、南开大学、北京航空航天大学、中科院数学与系统科学研究院、中国合格评定国家认可中心。本指导性技术文件主要起草人:王斗文、陈玉忠、于振凡、张帆、杨军、王海鹰、丁文兴、宋桂兰、曾浑。阳皿G/Z 22553-201 O/ISO/TS 21748: 2004 引测量结果的不确定度对解释测量结果十分重要。若未对不确定度做定量评估,就元法确定测量结果间观测到的差值是否包含试验变异以外的信息,测试项目是否符合规范,以及是否超出所依据的法规限。没有不确定度的信息,就存在着错误处理结果的风险,由此做出的错误决策可能导致工业上不必要的
6、损失、错误的法律起诉,或有害健康及造成不良的社会后果。按照GB/T27025认可和相关体系的要求,实验室应评定测量和测试结果的不确定度,并给出相关的不确定度报告。由IS0等发布的测量不确定度表示指南(GUM)是一个被广泛采用的标准方法,但是它仅适用于测量过程模型已知的情况。然而,大部分标准测试方法是基于GB/T6379.2一2004提出的协同试验来完成的。本指导性技术文件提供了一种经济有效的方法,对这些标准测试方法所得结果的不确定度进行估计,完全符合GUM的相关原理,同时也兼顾了由协同试验获取的方法性能数据。本指导性技术文件的通用方法要求如下:根据GB/T6379. 2-2004所述的协同试验
7、中获取的测试方法重复性、再现性和正确度的估计值,可从所用测试方法已发布的信息中获得。这些信息提供了实验室内和实验室间的方差分量的估计值,同时也涉及到测试方法正确度的不确定度估计值。一一实验室应通过核查自身的偏倚和精密度,判断其测试方法的实施是否符合方法所规定的性能,这表明了公布的数据可应用于实验室测得结果。一一协同试验未能包含到的所有测量结果影响量应予以识别,以及由此产生的相关方差加以量化。按照GUM所描述的方法,通过对有关方差估计值的合成,来给出不确定度估计值。同样,协同试验结果的分散性也常与用GUM程序的测量不确定度评估值进行比较,以检验对方法的全面理解。如果存在用协同试验数据来估计同一参
8、数的一致性方法,则这样的比较更为有效。N GBjZ 22553-2010jISOjTS 21748 :2004 利用重复性、再现性和正确度的估计值评估测量不确定度的指南1 范围本指导性技术文件规定了:一一-基于GBjT6379.2-2004的协同试验数据来评定测量不确定度(MU)。一一比较协同试验结果与不确定度传播原理获得的测量不确定度(见第14章)。本指导性技术文件规定了ISO5725-3中间精密度的其他模型研究,尽管本方法也可以应用到这些扩展模型,但不包含在这些模型下的不确定度评定。本指导性技术文件适用于所有的测量和测试领域中不确定度的评定,不适用于未给出缺乏再现性数据时重复性数据的应用方
9、法。本指导性技术文件适用于所识别的、不可忽略的系统效应己被修正假定,可应用作为测量方法一部分的数值修正,或通过查找并排除效应原因来完成。本指导性技术文件起指南性作用,提出了一种有效的多种用途下不确定度评定方法,但也可采用其他合适的评定方法。本指导性技术文件适用于测量结果、方法和过程或者测试结果、方法和过程。2 规范性引用文件下列文件中的条款通过本指导性技术文件的引用而成为本指导性技术文件的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本指导性技术文件。然而,鼓励根据本指导性技术文件达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最
10、新版本适用于本指导性技术文件。GBjT 3358. 1-2009 统计学词汇及符号第1部分:一般统计术语与用于概率的术语(lSO3534 1:2006,IDT) ISO 5725-3 测量方法与结果的准确度(正确度与精密度)第3部分:标准测量方法精密度的中间度量3 术语和定义3. 1 3.2 下列术语和定义适用于本指导性技术文件。偏倚bias 测试结果的期望与接受参照值之差。注:与随机误差相反,偏倚是系统误差的总和。偏倚可能由一个或多个系统误差引起。系统误差与接受参照值之差越大,偏倚就越大。引自GBjT3358. 1J 合成标准不确定度combined standard uncertainty
11、 u(y) 当测量结果是由若干个其他量的值求得时,按其他各量的方差或(和)协方差算得的标准不确定度。JJF 1059-1999J 1 G/Z 22553一201 O/ISO/TS 21748:2004 3.3 3.4 3.5 3.6 包含因子coverage factor h 为求得扩展不确定度,对合成标准不确定度所乘之数字因子。注:包含因子h一般取值范围为23oJJF 1059-1999J 扩展不确定度expanded uncertainty u 确定测量结果区间的量,合理赋予被测量之值分布的大部分可望含于此区间。注1:该部分可视为包含概率或区间的置信水平。注2:为将扩展不确定度决定的区间与
12、特定置信水平联系起来,需对有关表征测量结果概率分布及其合成标准不确定度作明白或隐含的假定,仅当这些假定是正确到某程度时,赋予此区间的置信水平才能知道该程度。注3:在建议书INC-l(1980)第5段中,扩展不确定度被称为总不确定度。JJF 1059-:-1999 精密度precision 在规定条件下,独立测试结果间的一致程度。注1:精密度仅仅依赖于随机误差的分布而与真值或规定值无关.注2:精密度的度量通常以不精密的程度刻画,其度量值用测试结果的标准差来表示。标准差越大,精密度越低。注3:独立测试结果指的是对相同或相似的测试对象所得的结果不受以前任何结果的影响。精密度的量化度量严格依赖于坦克的
13、条件,重复性条件和再现住条件为其中两种极端情况。GB/T 3358. 1J 重复性repeatability 重复性条件下的精密度。重复性条件指在同一实验室,由同一操作员使用同一设备,按相同的测试方法,在较短的时间间隔内对同一被测对象相互独立进行测试的条件。3. 7 3.8 GB/T 3358. 1J 重复性标准差repeatability standard deviation 重复性条件下所得测试结果的标准差。注2重复性标准差是重复性条件下测试结果分布的分散性的度量。类似地可定义重复性方差和重复性变异系数,作为重复性条件下测试结果分散性的度量。GB/T 3358. 1-2009J 再现性re
14、producibility 再现性条件下的精密度。再现性条件指在不同的实验室,由不同的操作员使用不同设备,按相同的测试方法,对同一被测对象相互独立进行测试的条件。3.9 2 注:对再现性的表述应指出相关测试条件的变化。再现性可用测试结果的分散性量化表述。GB/T 3358. 1-2009J 再现性标准差reproducibility standard deviation 再现性条件下所得测试结果的标准差。注:再现性标准差是再现性条件下测试结果分布的分散性的度量。类似地可定义再现性方差和再现性变异系数,作为再现性条件下测试结果分散性的度量。GB/T 3358. 1-2009J G/Z 22553
15、-201 O/ISO/TS 21748: 2004 3. 10 3. 11 标准不确定度standard uncertainty u(X;) 以标准差表示的测量结果码的不确定度。JJF 1059-1999J 正确度trueness 由大量测试结果得到的平均值与接受参照值间的一致程度。注:正确度的度量通常用偏倚来表示。正确度曾被称为均值的准确度,一般不推荐这样做。GB/T 3358. 1-2009J 3. 12 不确定度uncertainty 测量表征合理地赋予被测量之值的分散性,与测量结果相联系的参数。注1:此参数可以是诸如标准差或其倍数,或说明了置信水平的区间的半宽度。注2:测量不确定度由多
16、个分量组成,其中一些分量可用测量列结果的统计分布估算,并用实验标准差表征。另一些分量则可用基于经验或其他信息的假定概率分布估算,也可用标准差表征。注3:测量结果应理解为被测量之值的最佳估计,全部不确定度分量均贡献给了分散性,包括那些由系统效应引起的(如,与修正值和参考测量标准有关的)分量。JJF 1059-1999J 3.13 不确定度一览表uncertainty budget 不确定度来源及其标准不确定度的列表,用以评定测量结果的合成标准不确定度。注z该表常包含如灵敏系数(影响结果量值中结果改变的变化率)、每个标准不确定度的自由度,以及在A类或B类评定中每个标准不确定度评定方法的说明等其他信
17、息。4 符号a 经验式R=a+bm中的截距项B 偏倚的实验室分量b 经验式h=a+bm中的斜率C 经验式R=crnd中的系数C豆灵敏系数Y/Xid 经验式R=crnd中的指数E 随机误差er 重复性条件下的随机误差h 合成标准不确定度的数值乘积因子,用于获得扩展不确定度Ul 实验室编号z 测量平均值N 合成不确定度计算中的贡献项数, 不包括协同试验数据的合成不确定度计算中的贡献项数 nl 实验室l的一个水平下的重复测量次数n重重复测量次数 实验室数Q 较大批次的测试样品数3 GB/Z 22553-2010/150/币21748:20044 q 协同试验中公议的指定值数rij Xi和Xj间的相关
18、系数,取值为一1十1之间马方差的组间分量SD 为核查偏倚是否受控,对参照物料进行重复测量而获得的关于结果的标准差的估计值S; 自由度叭的重复标准差Sinh 样品不均匀性的不确定度511h 样品不均匀性的方差分量SL 室间标准差的估计值h B的不确定度调整值,其贡献量依赖于响应sE B的方差估计S, 室内标准差的估计值Sr 室内标准差调整值,其贡献量依赖于响应s er的方差估计SR 再现性标准差的估计值5FR 再现性标准差的估计调整值SR 经验模型计算的再现性标准差调整值,其贡献量依赖于响应马方差的组内分量S(y)差值的实验室标准差,该差值为常规使用方法与定义方法的比较X; 结果测定中第t个输入
19、值的量zi za与其标称值的差勾结果测定中第j个输入值的量u(8) 8的不确定度,是通过参照测量标准或附认证值物料的测量估计所得以)认证值的不确定度Uinh 样品不均匀性的不确定度U 扩展不确定度,等于h乘以标准不确定度uU(y) y的扩展不确定度,即U(y)=ku (y) ,k为包含因子y; 在方法比较中来自定义方法的测试样品结果y; 在方法比较中来自常规测试方法的测试样品结果yo 能力测试的指定值l 实验室l的偏倚估计,等于实验室平均值m减去认证值A.y 常规与定义两种方法比较中实验室偏倚平均值8 所采用测量方法的固有偏倚b 测量方法固有偏倚的估计值 理想结果的未知期望A 参照物料的认证值
20、。能力测试的标准差D 为核查偏倚是否受控,对参照物料进行重复测量而获得的关于结果的标准差的真值L 室间标准差,B的标准差 室间方差,B的方差r 室内标准差,e,的标准差d 室内方差,e,的方差w 组内标准差耐适宜性能要求的标准差(lSO指南33)GB/Z 22553-201 O/ISO/TS 21748: 2004 V.ff 输入值Xi标准差或不确定度的有效自由度Vi 自由度5 原理5.1 单结果与测量过程性能5. 1. 1 测量不确定度与单个测量结果有关,而重复性、再现性和偏倚则与测量或测试过程有关。在GB/T 6379各部分的研究中,测量和测试过程都是指一种单一测量方法,为所有参与协同试验
21、的实验室共同使用。应注意,本指导性技术文件目的在于,假定测量方法以单一详细的程序来实施(定义见国际通用计量学基本术语)。本指导性技术文件认为,过程性能指标源于方法性能研究,与过程产生的所有单个测量结果相关。由此可见,此假定需测量过程以适当的质量控制和质量保证数据提供支持(见第7章)。5. 1.2 每个测试样品间的差异需另做考虑,但是,对具有良好特性且稳定的测量过程,可不必对每个测试样品单独做详细的不确定度研究。5.2 再现性数据的适用性本指导性技术文件的应用基于两个原则:一一首先,协同试验中获得的再现性标准差是测量不确定度评定的有效依据(见A.2.1)。一一其次,协同试验过程中未能观测到的效应
22、,应经过论证后方可忽略,或通过扩展协同试验所使用的基本模型将这些效应清楚地考虑在内(见A.2. 3)。5.3 基本统计模型5.3.1 本指导性技术文件依据的基本统计模型如下:y=十O+B十二二CiXi+ e .( 1 ) 式中:y一一观测结果,假定由公式y=!(Xj ,X2,X.)算得;一一理想结果的(未知)均值;-一测量方法的固有偏倚;B一一偏倚的实验室分量;z:一-Xi与其标称值的差;Ci 灵敏系数,等于dY/dXi;E一一随:fJL误差。假定B和e服从均值为0,方差分别为4与d的正态分布,上述模型可用于GB/T6379. 2-2004 协同试验数据的分析。由于方法的固有偏倚8、偏倚的实验
23、室分量B和随机误差e这些观测到的标准差,是协同试验条件下分散性的整体性度量,则2:CiXi是指另外一些偏差效应的求和,且该求和包含了协同试验中未被纳入的操作效应。所指的操作效应举例如下:a) 每个测试样品制备切实可行,要求在协同试验的样品发放前完成。b) 协同试验测试样品的子抽样效应通常在试验前处于均匀状态。假定工服从均值0和方差u2 (Xi)的正态分布。该模型的基本原理参见附录A。注:误差通常被定义为结果与参照值的差值。在GUM中,误差(值明显区别于不确定度(值的分散性。然而,在不确定度估计中,应表示出随机效应产生的分散性,并将其纳入到统计显式模型中。由此,将均值为零的误差项计入上述式(1)
24、中。5.3.2 若按式。)描述的模型,则一次观测的不确定度以y)可用式(2)进行估计。5 GB/Z 22553-201 O/ISO/TS 21748: 2004 u2 (y) = u2 () + st + dU2 (x;) + s; ( 2 ) 式中zsi一-B的估计方差;s;-e的估计方差;u2( ) 奇的不确定度,是通过参照测量标准或附有认证值户的物料的测量估计所得;以五)一-4的不确定度。有s=st + s; ,将其代人式(2),即可化简为式(3): u2 (y) =U2 () + S + dU2 (x;) 5.4 重复性数据. ( 3 ) 可见,本指导性技术文件中的重复性数据主要用于精
25、密度的核查,并辅以其他测试,确保某实验室可应用再现性和正确度数据来估计不确定度。重复性数据还可用于不确定度再现性分量的计算(见7.3和第11章)。6 利用重复性、再现性和正确度的估计值评定测量不确定度6.1 测量不确定度的评定程序基于本指导性技术文件的原理(见5.1),测量不确定度的评估程序如下。a) 根据该方法公布的信息,获取所用方法的重复性、再现性和正确度的估计值。b) 根据6.1a)得到的数据,确认实验室测量的偏倚是否处于期望的范围内。c) 根据6.1a)得到的重复性和再现性估计值,确认当前测量的精密度是否处于期望的范围内。d) 对6.1a)涉及的协同试验中尚未涵盖的任何测量影响予以识别
26、,并对这些效应引起的方差予以量化,同时要考虑到每个影响的灵敏系数和不确定度。e) 如6.1b)和6.1c)所述,若偏倚和精密度均处于控制范围内,合并再现性估计值(6.1a)与正确度(6.1a)和6.1b)的不确定度以及其他影响效应(6.1d),形成合成不确定度的估计值。以上各操作步骤在第711章有较详细阐述。注:本指导性技术文件假定,若偏倚失控,应采取补救措施使程序处于控制范围内。6.2 预期精密度与实际精密度的差异若实际精密度的值不同于6.1a)协同试验的预期值,应调整不确定度的贡献项。通常精密度大致与响应的水平成比例,此时8.5给出了再现性估计的调整值。7 确立某特定测量过程中方法性能数据
27、与测量结果的关系7. 1 概述协同试验的结果给出性能指标(句,川,某些情况下也给出了方法的偏倚估计,它们形成了方法性能的规范。采用规定的方法时,实验室通常期望能证实其符合这种规范。大多数情况下,这可以通过控制协同试验的重复性(见7.3)、偏倚的实验室分量(见7.2)以及持续性能核查(质量控制和质量保证(见7.4)来实现。7.2 偏倚的实验室分量控制表示7.2. 1 一般要求7.2. 1. 1 实验室在方法实施中应证实其偏倚处于控制范围,即偏倚的实验室分量处于协同试验的预期范围内。在以下描述中,假定偏倚核查所用的附参照值物料近似于常规实际测试样品。若核查所用物料无参照值,则结果的不确定度贡献量应
28、按8.4和8.5修正。7.2. 1. 2 一般来说,偏倚的实验室分量核查,构成实验室结果与某些参照值的比较,或构成B的估计。式(2)表明与B中变异相联系的不确定度由SL表示,它们包含在SR中。然而,由于偏倚核查自身的不确定性,该比较的不确定性原则上增加了后续使用的结果不确定度。有鉴于此,在与SR比较时,一定要GB/Z 22553-201 O/ISO/TS 21748: 2004 确保偏倚核查的不确定度足够小(理想值应小于o.2sR ) ,以下假定偏倚核查的不确定度可做忽略。若符合该情况,且没有证据表明偏倚的实验室分量过大,可直接使用式(3)。若偏倚核查的不确定度过大时,要根据式(3)审慎地增加
29、所估计的不确定度,例如在不确定度一览表(3.13)中增加额外项。若协同试验的正确度研究表明,方法存在不可忽略的偏倚时,应在实验室偏倚的评估中予以考虑,例如,对己知方法偏倚的结果进行修正。7.2.2 偏倚的实验室分量控制表示方法7.2.2.1 概述偏倚控制可通过下述任一方法来表示。为了求得一致性,本指导性技术文件中所有偏倚的检验均采用这一通用准则。这些检验也可采用更苛刻的方法。7.2.2.2 有证标准物质或测量标准的研究在重复性条件下,实验室l应对参照标准进行nl次重复测量,形成该物料的偏倚估计值.11(等于实验室均值m减去认证值)。若有可能,应选择nl使得不确定度瓦110)时,是=2的选择对可
30、能的量值范围提供了足够可靠的标志。但值得注意的是,若式(12)中一个或一个以上主项的自由度少于7时,就可能会导致显著低估。13.2.3.2 当自由度叭的Ui(Y)为主项时(水平预示为Ui(Y)二三o.7u(y) ),通常足可取U(y)的有效自由度V.ff为叭。13.2.3.3 若几个主项的贡献大致相等且自由度都很小(即Vi10)时,其有效自由度V.ff可用式(15)Welch-Satterthwaite公式计算。U4 (y) _ ut (y) 一一Veff i=I.N Vi . ( 15 ) 11 GB/Z 22553-201 O/ISO/TS 21748: 2004 根据所需的置信水平和自由
31、度阳,使用t分布的双侧尾部概率来选择h值,为安全起见通常对非整数的Vefl舍去小数取整数值。注2在许多测量和测试领域里,统计离群值的频率显著高于正态分布情形,当无法获知有关分布信息时,在外推高置信水平F临界值,则认为U(Y)j显著大于U(Y)2 0 14.3 差异原因12 两个合成不确定度估计值之间的显著性差异,可能有以下多种原因:一一实验室间性能的真实差异z一一模型未包括与测量有关的所有重要效应;一一对不确定度主要贡献量的高估或低估。G/Z 22553-2010/ISO/TS 21748 :2004 A.1 GUM方法附录A(资料性附录)不确定度估计方法由1SO发布的测量不确定度表示指南CG
32、UM)给出了一种测量结果y的不确定度评定方法。GUM方法基于国际计量局CB1PM)的一系列建议性文件有时称为1NC-1(1980)。这些文件最先认识到不确定度贡献量的评估可通过系列观测值的统计分析CA类评定)或其他方式(B类评定)来完成,例如,采用公布的参照物料或测量标准不确定度的数据,或必要时经专业评判。但是各贡献分量的评估结果以标准差的形式来表示,必要时,对其做如下合成。GUM方法基于测量模型y=j(xl ,X2 ,XN) ,该模型建立了测量结果y与输入量Xi的相关式,当输入量相互独立时,GUM方法给出了式(A.l)的不确定度以y): u以(y)=J巾2(问z马J.川.川.川.川.叫. i
33、=写I.N式中:Ci 灵敏系数,由Ci=Y/Xi获得,即y对Xi的偏导数;U(Xi)与U(y)标准不确定度,即以标准差形式表示的测量不确定度。当输入量不相互独立时,其关系较复杂,不确定度U(y)由式(A.2)给出zU(y)= ldu2(xJ+ CiCjU(X;o Xj) .( A.2 ) =I.N i.j=I.N 1孚3式中zU(Xi ,Xj) -Xi和Xj的胁方差;Ci与Cj一一式(A.1)所述的灵敏系数。实际上,协方差与相关系数rij有如式(A.3)的关系:U(Xi ,x) = u(x)u(Xj )Tij ( A.3 ) 式中:-1Tij 1。当测量模型明显处于非线性时,式(A.1)应扩展
34、增加高阶项,这在GUM中有较详尽地表述。使用式(A.1) (A. 3)计算合成标准不确定度后,扩展不确定度的计算需用包含因子h乘以以Y), 走的选择基于以Y)的自由度估计值,详述见第13章。一般来说,GUM法的输入量为被测量或指定值,若存在未被界定的可测量效应(如操作者效应)时,应通过标准不确定度以X)合成来纳入这些效应,或在j(XI,X2 ,XN)中引入附加变量。因为基于每个输入量对不确定度的贡献,有时该方法被称作bottom-up不确定度评估方法。U(y)的物理解释并不清晰,因为其包含了一些靠判断才能估计的项,所以U(y)最好视为描述信任程度的函数,其在实际中有可能被观测到,也有可能无法观
35、测到。如果所有输入变量确实是服从假定分布的随机变量,则所计算出的U(y)实际上即为方差,这就提供了更直接的物理解释。原则上,当所有输入量都处于随机变化时,u(y)就容易观测和测量。A.2 协同试验方法A. 2.1 基本模型协同试验的设计、组织和统计处理在GB/T6379.2-2004中有详述。协同试验数据的统计处理简单模型由式(A.的给出:13 G/Z 22553一2010/ISO/TS21748: 2004 y=m+B十e,.( A.4 ) 式中:m-y的均值;B一-一重复性条件下偏倚的实验室分量,假定服从均值为零和标准差为L的正态分布;e,一一重复性条件下的随机误差,假定服从均值为零和标准
36、差为w的正态分布。此外,假定B和e,不相关。式(A.1)适用于该简捷模型,且注意w是通过室间研究得到的重复性标准差鸟来估计,由此得出如下结果:u(B) = SL与u(e,)= S, 以及y的合成标准不确定度u(y): U (y)2 =u (B)2十u(eY =sL +s .( A.6 ) 与GB/T6379.2-2004比较可知,式(A.6)正是再现性标准差品的估计值。因该评估方法注重整个方法的性能,则有时被称作top-down评估方法。应看到每个实验室依据等式y=f(Xl巧,XN)来计算自己的m估值,并假定其为被测量值y的实验室最佳估计。如果y=f(町,岛,XN)是一个完整的测量模型,以用来
37、描述测量体系的性能进而计算m,那么期望SL和表示的变异是由输入量工1,X2,阳的变异产生。若假定再现性条件下,所有显著影响量呈现随机变异,且考虑到上述u(y)的物理解释,则认为式(A.6)中的u(y)是对式(A.l)或式(A.2)中以y)的一种估计值。本指导性技术文件所遵循的原则1:协同试验的再现性标准差是测量不确定度评估的有效依据。A.2.2 正确度数据的合成一般来说,正确度通过相对于己确定的参照值的偏倚来度量。在一些协同试验中,对某特定单位制(通常为国际单位制S1),测量方法正确度通常根据采用的有证标准物质(CRM)或测量标准来获得,这里测量标准以该单位制(GB/T6379.4-2006)
38、表示。由此得到如下的统计模型:.( A.5 ) y=+B十e.( A.7 ) 式中z一一参照值;S一一方法偏倚。协同试验可获得被测偏倚8,其标准差S8的计算公式如下:lluv ( A.8 ) 式中:p一一实验室数;n一一每个实验室的重复测量次数。偏倚的不确定度以古)由式(A.9)给出:u2 (8) = si + u2 () .( A.9 ) 式中:u()一一一认证值的不确定度,用于协同试验中的正确度估计。如果实验室的结果计算中已包含了协同试验所估计的偏倚,且该估计的不确定度不可忽略时,应将其纳入到不确定度的一览表之中。A.2.3 其他效应一一合成模型实际中,怡和u(古)未必涵盖影响测量结果的所
39、有效应的变异,协同试验本身可能遗漏某些重要因素,还有一些因素可能由于偶然或设计的缘故未被考虑或者被低估。本指导性技术文件所遵循的原则2:整个协同试验内未被观测到的效应,经论证后可忽略或给予明14 GB/Z 22553-20 1 O/ISO/TS 21748 :2004 确解释。最简捷的办法是考虑y的解释变量4的效应,其中五为Xi与其标称值的差,并假定效应近似呈线性,得到如下的模型合成:y=十0+B + L; CiXi + e . ( A. 10 ) 式中zL: CiXi 求和项包含除B,和e外的所有效应。这些效应可能包括诸如抽样影响、测试样品制备、各个测试样品的组分或类型变异。严格来说,这是一
40、个最通用的线性模型,如有必要,可按GUM详细描述增加高阶项或相关项。注意到中心化的五对U(Xi)没有影响,则U(X;)=u(x;) q由此,式(A.10)中y估计值的不确定度由式(A.ll)给出:U2(y) =s +s; +u2(+ .: du2(Xi) . ( A. 11 ) 式中2L; du2 (Xi)一一求和项限于未包含的效应项。在方法性能评估过程中需注意的是,中间精密度条件也可用式(A.10)描述,但求和项会更多,因为中间状态下预期随机变化的变量比再现性条件下更少。但一般来说,只要在求和项中适当引入效应项,式(A.10)可用于任何精密度条件。当然,在s,和SL项为零、总偏倚的不确定度没
41、有确定的特例下,式(A.ll)与式(A.l)相同。这里有如下两个推论:a) 有必要证实协同试验获取的定量数据与试验的测试结果直接相关。b) 即便协同试验数据直接相关,为获得有效的不确定度估计,还需进行其他研究和考虑,确定最终引人的附加效应(式(A.10)中的Xi) 0考虑附加效应后,才可假定式(A.l)的使用。本指导性技术文件认为,使用GB/T6379所有部分获取的重复性、再现性和正确度数据的测量不确定度估计值是可信的,此所做出的假设等同于GB/T6379。使用再现性数据时,假定所有实验室的操作相似,尤其对某给定测试样品,不同实验室的重复性精密度应一致,且偏倚的实验室分量(由式CA.10)中的
42、B项表示)来自于协同试验的同一总体。协同试验中使用的测试物料应具有均质性和稳定性。A.3提供了附加效应是否可忽略的确认方法,若附加效应不可忽略,可将其导致的不确定度纳入到测量结果的不确定度估计值中。A.3 两种方法之间的关系前面的讨论描述了两种截然不同的不确定度评估方法。GUM方法是基于数学模型中输入量的方差,以方差的形式来预测不确定度。而另一种方法基于这样的事实,在再现性试验过程中,若那些相同的影响量给出代表性变化时,则观测到的方差即为同一不确定度的直接估计。实际上,由于诸多原因,两种方法所获得的不确定度值往往不同,其中的原因包括:a) 数学模型不完善(即,存在未知效应); b) 在再现性评
43、估中,影响因素未全部考虑到或影响的变化不显著。两种不同估计的比较有助于测量模型完整性的评价。但应注意到,所观测到的重复性或一些其他精密度的估计值,经常作为不确定度的贡献项,GUM方法也如此。同样,再现性评估前,每个效应通常至少要进行显著性检验或量化。由此,实际中的不确定度估计,经常综合运用这两种方法。既然不确定度估计值有助于对测量结果的解释,则应注意弥补每种评估方法的不足。模型不完善的问题通常通过采用保守估计或纳入更多附加效应的途径克服。在本指导性技术文件中,输入效应变异不足的可能性应通过附加效应的评估予以解决,一种兼顾的做法是对top-down和bottom-up两种评估方法的融合。15 G
44、B/Z 22553-201 O/ISO/TS 21748: 2004 附录B(资料性附录)实验不确定度评定B. 1 估计灵敏系数的实际程序若输入量Xi在相应范围内连续变化,则易对这种变化效应进行直接研究。假定结果Xi近似呈线性变化,可实施以下简单程序。a) 为变量Xi的变化选择一个合适的区间,该区间应以最佳估计为中心(或以方法提供的规定值为中心)。b) 选择Xi的5个或5个以上的水平,针对每个水平实施完整的测量程序(或受Xi影响的那部分程序)。若需要,可重复测量。c) 以Xi作为横坐标,测量结果作为纵坐标,对结果进行线性模型拟合。d) 直线的斜率即为式(A.1)或式(12)中的系数Ci0 本方
45、法对不同测试样品提供不同的灵敏系数,有助于对特定样品或测试样品类型的整体研究。但是,灵敏系数应用于不同情况的更大范围时,特别需要验证不同样品是否具有足够的相似性。B.2 评定随机效应不确定度的简单程序当输入量Xj不连续或不易控制时,其不确定度可根据实验分析获得,其中实验中的变量随机变化。如,环境分析中的土壤类型会对分析测定有不可预测效应。当随机误差近似独立于目标量水平时,使用一系列附有定义值或添加已知改变量的测试样品,可检查这些变异所产生的误差分散度。16 一般程序如下za) 选择代表性测试样品重复进行完全测量,在重复性条件下每个样品的重复测量次数相同。b) 计算每个观测值与已知值的差值。c) 用方差分析方法来分析测试结果(根据目标量分类),通过结果平方和来估计组内方差分量马和组间方差分量si,由Xj变异产生的标准不确定度U(Xj)等于Sb。注z不同测试样品或测试样品等级与有关量的作用也不同(即,量与测试样品等级间的交互),这种交互作用会加大Sb值。该情形的详细处理不属于本指导性技术文件的研究范畴。C.1 机动车尾气中一氧化碳(CO)测量C. 1. 1 简介附录C(资料性附录)不确定度计算实例GB/