1、 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 CNAS GL02 能力验证结果的统计处理和能力评价指南 Guidance on Statistic Treatment of Proficiency Testing Results and Performance Evaluation 中国合格评定国家认可委员会CNAS-GL02: 2014 第 1 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 目 次 前言 . 2 1 范围 . 3 2 规范性引用文件 . 3 3 术语和定义 . 3 4 统计处理和能力评价 . 4
2、附录 A 检测能力验证计划常用稳健统计方法 . 11 附录 B 能力验证计划结果 示例 . 14 附录 C 测量审核结果的评定 . 20 CNAS-GL02: 2014 第 2 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 前 言 本文件为 能力验证结果的统计处理和能力评价提供指南 。 本文件依据 GB/T 27043合格评定 能力验证的 通用要求制订 ,同时参考了GB/T 28043 利 用实验室间比对进行能力验证的统计方法 。 GB/T 28043 给出了能力验证统计方法的更详细指南, 使用本文件时,可同时参考 GB/T 28043。 本文件
3、 为 CNAS-GL02 能力验证结果的统计处理和能力评价指南 的第二版,代替 CNAS-GL02: 2006 能力验证结果的统计处理和能力评价指南 。 与 CNAS-GL02: 2006 相比,文件的主要变化如下: 增加前言、目次、术语和定义。 增加定性计划和半定量计划指定值的确定方法和能力评价方法。 增加对明显错误结果的处理方法。 增加定量计划能力评定标 准差的确 定 方法。 增加 z 比分数 和 比分数 两个能力统计量。 增加以能力比分数的平均值评价参加者能力可能存在的问题。 增加长期监测能力的方法。 附录 A 调整为 检测计划常用稳健统计方法 , 增加稳健统计方法算法 A 和算法S,
4、原 数据分布的内容 移 至正文, 相关 示例 移 至附录 B。 附录 B 调整为能力验证计划结果示例,包 含 检测和校准能力验证计划结果示例。对校准能力验证计划,以 200 mg 砝码校准能力验证计划结果,代替 1 伏直流 电压标准实验室间比对结果 ,并 增加制作结果图示的新方法。 CNAS-GL02: 2014 第 3 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 能力验证结果的统计处理和能力评价指南 1 范围 1.1 本 文件 为 能力验证结果的统计处理和能力评价提供指南。 1.2 本 文件 适用于 CNAS的能力验证 , 也可为其他机构组织
5、能力验证提供参考 。 2 规范性 引用 文件 下列文件中的条款通过引用而成为本文件的条款。以下引用的文件,注明日期的,仅引用的版本适用;未注明日期的,引用文件的最新版本(包括任何修订)适用。 CNAS-RL02 能力验证规则 CNAS-GL03 能力验证样品均匀性和稳定性评价指南 GB/T 27043 合格评定 能力验证的 通用要求( ISO/IEC 17043, IDT) GB/T 28043 利用实验室间比对进行能力验证的统计方法( ISO 13528, IDT) GB/T 6379 测量方法与结果的准确度(正确度和精密度) ( ISO 5725, IDT) ISO/IEC 指南 98-3
6、 测量不确定度 第 3 部分:测量不确定度 的 表示指南 ISO/IEC 指南 99: 2007 国际计量学词汇 基础 和 通用概念 及 相关术语 IUPAC 技术报告 分析化学实验室能力验证国际协议 3 术语和 定义 CNAS-RL02、 GB/T 27043、 GB/T 28043、 ISO/IEC 指南 99 界定的术语和定义适用于本文件。 为方便使用,重复列出以下术语和定义: 3.1 实验室间比对 interlaboratory comparison 按照预先规定的条件,由两个或多个实验室对相同或类似的物品进行测量或检测的组织、实施和评价。 3.2 能力验证 proficiency t
7、esting 利用实验室间比对,按照预先制定的准则评价参加者的能力。 3.3 指定值 assigned value 对能力验证物品的特定 性质赋予的值。 3.4 能力评定标准差 standard deviation for proficiency assessment 根据可获得的信息,用于评价能力验证结果分散性的度量。 注 1:标准差只适用于比例尺度和定距尺度的结果。 注 2:并非所有的能力验证计划都根据结果的分散性进行评价。 3.5 z比分数 z-score 由能力验证的指定值和能力评定标准差计算的 实验室 偏倚的标准化度量。 CNAS-GL02: 2014 第 4 页 共 20 页 20
8、14 年 09 月 15 日发布 2014 年 09 月 15 日实施 注: z比分数有时也称为 z值或 z分数。 3.6 离群值 outlier 一组数据中被认为与该组其他数据不一致的观测值。 注:离 群值可能来源于不同的总体,或由于不正确的记录或其他粗大误差的结果。 3.7 稳健统计方法 robust statistical method 对给定概率模型假定条件的微小偏离不敏感的统计方法。 3.8 测量审核 measurement audit 一个参加者对被测物品 (材料或制品 )进行实际测试,其测试结果与参考值进行比较的活动。 注:测量审核是对一个参加者进行“一对一”能力评价的能力验证计
9、划。 4 统计处理 和能力评价 4.1 总则 能力验证的结果可以以多种形式出现,并构成各种统计分布。分析数据的统计方法应与数据类型及其统计分布特性相适应。 分析这些结果时,应根据不同情况选择适用的统计方法。各种情况下优先使用的具体方法,可参见 GB/T 28043。对于其他方法,只要具有统计依据并向参加者进行了详细描述,也可使用。 无论使用哪一种方法对参加者的结果进行评价,一般 包括以下几方面内容: a)指定值的确定; b)能力统计量的计算; c)能力评定 。 必要时,考虑能力验证物品的均匀性和稳定性对能力评定的影响。 能力验证物品均匀性和稳定性的评价方法见 CNAS-GL03能力验证样品均匀
10、性和稳定性评价指南 、GB/T 28043和 IUPAC 技术报告 。 4.2 统计设计 4.2.1 应根据数据的特性(定量或定性,包括顺序和分类)、统计假设、误差的性质以及预期的结果数量,制定符合计划目标的统计设计。 在统计设计中应考虑下列事项: a) 能力验证中每个被测量或特性所要求或期望的准确度(正确度和精密度)以及测量不确定度; b) 达到统计设计目标所需的最少参加者数量;当参加者数量不足以达到目标或不能对结果进行有意义的统计分析时,应将评定参加者能力的替代方法的详细内容提供给参加者; c) 有效数字与所报告结果的相关性,包括小数位数; d) 需要 检测或测量的能力验证物品数量,以及对
11、每个能力验证物品或每项测定的检测、校准或测量的重复次数; CNAS-GL02: 2014 第 5 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 e) 用于确定能力评定标准差或其它评定准则的程序; f) 用于识别和(或)处理离群值的程序; g) 只要适用,对统计分析中剔除值的评价程序; h) 只要适当,与设计相符的目标和能力验证轮次的频率。 4.2.2 在缺少统计设计所需的可靠信息时, 可 通过开展先期 实验室间比对 来获得。 4.3指定值及其不确定度的确定 4.3.1 指定值的确定有多种方法,以下列出最常用的方法。 在大多数情况下,按照以下次序,
12、指定值的不确定度逐 渐增大。 a)已知值 根据特定能力验证物品配方(如制造或稀释)确定的结果; b)有证参考值 根据定义的检测或测量方法确定(针对定量检测); c)参考值 根据对能力验证物品和可溯源到国家标准或国际标准的标准物质 /标准样品或参考标准的并行分析、测量或比对来确定; d)由专家参加者确定的公议值 专家参加者(某些情况下可能是参考实验室)应当具有可证实的测定被测量的能力,并使用已确认的、有较高准确度的方法,且该方法与常用方法有可比性; e)由参加者确定的公议值 使用 GB/T 28043 和 IUPAC国际协议 等给出 的 统计方法 , 并考虑离群值的影响 。 例如,以参加者结果的
13、稳健平均值、中位值 (也称为中位数) 等作为指定值。 附录 A给出了由参加者结果确定指定值的常用稳健统计方法。 4.3.2 对上述每类指定值的不确定度,可参照 GB/T 28043等 所描述的方法 进行评定。此外, ISO/IEC 指南 98-3中给出了确定不确定度的其它信息。 4.3.3 指定值的确定应确保公平地评价参加者,并尽量使检测或测量方法间吻合一致。只要可能,应通过选择共 同的比对小组以及使用共同的指定值达到这一目的。 4.3.4 对 定性数据 也称为“分类的 ”或“定名的 ”值 或半定量值 也称为“顺序的”值 ,其指定值通常需要由专家进行判断或由制造过程确定。某些情况下,可使用大多
14、数参加者的结果(预先确定的比例,如 80%或更高)来确定公议值。该比例应基于能力验证计划的目标和参加者的能力和经验水平来确定。 4.3.5 离群值可按下列方法进行 统计处理: a)明显错误的结果,如单位错误、小数点错误、 计算错误 或者错报为其他能力验证物品的结果,应从数据集中剔除, 单独 处理。这些结果不再计入离 群值检验或稳健统计分析。 明显错误的结果应由专家进行识别和判断。 b)当使用参加者的结果确定指定值时,应使用适当的统计方法使离群值的影响降到最低,即可以使用稳健统计方法或计算前剔除离群值。 c)如果某结果作为离群值被剔除,则仅在计算总计统计量时剔除该值。但这些结果仍应当在能力验证计
15、划中予以评价,并进行适当能力评定。 4.3.6 需考虑的其他事项 CNAS-GL02: 2014 第 6 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 a)理想情况下,如果指定值由参加者公议确定, 应当有确定该指定值正确度和检查数据分布的程序。 例如, 可采用将 指定值与一个具备专业能力的实验室得到的参考值进行比较等方法确定 指定值的正确度。 通常, 正态分布是 许多 数据 统计处理的基础。正态分布的特点是单峰性、对称性、有界性和抵偿性。作为一个能力验证计划的结果,由于参加者的测试方法、测试条件往往各不相同,而且能力验证结果的数量也是有限的,所以
16、在许多情况下能力验证的结果呈偏态分布。 对能力验证的结果只要求近似正态分布, 尽可能对称, 但分布应当是单峰的,如果分布中出现双峰或多峰,则表明参加者之间存在群体性的系统偏差,这时应研究其原因,并采取相应的措施。例如,可能 是由于使用了产生不同结果的两种检测方法 造成的双峰分布 。在这种情况下,应对两 种方法的数据进行分离,然后对每一种方法的数据分别进行统计分析。数据直方图 或 核 (Kernel)密度图 可以 显示结果的分布 情况。 b) 应当有依据不确定度来判断指定值是否可接受的准则。在 GB/T 28043 和 IUPAC国际协议中给出了该准则,该准则是基 于限定指定值不确定度对能力评定
17、的影响而建立的,即 : 准则限定了由于指定值的不确定度而使参加者得到一个不可接受的评估结果的可能性。 4.4 能力统计量的计算 4.4.1 定量结果 4.4.1.1 能力验证结果通常需要转化为能力统计量,以便进行解释和与其他确定的目标作比 较。其目的是依据能力评定准则来度量与指定值的偏离。所用统计方法可能从不做任何处理到 使用 复杂的统计变换。 注:“能力统计量” 也 称为“性能统计量” 。 4.4.1.2 能力统计量对 参加者应是有意义的。因此,统计量应适合于相关检测,并在某特定领域得到认同或被视为惯例。 4.4.1.3 按照对参加者结果转化由简至繁的顺序 ,定量结果的常用统计量如下: a)
18、 差值 D ,由( 1)式计算: D x X ( 1) 式中: x 为参加者结果; X 为指定值。 b)百分相对差 %D ,由( 2)式计算: % 100xXD X ( 2) c) z比分数,由( 3)式计算: CNAS-GL02: 2014 第 7 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 xXz ( 3) 式中: 为能力评定标准差 。 可由以下方法 确定: 与能力评价的目标和目的相符,由专家判定或法规规定(规定值); 根据以前轮次的能力验证得到的估计值或由经验得到的预期值(经验值); 由统计模型得到的估计值(一般模型); 由精密度试验得到
19、的结果; 由参加者结果得到的 稳健 标准差 、 标准化 四分位距 、 传统 标准差等 。 具体方法 参 见 附录 A和 GB/T 28043等 。 d) z 比分数,由式( 4)计算 : 22/)( XuXxz ( 4) 式中: Xu 为指定值的标准不确定度。 注 1:当指定值的确定未用到参加者的结果时, 可用 式( 4) 来计算 。 注 2: z 比分数有时也称作 z 分数或 z 值。 e) 比分数,由式( 5)计算,除了使用标准不确定度代替扩展不确定度外,计算与 nE 值类似。 22xXxXuu ( 5) 式中: xu 为参加者结果的合成标准不确定度。 注 1:仅当 x 和 X 不相关 时
20、,式( 5)才 成立 。 注 2: 比分数有时也称作 分数或 值。 f) nE 值,由式( 6)计算: 22 Xxn UUXxE ( 6) 式中: xU 为参加者结果的扩展不确定度; XU 为 指定值 的扩展不确定度 ; xU 和 XU 的包含因子 k=2。 注 1: nE 值有时也称作 nE 数。 注 2: 仅当 x 和 X 不相关时,式( 6)成立 。 对于校准能力验证计划,常用 nE 值评价参加者结果。 CNAS-GL02: 2014 第 8 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 g)其他的统计方法,可参见 GB/T 28043 和
21、 IUPAC国际协议 等 。 4.4.1.4 需要考虑的其它事项 a)通过参加者结果与指定值之差完全可以确定 参加者的 能力,对于参加者也是最容易理解的。差值 ()xX 也 称为“实验室偏倚的估计值”。 b)百分相对差不依赖于指定值的大小,参加者也很容易理解。 c)对于高度分散或者偏态的结果、顺序响应量、数量有限的不同响应量,百分位数是有效的。但该方法仍应慎用。 d)根据检测的特性,优先或需要使用变换结果。例如,稀释的结果呈现几何尺度,需做对数变换。 e)如果 由公议 (参加者结果) 确定, 的值 应可靠,即,基于足够多次的观测以降低离群值的影响。 f)如果能力统计量(例如 nE 值和 比分数
22、)需使用参加者报告的测量不确定度的估计值时,只有所有参加者采用一致的方法(比如按照 ISO/IEC指南 98-3的原则)评估不确定度,该方法才有意义。 4.4.2 定性结果和半定量结果 4.4.2.1 对于定性结果和半定量结果,如果应用统计方法,必须与结果的特性相适应。对定性数据 也称之为“分类”数据 ,可采用直接将参加者结果与指定值进行比较的技术。如果两者相同,则结果是可接受的;如果不相同,可 由 专家判断参加者结果是否满足预期用途。某些情况下,可审查参加者的结果,并确定该能力验证物品不适于评估,或者指定值不正确。 4.4.2.2 用于定性数据的技术也适用于半定量结果 也称为“顺序”结果 。
23、顺序结果包括很多类型,例如,响应为等级或排序、感官评价,或化学反应强度(如 1+, 2+,3+,等)。有时,这些响 应结果由数字表示,如, 1=差, 2=不满意, 3=满意, 4=良好,5=优秀。 4.4.2.3 对顺序数据,即使结果以数值表示 ,计算常规的总计统计量是不合适的。因为这些数值并不是基于区间尺度,也就是说,客观意义上, 1和 2间的差可能与 3和4间的差并不相同,因而不能解释其平均值和标准差的意义。因此,对半定量结果使用诸如 z比分数的统计量是不合适的。特定的统计量,如秩或顺序统计量,对顺序数据是可以使用的。 4.4.2.4 描述出(或作图表示)所有参加者结果的分布,以及每一类结
24、果的数量或百分比,并给出总计统计量(如众数和极 差)是适当的。根据与指定值的接近程度评价结果的可接受性也是适当的,例如,结果落在指定值之上或之下一个数值范围内即为可接受的。某些情况下,利用百分位数评估能力也是合适的,如,可以规定距离众数或指定值最远的 5%的结果是不可接受的。这些规则应根据能力验证计划的目的来确定。 CNAS-GL02: 2014 第 9 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 4.4.3 合成的能力比分数 当对一个特定被测量使用了一个以上能力验证物品或有一组相关被测量时,可根据一轮能力验证计划中两个或两个以上的结果评定参加
25、者的能力。这样可以对参加者能力进行全面评定。 采用 图方法,如 尧敦( Youden)图或曼德尔( Mandels) h统计量图 等 , 也 是解释参加者能力的有效工具( 参 见 GB/T 28043)。 尽量不 使用能力比分数的平均值,因为这将掩盖对一个或多个能力验证物品的较差的检测或测量能力,而这正是需要调查的。最常用的合成的能力比分数是可接受结果的数量 (或百分比 )。 4.5 能力评定 4.5.1 初始能力 4.5.1.1应根据能力度量方式制定能力评定准则,用于能力评定的方式如下: a)专家公议,由顾问组或其他有资格的专家直接确定报告结果是否与预期目标相符合;专家达成一致是评估定性测试
26、结果的典型方法。 b)与目标的符合性 ,根据方法性能指标和参加者的操作水平等预先确定准则。 c)用统计方法确定比分数,其准则应当适用于每个比分数;比分数的常用例子如下: 1) z比分数、 z 比分数和 比分数(简单起见,示例中仅给出了 z比分数,对 z比分数和 比分数也适用); | 2|z 表明 “满意”,无需采取进一步措施; 2 | | 3z 表明“有问题”,产生警戒信号; | 3|z 表明“不满意”,产生措施信号。 2)对 nE 值: | 1|nE 表明“满意”,无需采取进一步措施; | 1|nE 表明“不满意”,产生措施信号。 4.5.1.2 只要可能,应当使用 GB/T 28043 和
27、 IUPAC 国际协议所 描 述的图形来显示 参加者 能力(如直方图,误差条形图,顺序 z 比分数图 , 尧敦 图 等 )。这些图可用来显示: a)参加者结果的分布; b)多个能力验证物品结果间的关系; c)不同方法所得结果分布的比较。 4.5.1.3 有时, 能力验证计划中某些 参加者的结果虽 为 不满意 结果,但可能仍在 相关标准 或规范 规定的允差范围之内,鉴于此, 在 能力验证计划 中, 对 参加者 的 结果 进行评价 时,通常不作 “ 合格 ” 与否的结论,而是使 用 “ 满意 /不满意 ” 或 “ 离群 ” 的概念。 CNAS-GL02: 2014 第 10 页 共 20 页 20
28、14 年 09 月 15 日发布 2014 年 09 月 15 日实施 4.5.1.4 当利用测量审核对 参加者 的 结果 进行判定时,可利用 En 值或参照相关技术标准(包括统计技术方面的标准)进行判定,附 录 C给出了相应的统计方法信息。 4.5.2 长期监测能力 4.5.2.1 能力验证计划可包含长期监测能力的程序。该程序 可以 使参加者能观测到其能力的变动,是否呈现趋势性的变化或不一致的结果,以及随机变化。 4.5.2.2 图形方法有助于理解数据分析结果 ,如 传统的“休哈特”控制图。数据列表和总计统计量可以提供更详细信息。用来评定能力的能力比分数, 如 z比分数,可用于绘制这些图和表
29、。其它示例和图形工具 可参见 GB/T 28043等 。 4.5.2.3 用参加者结果统计得到的标准差 作为能力评定标准差时,由于参加者群体的变化及其对比分数的未知影响,长期监测能力时应当谨慎。通常,由于参加者逐渐熟悉能力验证计划或者方法得到改进,实验室间标准差会随时间而减小。即便参加者本身的能力没有变化时,也会导致 z比分数的明显变大。 CNAS-GL02: 2014 第 11 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 附 录 A 检测能力验证计划 常用 稳健 统计 方法 A.1 总则 由能力验证计划参加者的结果确定指定值和能力评定标准差,
30、是检测能力验证计划常用的方法。通常,可以采用经典方法,用格拉布斯( Grubbs)准则 等 统计方法 剔除离群值后计算平均值和标准差,以平均值和标准差作为指定值和能力评定标准差;也可采用稳健统计方法 ,稳健统计方法不需要 用统计方法 剔除离群值 。例如, 使用中位值和标准化四分位距法 、 GB/T 28043 推荐的算法 A 和算法 S,计算中位值或 稳健平均值作为指定值,计算 标准化 四分位距 、 稳健标准差 或 标准差的稳健联合值 作为能力评定标准差。 本 附录描述了由参加者 的结 果 确定指定值 和能力评定标准差 的 常用 稳健 统计 方法 。 A.2 算法 A 算法 A来自 GB/T
31、6379.5。应用此算法计算得到数据平均值和标准差的稳健值。稳健性是估计算法的特点,而不是其产生的估计值的特点,因此严格来说,称由此算法计算的平均值和标准差是稳健的是不确切的。然而,为避免使用繁琐的术语,“稳健均值”和“稳健标准差”应理解为利用稳健算法计算的总体均值和总体标准差的 均值 估计。 从一个特定检测中得到的结果总数 为 p 。 按递增顺序排列 p 个检测数据,表示为: pi xxxx , 21 。 这些数据的稳健 平 均值和稳健标准差记为 *x 和 *s 。 计算 *x 和 *s 的初始值如下( med表示中位数): ixx med* ),2,1( pi ( A.1) *m e d4
32、83.1* xxs i ),2,1( pi ( A.2) 根据以下步骤更新 *x 和 *s 的值。计算: *5.1 s ( A.3) 对每个 ),2,1( pixi ,计算 其他若若,xx*x,x*x*x,x*xiii*i ( A.4) CNAS-GL02: 2014 第 12 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 再由下式计算 *x 和 *s 的新的取值: pxx /* *i ( A.5) 1/*134.1* 2*i pxxs ( A.6) 其中求和符号对 i 求和。 稳健估计值 *x 和 *s 可由迭代计算得出,例如用已修改数据更新
33、*x 和 *s ,直至过程收敛。当稳健标准差 的第三位有效数字 和稳健 平 均值 相对应的 数字在连续两次迭代中不再变化时,即可认为过程是收敛的。这是一种可用计算机编程实现的简单方法。 此外,还有一种简化的稳健计算方法可以替代算法 A。按式( A.1)计算稳健平均值,按式( A.2)计算稳健标准差停止,不再进行迭代,以稳健均值和稳健标准差的初始值作为数据平均值和标准差的稳健值。 A.3 算法 S 算法 S 用于 计算 标准差(或极差),可推出标准差或极差的稳健联合值。 算法 S与算法 A 类似,迭代若干次后最终获得标准差或极差的稳健估计 值 W*。计算的步骤如下: 将 p 个数据以递增顺序排列
34、,表示为: pi wwww , 21 。 (这些数据可以是极差或标准差。) 稳健联合值记为 *w ,每个 iw 对应的自由度为 。(当 iw 为极差时, 1 。当 iw为 n 次测试结果的标准差时, 1n 。)根据表 A.1, 查得算法所需的 和 值。 计算 *w 的 初始值如下( med表示中位数 ) : iww med* ),2,1( pi ( A.7) 按以下步骤更新 *w 的值,计算 *w ( A.8) 对于每个 ),2,1( piwi ,计算 其他若,ii*i w ww ( A.9) 计算新的 *w : pww i /* 2* ( A.10) 稳健估计值 *w 可由迭代算法得到,即不
35、断 更新 *w ,直到过程收敛。当稳健 估计值 的第三位有效数字连续两次迭代后数值不再变化时,即可认为过程是收敛的。这是一种可利用计算机编程实现的简单方法。 CNAS-GL02: 2014 第 13 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 表 A1 稳健分析必需的因子:算法 S 自由度 限系数 修正系数 1 1.645 1.097 2 1.517 1.054 3 1.444 1.039 4 1.395 1.032 5 1.359 1.027 6 1.332 1.024 7 1.310 1.021 8 1.292 1.019 9 1.277
36、1.018 10 1.264 1.017 注: 和 值由 GB/T 6379.5-2006的附录导出。 A.4 中位值和标准化四分位距法 中位值和标准化四分位距法 是一种简单的稳健 统计方法 。应用此 法 计算得到数据总体均值和总体标准差的估计值 中位值 ( med) 和标准化 四分位距( NIQR) 。 中位值和标准化 四分位距是数据集中和分散的度量, 与平均值和标准差相似。 中位值 是分布中间位置的一个估计。 标准化四分位距等于四分位距( IQR) 乘以因子 0.7413。 四分位距是 高四分位数 和 低四分位数 的差值。 对一组 由 小到大排列的数据,居于中间位置的数据为中位值, 有一半
37、的 数据 高于它 ,一半的 数据 低于它 ;居于下四分之一位置的数据 为下四分位数或低四分位数( Q1),该组数据的 四分之一低于 Q1, 四分之三 高于 Q1; 居于上四分之一位置的数据 为上四分位数或高四分位数 ( Q3),该组数据的四分之一 高于 Q3, 四分之三 低于 Q3。在大多数情况 下 Q1和 Q3通过数据值之间的内插法获得。 从一个特定检测中得到的结果总数为 p 。 按递增顺序排列 p 个检测数据,表示为: pi xxxx , 21 。 这些数据的中位值 , 可按照 式 A.11计算: 为偶数为奇数ppx xxxppp2m e d12221 ( A.11) 可按照 式 A.12
38、 和 式 A.13计算 IQR和 NIQR: 13 QQIQR ( A.12) IQ RN IQ R *7413.0 ( A.13) 注:因子 0.7413 是从“标准”正态分布中导出。 CNAS-GL02: 2014 第 14 页 共 20 页 2014 年 09 月 15 日发布 2014 年 09 月 15 日实施 附录 B 能力验证计划结果示例 B.1 总则 本 附录给出了检测能力验证计划和校准能力验证计划结果示例。其他的更多示例,可参见 GB/T 28043 等 。 B.2 检测能力验证计划 能力 验证计划 可以设计为使用单一样品,有时,为了查找造成结果 偏离的误差原因,也可以采用样
39、品对。样品对可以是完全相同的均一样品对,也可以是存在轻微差别的分割水平样品对。均一样品对,其结果预期是相同的。分割水平样品对,其 两个样品具有类似水平的被测量,其 结果稍有差异。对 双样品设计能力 验证计划,可按照附录 A的方法对 结果 进行统计处理 , 统计处理是基于 结果对 的 和与 差 值 。 以中位值和标准化四分位距法为例。 假设结果对是从 样品对 A和 B两个样品中获得的。 首先 按下式 计算 每个参加者 结果对的标准化和(用 S 表示)和标准化差( 用 D 表示 ),即: 2/)( BAS 2/)( BAD (保留 D 的 +或 -号) 通过计算每个 参加者 结果对 的标准化和 以 及标准化差,可以得出所有 参加者 的 S和 D 的中位值和 标准 化四分位距 ,即 med( S)、 NIQR( S)、 med( D)、 NIQR( D) 。 根据 所有 参加者 的 S 和 D 的中位值和 NIQR, 可以 计算两个 z 比分数,即实验室间 z 比分数( ZB )和实验室内 z 比分数( ZW ) ,即: )( )( SSSZB N IQ Rm ed和 )( )( DDDZW N IQ Rm edZB 和 ZW 的判定准则同 z 比分数。 ZB 主要反映结果的系统误差, ZW 主要反映结果的随机误差。 对于样品对, ZB 3 表明该样品对