1、ICS 0312030A 41 a目中华人民共和国国家标准GBT 8056-2008代替GBT 8056 1987数据的统计处理和解释指数分布样本离群值的判断和处理Statistical interpretation of data-Detection and treatment of outliersin the sample from exponential distribution2008-07-16发布 2009-0101实施丰瞀鹃紫黼警矬瞥霎发布中国国家标准化管理委员会及111GBr 8056-2008目 次前言IgI言-1范围-”12规范性引用文件13术语、定义和符号”131术语和
2、定义132符号和缩略语24离群值判断-241离群值的来源与判定242离群值的三种情形-243检出离群值个数的上限244单个离群值情形-245多个离群值情形35离群值处理-351处理方式352处理规则353备案36单个离群值的判断规则361检验统计量的选择362上侧情形的检验规则363下侧情形的检验规则464双侧情形的检验规则57多个离群值的判断规则671检验步骤672多个离群值检验示例78定数截尾样本离群值的判断规则781定数截尾样本782离群值的检验规则783定数截尾样本离群值检验示例8附录A(规范性附录)临界值表9参考文献15前 言GBT 8056-2008本标准代替GBT 8056-19
3、87数据的统计处理和解释 指数样本异常值的判断和处理。本标准与GBT 8056 1987相比较,技术内容的变化主要包括:增加了术语、定义和符号;将“指数样本异常值的判断和处理”改为“指数样本离群值的判断和处理”;将术语“检出异常值”和“高度异常值”分别改为“歧离值”和“统计离群值”,并进一步明确了二者的含义及相互差异;增加了检出水平和剔除水平的定义;检出水平由原标准中“检出水平一般取为1,5或10”改为“除非根据本标准达成协议的各方另有约定,检出水平应为005”;明确规定剔除水平的值除非根据本标准达成协议的各方另有约定,剔除水平应为001;增加了各种情形“统计离群值”的检验步骤;将“没有异常值
4、”和“没有高度异常的异常值”分别改为“未发现离群值”和“未发现统计离群值”;增加了双侧离群值检验、多个离群值检验、定数截尾样本离群值检验的示例。本标准的附录A是规范性附录。本标准由全国统计方法应用标准化技术委员会提出并归口。本标准起草单位:宁波工程学院、中国标准化研究院、北京大学、上海师范大学、福州春伦茶业有限公司。本标准主要起草人:荆广珠、丁文兴、于振凡、梁方楚、孙山泽、费鹤良、傅天龙。本标准所代替标准的历次版本发布情况为:GBT 80561987。GBT 8056-2008引 言从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不开统计方法。统计学是研究数
5、字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。数据的统计处理和解释含有多项国家标准,它们是:统计容忍区间的确定(GBT 3359)均值的估计和置信区间(GBT 3360)在成对观测值情形下两个均值的比较(GBT 3361)二项分布参数的估计与检验(GBT 4088)泊松分布参数的估计与检验(GBT 4089)正态性检验
6、(GBT4882)正态样本离群值的判断和处理(GBT 4883)正态分布均值和方差的估计与检验(GBT 4889)正态分布均值和方差检验的功效(G3T 4890)I型极值分布样本离群值的判断和处理(GBT 6380)伽玛分布(皮尔逊型分布)的参数估计(GBT 8055)指数分布样本离群值的判断和处理(GBT 8056)本标准尚无相应的国际标准。数据的统计处理和解释指数分布样本离群值的判断和处理GBT 8056-20081范围本标准规定了判断和处理来自指数分布的样本中离群值的一般原则和实施步骤。本标准适用于来自指数总体的样本。2规范性引用文件下列文件中的条款通过本标准引用成为本标准的条款。凡是注
7、日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版本均不适于本标准。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注EI期的引用文件,其最新版本适用于本标准。GBT 40864统计分布数值表F分布分位数表ISO 35341统计学词汇及符号第1部分:一般统计术语与用于概率的术语IsO 35342统计学词汇及符号第2部分:应用统计3术语、定义和符号ISO 35341、ISO 35342确立的术语、定义和符号以及下列术语、定义和符号适用于本标准。为便于参考,某些术语直接引自上述标准。31术语和定义311指数分布exponential distribution具
8、有下述分布函数的连续型分布,f1一e-,z0F(z)一100时,检验最大的观测值z c。,是否为离群值时所用的统计量样本量n100时,检验最小的观测值z(1)是否为离群值时所用的统计量定数截尾样本中,判断37m是否为离群值时所用的统计量自由度为V,和m的F分布的P分位数样本量n100时,检验最大的观测值z(。,是否为离群值时所用的统计量样本量n100时,检验最小的观测值zm是否为离群值时所用的统计量检出水平为a时,用统计量t,。作检验时的临界值检出水平为a时,用统计量T。作检验时的临界值4离群值判断41离群值的来源与判定411来源离群值按产生原因分为两类:第一类离群值是总体固有变异性的极端表现
9、,这类离群值与样本中其余观测值属于同一总体;第二类离群值是由于试验条件和试验方法的偶然偏离所产生的结果,或产生于观测、记录、计算中的失误,这类离群值与样本中其余观测值不属于同一总体。412判定对离群值的判定通常可根据技术上或物理上的理由直接进行,例如当试验者已经知道试验偏离规定的试验方法,或测试仪器发生问题等。当上述理由不明确时,可用本标准规定的方法。42离群值的三种情形本标准在下述不同情形下判断样本中的离群值:a)上侧情形:根据实际情况或以往经验,离群值都为高端值;b)下侧情形:根据实际情况或以往经验,离群值都为低端值;c)双侧情形:根据实际情况或以往经验,离群值可为高端值,也可为低端值。注
10、:1)上侧情形和下侧情形统称单侧情形;2)若无法认定单侧情形,按双侧情形处理。43检出离群值个数的上限应规定在样本中检出离群值个数的上限(与样本量相比应较小),当检出离群值个数达到了这个上限时,对此样本应作慎重的研究和处理。44单个离群值情形检验规则如下:2GBT 8056-2008a)原假设为所有观测值来自同一总体,依实际情况或以往经验选定42中的一种情形作为备择假设,根据统计学原理选用判断离群值的统计量(见61、82);b)确定适当的显著性水平;c)根据显著性水平及样本量,确定检验的临界值;d) 由观测值计算相应统计量的值,根据所得值与临界值的比较结果作出判断。45多个离群值情形在允许检出
11、离群值的个数大于1的情况下,重复使用44规定的检验规则进行检验,并按下述规则决定检验停止的时机:a)若没有检出离群值,则整个检验停止。b)若检出离群值,当检出的离群值总数达到上限(43)时,检验停止;否则,采用相同的检出水平和相同的规则,对除去已检出的离群值后余下的观测值继续检验。5离群值处理51处理方式处理离群值的方式有:a)保留离群值并用于后续数据处理;b)在找到实际原因时修正离群值,否则予以保留;c)剔除离群值,不追加观测值;d)剔除离群值,并追加新的观测值或用适宜的插补值代替。52处理规则对检出的离群值,应尽可能寻找其技术上和物理上的原因,作为处理离群值的依据。应根据实际问题的性质,权
12、衡寻找和判定产生离群值的原因所需代价、正确判定离群值的得益及错误剔除正常观测值的风险,以确定实施下述三个规则之一:a)若在技术上或物理上找到产生离群值的原因,则应剔除或修正;否则,不得剔除或修正;b)若在技术上或物理上找到产生离群值的原因,则应剔除或修正;否则,保留歧离值,剔除或修正统计离群值。在重复使用同一检验规则检验多个离群值的情形,每次检出离群值后,都要再检验它是否为统计离群值。若某次检出的离群值为统计离群值,则此离群值及在它前面检出的离群值(含歧离值)都应被剔除或修正。c)检出的离群值(含歧离值)都应被剔除或修正。53备案被剔除或修正的观测值及其理由应予记录,以备查询。6单个离群值的判
13、断规则61 检验统计量的选择当样本量n100时,使用统计量L。(或L,)进行检验;当样本量n100时,使用统计量E(或E,)进行检验。62上侧情形的检验规则621样本量n100时的检验当样本量n100时,实施步骤如下:a)计算统计量L。的值:L,。一半 (1)GBT 8056-2008b)确定检出水平n,在附录A的表A1中查出临界值T。(n,n);c)当L。T。(n,n)时,判定z(。,为离群值,否则判未发现z。,是离群值;d)对于检出的离群值z。,确定剔除水平a,在表A1中查出临界值T*(n,n)。当L。T口(n,n)时,判定z。,为统计离群值,否则判未发现z。,是统计离群值(即Jr c。,
14、为歧离值)。622样本量n100时的检验当样本量n100时,实施步骤如下:a)计算统计量E。的值:E。= 譬型鱼兰业l (2)五一z c。,一zc,t1b)确定检出水平a,在F分布的分位数表(见GBT 40864)中查出F,一。(2,2n一2);c) 当E。F-一。(2,2n一2)时,判定z(。,为离群值,否则判未发现z(。)是离群值;d)对于检出的离群值z。确定剔除水平a。,在F分布的分位数表(见GBT 40864)中查出F1一。-(2,2n一2)。当E,。F1。-(2,2n一2)时,判定z。,为统计离群值,否则判未发现z。)是统计离群值(即zm为歧离值)。623上侧情形的检验示例从某种电子
15、产品中随机地取出15个样品,在一定条件下进行寿命试验,其失效时间分别为(单位:kh):0215 0 0389 3 1484 9 1034 9 0298 40600 4 5102 0 01381 1234 9 2318 20489 3 0868 2 0725 4 0066 7 1818 2经验表明这种电子产品的寿命T服从指数分布,并且此处使用者关心的是数据中是否存在上侧离群值,据此,可采用621中的检验方法。本例中,样本量n一15,z)一5102 0,z。一1678,按式(1)计算得Tm一挚一黜扎3040乙五确定检出水平a一005,在表A1中查出临界值To。(15,15)一0334 6,因为T1
16、5。100时的检验当样本量n100时,实施步骤如下:a)计算统计量E。,的值:4GBT 8056-2008E,。;要尘生望坠 。(4)五一rtTc。t=1b)确定检出水平a,在F分布的分位数表中,查出F。(2,2n一2);c) 当E“F。m(2,218),故判未发现轧)一O001 2是统计离群值(即,一0001 2为歧离值)。64双侧情形的检验规则641样本量n100时的检验当样本量n100时,实施步骤如下:a)计算M;exp(一z(1)z)+exp(一z(。)z) (5)b)若M1,按式(1)计算统计量L。的值,并确定检出水平a,在表A1中查出I临界值T,“:(n,n)。当L,。n“:(n,
17、n)时,判定z。,为离群值,否则判未发现z。,是离群值;c)对于检出的离群值z c一确定剔除水平a+,在表A1中查出临界值T。,:(n,”)。当L。T,一。-z(n,n)时,判定z c。,为统计离群值,否则判未发现X c。,是统计离群值(即z(n为歧离值);d)若M1,按式(3)计算统计量L,的值,并确定检出水平a,在表A2中查出临界值t,。(”,1)。当L-100时的检验当样本量n100时,实施步骤如下:a)按式(5)计算M;b)若M1,按式(2)计算统计量E的值,并确定检出水平a,在F分布的分位数表(见GBT 40864)中查出F1“z(2,2n一2)。当E。F-“z(2,2n一2)时,判
18、定z(。)为离群值,否则判未发现z。,是离群值;c)对于检出的离群值z。确定剔除水平a,在F分布的分位数表(见GBT 40864)中查出F1一。-z(2,2n一2)。当EF1一。-,。(2,2n一2)时,判定z。为统计离群值,否则判未发现X。,是统计离群值(即zc。,为歧离值);d)若M1,按式(4)计算统计量E,的值,并确定检出水平a,在F分布的分位数表(见GBT 40864)中查出F口z(2,2n一2)。当E,To。,;(20,20),故判定X(z。)一6602 0为离群值。对于检出的离群值z(一6。602 0,确定剔除水平口。一001,在表A1中查出临界值To。,;(20,20)一o35
19、3 3。因为T2。To。(35,1),故判未发现X(。)一o0021为统计离群值(即z(:)一o0021为歧离值)。因为检出离群值个数已经达到规定的上限2,检验停止。8定数截尾样本离群值的判断规则81定数截尾样本在产品寿命试验中,经常会采用定数截尾寿命试验:取n个产品同时投入试验至第r(rF0 o z(2,10),故判未发现X(1)一o0081是统计离群值(即乩,一0008 1为歧离值)。附录A(规范性附录)临界值表T一(n,一)的临界值表见表A1,L(n,1)的临界值表见表A2。表A1置1叫(n,n)表GBT 8056m2008095 0975 099 o9952 0974 9 O987 4
20、 0995 0997 43 0,870 8 0908 7 o942 5 0959 o4 0768 0 0815 7 0864 0 0892 75 0683 9 o7341 0788 4 o822 76 0616 2 o665 9 0721 6 0758 27 05611 0608 8 0663 9 070118 0515 7 0 561 5 0614 7 0650 89 0 477 6 0520 7 o572 4 0607 610 0 445 0 0486 2 05361 057011l 0416 8 0455 7 0503 7 0536 312 O392 3 0429 3 o474 8 05
21、07 413 O370 8 O406 2 O449 9 0480 814 0351 6 o385 6 o427 3 0457 o15 0334 6 o366 8 o407 0 043,5 516 03191 o349 9 0388 5 0416 o17 0 305 2 0334 7 0371 9 o398 518 0292 6 o320 7 0356 6 0381 819 0281 o 0308 0 0342 2 0366 820 0270 3 0296 6 0329 7 o353 321 0260 6 0285 7 O318 o 034l 522 0251 5 0276 0 0306 9 O
22、329 323 02431 0266 7 0296 5 o318 324 0235 3 0258 O 0287 o 0308 225 0228 0 02501 0278 4 0299 226 0221 2 o242 5 0269 9 0290 327 o,214 7 0235 4 02621 0281 428 0208 8 o228 8 0254 7 0273 829 oZ03 2 0222 6 0247 7 o266 230 0197 8 0216 8 0241 3 o259 33l 0192 8 O211 2 0234 8 025Z 59GBT 8056m2008表A1(续)o95 o97
23、5 o99 o99532 o188 o o206 o 0229 2 o245 833 o183 4 o200 9 o223 6 o240 234 o179 2 O196 3 oZ18 2 o234 635 O1751 o191 8 O2131 0229136 O1711 o187 6 o208 8 o224 337 o167 5 o183 5 o204 o o219 338 0164 0 o179 6 O199 7 o214 539 1160 5 o175 7 o195 6 O210 340 o157 3 o172 2 0191 4 o205 641 o154 2 o168 9 o187 8
24、0201 442 o151 3 o165 5 o183 9 o197 943 O148 4 O162 4 o190 4 o194 o44 o145 7 o159 4 O177 4 o190 545 o1431 o156 6 0173 9 o186 846 o140 6 o153 7 o170 9 o183 447 01381 o1511 o167 7 o180 048 o135 7 O148 4 o1651 o177 349 o133 5 o145 9 o1621 o174 350 o131 3 o143 6 o159 6 o171 651 O129 2 o141 2 o156 9 o168
25、352 0127 2 o139 o o154 3 0165 753 o125 2 o136 9 o151 8 o162 954 o123 3 o134 8 o149 7 o160 855 o121 4 O132 7 o147 3 o158 256 o119 6 O130 8 o1451 o156157 o117 9 o128 9 o143 o 0153 658 O116 3 o127 o o1411 0151 559 o114 6 o125 2 o139 O o149 460 o113 o O123 5 o137 0 o147 461 o111 5 o12l 8 O1351 O145 362
26、o110 o o120 2 0133 3 o143 263 o108 6 o118 6 o131 6 o141 264 o1071 O117 0 o129 8 o139 465 o105 8 o115 5 o1281 O137 466 o104 5 o1141 o126 5 0135 810表A1(续)(;Blr 8056-2008095 0975 O99 099567 0103 2 0112 6 0125 0 0134 068 O101 9 0111 2 O123 3 O132 469 0100 7 O109 9 0122 0 0130 670 0099 5 0108 6 0120 3 01
27、29171 0098 3 0107 3 0119 0 0127 872 0097 2 0106 0 0117 6 0126 073 0096 0 O104 8 01161 0124 474 O095 0 O103 6 0114 8 O123l75 0093 9 0102 4 0113 6 O121 976 0092 9 0101 3 0 112 3 0120 377 0091 9 0100 2 O111 0 0119 O78 0090 9 00991 0109 8 O117 779 0089 9 0098 O O108 5 0116 480 0089 0 O097 0 O107 4 0115
28、28l O0881 0096 0 0106 3 0113 982 0087 2 0095 0 O105 3 0112 883 0086 3 0094 0 0104 2 0111 584 0085 4 O0931 01031 0110 585 0084 6 0092 2 O102 0 0109 486 0083 7 0091 2 0101 0 0108 287 0082 9 0090 4 O】00 0 O107 288 00821 0089 4 0099 0 0106189 0 081 3 0088 6 00981 0105 090 0080 6 0087 8 0097 2 01(14 291
29、0079 9 0087 0 0096 2 0103 392 00791 0086 2 0095 3 0102 293 0078 4 0085 4 0094 5 0101 494 0077 7 0084 6 0093 7 O100 495 0077 0 0083 9 0092 7 0099 496 0076 3 00831 0091 9 0098 497 0075 7 0082 4 00911 0097 698 0075 0 0081 6 0090 3 0096 899 0074 4 0081 0 0089 5 0096 0100 0073 7 0080 2 0088 8 0095 211GBT
30、 8056m2008表A2 L(n,1)的临界值表0005 001 0025 0052 2486 810一2 5000103 1249 6102 25001023 8200 610一 I670 910 3 4199 9103 8440 21034 4100 510 8361 210一4 2098 3103 4238110 35 2546 810一 5018 910一 1260110 3 2548 3X1036 1655 410一 3346 7104 8433 610一 1701 0X10 37 1171 610一 2390 910一4 6028 310 1216 110一38 8914 010
31、 5 1793 4104 4507 410一 9126 O10一9 6961 O105 1395 0104 3502 9104 7101 310一10 5526 0105 1116 l10一4 2806 310一 5683 010一11 4537 010_ 9132 110一5 2296 6X104 4651 110一12 3778 0105 7610 410一5 1_916 4104 3 876 810413 3173 010一5 6439 810 3 1620 110一4 3281 O10一14 2710 O10一5 5520 0105 1395 3104 2812 810415 2 39
32、3 0105 4784 210 3 1208 910一 2438 110416 2116 010一 4186 210 5 1053 710一 2133 610一17 1842 0105 3693 810 3 9333 010一, 1882 810一18 1626 010 5 3283 5105 8290 0105 1673 710 419 1459 010一 2937 9105 7398 010 3 1497 710420 1298 010一 2644 1105 6658 010 3 1348 010一421 1199 010 5 2392 3105 6026 0105 1219 71022
33、1087 0105 2174 9105 5474 010一。 1108 910423 9850 010 6 1985 8105 4982 0X105 1012 510 424 9120 0106 1820 310 5 4572 010一5 9281 910525 8250 010 5 1674 710一5 4206 0105 8539 810。26 7630 0106 1545 9105 3887 0105 7883 2X10_527 7060 0106 1431 410一5 3603 0103 7299 510528 6630 010一6 1329 2105 3356 010呐 6778 4
34、X10529 6130 O10一6 1237 5105 3126 0103 6311 110呐30 5770 010 6 1155 O10一 2902 0105 5890 610一。31 5330 010一6 1080 510 5 2727 0105 55lO 71053Z 5070 010 6 1013 O10一5 2553 O10一5 5166 410一33 4770 0105 9515 910一6 2399 0X10 5 4853 410呐34 4490 0106 8956 2106 2254 010一。 4568 010535 4140 O10一6 8444 410 6 2132 01
35、05 4370 110一536 4020 010 6 7975 3106 2016 0105 4067 910512表A2(续)GBT 8056m2008o005 001 o025 o0537 3700 olO一6 7544 2xlo5 1906 0103 3848 1X10538 3600 olO一6 7147 2xlo一6 1802 010一 3645 610 539 3390 oIO 6 6780 7106 1703 010呐 3458 810540 3230 o10一6 6441 7106 1622 010-5 3285 91054l 3030 oxlO一。 6127 510一6 15
36、39 0105 3125 610一o42 2960 o10 6 5835 7106 1473 0103 Z976 8X10543 2780 olO一6 5564 3106 1402 010 5 2838 4X10-544 2650 olO一6 5311 4105 1342 0105 2709 41045 2480 oxlO一6 5075 3106 1273 0105 2589 110546 2430 o10一6 4854 7X10叫 1222 0105 2476 5X10一347 2 310 0lO一6 4648 110一 1169 0lO一5 2371 210548 2200 o10一6 4
37、454 5106 1124 O10 5 2272 410一49 2120 010一6 4272 7105 1079 010 Z179 710550 2080 oxlO一6 410l 8106 1033 010一, 2092 510551 1940 oXlO_5 3940 9106 9910 O10 5 2010 510一52 1900 oxlo叫 3789 3X106 9540 010一6 1933 210 553 1810 010 3 646 410一6 9170 0106 1 860 2X10554 1780 o10一6 3511 3106 8860 0106 1791 4X10555 1
38、660 0lO一6 3383 6lO一6 8500 0106 1726 210556 1630 oxl06 3262 810一6 82lO OlO一6 1664 610一557 1550 010一6 3148 3106 7950 0XlO一6 1606 2X10 358 i490 o10 8 3039 8X106 7680 0X10 6 1550 8X10一559 1460 O10一5 2936 7106 7410 O10一6 1498 3X10 560 1440 o10一6 2838 8105 7。160 0106 1448 3X10-56l 1350 olO一6 2745 8X106 69
39、20 0106 1400 910一。62 1340 oxlO一 2657 210一6 6680 010一6 1355 710一563 1270 oxlo一6 2572 8105 6500 0lO 1312 610叶64 1230 o10 2492 4106 6270 0106 1271 610 365 1210 O106 2415 8105 6100 0IO一6 1232 5lO一566 1140 O10 6 2342 6X106 5890 0106 1195 210567 1130 oXlO一5 2272 6106 5730 OXl05 11S9 510568 1110 0106 2205
40、8106 5530 0106 1125 410569 1050 o10一6 2141 9106 5380 010-6 1092 810570 1040 oxlo一 2080 7X106 5220 0106 1061 610 571 9900 olO一7 2022 1X10“ 5080 010 6 1031 710513(;BT 8056-2008表A2(续)0005 001 0025 00572 9800 0107 1965 9lO一 4940 0105 1003 010一。73 9700 0107 1912 OlO一6 4810 010 o 9755 5X10674 9100 0107 1860 4106 4680 010一 9491 910一675 9000 0107 1810 7106 4570 0106 9238 8X10676 8700 0107 17631X10 6 4450 010-6 8995 710 677 8500 010 7 1717 310一6 4310 010 6 8762 110678 8400 0107 1673 3106 4200 010 6 8537