1、中华人民共和国国家标准数据的统计处理和解释均值的估计和置信区间Statistical interpretation of data Estimation of the mean-Confidence interval UDC 519.25:620 . 113 GB 3360-82 本标准适用于对抽自正态总体的随机样本所作的一系列试验的基础上,在总休方差未知的情形下,估计该总体的均馅,或者利用试验所得的数据计算出一个区间,使得这个区间以给定的概率包含总体均值。对于总体概率分布遵从正态分布的假定可以广泛地得到满足z在一定的试验条件F,所得试验结果的分布经常是正态分布或者近似正态分布。本标准假定,用
2、来进行测定的个体,构成h个来臼原总体的独立随机样本。变换试验结果的原点或单位可以使计算简化。如果没有试验t、技术t或其他的明显理由作为依据,则不许剔除任何观测值或修正可疑的观测值。试验方法可能受到系统误差(可确定原因的误差的约束。本标准假定没有系统误差。系统误差的存在可能使下述的方法失效。计算所得的区间称为均值的置信区间,与它相关联的是置信水平。置信水平是置信区间包含总体均值的概率,通常用百分数表示。本标准仅考虑95Yn和99%两个水平。本标准是参考国际标准ISO2602试验结果的统计解释一一均值的估计和置信区间(1980年第二版制订的。1 均值的估计1 . 1 不分组的情形在剔除可疑数据后,
3、这批数据包含n个观棋tl值X;(i =l,2,n),其中某些可能取相同的值。用n1数据的算术平均x估计正态分布的均值X=J_ Xi n i=l 1. 2 分组的情形当数据的个数很大(比如在50以上)时,可以将它们按等问隔分组。在某些情形,也可能直接获得分组的数据。n;表示第1组的频数,即是第i组中数据的个数。k表示组数,则有n .n; Y;表示第i组的中点,用所有组的中点的加权算术平均主作为均值的估计。y手n;y,Ii 1=o 国家标准局198212一ao发布l 198401 01实施吁4二GB 3360 82 2 均值的置信区间利用总体均值和标准差的估计量可以计算总体均值的置信区词。计算置信
4、区间的另一种方法是利用极差,这种方法在附录A中给出。2. 1 标准差的估计2. 1 . 1 不分组的情形标准差的估计公式如下gS(x; x!2 式中:X; 第1个观测值。1. 2, n 观测值的总个数,土一n个观测值的算术平均。为了计算方便,建议使用下列公式zS= J士1主xi令且2. I. 2 分组的情形标准差的估计公式如下g=fil川.Y 为了计算方便,建议使用下列公式gS牛1中叶言In;y; )2 式中Y;一一第1组的中点。l,2,k),k 组数,n;一第1组中观测值的个数,n一观测值的总个数,n军立ll; 9一一各组中值的加权算术平均。2.2 均值的置信区间对于所选取的置信水平(95%
5、或99%),根据特定情形,确定双侧的或单侧的置信区间。2.2. I 双侧置信区间总体均值的双侧置信区间由下列的双重不等式确定sa. 在置信水平95%下,19 b. 在置信水平99%下,2.2.2 单倒置信区间GB 3360 82 Q 。”tI o. 975 x二一一Sx t 0,95 s v句T表1I I a和元的值(i;j(¥侧情形i刊乎单侧情形f言水平叩侧情形(iJ;j(丰t单侧情形95% 99% 95% 99% 95% 99% 95% 99% t 0.975 ,抽5t 0.95 t ” n I t -0.铀t -0.崎I o.四n 、饵、旷、百、霄2 12. 71 63.66 6.314
6、 31.82 2 8.985 45.013 4.465 22.501 3 4.303 9.925 2. 920 6.965 3 2.484 5. 730 l. 686 4.021 4 3 182 5.841 2.353 4 541 4 I. 591 2.920 l. 177 2. 270 5 2. 776 4.604 3.132 3. 747 5 1.242 2.059 。.953 l. 676 6 2. 571 4.032 2 015 3.365 6 1.049 1.646 0.823 l. 37 4 7 2.447 3. 707 , 943 3.143 7 0.925 1.401 0.73
7、4 l. 188 8 2. 365 3.499 J. 895 2.998 8 0.836 1.237 。.6701.060 9 2. 306 3.355 1.860 2.896 9 0.769 1.118 0. 620 。因96610 2. 262 3.250 !. 833 2. 821 10 0.715 1.028 o. 580 o. 892 ll 2.228 3.169 I. 812 2. 764 II 0.672 0.956 0. 546 0.833 12 2 20! 3.106 l. 796 2. 718 12 0.635 0.897 0. 518 o. 7部13 2 179 3. 0
8、55 1.782 2. 681 13 。.6040.847 0. 494 。74414 2. l60 3.012 l. 771 2.650 14 0.577 0.805 0.473 0. 708 15 2. 14 5 2.977 l. 761 2.624 15 0.554 0.769 。.455 0.678 16 2.131 2.947 1.753 2. 602 16 0.533 0.737 0.438 0.651 17 2. 120 2.921 I. 746 2. 583 17 0.514 0.708 0 423 0.626 20 GB 3360-82 续表1置M叶(现侧情形信1k4单侧情形
9、i在乎(现侧情形二言7)(乎(惶侧情形)95% 99% 95% 99 95纠99. 95. 99 I I 0.975 I 0.995 l o. 95 l 0. 99 n I o. I n 0. 95 、卢n ,n 飞产百、(n 18 2 .110 2.898 1. 740 2 567 18 0. 497 0.683 。.410。.60519 2. 101 2. 878 1.734 2 552 19 0.482 0.660 0.398 0.586 20 2.093 2. 861 1. 729 2.539 20 0.468 0.640 0.387 0. 568 21 2.086 2. 845 1.
10、 725 2.528 21 0.455 0 .621 0.376 0. 552 22 2.080 2.831 1. 72 l 2.518 22 0 443 0.日040.367 0. 537 23 2.074 2.819 1 717 2. 508 23 。.4320.58 0 358 0.523 24 2. 069 2.807 1 714 2. 500 24 0 422 0. 573 0 350 0. 510 25 2.064 2.797 l. 711 2. 492 25 0. 413 0.559 0 342 0.498 26 2. 060 2.787 1. 708 2.485 26 0 40
11、4 0.547 0.335 0. 487 27 2.056 2.779 1.706 2. 479 27 0.396 0.535 0.328 0 477 28 2. 052 2. 77 l 1. 703 2.473 28 0.388 0. 524 0.322 0.467 29 2. 048 2. 763 1.701 2.467 29 0.380 0.513 o. 316 0.458 30 2. 045 2.756 1. 699 2.462 30 o. 373 0.503 0.310 0 449 40 2.024 2. 707 1. 682 2 430 40 0.320 0. 428 0. 266
12、 0 384 50 2. 008 2.680 1.676 2 404 50 0. 284 0.379 。,2370.340 60 2 000 2.664 1.673 2.393 60 o. 258 0.344 0. 216 0.309 b. 在置信水平99%下,Io. 99 x一s ) 对于数据分组的情形,必要时可用Y代替土。lo.975 lo.995 lo.95和Io.99均为自由度v= n 1的t分布的筐。在表1中给出这些值以及且芒,lo.995 lo.95 120 一一,和的值。当n大于60时,可以使用表2,由一一通过线性内插计算I的债。)./TI 例如:n = 250 120 一o.
13、48 n 10.995 =2.576 +0.48 (2.617 -2.576 l 二2.596、n、GB 3360-82 表2120 t 0. 975 t 0 995 t 0.95 t 0. 99 n n 60 2 2. c 00 2 664 1. 673 2.393 120 1 1.980 2 617 1. 658 2. 358 。1.960 2.576 1.645 2.326 S结果的表示3. 1 按照1.1或1.2给出均值的表达式。3.2 以2.2.1中的双重不等式或2.2.2中的不等式的一种形式表示置信区间,说明置信水平(95%或99%),并指出由于怀疑而剔除数据的个数和剔除的理由。2
14、2 GB 3360-82 附录A用极差确定均值的置信区间(补充件)如果将观测f1直从小到大排列,即x1x2义义Xn,则R Xn -Xi被定义为样本极差。仍然假定总体是正态分布。当观测值的个数较少时,比如说小于或等fl2,可以利用样本极羞来确定总体均值的置信区间。这种算法优点是比较快,缺点是通常导出一个较宽的置信区间,而且对观现tl值偏离正态假设比较敏感。双伽l置信区l同总体均值的双侧置信区间由下列双重不等式确定2. 在置信水平95%下x qo.1s R 土qo.1sR b. 在置信水平99%下x qo.s R x + qo.s R 单侧置信区间总体均值的单侧置信区间由下列不等式中的一个确定ga
15、. 在置信水平95%下b. 在置信水平99%下 x + Jo.sR 或者,士Qo.os R x + q0.99R 或者,土qo.oR 系数Qo.975,q0.995,的.95q0.99在附表中给出。附表置信血4(双侧情形)置信1.kf(单侧情形)95% 99% 95% 99% n lo.975 q 0.995 q o. 95 q o. 99 2 6.353 31 828 3. J 57 15.910 3 l. 304 3.008 0.885 2.111 4 0.717 1.316 。.5291.023 5 0.507 0.843 0. 388 。.6856 0. 399 0 628 0.312 0.523 7 0.333 0 507 0. 263 o. 429 8 0.288 o. 429 0.230 o. 366 9 0.255 0.374 0.205 o. 322 10 0. 230 0.333 0.186 o. 288 11 o. 210 0 302 0.170 0.262 12 0. 194 0.277 0.158 0.241 附加说明:本标准由电子工业部标准化研究所提出。本标准由电子工业部标准化研究所、科学院系统科学研究所、哈尔滨工业大学起草。二、