1、ICS 0312030A 41 圆雪中华人民共和国国家标准GBT 4088-2008代替GBT 40871一1983,GBT 408721983,GBT 4088-1983数据的统计处理和解释项分布参数的估计与检验Statistical interpretation of dataEstimation and hypothesis test of parameter in binomial distribution2008-07-16发布 2009-0101实施丰瞀徽鬻瓣警麟瞥星发布中国国家标准化管理委员会促19目 次GBT 4088-2008前言引言1范围”12规范性引用文件13术语、定义和
2、符号14二项分布参数的点估计241经典估计法2411样本的抽取方式2412估计量2413例子242序贯样本估计法2421样本的抽取方式2422估计量2423例子25二项分布参数的区间估计351 比率P的双侧置信区间和单坝4置信区间352置信区间的求法36二项分布参数的检验761原假设与备择假设762双侧检验Ho:ppo,H1:ppo-7621实施步骤7622拒绝域的临界值C1、C2的确定7623 i;例-一-863上限单侧检验10631实施步骤10632拒绝域临界值C2的确定1064下限单侧检验10641实施步骤10642拒绝域临界值c-的确定-11附录A(规范性附录)根据对点估计的绝对误差限
3、确定n及C的方法12附录B(规范性附录) 其他几种估计方法-13附录c(规范性附录) 置信上限表(nlo(1)30)14附录D(规范性附录) 图解法28附录E(规范性附录) 拒绝域上侧临界值表32附录F(规范性附录) 显著性检验中的两类错误37附录G(规范性附录) 检验Ho的等效方法42附录H(规范性附录)给定第一、第二类错误时样本量n的估算-43前 言GBT 4088-2008本标准是在GBT 408711983数据的统计处理和解释 二项分布参数的点估计、GBT 4087。2一1983数据的统计处理和解释二项分布参数的区闯估计和GBT 4088-1983数据的统计处理和解释二项分布参数的检验
4、的基础上整合而成。本标准代替GBT 408711983、GBT 408721983和GBT 4088 1983。本标准与GBT 4087,l一1983、GBT 40872 1983、GBT 4088-1983相比较,技术内容的变化主要包括:按GBT 112000标准化工作导则第1部分:标准的结构和编写规则的要求对标准格式进行了修改;增加了P值检验。本标准的附录A、附录B、附录C、附录D、附录E、附录F、附录G与附录H均为规范性附录。本标准由全国统计方法应用标准化技术委员会(SACTC 21)提出并归口。本标准起草单位:中国标准化研究院、北京大学、广州市产品质量监督检验所、海南省产品质量监督检验
5、所。本标准主要起草人:于振凡、孙山泽、吴玉銮、邓穗兴、丁文兴、黄艳、蔡玮红、侯向昶、房祥忠。本标准所代替标准的历次版本发布情况为:GBT 408711983:GBT 408721983;GBT 4088一1983mGBT 4088-2008引 言从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不开统计方法。统计学是研究数字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可把一大堆数据的特征表达
6、出来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。数据的统计处理和解释含有多项国家标准,它们是:统计容忍区间的确定(GBT 3359)均值的估计和置信区间(GST 3360)在成对观测值情形下两个均值的比较(GBT 3361)二项分布参数的估计与检验(GBT 4088)泊松分布参数的估计与检验(GBT 4089)正态性检验(GBT 4882)正态样本离群值的判断和处理(GBT 4883)正态分布均值和方差的估计与检验方法(GBT 4889)正态分布均值和方差检验的功效(GBT 4890)I型极值分布样本离群值的判断和处理(GBT 6380)伽玛分布(皮尔逊型
7、分布)的参数估计(GBT 8055)指数分布样本离群值的判断和处理(GBT 8056)1范围数据的统计处理和解释二项分布参数的估计与检验GBT 4088-2008本标准规定了二项分布参数的估计与检验方法。设总体中的部分个体具有某种特性,P是总体具有此种特性的个体的比率。例如P可以是一批产品中不合格品的比率。从总体中随机地、独立地抽取若干个个体作为样本。本标准规定了基于这类样本,对总体的参数P作点估计、区间估计及检验的方法。对有限总体,设其大小为N(N应充分大),样本量为n。当抽取是有放回时,或当抽取是无放回的,但詈30,且01=o302-1960o070一o165p(1一P。)(n+2d=o0
8、71Pup+v户(1-p)(n+2d)=0326+19600071=0466双侧置信区间是(o165,0466)。525当n30,且詈o,1或詈o9时可采用泊松近似。这种近似需要利用z2分布表(见GBT 40862)。这时置信下限为pL对于单侧置信区间,式中当王接近于0n(9)当三接近于lnA一告震(zz)一昙瑶一。2(n-JC)+25GBT 4088-20086对于双侧置信区间,式中置信上限为A百1撕2(2z)nI;ii勋2一。22(n-x)+2当三接近于0” (10)兰i-。x接近于1对于单侧置信区间,式中一百1 X21_。(2z+2)A 7一告意2(n-x)对于双侧置信区间,式中一告瑶一
9、一2(2z+2)A7一告z:2 E2(n-x)这里,瑶(v)表示自由度为V的z2分布的a分位数a例:某试验中:n一50,z=5,取1一a一095,a)求单侧置信区间0,加)。一50,z=5,三一01,用接近于零的公式。Ai1 z12一。(2z+2)一i1托2 95(12)一X 21026=10513PU煮瓢一纛篙籍蒜一o单侧置信区间是o0199)。b)求单侧置信区间(pr,1n=50,_z=5,王一01,用接近于零的公式。A=i1-X乙l(2z)一号瑶“10)一394019702 21970pL 2n-x+1+A-2X50-5+。l+1。970单侧置信区间是(o040,1c)求双侧置信区间(p
10、L,Pv)。n=50,z=5,三一o1,用接近于零的公式。对钆,有一丢x:2(纽)z1。z 025(10)一0040蠡f、f【一U声=zI x 3247=I624m一2n-x-L-l一+A一2Po (单侧检验)H。:户Po,H1:声246),满足(11)式,再计算C12,此时712(cl+1)一67z一2(一c1)一96查F分布表得:Fo95(6,90)一220Fo 95(6,loo)一219近似取Fo 95(6,96)一219鲁等一178(192),满足(12)式,因此满足要求的最小整数为10,所以C2106234平方根正态近似法先以C11,C29作预估值,“o951645,c112V(”一
11、c1)户0_、(c1+1)qo)一2490102090)一1744(1645),满足(15)式,再算c12,GBT 4088-20089GBT 4088-20082V(nC1)p旷_、(C1+1)qo)一2(_、480103090)=1。095(1645),满足(16)式,所以c210。63上限单侧检验Ho:Ppo H1:PPo631实施步骤a) 由声o、样本量n及给定的检验的显著性水平a,确定拒绝域的临界值c2(c2的确定见632)。b) 累计抽取的n个个体中,具有该种特性的个体的个数z。c)当zcz时,拒绝140,当zfl时,不拒绝Ho。642拒绝域临界值c1的确定拒绝域的临界值Cl由Po
12、、n及显著性水平a确定。c-是满足下式的最大整数f1PXc1 n,po-(:)掰(1一Po)一az=O相应的两类错误的概率的计算见附录F。附录E中的表E1、E2、E4,分别给出了a一010,005,001时,单侧检验的拒绝域的上侧临界值。在求拒绝域的下侧临界值C1时,根据给定的显著性水平a,选择相应的表,计算qo一1一po,按n及qo从表中查出c,nc即为所求的C1值。对附录E未列出的a、n、Po可以用表4中给出的方法确定cl。表4Ho:p声o原假设和拒绝域的形式zc1ct是满足下式的最大整数查表法P(XC1 In,Po)ac是使下列式子成立的最大整数用F分布表法 FI-=(T1,扎)-Tnz
13、pqDo (20)式中h一2(cl+1),22(n-c1)简单正态近似法 c】no o5一ul石而卜一(21)平方根正态近似法 2(v,再=百,而一v厂i面面)“,。-(22)GBT 40882008附录A(规范性附录)根据对点估计的绝对误差限确定n及c的方法当近似地以1一a的概率保证所得的点估计P与被估计值P的绝对误差限不超过8,即Pl声一pId)1一a时,可根据以往的记录或经验确定一个P的粗估计值户o。此时,经典估计法中的n可如下确定:n。(半)Po(1一Po)(A1)序贯样本估计法中的C可如下确定:c a(半)硝(1一po)(A2)式中;口由所要求的保证概率1一a确定;l一“2标准正态分
14、布的1-a2分位数。12GBT 4088-2008附录B(规范性附录)其他几种估计方法除标准正文中的估计方法之外,这里再给出两种估计方法。在使用者各方协商一致和主管部门同意的情况下,可以采用这些估计方法。B1贝叶斯估计B11使用条件掌握p的先验知识;声服从J9分布,其概率密度函数为 r(。)一踹z一1(1一z)“1当。z110 当z1式中n,b为未知参数,并且已知P的经验均值P与方差v。例如当有大批以往的可靠的P的数值记载时,可根据这些历史资料算出P的经验均值P与方差一。B12样本的抽取方式样本量是事先规定的。样本从总体中随机地、独立地抽取。B13估计量由p与v计算口、b的数值如下n一吐出一6
15、一(1一矽掣一,;一丽x+a式中:n样本量z样本中具有指定特性的个体的个数。B2极小极大估计B21使用条件当样本量n比较小、并且P值在12左右时,经典估计会引起较大的均方误差。这时采用极小极大估计能使极大均方误差达到极小值。B22样本的抽取方式样本量”是事先规定的。样本从总体中随机地、独立地抽取。B23估计量P式中:n样本量;z样本中具有指定特性的个体的个数。GBT 4088D2008一10附录C(规范性附录)置信上限表(n=10(1)30)表c1置信上限表 双 侧 单 侧090 095 099 090 095 0990 0259 0308 0411 0206 0259 03691 0394
16、0445 0544 O337 0394 05042 0507 0556 0648 0450 0507 06123 0607 0652 0735 0552 0607 07034 0696 0738 0809 0646 0696 07825 0778 0813 0872 0733 0778 08506 0850 0878 0923 O812 0850 09077 0913 0933 0963 0884 0913 09528 0963 0975 0989 0 945 0963 09849 0995 0997 0999 0990 0995 099910 1000 1000 1000 1000 1000
17、 1000n一11弋 双 侧 单 侧o90 o95 o99 o90 o95 o99o o221 o265 o357 oi75 o221 o3191 o339 o385 o477 o287 o339 o4402 o438 o484 o573 o386 o438 o5373 o527 o572 o655 o475 o527 o6224 o609 o651 o728 o559 o609 o6985 o685 o723 o 791 o638 o685 o7656 o755 o789 o848 o712 o755 o8257 o819 o848 o897 o781 o819 o8798 o877 o90
18、1 o938 o846 o877 o9249 o928 o945 o970 o904 o928 o96110 o970 o979 o991 o955 o970 o98711 o996 o998 1ooo o991 o996 o99912 1ooo 1ooo 1ooo 1000 1ooo 1ooon一13弋 双 侧 单 侧o90 o95 o99 o90 o95 o99o o206 o247 o335 o162 o206 o2981 o316 o360 o449 o268 o316 o4132 o410 o454 o54l 0360 o410 o5063 o495 o538 o62l o444 o
19、495 o5884 o573 o614 o691 o523 o573 o6615 o645 o684 o755 o598 o645 o7276 o713 o749 o811 o669 o713 o7877 o776 o808 o862 o736 o776 o8418 o834 o86l o906 o799 o834 o8899 o887 o909 o943 o858 o887 o93110 0934 o950 o972 o912 o934 o96411 o972 o981 o992 o958 o972 o98812 o996 o998 1ooo o992 o996 o99913 1ooo 10
20、00 1ooo 1ooo 1ooo 1ooo15GHT 4088m2008辩=14表c1(续)j入1-a 双 侧 单 侧$090 095 099 090 095 099一 ”0 0193 0232 0315 0152 0193 02801 0297 0339 0424 0251 0297 0389。2 0385 0428 0512 0337 0385 0478p 3 0466 0508 0589 0417 0466 05574 0540 0581 0658 0492 0540 06275 0610 0649 0720 0563 0610 06926 0675 0711 0777 0631 06
21、75 07517 0736 0770 0828 0695 0736 08058 0794 0823 0873 0757 0794 08549 0847 0872 0913 0815 0847 089810 0896 0916 0947 0869 0896 093611 0939 0953 0974 0919 0939 096712 0974 0982 0992 0961 0974 098913 0996 0998 1000 0993 0996 099914 1000 1000 1000 1000 1000 1000竹一15 双 侧 单 佣o90 o95 o99 o90 o95 o99o o17
22、1 o206 o282 o134 o171 o2501 o264 o302 o381 o222 o264 o3492 o344 o383 o463 o300 o344 o4303 o417 o456 o534 o371 o417 o5034 o484 o524 o599 o439 o484 o5695 o548 o587 o658 o504 o548 o6306 o609 o646 o713 o565 o609 o6877 o667 070l o764 o625 o667 o7398 o721 o753 o8lO o682 o721 o7889 o773 o802 o853 o737 o773
23、 o83410 o822 o848 o89l o790 o822 o87511 o868 o890 o925 o839 o868 o91212 o910 o927 o955 o886 o910 o94513 o947 o960 o978 o929 o947 o97114 o977 o984 o993 o966 o977 o99015 o997 o998 1ooo o993 o997 o99916 1ooo 1ooo 1ooo 1ooo 1ooo 1000n一17弋 双 侧 单 侧090 o95 o99 o90 o95 o99o o162 o195 o268 o127 o162 o2371 O2
24、50 O287 O363 oZ10 O250 o3322 o326 o364 o441 o284 o326 o4103 o396 o434 o5lO o352 o396 o4804 o461 o499 o573 o416 o461 o5435 o522 o560 o631 o478 o522 o6036 o580 o617 o685 o537 o580 o6587 o636 o671 o734 o594 o636 o7098 o689 o722 o781 o650 o689 o7589 o740 o770 o824 o703 o740 o80310 o788 o816 o863 o754 o7
25、88 o84511 o834 o858 o899 o803 o834 o88312 o876 o897 o930 o849 o876 o91813 o915 o932 o957 o893 o915 o94814 o950 o962 o979 o933 o950 o97315 o979 o985 o994 o968 o979 o99116 o997 o999 1000 o994 o997 o99917 1ooo 1ooo 1ooo 1ooo 1ooo 1ooo17GBT 4088m2008n=18表c1(续)弋 双 侧 单 侧090 095 099 090 095 0990 0146 0176
26、0243 0114 0146 02151 0226 0260 0331 0190 0226 03022 0296 0331 0404 0257 0296 03743 0359 0396 0468 0319 0359 04394 0419 0456 0527 0378 0419 04985 0476 0512 0582 0434 0476 05546 0530 0566 0633 0489 0530 06067 0582 0616 0681 0541 0582 06558 O632 O665 0726 0592 0632 07029 0680 0711 0768 0642 0680 074610
27、 O726 O756 O808 O690 O726 O78811 0770 0797 0845 0737 0770 082712 0812 0837 0879 0782 0812 086313 0853 0874 0910 0825 0853 089714 0890 0909 0938 0866 0890 092715 0925 0939 0962 0905 0925 095416 0956 0966 0981 094l 0956 097617 0981 0987 0994 0972 0981 099218 0997 0999 1000 0994 0997 099919 1000 1000 1
28、000 1000 1000 100018n一20表c1(续)GBT 4088-2008 双 侧 单 侧090 095 099 090 095 099O 0105 0128 0178 0082 0105 01571 0164 0190 0245 0137 0164 02222 0215 0243 0300 0185 0215 02773 0263 0292 0351 0231 0263 03264 0308 0337 0397 0275 0308 03735 0351 O381 0441 0317 0351 04176 0392 0423 0483 0358 0392 04587 0432 04
29、63 0523 0397 0432 04988 0471 0502 0561 0436 0471 05379 0509 0540 0597 0475 0509 057410 0547 0576 0633 0512 0547 061011 0583 0612 0667 0549 0583 064512 0618 0647 0700 0585 0618 067913 0653 0681 0731 0620 0653 071114 0687 0713 0762 0655 0687 074315 0720 0745 0791 0689 0720 077316 0752 0776 0819 0723 0
30、752 080217 0783 0806 0846 0756 0783 083118 0814 0835 0872 0788 0814 085719 0843 0862 0896 0819 0843 088320 0871 0889 0918 0849 0871 090721 0899 0914 0939 0879 0899 093022 0924 0937 0958 0907 0924 095023 0948 0958 0974 0934 0948 096824 0969 0976 0987 0958 0969 098325 0987 0991 0996 0980 0987 099426 0
31、998 0999 1000 0996 0998 100027 1000 1000 1000 1000 1000 1000247128表c1(续)GBT 4088-2008 双 侧 单 侧090 095 099 090 095 099,。0 0098 0119 0167 0076 0098 01471 0153 0178 0230 0128 0153 02082 0202 0228 0282 0173 0202 02603 0246 0274 0330 0216 0246 03074 0288 0317 0374 0257 0288 03505 0329 0358 0416 0297 0329
32、03926 0368 0397 0455 0335 0368 04327 0406 0435 0493 0372 0406 04708 0443 0472 0530 0409 0443 05079 0479 0508 0565 0445 0479 054210 0514 0543 0599 0481 0514 057711 0549 0577 0632 0515 0549 061012 0583 0611 0664 0550 0583 0 64313 0616 0643 0695 0583 0 616 067414 0 648 0675 0724 0616 0648 070515 0680 0
33、706 0753 0649 0680 073416 0711 0736 0781 0681 0711 076317 0741 0765 0808 0712 0741 079118 0771 0793 0833 0743 0771 081819 0800 0821 0858 0774 0800 084320 0828 0847 0881 0803 0828 086821 0855 0873 0904 0832 0855 08922Z 0881 0897 0924 0860 0881 091423 0906 0920 0944 0888 0906 093524 0930 0942 0961 091
34、4 0930 095425 0951 096i 0976 0938 0951 097026 0971 0978 0988 0961 0971 098527 0988 0992 0996 0982 0988 099528 0998 0999 1000 0996 0998 100029 1000 1000 1000 1000 1000 100026n=30表c1(续)GBT 4088-2008弋 双 侧 单 侧o90 095 O99 090 095 0990 0095 o116 0162 0074 0095 01421 0149 0172 0223 o124 o149 02022 0195 022
35、1 o274 0168 0195 02523 0239 0265 0320 o209 0239 02984 0280 0307 o363 o249 0280 03405 0319 0347 0404 0287 o319 o3816 0357 0386 0443 0325 0357 o4207 o394 o423 0480 0361 0394 04578 o430 0459 0516 0397 o430 o4939 o465 o494 o550 0432 0465 052710 0499 0528 o583 o466 o499 o56111 o533 056l O616 0500 o533 o5
36、9412 0566 0594 0647 0 533 0566 062613 o 598 o626 0677 0566 0598 065714 0630 o 657 o707 o599 0 630 068715 o661 0687 0735 0630 0661 o71616 0692 0717 0763 0662 o692 o74417 o721 0745 0789 0692 0721 o77218 0750 0773 o815 0723 0750 079919 o779 0801 0840 0752 0779 082420 0807 0827 o863 o782 0807 084921 083
37、4 0853 0886 0810 o834 087322 0860 0877 o907 o838 o860 089623 0885 0901 0927 0865 0885 o91724 o909 0923 0946 0891 0909 o93725 0932 0944 o962 0917 0932 095526 0953 o962 0977 0941 0953 097227 0972 o979 0988 0963 0972 o98528 0988 0992 0996 0982 o988 099529 0998 0999 1ooo o996 0998 100030 1ooo 1ooo 1000
38、1000 1000 1oooGBT 4088-2008附录D(规范性附录)图解法D1在精度要求不很高的情况下,可采用图解法。这种方法简便快速。甄2本标准给出了单侧置信区间和双侧置信区间的置信水平分别为095(95),090(90);0975(975),095(95);o995(995),099(99)的三张图(见图D1、D2、D3)。对于给定的置信永平a和固定的样本量n(在8到200之间),以及观测到的具有某种特性的个体频率xn,可以按以下;方法从图中直接读出置信上限Pu和置信下限P-。甄3单侧区间的置信限的确定D31置信上限Pu值的确定选择相应于单侧区间的置信水平为1一n的图。根据观测到的具有某种特性的个体的频率=n,取凰中上面一组曲线,在左方刻度上读出相应的Pu值。甄32置信下限钆值的确定选择相应于单侧置信区间的置信水平为1一a的图,根据观测到的具有某种特性的个体的频率#n,取图中下面一组曲线,在左方刻度上读出相应的P。值。D33对于图中标出的n值之间的其他n值可以使用1胍作为插值变量通过曲线之间的线性插值藏列近似的pr和PU值。具体作法如下:以确定加为例。设no所对应的曲线没有在图中标出。m,nz与n。相邻,其对应的曲线已经在图中标出(m Z , , 、,。妒 , 夕 蜀 7, b, 名 夕 , 夕 。 匆 , , , 石 矽 衫 , 夕 。 形 夕 ? 岩 , , 影