1、中华人民共和国国家标准为估计批(或过程)平均质量选择样本大小的方法Choice of sam ple slze to estimate the average quality of a lot or process UDC 519.28 GB 4891-85 本标准适用r在简单随机抽样条件F.以规定的精密度,估计批(或过程)中所有个体的某个特性的平均值时,选择样本大小。1符号X,所观测个体的特性俏,或随机变旨是;_ X X=-二-,样术的平均值3 3批(或过程)的均值,或批(或过程)中所观测个体的特性值X的Jtfl望322的事前估计ifi(根据以往的经验戎数据所作的估计值); E,精密度。IX
2、-|的可容许的最大值,e=Ez相对误差, N,批量gn,从无限批中抽取样木的大小31 :从有限批中抽取样木的大小g,批(或Ul)不合格dlz率;ptP的营前估计值;户,样本不合格品率,R,极差。一组U值的展大值与最小值之辈gR,样本极差的平均俏(样*大小相同); ,批(戎过程)的标准差,戎批(或过程中个体的观测结果的标准差,1的字自J估计值3S,样本的标准差,S,样本标准差的平均值-(样本大小相同), v=已批(戎过程)的变异系数g v , v的至前估计俏,S R v= 戎-.样本的变异系数。d,是与n有关的常数。X d,X 国家标准局1985-01-29发布1985-10-01实施GB 48
3、91-85 2使用条件和经验知识2.1 根据以往观测值的数据,可确定特性值的标准差的估计俏,成点一确也此特性的的散布范围以反分布的形状。2.2如果目的在于估计不合格品率,则每个个体的特性但取0或1!f!的一个俏。例如:个体均fT格tlL时取o.为不合格Ja-、f则取10分布的形状和标准差只取决于批(或过程)的不合格品率,至于P值,可以从初步的抽样成以往的经驳得到估计。2.8 当样本的信息不是很充足,标准差的估计不准确,而对精密度的要求又较可真IJ时,实际需雯的样本大小将比F列各公式得到的样本大小安大些。2.4在任何情况下,甚至当只有粗浅的知识就着手进衍估计时.111个样本所作估11的精密度也可
4、由此样本来估计。第一个样本所达到的精密度的估计,有利于确定同样产品的下一个杆本的大小。S关于精密度的要求必须规定估计值所要求的精密度Eo4计算样本大小的公式4.1 计算样本大小通常采用如下的公式n (平).(1) 利用公式(1 )确定样本大小,将使得样本估计值与批(或过程7中所有个休所得结果之间的差大d子E的概率很小。当所妻求的确信程度较低时,在公式(1 )中可使用比系数3更小的系数。8. 如果以系数2代替系数3.抽样误差超过E的概率约为45%0。实际I所遇到的分布也l午不是正态的,表1(以正态分布为基例给世i采用不同系数H仁抽样误羞超过E的近1以概率。表l系数近iU 的概率3 0.003N:
5、 3飞。2.58 0.010豆武10%.)2 0.045旦注45%1. 96 0.050贝Ii:5% (1 /20) 1.64 0.100戎10%(1/10) b. 如果所观测的特性值的分布偏斜,各系数Jifi对院的近似的概率将不同干表1。如果担心偏斜的影响,有的件事需要做:(1)检查数据是否有过大或过小伯等异常情况,粗略估计偏斜系数。在必要时用统计理论调辑样本大小s( 2 )调查异常的材料批,并将它们分别处理。4.2计算样本大小有时采用公式(1 )的另一种形戊.&11 GB 4891-85 3V , 2 n c; ) m o 有些产品的随着变化,但V寸丘似地保持不变。如果相对误差e巾的所有数
6、值都相同。11 则公式(2 )右端的每个量都是常数。所以,n也是个常数。就是说,对所有的值将要求相同的样本大小。为估计批不合格品率,则以3古丁p)作为台。此时,公式(1 )变成二(伊F(12)HH-(3)如果P,J、,以至np.大小的公式为nl=(Jz)n(4) 其中n是由公式(川、( 2 )或(3 )确边的样本大小。5可利用以往的样本数据时各公式的用法5.1公式(1 )的使用z计算以往若干批的样本标准羞主(死-X) 2 n-1 ,如果样本标准差的差别不大,IJl以它们的平均值作为乡。s= 8. 由样本数据确定合值有一种简便方法,是将观测值按随机111国序排列,然后按每4,5,., l叫现g值
7、进行分组(以8个左右为白,求山倒极差的叫自R,以去作为S。表2给出仇的几个选择值。表2组的大小d , 4 2.06 5 2.33 6 2.53 7 2.70 8 2.85 9 2.97 10 3.08 b. 如果样本较小,可取h个样本标准差S,S2孔的如下的平均值作为20 GB 4881-85 c;- 1 乳白丁ZEE-其中,2是依赖于各样本大小的系数,即c., = r;I;. r 20 伊tl1.当E的规定值为3.64x10Pa时,为求某批砖的卓均抗折强度,计算所需的样本大小。解法z根据以前的三批砖每批以100块砖为样本的数据,估计的标准差的数值为15.64、13.96和14.69x 10
8、Pa 。这几个标准羞的平均值为14.76x 10Pa,由公式(1 )得出下列结果3 x 14. 76 , ,_. _. , = (一寸7EZ一)= (12.16) 148 (块)GB 4811-81 5.2公式(2 )的使用B如果。随着所观调l产品特性的均值变化,就要对几个样本计算出平均值s . . . ._ . _. _. . . . X和标准差S,如果这几个V=,.值的差别不大,可取V的平均值作为V。x 当样本大小都较小时,可使用如下的公式得出V.1 2白k1 页丁7可E7.于盯hF nl+n2+ + k 其中,可(i= 1, 由表4给出。k )是大小为叭的第1个样本的变异系数,.是依赖于
9、n;的常数,它的值表4 a 34567890 1 1. 7725 1.3820 1. 2533 1. 1894 1. 1512 1. 1259 1.1078 1.0942 1234567890 llIll-12 1. 0837 1. 0753 1. 0684 1. 0627 1. 0579 1. 0537 1.0501 1.0470 1.0442 1.0418 1.0396 . 1. 0376 1.0358 1. 0342 1. 0327 1 12845 22222 的这也数值是以手遵从非中时布为依据的。GB 4891-85 例2,当e的规定值为0.10或10%时,为估计某种产品的平均耐磨度,
10、计算所需的样本大小。解法:没有以往相同产品的样本数据。6个相似产品的样本数据表明耐磨度取值范围较宽,然而标准差的估计值与所观测的平均值近似地成比例,如表5所示。表5号样本大小平均耐磨度观测值的极差的估计值批X R = R /3.08 l 10 90 40 13.0 2 10 190 100 32.5 3 10 350 140 45.5 4 10 450 220 71.4 5 10 1000 360 116.9 6 10 3550 2090 678.6 平均在公式(2 )中以变异系数观测值的平均值作为V,则得3xO.152 n = (寸-). = (4.6)=21. 222 在本例中,由于各样本
11、的大小较小,也可按下式计算zn 1 n? n T T I + r;:r-=-一+.,.-;:7-1 / I al V;a2 Vtih、F飞1+2+n6 / 变异系数(%) 14 17 13 16 12 19 15.2 10 / 1 1 1 1 1 1、可得-一一一一-1-一一一一+-一+-一+-一一一+一-一+-一一-I l.0942、0.140.17 0.13 0.16 0.12 0.19 / = 6.179 ,、V =0.162 (= 16.2%) /3xO.162、,n = (一一-一】.= 23.6旬24飞0.10/ 60 在本例中,如果规定e= 0.05或5%时,则所需的样本大小为8
12、5。5.3公式(3 )的使用g计算F的公式为声=所有样本中不合格品总数所有样本中个体的总数伊tl3I当E的规定值为0.04时,为估计某批合金钢履带螺栓和螺母的不合格品率,计算所需的样本大小。解法g用表6中给出的前4批的数据,给出p的事前估计值。批号l 2 3 4 总计GB 4891-85 表B样本大小不合格品数75 3 100 10 90 4 125 4 390 21 21 = _-.-_ = 0.054 390 n= () 2 (0.054) (0.946)工287.4 288 、0.04 不合格品率0.040 0.100 0.044 0.032 如果E的规定值为0.01.则所需的样本大小取
13、460006没有以往的样本数据可利用时各公式的用法6.1 公式(1 )的使用g根据以往的经验,估出所观测特性的最大值b和最小值,并用图形表示观测值的分布情形。a. 在分布形式不明确和对精密度E要求较严格的情形下,可以采用均匀分布。由于这种分布的标准差较大,需要比较大的样本。如果使用等腰工角形分布代替其他王角形分布和均匀分布,所得的标准差相差不跑过40%。/、b. 采用图1中公式所估计的标准差作为公式(1)中的。这种事前估计的方法是经常使用的。分布:+b 均值22 b一a标准差z3.5 均匀忖li干一才叫一一布c工工止三/,_L全L2b+ 2+b +b +b 3 3 2 2 b-a b-a b-
14、a b-a 4.2 4.2 4.9 6.0 -a b-a b-a b-a fIi b-a 变异系数:0.57 ( . , ) 0.71卜-一一)0.71 (一一一一)0.41 (一一一一)0.33 (一一一2b+a v. 2a+b 图l几种分布形式及其均值、标准差和变异系数例4:问题!口例1,当E的规定值为3.64x10Pa时,为估计某批砖的、|尺均抗折强度,计算所需的样本大小。解法:根挝以往的终验,抗折强度值的散布范|有大约为87.27x 10 P a .这哩数值集1在此范用GB 4891-85 的中间,但不一定是正态分布的。图l巾等腰三角形分布最适合,的事前估计值为87.27 =一一一一=
15、17.81xl0Pa4.9 3x17.81 n = (一EZ-Y=(1468)216(块本例比例1的情形所需的样本要大,这是由于没有以往的样本数据可利用所造成的。6.2公式(2 )盹使用z在公式(2 )中,虽然可用图1估计V,但不推荐使用。通过分析实际数据,-般可得出使用比使用。更好的看法。如果这样,可用5.1条与5.2条的方法。自.3公式(3 )的使用s根据以往的经验,近似地估计不合格品率可能落在什么范围。杳图2,由P值可能范围的1点,读出a= p( 1 -p)的数值,并且用于公式(3 )。当精密度的要求较严时,可使用在P1I直可能范围内的最大值。比如,p值可能范围为0至0.1,由图2可知,
16、P=O.1时a的值最大,所以取=百=0.3 !I;a zv1F1 1百l 0.5 k: 间崎阉h巴/ ¥ 民k三1-0. v l主/ u! .c= p ( 1 - ) 1 0.3 11 v -唱-、飞i 1-l1_ 0.2 y 、c:.,. 1/ b 0.1 V 。0.1 。.20.3 。.0.5 0.& 0.1 0.8 0.9 o 图2对应P俏的及1.点7费用的考虑7.1 根据公式(1 )、( 2 )戎(3 )计算出符合规定精密度要求的样本大小后,r:一步就是计算观测此样本的费用。如果费用太高,也可放宽所要求的精密度,并酌减样水大小,以满足对于容许费用的要求。7.2 当规定容许费用时,口I由
17、此确定样本大小n,然后利用公式(1),(2)或(3 )计算出可能达到的精密度。7.2.1 在4.1的情形,可容许的最大误/f.F的估计的由如l下的公式给出或者GB 4891-85 E38 -F E = _1_!_ 一-d,rn 如果可利用以往的样本数据,当各样本柄神住差相差不大时,E=L主S;/ n i=l 其中,Sj为第t个样本的标准差(i= 1, k )。当各样本的大小较小时,E= 3全SikJ,; , Ci i 7.2.2在4.2的情形,相对误差e的估计值由如下的公式给出,、3V e = J石如果可利用以往的样本数据,当各样本变异系数相差不大时,。ke =一二=;v, k/n 其中,!为
18、第i个样本的变异系数(i= 1,劫。当各样本的大小较小时,3 n 1 + + nk e弓一-一/;-n 1 ,一+rrl -1 1 Ul J k ak 7.2.3在4.3的情形,可容许的最大误差E的估计值由如下的公式给出E=争而可了如果可以利用以往的样本数据,在上式中取严为所有样本中不合格品总数与所需样本中个休的总数的比值(见5.3条)。7.3费用与精密度必须规定其一,否则无法确定样本大小。S样本的选取8.1 均了对某个批(或过程)孚均质量作出估计,必须随机地抽取样本。抽取样本可以使用随机数表,在使用随机数时,要把产品分成若千个抽样单位,每一个抽样单位必须能够通过实际的顺序号或某种规则加以识别。GB 488186 8.2本标准不讨论处理产品及构成抽样单位的方法,而是认为已有适当的方法构成抽样单位,然后回答抽取多少抽样单位的问题。附加说明z本标准由中华人民共和国电子工业部提出。本标准由电子工业部标准化研究所,中国科学院系统科学研究所,哈尔滨工业大学共同起草。