1、ICS 0312030A 41 圆目中华人民共和国国家标准GBT 1011 12008代替GBT 10111-1988,GBT 15500 1995随机数的产生及其在 产品 质量抽样检验中的应用程序Generation of random numbers and procedures applied tosampling inspection for product quality2008-07-28发布 2009-01-01实施宰瞀鳃紫瓣警糌赞星发布中国国家标准化管理委员会捉111GBT 1011 12008目 次前言1范围2规范性引用文件3术语、定义和符号31术语和定义32符号4随机抽样的
2、一般程序(见图1)41确定样本量或抽样量42选取适用的随机抽样方法43对总体或批中的产品编号44生成随机样本单元号45按样本单元编号取出单位产品一46管理并检验样本单元5生成随机数的方法51随机数表法一52随机数骰子法一53伪随机数发生器法一6简单随机抽样61简单随机抽样的实旋62简单随机抽样的用途63简单随机抽样的示例7系统抽样-71系统抽样概述72系统抽样方法与实施8分层随机抽样的实施81分层抽样概述82分层随机抽样的实施83分层随机抽样的示例9关于二次或多次抽样的说明附录A(规范性附录)随机数表附录B(规范性附录) 随机抽样的扑克牌法附录c(规范性附录) 产生伪随机数的方法与程序参考文献
3、I,3333445555689999如u地n坞毖刖 昌GBT 1011 12008本标准代替GBT 10111-1988利用随机数骰子进行随机抽样的方法和GBT 15500-1995利用电子随机数抽样器进行随机抽样的方法。为使本标准的技术内容更加系统完善、便于操作,在保留原标准的主要内容和技术特点的基础上,将GBT 10111 1988和GBT 15500 1995合并为一个标准。本标准与GBT 10111 1988和GBT 15500 1995的主要差别:a)重新设计了标准的技术架构,并按照GBT 112000的要求起草了标准文本。b)为便于标准的理解和实施,增加了相关的术语。c)增加了“随
4、机抽样的一般程序”。d)增加了生成随机数的“随机数表法”、“伪随机数发生器法”、“扑克牌法”。e)增加了“系统随机抽样”和“分层随机抽样”方法。f)增加了附录A、附录B和附录C。本标准的附录A、附录B和附录c均为规范性附录。本标准由中国标准化研究院提出。本标准由全国统计方法应用标准化技术委员会归口。本标准起草单位:中国人民解放军军械工程学院、中国标准化研究院、中国科学院数学与系统科学研究院、福州春伦茶业有限公司。本标准主要起草人:张玉柱、于振凡、陈敏、丁文兴、冯士雍、傅天龙。本标准所代替标准的历次版本发布情况为:GBT 10111 1988:GBT 15500 1995。1范围随机数的产生及其
5、在产品质量抽样检验中的应用程序GBT 1011 12008本标准规定了随机数的产生及利用随机数进行随机抽样的方法。本标准适用于分立个体类产品质量抽样检验的随机样本的抽取,也可用于调查抽样中随机样本的抽取。本标准不适用于散料类产品质量抽样检验的样本抽取。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。ISO 35341:2006统计学词汇及符号第1部分:一般统计术语与用于概率的术
6、语ISO 35342:2006统计学词汇及符号第2部分:应用统计3术语、定义和符号31术语和定义下列术语和定义适用于本标准。311分立个体类产品discrete item彼此容易区分、批产品由有限多个单位产品组成的产品。312抽样检验sampling inspection从所考虑的产品集合中抽取若干单位产品进行的检验。EIso 3534-2:2006,416注:产品集合可以是总体、批或提交批。313总体population所考虑对象的全体。Uso 35341:2006,11314批lot按抽样目的,在基本相同条件下组成的总体的一个确定部分。注:抽样目的可以是判定批的可接收性,或是估计某特定特性
7、的均值。iso 35342:2006,124315抽样sampling抽取或组成样本的行动。EISO 35342:2006,131GBT 1011 12008316随机抽取drawitem at random从由N个个体组成的总体中抽取个体时,使每一个体被抽到的可能性都相等的抽取方法。317抽样单元sampling unit将总体进行划分后的每一部分。注1:一个抽样单元可以包含一个或多个个体。注2:抽样单元可由分立的个体组成或由一定量的散料组成。iso 35342:2006,1214318样本量sample size样本中所包含的抽样单元(或个体)的数目。iso 35342:2006,1226
8、3319随机抽样random sampling从总体中抽取n个抽样单元构成样本,使n个抽样单元每一可能组合都有一个特定被抽到概率的抽样。Iso 35342:2006,1353110放回抽样sampling with replacement每个被抽取并经观测后的抽样单元,在抽取下一个抽样单元之前将其放回总体的抽样。注:在这种抽样方法中,同一抽样单元有可能在样本中出现多次。ISO 35342:2006,13153111不放回抽样sampling without replacement每个抽样单元只从总体中抽取一次,不再放回总体的抽样。iso 35342:2006,13163112样本sample由
9、一个或多个抽样单元构成的总体的子集。注:样本既可指构成抽样单元的具体物品、散料、服务,也可指这些抽样单元(或单位产品个体)的某个特性值。在限定前一种含义时,样本中的每个抽样单元(或单位产品个体)也称为“样品”。Iso 35341:2006,121733113简单随机抽样simple random sampling从总体中抽取n个抽样单元构成样本,使n个抽样单元所有的可能组合都有相等被抽到概率的抽样。iso 35342:2006,1343114分层抽样stratified sampling样本抽自于总体不同的层,且每个层至少有一个抽样单元入样的抽样。ISO 35342:2006,1362GBT
10、1011 120083115分层简单随机抽样stratified simple random sampling每层都采用简单随机抽样的分层抽样。注:如果从不同层抽出的个体单位产品的比例与层在总体中的比例相等,则称为比例分配分层简单随机抽样。ISO 35342:2006,1373116系统抽样systematic sampling将总体中的抽样单元按某种次序排列,在规定的范围内随机抽取一个或一组初始单元,然后按一套规则确定其他样本单元的抽样方法。3117等距抽样periodic systematic sampling将总体中的N个抽样单元按某种次序排列,并编上l到N的号码,抽取n个单元的等距抽样
11、,即是抽取号码为,+,十2,+(n-1)的n个单元,其中k是最接近Nn的整数,是从1到k的整数中随机抽取的初始单元的号码。同义词:周期系统抽样。Bso 35341:2006,13133118随机数 random number指定的随机变量的一个实现值。注:作为系列提供的随机数称为随机数序列。3119伪随机数pseudo-random number由某种算法产生的随机数。注:在不产生误解的情况下,也将伪随机数简单地称为随机数。3120物理随机数physical random number由某种物理装置产生的随机数。32符号KI一NRo,NRo的整数部分;K2一RoM,RoM的整数部分;M大于_N
12、的适当整数;m根据批量N所确定的随机数骰子个数;n样本量;N产品总体量或产品的批量;Ro用随机数的生成方法所产生的随机数;ro用随机数发生器生成的(o,1)上均匀分布的伪随机数;R按规定的读取方法所确定的随机数;R1当Ro1,将其转化为小于1的随机数。4随机抽样的一般程序(见图1)41确定样本量或抽样量根据抽样检验的目的,应用适当的标准或规范确定抽样检验样本量或抽样量。42选取适用的随机抽样方法根据确定的抽样检验方案,选取适用的抽样方法。本标准提供了简单随机抽样、系统随机抽样和分层随机抽样方法。GBT 1011 12008如有特殊需要,亦可使用整群抽样、多阶抽样方法。确定样本量或抽样量囱 冈
13、自 巨I 对总体或批中的产品编号 I获得随机数R。并读取样本单元号月 l目 国 国 嘲接样本单元编号取出单位产品按规定管理样品 I图1 随机抽样的一般程序43对总体或批中的产品编号按照选定抽样方法的要求,对产品总体、批次、生产班次、生产车间、码垛及其单位产品等进行编号。编号应不重不漏,且具唯一性。把抽样单元或单位产品按自然数从“1”开始顺序编号。44生成随机样本单元号按抽样检验方案所需的样本量或用其他方法规定的样本量,生成随机样本单元号。441获得随机数置。的方法本标准提供了如下4种产生随机数或伪随机数的方法。a)随机数骰子法;4b)随机数表法;c)伪随机数法;d)扑克牌法(见附录B)。442
14、读取样本单元编号R当获得随机数Ro后,应正确读取与样本单元对应的编号R。45按样本单元编号取出单位产品按生成的随机样本单元号取出相应的单位产品作为样本。46管理并检验样本单元按照标准、规范或合同的有关规定对样本单元进行管理和检验。5生成随机数的方法GB,T 1011卜一200851随机数表法511随机数表简介随机数表是一组由0到9数字组成的表,每个数字都有相同的概率出现在每个位置上。附录A提供了五张5050的随机数表(见表A1表A5)。如表A1不敷使用也可选择其他合适的随机数表。512获得随机数Ro的方法a) 确定随机数表号与初始点:首先在第一张表上随机指定一点,以它为起点依次向右读取5个数字
15、,第一个数字若小于5,则取该数加1作为选定的随机数表号,若第一个数字大于或等于5,则取该数减4之差作为选定的随机数表号。第23位和45位组成两个两位数,若两位数小于50,则加上1,若两位数大于或等于50,则减去49,最后所得的数表示初始点所在的行数和列数。b)获得Ro的方法:从初始点依次向下读取所需m位数得到所需的随机数Ro。在读取过程中,若读到该页的最后一行则转到第一行依次读取后m列,若最后剩下的几列不足m列则从下一号表的第一列开始依次补上。513读取样本单元编号Ra) 如获得的随机数尺oN,则随机数R就取Ro;若RoN,则设RoKtN+R,其中KIENR。,当(Kl+1)N10”时,舍弃并
16、重新生成随机数Ro;当(KI+1)Ni0”时,则取RR1(若0N,则取一个大于N的适当整数M。一般取M一2101,25i01,3Xi01或5101。设RoK2M+R2,其中K2一RoM3,则当(K2+1)Mi0“时,舍弃并重新生成随机数Ro;当(K2+I)M、N)。重复上述过程,直到获得n个不同的随机数为止。注1:当N小于200,而所得读数大于200,取读数减去200的倍数,若其差数小于或等于N则作为所要的随机数,著差数大于N,则舍弃;当2006或个别骰子丢失、损坏时,可通过重复摇骰子的方法获得随机数Ro。例如,可用一个骰子摇m次来代替m个骰子摇一次。规定第一次摇骰子所得数字为随机数的最高数位
17、,摇第二次骰子所得数字为随机数的第二高数位,依此类推。523读取随机样本单元号R的方法5231方法一如获得的随机数RoN,则随机数R就取R。;若RoN,则舍弃不用,另行重新生成随机数Ro。重复上述过程,直到取得n个不同的随机数为止。5232方法二如获得的随机数R。N,则随机数R就取R。;若RoN,则设Ro-K1N+Rz,其中KI一NRo,当(K1+1)N1时,舍弃并重新生成随机数Ro;当(KI+1)N10“时,则取RR1(若oN,则取一个大于N的适当整数M。一般取M一2X10m 1,2510mi,310m-i或5X10m 1。设RoK2M+R2,其中Kz一RoM,则当(K2-FI)M10m时,
18、舍弃并重新生成随机数Ro;当(K2+1)MN)。重复上述过程,直到获得n个不同的随机数为止。注:若遇到与已获得随机数重复情形,则舍弃重摇。524随机数骰子法示例示例1:设批量N一753,样本量n一3,试对其进行随机抽样。采用523I规定的方法:将批中的单位产品编号将批中的单位产品按自然数从“1”开始顺序编号到753。用随机数骰子摇随机数a)若摇出的第一个随机数Ro一725753,则舍弃重摇d)重摇出的第三个随机数Ro一086350,因为KI一NRo一45Z350一1,且(Kt4-1)N一(1+1)350700103,由Ro=K1 N4-R1导出:Rt:Ro KI N一452 350一102;G
19、BT 1011 12008c)设摇出的第三个随机数Ro=810350,因为K1一ENR。一81013503=2,且(K1+1)N一(2+1)X 3501 050103,故舍弃重摇;d)设重摇出的第三个随机数Ro=568350,因为Kl一NRo=65885031,且(Kl+1)N=(1+1)X350=700103,由RoK1N+R1导出:R1一RoK1N一658350=308。从批中取出样品从批中取出编号为102、211、308的这3个单位产品。示例3:设批量N一4 562,样本量n一5,试对其进行随机抽样。采用5233规定的方法:将批中的单位产品编号将批中的单位产品按自然数从1开始顺序编号到4
20、 562;需要的骰子数m=4。令M一5 000。用随机数骰子摇随机数a)设摇出的第一个随机数R。=31504562,K2一R。M3一68975000一1,因为(K2+1)M一(1+1)M一2500010000104,由RoKzM+R2,导出R2一Ro K2M一689750001897;c)设摇出的第三个随机数R。=03644562,K2一R。M一58975000一1,因为(K2+1)M=(1+1)M一25000=10000i04,由Ro=K2M+R2,导出R2一风一KzM一96995000=46994562,舍弃重摇;f)设摇出的第六个随机数Ro一83414562,K2一RoM一8341150
21、003一l,因为(K2+1)M一(1+1)M一2X 5000=10000104,由RoK2M+R2,导出R2一RoK2M一834I一5000=3341。从批中取出样品从批中取出编号为0364、1897、2851、3150、3341的这5个单位产品。示例4:设批量一2 677,样本量n一5,试对其进行简单随机抽样。采用5233规定的方法:将批中的单位产品编号将批中的单位产品按自然数从1开始顺序编号到2677;需要的骰子数m=4。令M一3000。用随机数彀子摇随机数a)设摇出的第一个随机数岛一90122677,则K2一90123000一3,因为(Kz+1)M一(3+1)M一430001200010
22、4,故舍弃重摇;b)重摇出的第一个随机数Ro=78202677,K2一RoM3=7820300032,因为(Kz+1)M一(2+1)M一3300090002677,Kz一R0M3=5891300031,因为(Kz+1)M一(1+1)M一230006000N,舍弃重摇;d)重摇出的第二个随机数Ro一06732一1(即L),这时将数值4z。一1存人计算机的存储单元时i=0会发生溢出。它将导致最左边的一L+1个二进制丢失(溢出)。而保留的L位数值正好就是x。C2线性同余组合发生器随机数研究导致了各种各样的新方法,比如逆同余发生器、Fibonacei随机数、Tausworethe随机数、进位加发生器和
23、错位减发生器、复合素数随机数发生器和混沌映射随机数发生器、克努斯减去方法等。组合发生器是指几个不同随机数发生器组合所得的一类发生器。线性同余组合法与单独使用线性同余法相比,其产生的随机数周期更长,随机性和均匀性都有较好的改进。下面介绍乘同余组合发生器,然后给出两个示例,示例中的参数都是被优化过的。一个k阶MRG(Multiple Reeursive Generator)定义为:X。一(alz一1+nlz一)mod m (C1)hz。m其中m和k都是正整数,口;z一0,1,m一1)2“。下面要介绍的随机数发生器(RNGs)是J个式(c1)组合,即式(c2): 巧。一(aj1xj1+ajzJ,P)
24、rood mJ(C2)其中J一1,2,J,mj为不同的素数,其中第J个随机数发生器有k阶滞后,其周期长为(m;一1)。令赴,曲为每个和m,互为素数的J个任意整数。现可定义如下两个线性同余组合发生器:1 92aHGBT 1011 12008wn一(蚤母等)rood,和Jz。一(以。)rood蛳J=1r。一z。mi(和饥)定义了两类不同的随机数发生序列2“。现给出(c4)的线性同余组合发生器两个实用例子,关于k和m,的取值可以查询L 7Ecuyer(1999)。线性同余组合发生器(c3)的例子可参考L 7Ecuyer_Tezuka(1991)。示例1:该示例经杨自强、魏公毅(2005)通过反复寻优
25、算得56“。该发生器所得随机序列的周期能达到其最大值(ml一1)(m21)22“,其中m1和mz所组合的两个随机数发生器的模数。首先取两个初值,不妨记做x5”,x5”,其范围分别是:oO“。1 4 294 967 0874 294 967 088 if z。一o(nl就是要产生的(0。1)上的均匀随机数。为方便使用,本标准提供一个实现上述算法的函数子程序(32位c语言)#define norm 2328306549295728e-10#define ml 42949670870#define m2 42949444430#define a12 14035800#define a13n 8107
26、280#define a21 5276120#define a23n 13705890double slO,s11,s12,s20,s21,s22;double MRG32k3a()long k;double pl,p2;i*Component、*|pla12 o s11一a13n*slO;kplml:pl一一k*ml;if(pl00)pl+一ml;s10一s11;s11一s12;s12=pl;*Component2*p2一a21*s22一a23n*s20;kp2m2;p2一一k*m2;if(p2O0)p2+一m2;s20一s21;s21一s22;s22;p2;*Combination*if(
27、p1一p2)return(plp2+m1)。norm);else return(plp2)*norm);,GBT 101 1 1200821GBT 1011 12008参考文献1LEcuyer P and Tezuka SStructural Properties for Two Classes of Combined RandomNumber GeneratorsJMathematics of Computation,1991,57(19):735746Grube,A1973Mehrfach rekursiv-erzeugte Pseudo-ZufallszahlenZAngewMathMe
28、ch53T223一T2252 Niederreiter,H1992Random Number Generation and QuasiMonte Carlo MethodsVolume 63 of SIAM CBMS-NSF Regional Conf:Series in Applied MathSIAM,Phila-delphia,PA3LEcuyer 1996Combined multiple recursive random number generatorsOperRes44(5)8168224Pierre LEcuyer(1999)Good Parameters and Implem
29、entations for Combined Multiple Recursive Random Number GeneratorsOperations Research,V0147,No1,(Jan一Feb,1999),PP1591645杨自强,魏公毅常见随机数发生器的缺陷及组合随机数发生器的理论与实践口数理统计与管理2001,20(1):45 516杨自强,魏公毅伪随机数、拟随机数和任意分布随机变量抽样程序库使用说明M北京:中国科学院数学与系统科学研究院,计算数学与科学工程计算研究所,2005(见ftpftpCCaccnpubsoftwareLinuxrandom)7杨自强你也需要蒙特卡罗方法一个得心应手的工具口数理统计与管理2007年1月第26卷第1期