1、10.2 随机抽样,-2-,知识梳理,考点自诊,1.总体、个体、样本、样本容量的概念 统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素作为个体,从总体中抽取的 所组成的集合叫做样本,样本中个体的 叫做样本容量. 2.简单随机抽样 (1)定义:一般地,设一个总体含有N个个体,从中逐个 地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的 ,就把这种抽样方法叫做简单随机抽样. (2)常用方法: 和 . (3)应用范围:总体中的个体数较少.,一部分个体,数目,不放回,机会都相等,抽签法 随机数法,-3-,知识梳理,考点自诊,3.系统抽样 (1)定义:当总体中的个体比较多
2、时,首先把总体分成均衡的若干部分,然后按照预先定出的规则,从每一部分中抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样. (2)应用范围:总体中的个体数较多. 4.分层抽样 (1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样. (2)适用范围:适用于总体由差异比较明显的几个部分组成.,一定的比例,-4-,知识梳理,考点自诊,1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的. 2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍. 3.分层抽样是按比例抽样,
3、每一层入样的个体数为该层的个体数乘抽样比.,-5-,知识梳理,考点自诊,1.判断下列结论是否正确,正确的画“”,错误的画“”. (1)简单随机抽样是一种不放回抽样. ( ) (2)在抽签法中,先抽的人抽中的可能性大. ( ) (3)系统抽样在起始部分抽样时采用简单随机抽样. ( ) (4)用系统抽样从102名学生中选取20名,需剔除2名,这样对被剔除者不公平. ( ) (5)在分层抽样中,每个个体被抽到的可能性与层数及分层有关. ( ),-6-,知识梳理,考点自诊,2.(2017福建福州一模,文4)在检测一批相同规格共500 kg航空耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,
4、则这批垫片中非优质品约为( ) A.2.8 kg B.8.9 kg C.10 kg D.28 kg,B,解析:由题意,得这批垫片中非优质品约为 5008.9(kg),故选B.,3.(2018湖南永州三模,2)现从已编号(150)的50位同学中随机抽取5位以了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是( ) A.5,10,15,20,25 B.3,13,23,33,43 C.1,2,3,4,5 D.2,10,18,26,34,B,解析:由系统抽样方法的概念可知抽取的样本编号构成公差为10的等差数列,所以符合要求的编号可能是3,13,23,33,43
5、,故选B.,-7-,知识梳理,考点自诊,4.(2018五省六校联考,3)某中学有高中生960人,初中生480人,为了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n的样本,其中高中生有24人,那么n等于( ) A.12 B.18 C.24 D.36,D,-8-,知识梳理,考点自诊,5.(2018全国3,文14)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是 .,分层抽样,解析:因大量客户且具有不同的年龄段,分层明显,故根据分层抽样的定义可知采用分层抽样
6、最为合适.,-9-,考点1,考点2,考点3,简单随机抽样 例1(1)用随机数法从100名学生(其中男生25人)中抽取20人进行评教,某男生被抽到的概率是( ),(2)(2018湖南怀化模拟,7)总体由编号为01,02,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从第1行的第5列和第6列数字开始由左往右依次选取两个数字,则选出来的第5个个体的编号为( ),C,A,A.01 B.02 C.14 D.19,-10-,考点1,考点2,考点3,解析: (1)从容量N=100的总体中抽取一个容量为n=20的样本,每个个体被抽到的概率都是 (2)从随机数表第1行的第5列和第6列数字
7、开始,由左到右依次选取两个数字中小于20的编号,重复的略过.可知对应的数值为08,02,14,19,01,则第5个个体的编号为01.故选A.,思考使用简单随机抽样应满足的条件是什么? 解题心得1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取. 2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).,-11-,考点1,考点2,考点3,对点训练1(1)下列抽取样本的方式是简单随机抽样的有( ) 从无限多个个体中抽取50个个体作为样本; 箱子里有100支铅笔,从中选取10支进行检验,在抽样操作
8、时,从中任意拿出一支检测后再放回箱子里; 从50个个体中一次性抽取5个个体作为样本. A.0个 B.1个 C.2个 D.3个,A,-12-,考点1,考点2,考点3,(2)(2018山东潍坊青州三模,2)总体由编号为00,01,02,48,49的50个个体组成,利用下面的随机数表选取8个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为( ) 附:第6行至第9行的随机数表: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 27
9、48 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A.3 B.16 C.38 D.49,C,-13-,考点1,考点2,考点3,解析: (1)不满足样本的总体数有限的特点;不满足不放回抽取的特点;不满足逐个抽取的特点. (2)选出来编号在0049的前4个个体的编号为33,16,20,38,所以选出来的第4个个体的编号为38,故选C.,-14-,考点1,考点2,考点3,系统抽样 例2(1)(2018四川绵阳三诊,3)为了解某高校高中学生的数学运算能力,从编号为0001,0002,2000的2
10、000名学生中采用系统抽样的方法抽取一个容量为50的样本,并把样本编号从小到大排列,已知抽取的第一个样本编号为0003,则最后一个样本编号是( ) A.0047 B.1663 C.1960 D.1963 (2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是 .,D,4,-15-,考点1,考点2,考点3,解析: (1)2 00050=40,故最后一个样本编号为3+4940=1 963,故选D. (2)依题意,应将35名运动员的成绩由好到差排序后分为7组,每组5
11、人.然后从每组中抽取1人,其中成绩在区间139,151上的运动员恰好是第3,4,5,6组,因此,成绩在该区间上的运动员人数是4.,-16-,考点1,考点2,考点3,思考具有什么特点的总体适合用系统抽样抽取样本? 解题心得(1)系统抽样适用的条件是总体容量较大,样本容量也较大. (2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔. (3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. (4)系统抽样是等距抽样,利用系统抽样抽取的样本编号通常构成等差数列,但如果抽样规则另有说明(非等距抽样),得到样本编号则不一定成等
12、差数列.,-17-,考点1,考点2,考点3,对点训练2(1)为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( ) A.5,10,15,20,25 B.2,4,8,16,32 C.1,2,3,4,5 D.7,17,27,37,47 (2)(2018湖北5月冲刺,3)随着中央决定在海南省全岛建立自贸区的政策公布以来,海南各地逐步成为投资热点.有24名投资者想到海南某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为124号,再用系统抽样方法抽出6名投资者,邀请他们到
13、海南某地实地考察.其中年龄不超过55岁的人数为( ) A.1 B.2 C.3 D.不确定,D,B,-18-,考点1,考点2,考点3,解析: (1)利用系统抽样,把编号分为5段,每段10个,每段抽取一个,号码间隔为10,故选D. (2)因为系统抽样是等距性抽样,按年龄从小到大编号,每4人(一个区间)抽出一人,不超过55岁落在(39,40,41,41)内,或(42,45,51,53)内,所以抽取2人.故选B.,-19-,考点1,考点2,考点3,分层抽样(多考向) 考向1 已知总体数量,求各层抽取数量 例3(2018河南信阳模拟,3)某中学有高中生3 000人,初中生2 000人,男、女生所占的比例
14、如下图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是( )A.12 B.15 C.20 D.21 思考在分层抽样中抽样比是什么?每一层是按什么比来抽取的?,A,-20-,考点1,考点2,考点3,-21-,考点1,考点2,考点3,考向2 已知抽取人数,确定总体或各层数量 例4(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25
15、,43,则这四个社区驾驶员的总人数N为( ) A.101 B.808 C.1 212 D.2 012 (2)(2018黑龙江仿真模拟,14)某工厂生产的A、B、C三种不同型号的产品数量之比依次为235,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A、B、C三种产品中抽出样本容量为n的样本,若样本中A型产品有16件,则n的值为 .,B,80,-22-,考点1,考点2,考点3,-23-,考点1,考点2,考点3,思考在分层抽样中,每个个体入样的可能性与抽样的个数和总体数量之比有怎样的关系?,解题心得1.在分层抽样中,抽样比 ,每一层都是按抽样比的比例来抽取的. 2.在分层抽样的过程中,各
16、层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即niNi=nN. 3.分层抽样适用于总体是由差异明显的几部分组成的情况,这样更能反映总体的情况,是等可能抽样.,-24-,考点1,考点2,考点3,对点训练3(1)(2018山东肥城模拟,14)某学校高一学生有720人,现从高一、高二、高三这三个年级学生中采用分层抽样方法,抽取180人进行英语水平测试,已知抽取高一学生人数是抽取高二学生人数和高三学生人数的等差中项,且高二年级抽取65人,则该校高三年级学生人数是 . (2)某校高一、高二、高三分别有学生1 600名、1 200名、800名.为了解该校高中学生的牙齿健康情况,
17、按各年级的学生数进行分层抽样.若高三抽取20名学生,则高一、高二共需抽取的学生数为 .,660,70,-25-,考点1,考点2,考点3,(3)一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画出了如图所示的频率分布直方图,现要从这10 000人中用分层抽样的方法抽取100人作进一步调查,则月收入在2 500, 3 000)(元)内应抽取 人.,25,-26-,考点1,考点2,考点3,-27-,考点1,考点2,考点3,1.在三种抽样方法中,简单随机抽样是最基本的抽样方法,是其他两种方法的基础;适用范围不同,要根据总体的具体情况选用不同的方法;它们的共同点都是等可能抽样,即抽
18、样过程中每个个体被抽取的可能性相等,体现了这三种抽样方法的客观性和公平性;若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每一个个体被抽到的可能性都是 .,-28-,考点1,考点2,考点3,2.三种抽样方法的比较,-29-,考点1,考点2,考点3,1.根据简单随机抽样求概率要注意是求一次抽取的概率,还是求整个抽样过程中的概率. 2.利用随机数表抽取样本要注意起始位置与抽取法则,还要注意把重复的剔除. 3.系统抽样中要注意根据所抽取样本个数进行分组,并确定好间隔,遇到不能整除的情况,一般是先剔除几个再抽取. 4.进行分层抽样时应注意几点 (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠; (2)分层抽样中,易忽视每层抽取的个体的比例是相同的,即,