1、第3讲 统计、统计案例,要点知识整合,1统计 (1)抽样方法:简单随机抽样、系统抽样、分层抽样 (2)利用样本频率分布估计总体分布 频率分布表和频率分布直方图 总体密度曲线 茎叶图,热点突破探究,(2010年高考湖北卷)将参加夏令营的600名学生编号为:001,002,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第营区,从301到495在第营区,从496到600在第营区,三个营区被抽中的人数依次为( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9,【解析】总体数为600,样本的容
2、量是50, 60050=12. 因此,每隔12个号能抽到一名,由于随机抽得第一个号码为003,按照系统抽样的操作步骤在第营区应抽到25人,第营区应抽到17人,第营区应抽到8人,故选B.,【答案】B,【题后点评】(1)解决有关随机抽样问题首先要深刻理解各种抽样方法的特点和适用范围,如分层抽样,适用于数目较多且各部分之间具有明显差异的总体. (2)系统抽样中编号的确定和分层抽样中各层人数的确定是高考重点考查的内容.,1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号).若第
3、5组抽出的号码为22,则第8组抽出的号码应是_.若用分层抽样方法,则40岁以下年龄段应抽取_人.,答案:37 20,(2010年高考北京卷)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=_.若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_.,【答案】 0.030 3,【题后点评】解决该类问题时,应正确理解图表中各量的意义,通过图表掌握信息是解决该类问题的关键.频率分布指的是样本数据在各个范围内所占的比例的大小,一般
4、用频率分布直方图反映样本的频率分布.,2.根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精度在2080 mg/100 mL(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据法制晚报报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28800人,,如图是对这28800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为( ) A.2160
5、 B.2880 C.4320 D.8640,解析:选C.由题可知,属于醉酒驾车的酒精含量为80 mg/100 mL及以上,其占有的频率为(0.01+0.005)10=0.15,所以查处的醉酒驾车的人数为288000.15=4320人,故选C.,(2010年高考天津卷)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如图所示,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天中甲、乙两人日加工零件的平均数分别为_和_.,【答案】24 23,【题后点评】(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况. (2)在作茎叶图或读茎叶图时,首
6、先要弄清楚“茎”和“叶”分别代表什么.,3.某良种培育基地正在培育一种小麦新品种A,将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下: 品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454 品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430,(
7、1)作出品种A、B亩产数据的茎叶图; (2)用茎叶图处理现有的数据,有什么优点? (3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论,解:(1)茎叶图如图所示:,(2)由于每个品种的数据都只有25个,样本容量不大,画茎叶图方便,茎叶图不仅清晰地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据. (3)通过观察茎叶图可以看出: 品种A的亩产平均数比品种B大; 品种B的亩产量比品种A的亩产量更集中.,(2009年高考上海卷)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过
8、7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ),A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3,【答案】 D,【题后点评】求解选择题时要善于从题目的特点出发,灵活选用简洁、恰当的方法进行求解,特值排除法是解决选择题的一种重要方法,例如本题通过列举具体的数值;一一进行检验,排除了错误选项,获得了正确答案.,4.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表,则以上两组数据的方差中较小的一个为s2_.,(本题满分
9、12分)(2010年高考课标全国卷)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.,附:,P(K2k),0.0500.0100.001k,3.8416.63510.828,k,【思维升华】(1)独立性检验的关键是准确计算K2,而计算K2时,要正确绘制22列联表 (2)两个变量的独立性检验,
10、在统计学中有着广泛的应用,学习时一定要结合实际问题,从现实中寻找例子,增强学习数学的动力,5.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动. (1)根据以上数据建立一个22列联表; (2)判断性别与休闲方式是否有关系.,解:(1)22列联表如下,转化与化归,(2009年高考福建卷)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员
11、在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是_.,8 9,9 9 2 3 x 2 1 4,作品A,【答案】 1,【题后点评】本题体现一种数表与数字的转化,研究原问题中数量关系(解析式)与空间形式(图形)关系,通过互相变换获得转化途径,本节中的频率分布表和直方图也是一种转化过程.,高考动态聚焦,从近几年高考情况来看,本讲高考命题具有以下特点: 1.在选择题、填空题中主要考查抽样方法、各种统计图表、样本数字特征、茎叶图等内容,每份试卷中有12题,多为容易题和中档题. 2.对于独立性检验和回归分析,一般较少考查,即使考查,难度也不会太大,多数情况下是考查两种统计
12、分析方法的简单知识,以计算和判断为主.,解析:选A.由负相关定义得斜率小于0,排除B、D,又因x,y均大于0,排除C.故选A.,3.(2010年高考福建卷)将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为234641,且前三组数据的频数之和等于27,则n等于_.,解析:由第一组至第六组频率之比为234641,且六组频率之和为1,可得各组频率依次为0.1,0.15,0.2,0.3,0.2,0.05,前三组数据的频数之和n(0.10.150.2)27,n60.答案:60,4(2010年高考广东卷)某市居民20052009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:,根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系.,解析:居民家庭的年平均收入按从小到大排列依次为:11.5、12.1、13、13.3、15,由中位数定义知年平均收入的中位数是13.画出散点图,由图可知家庭年平均收入与年平均支出有正的线性相关关系. 答案:13 正,