1、110.2 统计及统计案例考纲解读考点 内容解读 要求 高考示例 常考题型 预测热度1.抽样方法1.理解随机抽样的必要性和重要性2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法2017江苏,3;2015北京,4;2015湖南,22.统计图表了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点2017课标全国,3;2017北京,17;2016北京,173.样本的数字特征1.理解样本数据标准差的意义和作用,会计算数据标准差2.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释3.会用样本的频率分布估计总体分布,
2、会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想4.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题2017课标全国,2;2017山东,8;2016课标全国,19;2016四川,16;2016江苏,4;2015重庆,4;2015山东,6;2014课标,184.变量间的相关性1.会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程2017课标全,19;2016课标全,18;2015湖北,4;2015课标,195.独立性检验了解独立性检验的基本思想、方法及其简单应用,能通过
3、计算判断两个变量的相关程度2017课标全,19;2014安徽,17;2013福建,19选择题、填空题、解答题分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,2平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)10=0.6,所以样本中分数小于7
4、0的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)10=0.9,分数在区间40,50)内的人数为100-1000.9-5=5.所以总体中分数在区间40,50)内的人数估计为400 =20.5100(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)10100=60,所以样本中分数不小于70的男生人数为60 =30.12所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32.所以根据分层抽样
5、原理,总体中男生和女生人数的比例估计为32.五年高考3考点一 抽样方法1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )类别 人数老年教师 900中年教师 1 800青年教师 1 600合计 4 300A.90 B.100 C.180 D.300答案 C 2.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间139,151上的运动员人数是( )
6、A.3 B.4 C.5 D.6答案 B 3.(2015四川,3,5分)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法 B.系统抽样法 C.分层抽样法 D.随机数法答案 C 4.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p2,p3,则( )A.p1=p219时,y=3 800+500(x-19)=500x-5 700,所以y与x的函数解析式为y= (xN).
7、(4 分)3 800, 19,500-5 700,19(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(5分)(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为(3 80070+4 30020+11004 80010)=4 000(元).(7分)若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000元,10台的费用为4 5
8、00元,因此这100台机器在购买易损零件上所需费用的平均数为 (4 00090+4 50010)=4 1100050(元).(10分)比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)145.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水
9、量的中位数.解析 (1)由频率分布直方图可知:月均用水量在0,0.5)的频率为0.080.5=0.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5a+0.5a,解得a=0.30.(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 0000.12=36 000.(3)
10、设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.730.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.480.5,所以中位数在区间220,240)内.设中位数为m,则20(0.002+0.009 5+0.011)+0.012 5(m-220)=0.5,解得m=224.所以月平均用电量的中位数为224.(3)由题图知,月平均用电量为220,240)的用户数为(240-220)0.012 5100=25,同理可得,月平均用电量为240,260),260,280),280,300的用户数分别为15,10,5.故用分层抽样的方式抽取11
11、户居民,月平均用电量在220,240)的用户中应抽取11 =5(户).2525+15+10+513.(2014课标,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门 乙部门4979766533211098877766555554443332100665520063222034567891059044812245667778901123468800113449123345011456000(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于
12、90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解析 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为 =67,所以该市的市民对乙部门评分的中位数的估计值是67.66+682(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为 =0.1, =0.16,故该市的市民对甲、550 850乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,
13、市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致18,对乙部门的评价较低、评价差异较大.14.(2014广东,17,13分)某车间20名工人年龄数据如下表:年龄(岁) 工人数(人)19 128 329 330 531 432 340 1合计 20(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.解析 (1)由题表中的数据易知,这20名工人年龄的众数是30,极差为40-19=21.(2)这2
14、0名工人年龄的茎叶图如下:123498 8 8 9 9 90 0 0 0 0 1 1 1 1 2 2 20(3)这20名工人年龄的平均数 = (191+283+293+305+314+323+401)=30,120故方差s 2= 1(19-30)2+3(28-30)2+3(29-30)2+5(30-30)2+4(31-30)2+3(32-30)2+1(40-30)2=120(121+12+3+0+4+12+100)=12.6.12015.(2014湖南,17,12分)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a, ),(a,
15、b),( ,b),( , ),(a,b),(a,b),(a, ),( ,b),(a, ),( , ),(a,b),(a, ),( ,b),(a,b), 其中a, 分别表示甲组研发成功和失败;b, 分别表示乙组研发成功和失败. (1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和19方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.解析 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数为 = = ;甲101523方差 = = .2甲 11
16、5(1-23)210+(0-23)25 29乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数为 = = ;乙91535方差 = = .2乙 115(1-35)29+(0-35)26 625因为 , 0,b0,b0C.a0答案 A 3.(2017课标全国,19,12分)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:21抽取次序1 2 3 4 5 6 7 8零件尺寸9.9510.129.96 9.9610.019.92 9.9810.
17、04抽取次序9 10 11 12 13 14 15 16零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得 = xi=9.97,s=11616=1 11616=1(-)2= 0.212,116(16=12-16 2) 16=1(-8.5)218.439, (xi- )(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2,16.16=1 (1)求(x i,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0,故2007年至2013年该地区农村居民家庭人均纯收入逐年
18、增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得 =0.59+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.8.(2013重庆,17,13分)从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i(单26位:千元)的数据资料,算得 xi=80, yi=20, xiyi=184, =720.10=110=110=110=12(1)求家庭的月储蓄y对月收入x的线性回归方程y=bx+a;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y
19、=bx+a中,=1- =12-2 ,=-,其中 , 为样本平均值.线性回归方程也可写为 = x+ . 解析 (1)由题意知n=10, = xi= =8, = yi= =2,1=1 8010 1=1 2010又l xx= -n =720-1082=80,lxy= xiyi-n =184-1082=24,=12 2=1 由此得b= = =0.3,a= -b =2-0.38=-0.4,2480 故所求回归方程为y=0.3x-0.4.(2)由于变量y的值随x的值的增加而增加(b=0.30),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.37-0.4=1.7(千元).考
20、点五 独立性检验1.(2014江西,7,5分)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1成绩性别 不及格及格总计男 6 14 20女 10 22 32总计 16 36 5227视力性别 好 差总计男 4 16 20女 12 20 32总计 16 36 52智商性别 偏高正常总计男 8 12 20女 8 24 32总计 16 36 52表4阅读量性别 丰富不丰富总计男 14 6 20女 2 30 32总计 16 36 52A.成绩 B.视力 C.智商 D.阅读量答案 D 2.(20
21、17课标全国,19,12分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:28(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;箱产量6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 29kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量
22、分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.(2014安徽,17,12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有6
23、0位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K 2=(-)2(+)(+)(+)(+)P(K2k 0) 0.10 0.05 0.010 0.005k0 2.706 3.841 6.635 7.879解析 (1)300 =90,所以应收集90位女生的样本数据.4 50015 000(2)由频率分布直方图得1-2(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有3000.75=225人的每周平均体
24、育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表男生 女生 总计每周平均体育运动时间不超过4小时45 30 7530每周平均体育运动时间超过4小时165 60 225总计 210 90 300结合列联表可算得K 2= = 4.7623.841.300(4560-16530)27522521090 10021所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.教师用书专用(45)4.(2014辽宁,18,12分)某大学餐饮中心为了
25、解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生 60 20 80北方学生 10 10 20合计 70 30 100(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.附: 2= ,(1122-1221)21+2+1+2P( 2k) 0.100 0.050 0.010k 2.706 3.841 6.635解析 (1)将22列联表中的数据代入公式计算,得 2= = = 4
26、.762.(1122-1221)21+2+1+2 100(6010-2010)270308020 10021由于4.7623.841,所以有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间=(a 1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),(a2,b2,b3),(a2,b1,b3),(b1,b2,b3).其中a i表示喜欢甜品的学生,i=1,2.b j表示不喜欢甜品的学生,j=1,2,3.由10个基本事件组成,且这些基本事件的出现是等可能的.用A表示“3人中至多有1人喜欢甜品”这一事件,则A=(a 1,b1,b2),(a1,b2,b3),(a1,b1,b3),(a2,b1,b2),
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1