1、1高考大题专项练六 高考中的概率、统计与统计案例1.某工厂 36 名工人的年龄数据如下表:工人编号 年龄 工人编号 年龄 工人编号 年龄 工人编号 年龄1 40 10 36 19 27 28 342 44 11 31 20 43 29 393 40 12 38 21 41 30 434 41 13 39 22 37 31 385 33 14 43 23 34 32 426 40 15 45 24 42 33 537 45 16 39 25 37 34 378 42 17 38 26 44 35 499 43 18 36 27 42 36 39(1)用系统抽样的方法从 36 名工人中抽取容量为
2、9 的样本,且在第一分段里用随机抽样的方法抽到的年龄数据为 44,列出样本的年龄数据;(2)计算(1)中样本的平均值 和方差 s2;x(3)求这 36 名工人中年龄在( -s, +s)内的人数所占的百分比 .x x解 (1)把工厂 36 名工人的年龄数据分为 9 组,每组 4 人 .在第一分段里抽到的年龄数据 44 对应的编号为 2,故抽取的样本编号依次为 2,6,10,14,18,22,26,30,34,对应样本的年龄数据依次为 44,40,36,43,36,37,44,43,37.(2)由(1)得,=40,x=44+40+36+43+36+37+44+43+379s2= (44-40)2+
3、(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-1940)2= .1009(3)由(2)得 =40,s= ,则 -s=36 +s=43 .x103 x 23,x 132由表可知,这 36 名工人中年龄在( -s, +s)内共有 23 人,所占的百分比为 100%63 .89%.x x23362.(2018 全国 ,文 18)下图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图 .为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型
4、.根据2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,17)建立模型 : =-30.4+13.5t;根据y2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型 : =99+17.5t.y(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由 .解 (1)利用模型 ,该地区 2018 年的环境基础设施投资额的预测值为 =-30.4+13.519=226.1(亿y元) .利用模型 ,该地区 2018 年的环境基础设施投资额的预测值为 =99+17.59=256.5(亿元)
5、 .y(2)利用模型 得到的预测值更可靠 .理由如下:(i)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+13.5t上下,这说明利用 2000 年至 2016 年的数据建立的线性模型 不能很好地描述环境基础设施投资额的变化趋势 .2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型 =99+17.5t 可以较好地描述 2010 年以后的环境基础y设施投
6、资额的变化趋势,因此利用模型 得到的预测值更可靠 .3(ii)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型 得到的预测值226.1 亿元的增幅明显偏低,而利用模型 得到的预测值的增幅比较合理,说明利用模型 得到的预测值更可靠 .(以上给出了 2 种理由,写出其中任意一种或其他合理理由均可)3.某公司计划购买 1 台机器,该种机器使用三年后即被淘汰 .机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元 .在机器使用期间,如果备件不足再购买,则每个 500 元 .现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种
7、机器在三年使用期内更换的易损零件数,得上面柱状图 .记 x 表示 1 台机器在三年使用期内需更换的易损零件数, y 表示 1 台机器在购买易损零件上所需的费用(单位:元), n 表示购机的同时购买的易损零件数 .(1)若 n=19,求 y 与 x 的函数解析式;(2)若要求“需更换的易损零件数不大于 n”的频率不小于 0.5,求 n 的最小值;(3)假设这 100 台机器在购机的同时每台都购买 19 个易损零件,或每台都购买 20 个易损零件,分别计算这 100 台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买 1 台机器的同时应购买 19 个还是 20 个易损零件?解 (1)当
8、 x19 时, y=3800;当 x19 时, y=3800+500(x-19)=500x-5700.所以 y 与 x 的函数解析式为 y= (xN) .3800,x 19,500x-5700,x19(2)由柱状图知,需更换的零件数不大于 18 的频率为 0.46,不大于 19 的频率为 0.7,故 n 的最小值为 19.4(3)若每台机器在购机同时都购买 19 个易损零件,则这 100 台机器中有 70 台在购买易损零件上的费用为 3800,20 台的费用为 4300,10 台的费用为 4800,因此这 100 台机器在购买易损零件上所需费用的平均数为(380070+430020+48001
9、0)=4000.1100若每台机器在购机同时都购买 20 个易损零件,则这 100 台机器中有 90 台在购买易损零件上的费用为 4000,10 台的费用为 4500,因此这 100 台机器在购买易损零件上所需费用的平均数为(400090+450010)=4050.1100比较两个平均数可知,购买 1 台机器的同时应购买 19 个易损零件 .4.某商场经销某一种电器商品,在一个销售季度内,每售出一件该电器商品获利 200 元,未售出的商品,每件亏损 100 元 .根据以往资料,得到销售季度内市场需求量的频率分布直方图如图所示,现在经销商为下一个销售季度购进了 125 件该种电器,以 n(单位:
10、件,95 n155)表示下一个销售季度内市场需求量, Y(单位:元)表示下一个销售季度内销售该电器的利润 .(1)将 Y 表示为 n 的函数;(2)求频率分布直方图中 a 的值;(3)根据直方图估计利润 Y 不少于 22 000 元的概率 .解 (1)依题意知下一个销售季度内经销该电器所获利润 Y 与需求量 n 之间的关系为Y=200n-100(125-n),95 n 125,125200,126 n 155. (2)由 0.010102+a10+0.01810+0.02210+0.02410=1,求得 a=0.016.(3)而 300n-10012522000,知 n115(件) .由频率分
11、布直方图可知 P(n115) =1-0.1-0.16=0.74,故估计利润 Y 不少于 22000 元的概率为 0.74.55.学业水平考试后,某校对高二学生的数学、英语成绩进行了统计,结果如下(人数):数学项 目优秀合格不合格优秀 70 30 20合格 60 240b英语不合格a 20 10已知英语、数学的优秀率分别为 24%,30%(注:合格人数中不包含优秀人数) .(1)求 a,b 的值;(2)现按照英语成绩的等级,采用分层抽样的方法,从数学不合格的学生中选取 6 人,若再从这 6 人中任选 2 人,求这两名学生的英语成绩恰为一人优秀一人合格的概率 .解 (1)设该校高二学生共有 x 人
12、,已知英语优秀的有 70+30+20=120(人),依题意得 =0.24,解得 x=500.120x故 =0.3,解得 a=20,70+60+a500由学生总数为 500 人,得 b=30.(2)由题意得,在抽取的数学不合格的 6 人中,英语优秀的应抽取 2 人,分别记为 a1,a2;英语合格的应抽取 3 人,分别记为 b1,b2,b3;英语不合格的应抽取 1 人,记为 c,从中任取 2 人的所有结果有 15 种,这两名学生的英语成绩恰为一人优秀一人合格的基本事件有a1,b1,a1,b2,a1,b3,a2,b1,a2,b2,a2,b3,共 6 种,6因此这两名学生的英语成绩恰为一人优秀一人合格
13、的概率为 .615=256.(2018 全国 ,文 18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式 .为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第二组工人用第二种生产方式 .根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m的工人数填入下面的列联表:超过m不超过 m第一种生产方式第二种生产方式(3)根据(2)中的列联表
14、,能否有 99%的把握认为两种生产方式的效率有差异?附: K2= . n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2k)0.0500.0100.001k3.8416.63510.8287解 (1)第二种生产方式的效率更高 .理由如下: 由茎叶图可知:用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间至少 80 分钟,用第二种生产方式的工人中,有 75%的工人完成生产任务所需时间至多 79 分钟 .因此第二种生产方式的效率更高 . 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,用第二种生产方式的工人完成生产任务所需时间的中位数
15、为 73.5 分钟 .因此第二种生产方式的效率更高 . 由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于 80 分钟;用第二种生产方式的工人完成生产任务平均所需时间低于 80 分钟 .因此第二种生产方式的效率更高 . 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多,关于茎 8 大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多,关于茎 7 大致呈对称分布 .又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少 .因此第二
16、种生产方式的效率更高 .(以上给出了 4 种理由,写出其中任意一种或其他合理理由均可)(2)由茎叶图知 m= =80.79+812列联表如下:超过m不超过 m第一种生产方式 15 5第二种生产方式 5 15(3)由于 K2= =106.635,所以有 99%的把握认为两种生产方式的效率有差异 .40(1515-55)22020202087.(2018 河北石家庄一模)小明在石家庄市某物流派送公司找到了一份派送员的工作,该公司给出了两种日薪薪酬方案 .甲方案:底薪 100 元,每派送一单奖励 1 元;乙方案:底薪 140 元,每日前 55 单没有奖励,超过 55 单的部分每单奖励 12 元 .(
17、1)请分别求出甲、乙两种薪酬方案中日薪 y(单位:元)与送货单数 n 的函数关系式;(2)根据该公司所有派送员 100 天的派送记录,发现派送员的日平均派送单数与天数满足以下表格:日均派送单数5254565860频数 /天2030202010回答下列问题: 根据以上数据,设每名派送员的日工资为 X(单位:元),试分别求出这 100 天中甲、乙两种方案的日薪 X 的平均数及方差; 结合 中的数据,根据统计学的思想,帮助小明分析,他选择哪种薪酬方案比较合适,并说明你的理由 .(参考数据:0.62=0.36,1.42=1.96,2.62=6.76,3.42=11.56,3.62=12.96,4.62
18、=21.16,15.62=243.36,20.42=416.16,44.42=1 971.36)解 (1)甲方案中派送员日薪 y(单位:元)与送货单数 n 的函数关系式为 y=100+n,nN;乙方案中派送员日薪 y(单位:元)与送货单数 n 的函数关系式为 y=140,n 55,n N,12n-520,n55,n N.(2) 由表格可知,甲方案中,日薪为 152 元的有 20 天,日薪为 154 元的有 30 天,日薪为 156 元的有 20 天,日薪为 158 元的有 20 天,日薪为 160 元的有 10 天,则(15220+15430+15620+15820+16010)x甲 =110
19、0=155.4(元),9(20(152-155.4)2+30(154-155.4)2+20(156-155.4)2+20(158-s2甲 = 1100155.4)2+10(160-155.4)2=6.44.乙方案中,日薪为 140 元的有 50 天,日薪为 152 元的有 20 天,日薪为 176 元的有 20 天,日薪为200 元的有 10 天,则(14050+15220+17620+20010)=155.6,x乙 =110050(140-155.6)2+20(152-155.6)2+20(176-155.6)2+10(200-s2乙 = 1100155.6)2=404.64. 答案一:由以上的计算可知,虽然 ,但两者相差不大,且 远小于 ,即甲方案日薪x甲 x乙 s2甲 s2乙收入波动相对较小,所以小明应选择甲方案 .答案二:由以上的计算结果可以看出, ,即甲方案日薪的平均数小于乙方案日薪的平均x甲 x乙数,所以小明应选择乙方案 .