2019届高考数学二轮复习第一篇专题七概率与统计第2讲统计案例教案理.doc

上传人:刘芸 文档编号:919090 上传时间:2019-03-03 格式:DOC 页数:19 大小:2.35MB
下载 相关 举报
2019届高考数学二轮复习第一篇专题七概率与统计第2讲统计案例教案理.doc_第1页
第1页 / 共19页
2019届高考数学二轮复习第一篇专题七概率与统计第2讲统计案例教案理.doc_第2页
第2页 / 共19页
2019届高考数学二轮复习第一篇专题七概率与统计第2讲统计案例教案理.doc_第3页
第3页 / 共19页
2019届高考数学二轮复习第一篇专题七概率与统计第2讲统计案例教案理.doc_第4页
第4页 / 共19页
2019届高考数学二轮复习第一篇专题七概率与统计第2讲统计案例教案理.doc_第5页
第5页 / 共19页
点击查看更多>>
资源描述

1、1第 2 讲 统计案例1.(2018全国卷,理 18)如图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图.为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型.根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,17)建立模型: =-30.4+13.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型:=99+17.5t.(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由

2、.解:(1)利用模型,可得该地区 2018 年的环境基础设施投资额的预测值为 =-30.4+13.519=226.1(亿元).利用模型,可得该地区 2018 年的环境基础设施投资额的预测值为=99+17.59=256.5(亿元).(2)利用模型得到的预测值更可靠.理由如下:从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=-30.4+13.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于

3、一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年的数据建立的线性模型=99+17.5t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠.从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.2.(2016全国卷,理 18)如图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图.2(1)由折线图看出,可用线性回归模型

4、拟合 y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2016 年我国生活垃圾无害化处理量.参考数据: yi=9.32, tiyi=40.17,7=1 7=1=0.55, 2.646.7=1()2 7参考公式:相关系数 r= ,=1()()=1()2=1()2回归方程 = + t 中斜率和截距的最小二乘估计公式分别为 = , = - .=1()()=1()2 解:(1)由已知条件知,=4, (ti- )2=28, =0.55,7=1 7=1()2(ti- )(yi- )= tiyi- yi=40.17-49.32=2.89,7=1

5、7=1r 0.99.2.890.5522.646因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当大,从而可以用线性回归模型拟合 y 与 t 的关系.(2)由 = 1.331 及(1)得= = 0.103.2.8928= - 1.331-0.10340.92.所以,y 关于 t 的回归方程为 =0.92+0.10t.将 2016 年对应的 t=9 代入回归方程得3=0.92+0.109=1.82.所以预测 2016 年我国生活垃圾无害化处理量约为 1.82 亿吨.3.(2017全国卷,理 19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽

6、取 16 个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布 N(, 2).(1)假设生产状态正常,记 X 表示一天内抽取的 16 个零件中其尺寸在(-3,+3)之外的零件数,求 P(X1)及 X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(-3,+3)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.试说明上述监控生产过程方法的合理性;下面是检验员在一天内抽取的 16 个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9

7、.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得 = xi=9.97,s= = 0.212,其中 xi为抽取的11616=1 11616=1()2 116(16=12162)第 i 个零件的尺寸,i=1,2,16.用样本平均数 作为 的估计值 ,用样本标准差 s 作为 的估计值 ,利用估计值判断是 否需对当天的生产过程进行检查?剔除( -3 , +3 )之外的数据,用剩下的数据估计 和 (精确到 0.01).附:若随机变量 Z 服从正态分布 N(, 2),则 P(-30.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较高,某光照控制仪

8、商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量 X 限制,并有如下关系:周光照量 X/小时 3070光照控制仪运行台数 3 2 1对商家来说,若某台光照控制仪运行,则该台光照控制仪产生的周利润为 3 000 元;若某台光照控制仪未运行,则该台光照控制仪周亏损 1 000 元.若商家安装了 3 台光照控制仪,求商家在过去 50 周的周总利润的平均值.相关系数公式:r= ,参考数据: 0.55, 0.95.0.3 0.9解:(1)由已知数据可得 = =5, = =4.2+4+5+6+85 3+4+4+4+556因为 (xi- )(yi- )=(-3)(-1)+0+0+0+31

9、=6,5=1= =2 ,5=1()2 (3)2+(1)2+02+12+32 5= = ,5=1()2所以相关系数 r= = = 0.95.5=1()()5=1()2 5=1()2 62520.9因为|r|0.75,所以可用线性回归模型拟合 y 与 x 的关系.(2)由条件可得在过去 50 周里,当 X70 时,共有 10 周,此时只有 1 台光照控制仪运行,每周的周总利润为 13 000-21 000=1 000(元).当 50X70 时,共有 35 周,此时有 2 台光照控制仪运行,每周的周总利润为 23 000-11 000=5 000(元).当 300 时,表明两个变量正相关;当 r ,

10、2122所以种植彩椒比较好.独立性检验【例 3】 (2018江西九校联考)进入高三,同学们的学习越来越紧张,学生休息和锻炼的时间也减少了.学校为了提高学生的学习效率,鼓励学生加强体育锻炼.某中学高三(3)班有学生 50 人.现调查该班学生每周平均体育锻炼时间的情况,得到如下频率分布直方图.其中数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.(1)求学生周平均体育锻炼时间的中位数(保留 3 位有效数字);(2)从每周平均体育锻炼时间在0,4的学生中,随机抽取 2 人进行调查,求此 2 人的每周平均体育锻炼时间都超过 2 小时的概率;(3)现全班学生中有 40%是

11、女生,其中 3 个女生的每周平均体育锻炼时间不超过 4 小时.若每周平均体育锻炼时间超过 4 小时称为经常锻炼,问:有没有 90%的把握说明,是否经常锻炼与性别有关?附:K 2=P(K2k 0) 0.100 0.050 0.010 0.0019k0 2.706 3.841 6.635 10.828解:(1)设中位数为 a,因为前三组的频率和为(0.02+0.03+0.11)2=0.323.841.100(65151010)275257525所以有 95%的把握认为“该校学生的每周使用手机上网时间与近视程度有关”.可线性化的非线性回归分析11【例 4】 某品牌汽车旗下的 4S 店以“四位一体”(

12、整车销售、零配件销售、售后服务、信息反馈)为核心的模式经营,4S 店为了了解该品牌的 A,B,C 三种车型的质量问题,从出售时间 5 年以上的该三种车型的汽车中各随机抽取 100 辆进行跟踪调查,发现各车型在一年内需要维修的车辆如表(1)所示.(1)该 4S 店从所有的跟踪服务的 A,B,C 三种车型的汽车中用分层抽样的方法抽取 10 个样本做进一步调查,求分别抽取的 A,B,C 三种车型的汽车辆数;(2)该品牌汽车研发中心针对 A,B,C 三种车型在维修中反映的主要问题研发了一种辅助产品,4S 店需要对研发中心研发的辅助产品进行合理定价,该产品在试营时的数据如散点图和表(2)所示.根据散点图

13、判断,y 与 x 和 z 与 x 哪一对具有的线性相关性较强(给出判断即可,不必说明理由)?并根据你的判断结果及数据,求 y 关于 x 的回归方程(方程中的系数均保留两位小数).表(1)车型 A B C维修频数 20 40 40表(2)定价 x/(百元/件) 10 20 30 40 50 60年销量 y/件 1 150 643 424 262 165 86z=2ln y 14.1 12.9 12.1 11.1 10.2 8.9参考数据: (xi- )(yi- )=-34 580, (xi- )(zi- )=-175.5, (yi- )2=776 6=1 6=1 6=1840, (yi- )(z

14、i- )=3 465.2.6=1参考公式:对于一组数据(x 1,y1),(x2,y2),(x3,y3),(xn,yn),其回归方程 = x+ 的斜率和截距的最小二乘估计分别为= = , = - .=1()()=1()2 解:(1)抽取的 A 车型的汽车辆数为 10=2,抽取的 B 车型的汽车辆数为 10=4,12抽取的 C 车型的汽车辆数为 10=4,故抽取的 A,B,C 三种车型的汽车辆数分别为 2,4,4.(2)由散点图可知,z 与 x 具有的线性相关性较强.由题设知 = =35,10+20+30+40+50+606= =11.55,= =- -0.10,175.51 750所以 = -

15、15.05,所以 = x+ =15.05-0.10x.又 z=2ln y,所以 y 关于 x 的回归方程为 = .解非线性回归分析问题,首先观察散点图,挑出与散点图拟合得最好的函数,然后采用适当的变量置换把问题转化为线性回归分析问题.热点训练 3:(2018 广州综合测试)某地 110 岁男童年龄 xi(单位:岁)与身高的中位数 yi(单位:cm)(i=1,2,10)如表:x/岁 1 2 3 4 5y/cm 76.5 88.5 96.8 104.1 111.3x/岁 6 7 8 9 10y/cm 117.7 124.0 130.0 135.4 140.2对上表的数据作初步处理,得到下面的散点图

16、及一些统计量的值.13 (xi- )210=1 (yi- )210=1 (xi- )(yi- )10=1 5.5 112.45 82.50 3 947.71 566.85(1)求 y 关于 x 的线性回归方程(回归方程系数精确到 0.01);(2)某同学认为,y=px 2+qx+r 更适宜作为 y 关于 x 的回归方程模型,他求得的回归方程是 =-0.30x2+10.17x+68.07.经调查,该地 11 岁男童身高的中位数为 145.3 cm.与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?附:回归方程 = + x 中的斜率和截距的最小二乘估计分别为 = , = -.解:(1) =

17、 = 6.87,= - =112.45-6.875.574.67,所以 y 关于 x 的线性回归方程为 =6.87x+74.67,(2)若回归方程为 =6.87x+74.67,则当 x=11 时, =150.24.若回归方程为 =-0.30x2+10.17x+68.07,则当 x=11 时, =143.64.|143.64-145.3|=1.662),那么在消费者对该产品的心理价的范围内,销售单价定为多少时,网店才能获得最大利润?(注:利润=销售收入-成本)参考数据: xiyi=392, =502.5.5=1参考公式:回归方程 = x+ ,其中 = ,= - .解:(1)因为 = (9+9.5

18、+10+10.5+11)=10,15= (11+10+8+6+5)=8,15所以 = =-3.2,则 =8-(-3.2)10=40.所以 y 关于 x 的回归方程为 =-3.2x+40.(2)由已知得利润 L=(x-a)(-3.2x+40)=-3.2x2+(40+3.2a)x-40a,x7,9,该二次函数图象的对称轴方程为 x= = .40+3.223.2因为 a2,所以 .当 9,即 a 时,函数在区间7,9上单调递增,所以当 x=9 时,L 取得最大值;当 时,该产品的销售单价为 9 元时,网店能获得最大利润;当 26.635,所以有 99%的把握认为该企业生产的这种产品的质量指标值与设备

19、改造有关.(2)根据题中图和表可知,设备改造后产品的合格率约为 = ,设备改造前产品的合格率1922002425约为 = ,即设备改造后产品的合格率更高,因此,设备改造后性能更好.1722004350(3)用频率估计概率,1 000 件产品中大约有 960 件合格品,40 件不合格品,则 180960-10040=168 800,所以该企业大约获利 168 800 元.【例 3】 (2018新余二模)“一带一路”是“丝绸之路经济带”和“21 世纪海上丝绸之路”的简称,某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分 100 分(90 分及以

20、上为认知程度高),现从参赛者中抽取了x 人,按年龄分成 5 组(第一组:20,25),第二组:25,30),第三组:30,35),第四组:35,40),第五组:40,45),得到如图所示的频率分布直方图,已知第一组有 6 人.(1)求 x;(2)求抽取的 x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取 6人,42 人,36 人,24 人,12 人,分别记 15 组,从这 5 个按年龄分的组和 5 个按职业分的组中每组各选派 1 人参加知识竞赛代表相应的成绩,年龄组中 15 组的成绩分别为93,96,97,94,90,职业组

21、中 15 组的成绩分别为 93,98,94,95,90.分别求 5 个年龄组和 5 个职业组成绩的平均数和方差;以上述数据为依据,评价 5 个年龄组和 5 个职业组对“一带一路”的认知程度,并谈谈你的感想.解:(1)根据频率分布直方图得第一组频率为0.015=0.05,所以 =0.05,所以 x=120.(2)设中位数为 a,则0.015+0.075+(a-30)0.06=0.5,解得 a= 32,17所以中位数为 32.(3)5 个年龄组的平均数为= (93+96+97+94+90)=94,15方差为 = (-1)2+22+32+02+(-4)2=6,21155 个职业组的平均数为= (93

22、+98+94+95+90)=94,15方差为 = (-1)2+42+02+12+(-4)2=6.8.2215评价:从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更好.感想:“一带一路”是指“丝绸之路经济带”和“21 世纪海上丝绸之路”的简称.它将充分依靠中国与有关国家既有的双多边机制,借助既有的、行之有效的区域合作平台,“一带一路”战略目标是要建立一个政治互信、经济融合、文化包容的利益共同体、命运共同体和责任共同体,是包括欧亚大陆在内的世界各国,构建一个互惠互利的利益、命运和责任共同体.(对应学生用书第 61 页)【典例】 (2018全国卷,理 18)(12 分)某工厂为提高生产效

23、率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图,(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表:超过 m 不超过 m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?附:K 2= ,P(K

24、2k) 0.050 0.010 0.001k 3.841 6.635 10.82818.评分细则:解:(1)第二种生产方式的效率更高.1 分理由如下(写出一种,合理即可):由茎叶图可知,用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间至少 80分钟,用第二种生产方式的工人中,有 75%的工人完成生产任务所需时间至多 79 分钟.因此第二种生产方式的效率更高.由茎叶图可知,用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为 73.5 分钟.因此第二种生产方式的效率更高.由茎叶图可知,用第一种生产方式的工人完成生

25、产任务平均所需时间高于 80 分钟;用第二种生产方式的工人完成生产任务平均所需时间低于 80 分钟,因此第二种生产方式的效率更高.由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多,关于茎 8 大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多,关于茎 7 大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.4 分(由上给出了 4 种理由,考生答出其中任意一种或其他合理理由均可得分.)(2)由

26、茎叶图知 m= =80.6 分79+81222 列联表如下:超过 m 不超过 m第一种生产方式 15 5第二种生产方式 5 158 分(3)由于 K2= =106.635,11 分所以有 99%的把握认为两种生产方式的效率有差异.12 分注:第(1)问得分说明:判断出效率更高的生产方式,得 1 分;根据茎叶图中的数据分布,分析出效率更高,生产方式的任意一种合理理由均得 3 分.第(2)问得分说明:由茎叶图中的数据及中位数定义求出中位数,得 2 分;列出 22 列联表,得 2 分,第(3)问得分说明:用独立性检验公式求出 K2的值,并与 6.635 比较,得 3 分;得出结论,得 1 分.【答题启示】 19(1)统计中涉及的图形较多,常见的有条形图、扇形图、折线图、茎叶图、频率分布直方图等,要熟练掌握这些图的特点,并能根据图直观进行一些判断或计算.本题常不能根据茎叶图的数据分布特点进行判断、计算而失分.(2)常因概念(中位数)不清而失分.(3)常因计算马虎而失分.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 中学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1