1、1大题精做 4 统计概率:统计与统计案例2019开封一模大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学 习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中成功开设大学先修课程已有两年,共有 250 人参与学习先 修课程(1)这两年学校共培养出优等生 150 人,根据下图等高条形图,填写相应列联表,并根据列联表检验能否在犯错的概率不超过 0.1的前提下认为学习先修课程与优等生有关系?优等生 非优等生 总计学习大学先修课程 250没有学习大学先修课程总计 150(2)某班有 5 名优等生,其中有 2 名参加了大学生先修课程的学习,在这 5 名优
2、等生中任选 3 人进行测试,求这 3 人中至少有 1 名参加了大学先修课程学习的概率参考数据: 20PKk.50.10.50.250.10.502.72.763.841.46.357.89参考公式: 2nadbcKd,其中 nabcd【答案】 (1)列联表见解析,有关系;(2) 910【解析】 (1)列联表如下:优等生 非优等生 总计学习大学先修课程 50 200 250没有学习大学先修课程 100 900 10002总计 150 1100 1250由列联表可得 212509018.936.55k,因此在犯错误的概率不超过 .的前提下认为学习先修课程与优等生有关系(2)在这 5 名优等生中,记
3、参加了大学先修课程的学习的 2 名学生为 1A, 2,记没有参加大学先修课程学习的 3 名学生为 1B, 2, 3则所有的抽样情况如下: 12,A, ,A, 1,B, 12,, 13,B,123,AB, 21,B, 3,, 23,, 23,,共 10 种,其中没有学生参加大学先修课程学习的情况有 1 种,为 1,记事件为至少有 1 名学生参加了大学先修课程的学习,则 901PA12019驻马店期末某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取 40 件产品作为样本,并称出它们的重量(单位:克) ,重量值落在 495,10内的产品为合格品,否则 为不合格品注:表
4、1 是甲流水线样本的频数分布表,图 1 是乙流水线样本的频率分布直方图产品重量(克) 频数490,56,850,1450,1850,143(1)根据上面表 1 中的数据在图 2 中作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线上分别任取 1 件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面 2列联表,并回答 有多大的把握认为产品的包装质量与两条自动包装流水线的选择有关甲流水线 乙流水线 合计合格不合格合计参考公式: 22nadbckd,其中 nabcd20PK.150.10.50.250.10.5.010k2.72.763.841.46.3
5、57.89.28422019肇庆统测下图是某市 201年至 7年环境基础设施投资额 y (单位:亿元)的条形图(1)若从 201年到 5年的五年中,任意选取两年,则这两年的投资额的平均数不少于 140亿元的概率;(2)为了预测该市 9年的环境基础设施投资额,建立了 y与时间变量 t的两个线性回归模型根据年至 7年的数据(时间变量 t的值依次为 1,2, ,17)建立模型: 3.5yt;根据 21年至 201年的数据(时间变量的值 依次为 1,2, ,7)建立模型: 917.5t(i)分别利用这两个模型,求该地区 09年的环境基础设施投资额的预测值;(ii)你认为用哪个模型得到的预测值更可靠?并
6、说明理由532019衡水中学为提高玉米产量,某种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了 1块试验田的数据,得到下表: 试验田编号 1 2 3 4 5 6 7 8 9 11( 棵/) 3.54 5.1.7.1.9.58 .110 1.2(斤/棵) 020.3.2802024050.技术人员选择模型 21yabx作为 y与 x的回归方程类型,令 2iux, 1ivy相关统计量的值如下表:1niu1niv1niv21niu600 44 2721 45642由表中数据得到回归方程后进行残差分析,残差图如图所示:6(1)根据残差图发现一个可疑数据,请写出可疑数据的编号(给出判
7、断即可,不必说明理由) ;(2)剔除可疑数据后,由最小二乘法得到关于的线性回归方程 vu中的 0.3,求 y关于 x的回归方程;(3)利用(2)得出的结果,计算当单位面积播种数 x为何值时,单位面积的总产量 wxy的预报值最大?(计算结果精确到 0.1)附:对于一组数据 ,uv, 2,, , ,nuv其回归直线 vu的斜率和截距的最小二乘法估计分别为 12nii, , 305.4871 【答案】 (1)见解析;(2)从甲流水线上任取 1 件产品,该产品恰好是合格品的概率为 0.75,从乙流水线上任取 1 件产品 ,该产品恰好是合格品的概率为 9;(3)见解析【解析】 (1)甲流水线样本的频率分
8、布直方图如下:(2)由表 1 知甲流水线样本中合格品数为 81430,故甲流水线样本中合格品的频率为 30.75,由图 1 知乙流水线样本中合格品的频率为 .60.9.350.9,据此可估计从甲流水线上任取 1 件产品,该产品恰好是合格品的概率为 .75;从乙流水线上任取 1 件产品,该产品恰好是合格品的概率为 .(3)由 (2)知甲流水线样本中合格品数为 30,乙流水线样本中合格品数为 0.9436列联表如下:甲流水线 乙流水线 合计合格 30 36 66不合格 10 4 14合计 40 40 80 2280136.17.0640k,有 9%的把握认为产品的包装质量与两条自动包装流水线的选择
9、有关82 【答案】 (1) 70p;(2) (i)利用模型,预测值为 26.1亿元,利用模型,预测值为 256.亿元;(ii)见解析【解析】 (1)从条形图中可知,2011 年到 2015 年这五年的投资额分别为 122 亿、129 亿、148 亿、171 亿、184 亿,设 2011 年到 2015 年这五年的年份分别用 a, b, c, d, e表示,则从中任意选取两年 的所有基本事件有:,ab, ,c, ,ad, ,e, ,bc, ,d, ,e, ,c, ,e, ,,共 10 种,其中满足两年的投资额的平均数不少于 140 亿元的所有基本事件有:,d, ,e, ,b, ,e, ,c, ,
10、e, ,,共 7 种,从 2011 年到 2015 年的五年中,任意选取两年,则这两年的投资额的平均数不少于 140 亿元的概率为710p(2) (i)利用模型,该地区 2019 年的环境基础设施投资额的预测值为 30.415926.1y (亿元)利用模型,该地区 2019年的环境基础设施投资额的预测值为 917.526.y (亿元) (ii)利用模型得到的预测值更可靠 理由如下:画出 2001 年至 2017 年环境基础设施投资额 y (单位:亿元)的散点图(i)从散点图可以看出,2001 年至 2017 年的数据对应的点没有随机散布在直线 30.415yt上下这说明利用 2001 年至 2
11、017 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势2011 年相对 2010 年的环境基础设施投资额有明显增加,2011 年至 2017 年的数据对应的点位于一条直线的附近,这说明从 2011 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2011 年至 2017 年的数据建立的线性模型 917.5yt可以较好地描述 2011 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠 (ii)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,9由模型得到的预测值 26.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理说明利用模型得到的预测值更可靠3 【答案】 (1) 0;(2) 2.503yx;(3) 9.1【解析】 (1)可疑数据为第 1组(2)剔除数据 ,.后,在剩余的 9组数据中,106150iu,1041iv .34.3 2.v, 关于 u的线性回归方程为 0.5vu,则 y关于 x的回归方程为 21.503yx(3)根据(2)的结果并结合条件,单位面积的总产量的预报值 w,211301.8.5.5032.50 3xwx,当且仅当 .x时,等号成立,此时 2.59.303x,即当 9.13时,单位面积的总产量 w的预报值最大,最大值是 1810