1、1专题突破练 18 统计与统计案例1.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图所示 .(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价 .22.(2018 全国卷 2,理 18)下图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图 .为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型 .根据2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,17)建立模型 ;=-30.4+13.5t;根据 2010年至 2016 年的数据(时间变量
2、t 的值依次为 1,2,7)建立模型 :=99+17.5t.(1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由 .33.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧养殖法新养殖法(1)设两种养殖方法的箱产量相互独立,记 A 表示事件“旧养殖法的箱产量低于 50 kg,新养殖法的箱产量不低于 50 kg”,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关;箱产量
3、 6.635,故有 99%的把握认为箱产量与养殖方法有关 .(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于 50 kg 的直方图面积为(0.004+0.020+0.044)5=0.340.5,故新养殖法箱产量的中位数的估计值为 50+52.35(kg).4.解 (1)由题意可知=-6,=110,(xi-)2=42+22+02+(-2)2+(-4)2=40,(xi-)(yi-)=4(-60)+2(-25)+05+(-2)30+(-4)50=-550,所以 =-13.75,=110+13.75(-6)=27.5,所以 y 关于 x 的回归方程为 =-13.75x+27.5.当 x=-12
4、时, =-13.75x+27.5=-13.75(-12)+27.5=192.5193 .13所以可预测当平均气温为 -12 时,该店的外卖订单数为 193 份 .(2)由题意知, X 的取值可能为 0,1,2,3.P(X=0)=,P(X=1)=,P(X=2)=,P(X=3)=所以 X 的分布列为X 0 1 2 3PE(X)=0+1+2+35.解 (1)由题意,得 =119,=96,(xi-)(yi-)=100,(xi-)2=200,b=0.5,=36.5,故所求的回归直线方程为=0.5x+36.5.(2)随机变量 X 的所有可能的取值为 0,1,2.P(X=0)=,P(X=1)=,P(X=2)
5、=所以 X 的分布列为X 0 1 2P故 E(X)=0+1+2=6.解 (1) n=100,男生人数为 55 人 .(2)列联表为:选择“物理” 选择“地理” 总计14男生 45 10 55女生 25 20 45总计 70 30 100K2=8.128 96.635.所以有 99%的把握认为选择科目与性别有关 .(3)从 45 名女生中分层抽样抽 9 名女生,所以这 9 名女生中有 5 人选择物理,4 人选择地理,9名女生中再选择 4 名女生,则这 4 名女生中选择地理的人数 X 可为 0,1,2,3,4.设事件 X 发生的概率为 P(X),则P(X=0)=,P(X=1)=,P(X=2)=,P
6、(X=3)=,P(X=4)=,X 的分布列为:X 0 1 2 3 4PE(X)=0+1+2+3+47.解 (1)记每户居民的平均损失为元,则 =(1 0000.000 15+3 0000.000 20+5 0000.000 09+7 0000.000 03+9 0000.000 03)2 000=3 360.(2)由频率分布直方图,可得超过 4 000 元的居民共有(0 .000 09+0.000 03+0.000 03)2 00050=15(户),损失超过 8 000 元的居民共有 0.000 032 00050=3(户),因此 的可能值为 0,1,2,15P(= 0)=,P(= 1)=,P(= 2)=, 的分布列为: 0 1 2pE( )=0+1+2(3)解得 b=9,c=5,a+b=39,c+d=11,a+c=35,b+d=15,a+b+c+d=50,K2=4.0463.841,所以有 95%以上的把握认为捐款数额多于或少于 500 元和自身经济损失是否到 4 000 元有关 .