1、1第 2 讲 统计案例(限时:45 分钟)【选题明细表】知识点、方法 题号线性回归方程 1相关系数 3独立性检验 2可线性化的非线性回归分析 41.(2018广西教育质量诊断性联考)已知某企业近 3 年的前 7 个月的月利润(单位:百万元)如折线图所示:(1)试问这 3 年的前 7 个月中哪个月的月平均利润最高?(2)通过计算判断这 3 年的前 7 个月的总利润的发展趋势;(3)试以第 3 年的前 4 个月的数据(如表),用线性回归的拟合模式估测第 3 年 8 月份的利润.月份 x 1 2 3 4利润 y(单位:百万元) 4 4 6 6相关公式: = = , = - .=1()()=1()2=
2、1=122 解:(1)由折线图可知 5 月和 6 月的月平均利润最高.(2)第 1 年前 7 个月的总利润为 1+2+3+5+6+7+4=28(百万元),第 2 年前 7 个月的总利润为 2+5+5+4+5+5+5=31(百万元),第 3 年前 7 个月的总利润为 4+4+6+6+7+6+8=41(百万元),所以这 3 年的前 7 个月的总利润呈上升趋势.(3)因为 =2.5, =5, =12+22+32+42=30,xiyi=14+24+36+46=54,4=1所以 = =0.8,所以 =5-2.50.8=3,所以 =0.8x+3,当 x=8 时, =0.88+3=9.4(百万元),所以估计
3、 8 月份的利润为 940 万元.22.(2018保定二模)共享单车的投放,方便了市民短途出行,被誉为中国“新四大发明”之一.某市为研究单车用户与年龄的相关程度,随机调查了 100 位成人市民,统计数据如下:不小于 40 岁 小于 40 岁 合计单车用户 12 18 30非单车用户 38 32 70合计 50 50 100(1)从独立性检验角度分析,能否有 90%以上的把握认为该市成人市民是否为单车用户与年龄是否小于 40 岁有关;(2)将此样本的频率作为概率,从该市单车用户中随机抽取 3 人,记不小于 40 岁的单车用户的人数为 ,求 的分布列与数学期望.下面临界值表供参考:P(K2k) 0
4、.15 0.10 0.05 0.25 0.010 0.005 0.001k 2.072 2.706 3.841 5.024 6.635 7.879 10.828(参考公式:K 2= ,其中 n=a+b+c+d)解:(1)根据表中数据计算,K2= 1.7142.706,100(12323818)250503070故不能有 90%以上的把握认为,该市成人市民是否为单车用户与年龄是否小于 40 岁有关.(2)由题意,单车用户中,不小于 40 岁的概率为 0.4,小于 40 岁的概率为 0.6, 的所有可能取值为 0,1,2,3,计算 P(=0)=0.6 3=0.216,P(=1)= 0.40.62=
5、0.432,P(=2)= 0.420.6=0.288,P(=3)=0.4 3=0.064. 的分布列为 0 1 2 3P 0.216 0.432 0.288 0.064所以 E()=00.216+10.432+20.288+30.064=1.2.3.(2018南昌市重点中学模拟)水稻苗经过一个培育周期的生长,达到 8 cm 左右最适宜播种,过高或过低都会影响后期的生长.为了监控水稻苗的培育过程,检验员从经过了一个培育周期的水稻苗中随机依序抽取 20 株,并测量其株高(单位:cm),数据如表.次序 1 2 3 4 5 6 7 8 9 10株高 7.98 8.01 8.00 8.03 7.99 7
6、.83 7.99 8.28 7.05 7.69次序 11 12 13 14 15 16 17 18 19 20株高 8.00 8.41 7.75 8.38 7.72 7.69 8.04 8.29 7.82 8.05其中,3= xi=7.95,s= = 0.294, 25.788,12020=1 12020=1()2 120(20=12202)(xi- )(i-10.5)=1.38,xi为抽取的第 i 株水稻苗的株高, i=1,2,20.(1)求 xi与 i(i=1,2,20)的相关系数 r,并判断抽取的 20 株水稻苗的株高是否与抽取次序有关(若|r|0.25,则可以认为水稻苗的株高与抽取次序
7、无关);(2)把株高在( -3s, +3s)之外的水稻苗称为异常苗.监控部门要求,如果在抽取的水稻田中出现了异常苗,就认定这个培育周期的培育环境出现了异常情况,需要对培育环境进行检查和修正.从抽检的结果看,是否需要对培育环境进行检查?请说明理由;剔除异常苗的株高,用余下的数据估计总体的均值和标准差(精确到 0.01).附:相关系数 r= , 2.236, 0.06.5 0.004解:(1)x i与 i(i=1,2,20)的相关系数 r= 20=1()(10.5)20=1()2 20=1(10.5)20.04. 由于|r|0.25,故可以认为水稻苗的株高与抽取次序无关 .1.380.294202
8、5.788(2)由于 =7.95,s0.294,( -3s, +3s)即(7.068,8.832),由样本数据可以看出,第 9 棵株高为 7.05 cm 的水稻苗为异常苗,因此需要对培育环境进行检查和修正.剔除( -3s, +3s)之外的数据 7.05,剩下数据的样本平均数为 (207.95-7.05)8.00,因此总体的均值的估计值为 8.00.200.294 2+207.9521 265.779.20=12剔除 7.05,剩下数据的样本方差为 (1 265.779-7.052-198.002)0.004,因此总体的标准差的估计值为 0.06.0.0044.在试验中得到变量 y 与 x 的数
9、据如表:x 0.066 7 0.038 8 0.033 3 0.027 3 0.022 5y 39.4 42.9 41.0 43.1 49.2由经验知识知,y 与 之间具有线性相关关系,试求 y 与 x 之间的回归方程.当 x=0.038 时,预测 y 的值.(回归方程系数及结果保留两位小数)参考公式: = = ,4= - .参考数据: xi=0.188 6, yi=215.6, =151.8,5=1 5=1 5=11( )2=5 101.56, =6 689.76.5=11 5=1解:令 u= ,则 ui=151.8,5=1所以 =30.36.因为 yi=215.6,5=1所以 =43.12,又 uiyi= =6 689.76,5=1 5=1= ( )2=5 101.56,5=11所以 =5=155=1252=0.29.所以 = - =43.12-0.2930.3634.32,所以 =34.32+0.29u.所以所求回归曲线方程为 =34.32+ ,0.29所以当 x=0.038 时,y 的预测值为 41.95.
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1