1、- 1 -第 3 课时 统计案例1.已知变量 x 与 y 正相关,且由观测数据算得样本平均数 =3, =3.5,则由该观测数据算得的线性回归方程可能是( )A.y=0.4x+2.3B.y=2x-2.4C.y=-2x+9.5D.y=-0.3x+4.4解析:因为变量 x 和 y 正相关,所以回归直线的斜率为正,故可以排除选项 C 和 D.因为样本点的中心在回归直线上,把点(3,3 .5)的坐标分别代入选项 A 和 B 中的直线方程进行检验,可以排除 B,故选 A.答案:A2.下列说法: 将一组数据中的每一个数据都加上或减去同一个常数后,方差不变; 设有一个线性回归方程 y=3-5x,变量 x 增加
2、 1 个单位时, y 平均增加 5 个单位; 设具有相关关系的两个变量 x,y 的相关系数为 r,则 |r|越接近于 0,x 和 y 之间的线性相关程度越强; 在一个 22 列联表中,由计算得 2的值,则 2的值越大,判断两个变量间有关联的把握就越大 .其中错误的个数是( )A.0 B.1C.2 D.3解析:方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故 正确;在回归方程 y=3-5x 中,变量 x 增加 1 个单位时, y 平均减小 5 个单位,故 不正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为 r,|r|越接近于 1,相关程
3、度越强,故 不正确;对分类变量 x 与 y 的随机变量的观测值 2来说, 2越大,“x 与 y 有关系”的可信程度越大,故 正确 .综上所述,错误结论的个数为 2,故选 C.答案:C3.根据如下样本数据x 3 4 5 6 7 8y 4.0 2.5 -0.5 0.5 -2.0 -3.0得到的回归方程为 y=bx+a,则( )A.a0,b0,b0C.a0解析:作出散点图(图略),由散点图可知 b0,故选 A.答案:A- 2 -4.春节期间,某销售公司每天销售某种取暖商品的销售额 y(单位:万元)与当天的平均气温x(单位:)有关 .现收集了春节期间这个销售公司 4 天的 x 与 y 的数据列于下表:
4、平均气温 / -2 -3 -5 -6销售额 /万元 20 23 27 30根据以上数据,用线性回归的方法,求得 y 与 x 之间的线性回归方程 y=bx+a 的系数 b=- ,则a= . 解析:由表中数据可得 =-4, =25,所以线性回归方程 y=- x+a 过点( -4,25),代入方程得 25=-(-4)+a,解得 a=答案:5.已知回归方程 y=4.4x+838.19,则可估计 x 与 y 的增长速度之比约为 . 解析: x 每增长 1 个单位, y 增长 4.4 个单位,故增长的速度之比约为 1 4.4=5 22.事实上所求的比值为回归直线方程斜率的倒数 .答案:5 226.某数学老
5、师身高 176 cm,他爷爷、父亲和儿子的身高分别是 173 cm,170 cm 和 182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为 cm. 解析:儿子和父亲的身高可列表如下:父亲身高 173 170 176儿子身高 170 176 182设线性回归方程为 y=a+bx,由表中的三组数据可求得 b=1,且过中心点(173,176),故 a= -b =176-173=3,故线性回归方程为 y=3+x,将 x=182 代入得孙子的身高为 185 cm.答案:1857.导学号 43944065 假设关于某设备的使用年限 x(单位:年)和所支出的维修费用 y(
6、单位:万元)有如下表的统计资料:使用年限 x/年 2 3 4 5 6维修费用 y/万元 2.2 3.8 5.5 6.5 7.0若由资料可知 y 对 x 呈线性相关关系,试求:- 3 -(1)线性回归直线方程;(2)根据回归直线方程,估计使用年限为 12 年时,维修费用是多少?解(1)列表i 1 2 3 4 5 总计xi 2 3 4 5 6 20yi 2.2 3.8 5.5 6.5 7.0 25xiyi 4.4 11.4 22.0 32.5 42.0 112.34 9 16 25 36 90=4, =5;=90, xiyi=112.3b= =1.23,于是 a= -b =5-1.234=0.08
7、.所以线性回归直线方程为 y=1.23x+0.08.(2)当 x=12 时, y=1.2312+0.08=14.84(万元),即估计使用 12 年时,维修费用是 14.84 万元 .8.导学号 43944066 某企业通过调查问卷(满分 50 分)的形式对本企业 900 名员工的工作满意度进行调查,并随机抽取了其中 30 名员工(16 名女员工,14 名男员工)的得分,如下表:女 47 36 32 48 34 44 43 47 46 41 43 42 50 43 35 49男 37 35 34 43 46 36 38 40 39 32 48 33 40 34(1)根据以上数据,估计该企业得分大
8、于 45 分的员工人数;(2)现用计算器求得这 30 名员工的平均得分为 40.5 分,若规定大于平均得分为“满意”,否则为“不满意”,请完成下列表格:“满意”的人数 “不满意”的人数 总计女 16男 14总计 30(3)根据上述表中数据,利用独立性检验的方法判断,能否有 99%以上的把握,认为该企业员工“性别”与“工作是否满意”有关?- 4 -参考数据:P( 2 k0) 0.10 0.050 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.828解(1)从表中可知,30 名员工中有 8 名得分大于 45 分,所以任选一名员工,他(她)的得分大于45 分的概率是 ,所以估计此次调查中,该单位约有 900 =240 名员工的得分大于 45 分 .(2)完成下列表格:“满意”的人数 “不满意”的人数 总计女 12 4 16男 3 11 14总计 15 15 30(3)假设 H0:性别与工作是否满意无关,根据表中数据,求得 2的观测值k= 8.5716.635,查表得 P( 26 .635)=0.010.所以有 99%以上的把握认为性别与工作是否满意有关 .- 5 -