1、11.2 回归分析学习目标 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度知识点一 回归分析及回归直线方程思考 1 什么叫回归分析?答案 回归分析是对具有相关关系的两个变量进行统计分析的一种方法思考 2 回归分析中,利用回归直线方程求出的函数值一定是真实值吗?答案 不一定是真实值,利用回归直线方程求的值,在很多时候是个预测值梳理 (1)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法若两个变量之间具有线性相关关系,则称相应的回归分析为线性回归分析(2)回归直线方程为 x ,且 , ,其中 i, y b a b ni 1xi xyi y
2、ni 1xi x2 a y b x x 1nni 1x y 1ni,( , )称为样本点的中心,回归直线一定过样本点的中心ni 1y x y知识点二 相关系数1对于变量 x 与 Y 随机抽到的 n 对数据( x1, y1),( x2, y2),( xn, yn),检验统计量是样本相关系数r n i 1 xi xyi y n i 1 xi x2 n i 1 yi y2 . n i 1xiyi nx y n i 1x2i nx2 n i 1y2i ny22相关系数 r 的取值范围是1,1,| r|越接近 1,变量之间的线性相关程度越强;| r|越2接近 0,变量之间的线性相关程度越弱当| r|r0
3、.05时,表明有 95%的把握认为两个变量之间具有线性相关关系1求回归直线方程前可以不进行相关性检验( )2利用回归直线方程求出的值是准确值( )类型一 回归直线方程例 1 若从某大学中随机选取 8 名女大学生,其身高和体重数据如下表所示:编号 1 2 3 4 5 6 7 8身高/cm 165 165 157 170 175 165 155 170体重/kg 48 57 50 54 64 61 43 59求根据女大学生的身高预测体重的回归直线方程,并预测一名身高为 172 cm 的女大学生的体重考点 线性回归分析题点 回归直线的应用解 (1)画散点图选取身高为自变量 x,体重为因变量 y,画出
4、散点图,展示两个变量之间的关系,并判断二者是否具有线性关系由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线方程 x 来近似刻画它们之间的关系y b a (2)建立回归方程由计算器可得 0.848, 85.632.b a 3于是得到回归直线方程为 0.848 x85.632.y (3)预测和决策当 x172 时, 0.84817285.63260.224(kg)y 即一名身高为 172 cm 的女大学生的体重预测值为 60.224 kg.反思与感悟 在使用回归直线方程进行预测时要注意(1)回归直线方程只适用于我们所研究的样本的总体(2)我们所建立的回归直线
5、方程一般都有时间性(3)样本取值的范围会影响回归直线方程的适用范围(4)不能期望回归直线方程得到的预测值就是因变量的精确值跟踪训练 1 假设关于某设备的使用年限 x(年)和所支出的维修费用 y(万元)有如下的统计数据:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0由此资料可知 y 对 x 呈线性相关关系(1)求回归直线方程;(2)求使用年限为 10 年时,该设备的维修费用为多少?考点 回归直线方程题点 求回归直线方程解 (1)由题干表中的数据可得4, 5, 90, iyi112.3,x y5i 1x2i5i 1x 1.23,b 5i 1xiyi 5xy5i 1x2i 5x2
6、112.3 54590 542 51.2340.08.a y b x回归直线方程为 1.23 x0.08.y 4(2)当 x10 时, 1.23100.0812.38.y 即使用年限为 10 年时,该设备的维修费用约为 12.38 万元类型二 相关性检验例 2 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度” y 来衡量,这个指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度 x(g/L)去控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据:甲醛浓度(g/L) 18 20 22 24 26 28 30缩醛化度(克分子%) 26.86 28
7、.35 28.75 28.87 29.75 30.00 30.36(1)画散点图;(2)求回归直线方程;(3)求相关系数 r,并进行相关性检验考点 线性相关系数题点 线性相关系数的概念及计算解 (1)散点图如图(2)可以看出,两变量之间有近似的线性相关关系,下面用列表的方法计算 , .a b i xi yi x2i xiyi1 18 26.86 324 483.482 20 28.35 400 5673 22 28.75 484 632.54 24 28.87 576 692.885 26 29.75 676 773.56 28 30.00 784 8407 30 30.36 900 910.
8、805 168 202.94 4 144 4 900.16 24, ,x1687 y 202.947 0.264 3,b 7 i 1xiyi 7x y 7 i 1x2i 7x2 4 900.16 724202.9474 144 7242 0.264 32422.648,a y b x 202.947回归直线方程为 22.6480.264 3 x.y (3) y 5 892, r7 i 12i 7 i 1xiyi 7x y 7 i 1x2i 7x2 7 i 1y2i 7y2 0.96.4 900.16 724202.9474 144 72425 892 7(202.947 )2 r0.96 r0
9、.050.754.有 95%的把握认为“甲醛浓度与缩醛化度有线性相关关系” ,求得的回归直线方程有意义反思与感悟 根据已知数据求得回归直线方程后,可以利用相关系数和临界值 r0.05比较,进行相关性检验跟踪训练 2 为了研究 3 月下旬的平均气温( x)与 4 月 20 日前棉花害虫化蛹高峰日( y)的关系,某地区观察了 2012 年至 2017 年的情况,得到了下面的数据:年份 2012 2013 2014 2015 2016 2017x() 24.4 29.6 32.9 28.7 30.3 28.9y(日) 19 6 1 10 1 8(1)对变量 x, y 进行相关性检验;(2)据气象预测
10、,该地区在 2019 年 3 月下旬平均气温为 27,试估计 2019 年 4 月化蛹高峰日为哪天考点 线性相关系数题点 线性相关系数的概念及计算6解 由已知条件可得下表:i 1 2 3 4 5 6xi 24.4 29.6 32.9 28.7 30.3 28.9yi 19 6 1 10 1 829.13, 7.5, 5 130.92, 563, iyi1 222.6x y6i 1x2i6i 1y2i6i 1x(1)r 0.934 1.6i 1xiyi 6xy 6i 1x2i 6x2 6i 1y2i 6y2查表知: r0.050.811.由| r|r0.05可知,变量 y 和 x 存在线性相关关
11、系(2) 2.23,b 1 222.6 629.137.55 130.92 629.132 72.46.a y b x所以回归直线方程为 2.23 x72.46.y 当 x27 时, 2.232772.4612.y 据此,可估计该地区 2019 年 4 月 12 日为化蛹高峰日.1某商品销售量 y(件)与销售价格 x(元/件)呈负相关,则其回归直线方程可能是( )A. 10 x200y B. 10 x200y C. 10 x200y D. 10 x200y 考点 线性回归分析题点 回归直线的应用7答案 A解析 由于销售量 y 与销售价格 x 成负相关,故排除 B,D.又当 x10 时,A 中
12、y100,而C 中 y300,C 不符合题意,故选 A.2下表是 x 和 y 之间的一组数据,则 y 关于 x 的回归直线必过( )x 1 2 3 4y 1 3 5 7A.点(2,3) B点(1.5,4)C点(2.5,4) D点(2.5,5)考点 回归直线方程题点 样本点中心的应用答案 C解析 回归直线必过样本点中心( , ),即(2.5,4)x y3对变量 y 和 x 进行相关性检验,已知 n 为数据的对数, r 是相关系数,且已知 n3, r0.995 0; n7, r0.953 3; n15, r0.301 2; n17, r0.499 1.则变量 y 和 x 具有线性相关关系的是( )
13、A和 B和C和 D和考点 线性相关系数题点 线性相关系数的应用答案 C解析 当 n3 时, r0.050.997,所以| r|r0.05,表明有 95%的把握认为 x 与 y 之间具有线性相关关系;当 n15 时, r0.050.514,所以| r|r0.05,表明有 95%的把握认为 x 与 y 之间具有线性相关关系,所以和满足题意,故选 C.84某产品在某零售摊位的零售价 x(单位:元)与每天的销售量 y(单位:个)的统计资料如下表所示:x 16 17 18 19y 50 34 41 31由上表可得回归直线方程 x 中的 5,据此模型预测当零售价为 14.5 元时,每天y b a b 的销
14、售量为( )A51 个 B50 个 C54 个 D48 个考点 线性回归分析题点 回归直线方程的应用答案 C解析 由题意知 17.5, 39,代入回归直线方程得x y126.5,126.514.5554,故选 C.a 5已知 x, y 之间的一组数据如下表:x 0 1 2 3y 1 3 5 7(1)分别计算: , x1y1 x2y2 x3y3 x4y4, x x x x ;xy 21 2 23 24(2)已知变量 x 与 y 线性相关,求出回归直线方程考点 回归直线方程题点 求回归直线方程解 (1) 1.5, 4,x0 1 2 34 y 1 3 5 74x1y1 x2y2 x3y3 x4y40
15、113253734,x x x x 0 21 22 23 214.21 2 23 24(2) 2,b 34 41.5414 41.52 421.51,a y b x故回归直线方程为 2 x1.y 91对具有线性相关关系的两个变量进行统计分析,可从散点图观察大致呈条状分布,可以求回归直线方程并进行预报2通过求相关系数并和临界值 r0.05比较可以判断两个变量是否有线性相关关系,求得的回归直线方程是否有意义.一、选择题1根据如下样本数据x 3 4 5 6 7 8y 4.0 2.5 0.5 0.5 2.0 3.0得到的回归直线方程为 x ,则( )y b a A. 0, 0 B. 0, 0 D. 0.故 0, s ,所以他的物理成绩更稳定2数 学 2物 理(2)由于 x 与 y 之间具有线性相关关系,经计算得 0.5, 1000.510050.b a 所以回归直线方程为 0.5 x50.y 当 y115 时, x130.估计他的数学成绩是 130 分建议:进一步加强对数学的学习,提高数学成绩的稳定性,将有助于物理成绩的进一步提高