1、3.1 回归分析的基本思想及其初步应用,第三章 统计案例,学习目标 1.了解随机误差、残差、残差图的概念. 2.会通过分析残差判断线性回归模型的拟合效果. 3.掌握建立线性回归模型的步骤.,问题导学,达标检测,题型探究,内容索引,问题导学,思考 某电脑公司有5名产品推销员,其工作年限与年推销金额数据如下表:,知识点一 线性回归模型,请问如何表示推销金额y与工作年限x之间的相关关系?y关于x的线性回归方程是什么?,答案 画出散点图,由图可知,样本点散布在一条直线附近,因此可用回归直线表示变量之间的相关关系.,梳理 (1)函数关系是一种 关系,而相关关系是一种_ 关系. (2)回归分析是对具有 关
2、系的两个变量进行统计分析的一种常用方法.,确定性,非确定性,相关,(4)线性回归模型ybxae,其中a和b是模型的未知参数,e称为_ ,自变量x称为 ,因变量y称为 .,随机,解释变量,误差,预报变量,知识点二 线性回归分析,答案 不一定.,答案 越小越好.,(2)残差图法 残差点 落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度 ,说明模型拟合精度越高,回归方程的预报精度越高.,比较均匀地,越窄,R2越接近于1,知识点三 建立回归模型的基本步骤,1.确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量. 2.画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在
3、线性关系等). 3.由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程). 4.按一定规则(如最小二乘法)估计回归方程中的参数. 5.得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.,1.求线性回归方程前可以不进行相关性检验.( ) 2.在残差图中,纵坐标为残差,横坐标可以选为样本编号.( ) 3.利用线性回归方程求出的值是准确值.( ),思考辨析 判断正误,题型探究,例1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:,类型一 求线性回归方程,解答,(1)请画出上表数据
4、的散点图;,解 如图:,解答,(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.,预测记忆力为9的同学的判断力约为4.,解答,反思与感悟 (1)求线性回归方程的基本步骤 列出散点图,从直观上分析数据间是否存在线性相关关系.,写出线性回归方程并对实际问题作出估计. (2)需特别注意的是,只有在散点图大致呈线性时,求出的回归方程才有实际意义,否则求出的回归方程毫无意义.,跟踪训练1 假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计数据:,解答,由此资料可知y对x呈线性相关关系. (1)求线性回归方程;,解 由上表中的数据可得,(2)求使用年限为10年时,该设备的
5、维修费用为多少?,解答,即使用年限为10年时,该设备的维修费用约为12.38万元.,命题角度1 线性回归分析,类型二 回归分析,解答,求出y对x的线性回归方程,并说明拟合效果的程度.,例2 在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:,列出残差表:,所以回归模型的拟合效果很好.,反思与感悟 (1)该类题属于线性回归问题,解答此类题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助线性回归方程对实际问题进行分析. (2)刻画回归效果的三种方法 残差图法,残差点比较均匀地落在
6、水平的带状区域内说明选用的模型比较合适.,跟踪训练2 关于x与y有如下数据:,解答,(1)的拟合效果好于(2)的拟合效果.,例3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值.,命题角度2 非线性回归分析,解答,(1)根据散点图判断,yabx与ycd 哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由),解 由散点图可以判断,ycd 适宜作为年销售量y关于年宣传费x的回归方程类型
7、.,(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;,解答,(3)已知这种产品的年利润z与x,y的关系为z0.2yx.根据(2)的结果回答下列问题: 年宣传费x49时,年销售量及年利润的预报值是多少?,解答,年宣传费x为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线vu的斜率和截距的最小二乘估计分别为,解答,解 根据(2)的结果知,年利润z的预报值,故年宣传费为46.24千元时,年利润的预报值最大.,反思与感悟 求非线性回归方程的步骤 (1)确定变量,作出散点图. (2)根据散点图,选择恰当的拟合函数. (3)变量置换,通
8、过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程. (4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果. (5)根据相应的变换,写出非线性回归方程.,跟踪训练3 在一次抽样调查中测得样本的5个样本点,数值如下表:,试建立y与x之间的回归方程.,解答,解 由数值表可作散点图如图,,由置换后的数值表作散点图如右:,根据散点图可知y与x近似地呈反比例函数关系,,由散点图可以看出y与t呈近似的线性相关关系,列表如下:,达标检测,1.下列两个变量之间的关系不是函数关系的是 A.角度和它的余弦值 B.正方形的边长和面积 C.正n边形的边数和内角度数和 D.人的年龄和身高,解析 函
9、数关系就是变量之间的一种确定性关系. A,B,C三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f()cos ,g(a)a2,h(n)(n2). D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.,答案,解析,1,2,3,4,5,答案,解析,2.设有一个线性回归方程 21.5x,当变量x增加1个单位时 A.y平均增加1.5个单位 B.y平均增加2个单位 C.y平均减少1.5个单位 D.y平均减少2个单位,解析 由回归方程中两个变量之间的关系可以得到.,1,2,3,4,5,答案,3.如图四个散点图中,适合用线性回归模型拟合其中两个变量的是,1,
10、2,3,4,5,A. B. C. D.,解析,解析 由图易知两个图中样本点在一条直线附近,因此适合用线性回归模型.,4.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:,A.51个 B.50个 C.54个 D.48个,解析,1,2,3,4,5,答案,解答,5.已知x,y之间的一组数据如下表:,1,2,3,4,5,x1y1x2y2x3y3x4y40113253734,,解答,(2)已知变量x与y线性相关,求出线性回归方程.,1,2,3,4,5,回归分析的步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程 ); (4)按一定规则估算回归方程中的参数; (5)得出结果后分析残差图是否有异常(个别数据对应的残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误或模型是否合适等.,规律与方法,