版选修2_3.doc

上传人:orderah291 文档编号:1091102 上传时间:2019-04-09 格式:DOC 页数:12 大小:2.16MB
下载 相关 举报
版选修2_3.doc_第1页
第1页 / 共12页
版选修2_3.doc_第2页
第2页 / 共12页
版选修2_3.doc_第3页
第3页 / 共12页
版选修2_3.doc_第4页
第4页 / 共12页
版选修2_3.doc_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、131 回归分析的基本思想及其初步应用教材研读预习教材 P8088 ,思考以下问题1什么是回归分析?2什么是线性回归模型?要点梳理1回归分析(1)回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法(2)回归方程的相关计算对于两个具有线性相关关系的变量的一组数据( x1, y1),( x2, y2),( xn, yn)设其回归直线方程为 x ,其中 , 是待定参数,由最小二乘法得y b a a b ,b ni 1 xi x yi yni 1 xi x 2ni 1xiyi nx yni 1x2i nx2 .a y b x(3)线性回归模型线性回归模型Error!,其中 a, b为

2、模型的未知参数,通常 e为随机变量,称为随机误差 x称为解释变量, y称为预报变量2线性回归分析(1)残差:对于样本点( xi, yi)(i1,2, n)的随机误差的估计值 i yi i称为e y 相应于点( xi, yi)的残差, (yi i)2称为残差平方和ni 1 y (2)残差图:利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图2(3)R21 越接近 1,表示回归的效果越好ni 1 yi y i 2ni 1 yi y 2自我诊断判断(正确的打“” ,错误的打“”)1残差平方和越小,线性回归方程的拟合效果越好( )

3、2在画两个变量的散点图时,预报变量在 x轴上,解释变量在 y轴上( )3 R2越小,线性回归方程的拟合效果越好( )答案 1. 2. 3.题 型 一 求 线 性 回 归 方 程思考:求线性回归方程的步骤是什么?提示:列表表示 xi, yi, xiyi, x ;2i计算 , , iyi;xyni 1x2ini 1x代入公式计算 , 的值;a b 写出线性回归方程某研究机构对高三学生的记忆力 x和判断力 y 进行统计分析,得下表数据x 6 8 10 12y 2 3 5 6(1)请画出上表数据的散点图;(要求:点要描粗)(2)请根据上表提供的数据,用最小二乘法求出 y关于 x的线性回归方程 x ;y

4、 b a (3)试根据求出的线性回归方程,预测记忆力为 9的同学的判断力(相 关 公 式 : b ni 1xiyi nxyni 1x2i nx2, a y b x)思路导引 先画散点图,再求回归系数 , 写出方程a b 解 (1)如图:3(2) iyi6283105126158,ni 1x 9,x6 8 10 124 4,y2 3 5 646 28 210 212 2344,ni 1x2i 0.7, 40.792.3,b 158 494344 492 1420 a y b x故线性回归方程为 0.7 x2.3.y (3)由(2)中线性回归方程当 x9 时, 0.792.34,预测记忆力为 9的

5、同学的y 判断力约为 4.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系(2)求回归系数:若存在线性相关关系,则求回归系数(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明【温馨提示】 对回归直线的四点说明(1)回归直线过点( , )x y (2)回归直线的截距 a和斜率 b都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差(3)线性回归方程 y a bx中的 b表示 x增加 1个单位时, y的平均变化量为 b,而 a表示 y不随 x的变化而变化的部分4(4)可以利用线性回归方程 y a bx预报在 x取某个值时, y

6、的估计值跟踪训练(链接教材 P81例 1)某种产品的广告费用支出 x与销售额 y(单位:百万元)之间有如下的对应数据:x/百万元 2 4 5 6 8y/百万元 30 40 60 50 70(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为 10百万元时的销售额解 (1)散点图如图所示:(2)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 合计xi 2 4 5 6 8 25yi 30 40 60 50 70 250xiyi 60 160 300 300 560 1380x2i 4 16 25 36 64 145所以, 5, 50, x 145,x 255 y 250

7、5 5i 12ixiyi1380.5i 1于是可得 6.5,b 5i 1xiyi 5x y 5i 1x2i 5x 2 1380 5550145 5525 506.5517.5.a y b x 所以所求的线性回归方程为 6.5 x17.5.y (3)根据(2)中求得的线性回归方程,当广告费用支出为 10百万元时,6.51017.582.5(百万元),y 即广告费用支出为 10百万元时,销售额大约为 82.5百万元题型二 线性回归分析思考:如何用残差图、残差平方和、相关指数 R2分析模型拟合效果?提示:残差图的带状区域的宽度越窄,模型拟合精度越高;残差平方和越小,模型拟合效果越好; R2越接近于

8、1,模型拟合效果越好假定小麦基本苗数 x与成熟期有效穗 y之间存在相关关系,今测得 5组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2(1)以 x为解释变量, y为预报变量,作出散点图;(2)求 y与 x之间的回归方程,对于基本苗数 56.7预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求 R2,并说明残差变量对有效穗的影响占百分之几?解 (1)散点图如下(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系设回归方程为 x , 30.36, 43

9、.5,y b a x y x 5101.56, y 9511.43.5i 12i5i 12i61320.66, 2921.7296,x y x xiyi6746.76.5i 1则 0.29, 34.70.b 5i 1xiyi 5x y 5i 1x2i 5x 2 ay b x 故所求的回归直线方程为 0.29 x34.70.y 当 x56.7 时, 0.2956.734.7051.143.y 估计成熟期有效穗为 51.143.(3)由于 i xi ,可以算得 i yi i分别为 10.35, 20.718, 30.5,y b a e y e e e 42.214, 51.624,残差平方和: 8

10、.43.e e 5i 1e 2i(4) (yi )250.18,故 R21 0.832.所以解释变量小麦基本苗数对总5i 1 y 8.4350.18效应约贡献了 83.2%,残差变量贡献了约 183.2%16.8%.(1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差 1, 2, n来判断模型拟合e e e 的效果(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高跟踪训练为研究质量 x(单位:克)对弹簧长度 y(单位:厘米)的影响,对不同质量的 6个物体进7行测量,数

11、据如表所示:x 5 10 15 20 25 30y 7.25 8.12 8.95 9.90 10.9 11.8(1)作出散点图并求线性回归方程(2)求出 R2.(3)进行残差分析解 (1)作出散点图如图所示: (51015202530)17.5.x 16 (7.258.128.959.9010.911.8)9.487,y 16x 2275, xiyi1076.2,6i 12i6i 1计算得, 0.183, 6.285,b a 所求回归直线方程为 6.2850.183 x.y (2)列表如下:yi iy 0.05 0.005 0.08 0.045 0.04 0.025yi y 2.24 1.37

12、 0.54 0.41 1.41 2.31所以 (yi i)20.01318,6i 1 y (yi )214.6784.6i 1 y 所以, R21 0.9991.0.0131814.67848所以回归模型的拟合效果较好(3)由残差表中的数值可以看出第 3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过 0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量具有线性关系题 型 三 非 线 性 回 归 分 析(链接教材 P86例 2)某地区六年来轻工

13、业产品利润总额 y与年次 x的试验数据如下表所示:年次 x 1 2 3 4 5 6利润总额 y 11.35 11.85 12.44 13.07 13.59 14.41由经验知,年次 x与利润总额 y(单位:亿元)近似有如下关系: y abxe0.其中 a, b均为正数,求 y关于 x的回归方程思路导引 解答此题可根据散点图选择恰当的拟合函数,而本题已经给出,只需将其转化为线性函数,利用最小二乘法求得回归直线方程,再将其还原为非线性回归方程即可解 对 y abxe0两边取自然对数,得 lnyln ae0 xlnb,令 zln y,则 z与 x的数据如下表:x 1 2 3 4 5 6z 2.43

14、2.47 2.52 2.57 2.61 2.67由 zln ae0 xlnb及最小二乘法公式,得lnb0.0477,ln ae02.378,即 2.3780.0477 x,故 10.81.05 x.z y 非线性回归问题的处理方法一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型研究呈非线性回归关系的两个变量之间的关系:(1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模;(2)如果散点图中的点分布在一个曲线状带形区域,要先对变量作适当的变换,再利用9线性回归模型来建模(3)非线性回归方程的求法:根据原始数据( x, y)作出散点图;根据散点图

15、,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;在的基础上通过相应的变换,即可得非线性回归方程(4)非线性相关问题常见的几种线性变换:在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与已知函数的图象进行比较,确定曲线的类型,再作变量替换,将曲线改为直线下面是几种容易通过变量替换转化为直线的函数模型: y a ,令 y y, x ,则有 y a bx;bx 1x y axb,令 yln y, xln x, aln a,则有 y a bx; y aebx,令 yln y, x x, aln a,则有 y a bx; y a

16、e ,令 yln y, x , aln a,则有 y a bx; 1x y a blnx,令 y y, xln x,则有 y a bx; y bx2 a,令 y y, x x2,则有 y bx a.跟踪训练某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8年的年宣传费 xi和年销售量yi(i1,2,8)数据作了初步处理,得到下面的散点图及一些统计量的值x y w (xi8i 1 (wi8i 1 (xi8i 1 (wi8i 110)2x )2w )(yi )x y )(yi )w y 46.6 563 6

17、.8 289.8 1.6 1469 108.8表中 wi , wi.xi w 188i 1(1)根据散点图判断, y a bx与 y c d 哪一个适宜作为年销售量 y关于年宣传x费 x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立 y关于 x的回归方程(3)已知这种产品的年利润 z与 x, y的关系为 z0.2 y x.根据(2)的结果回答下列问题:年宣传费 x49 时,年销售量及年利润的预报值是多少?年宣传费 x为何值时,年利润的预报值最大?附:对于一组数据( u1, v1),( u2, v2),( un, vn),其回归线 v u 的斜率和截距的

18、最小二乘估计分别为: , . ni 1 ui u vi v ni 1 ui u 2 v u 解 (1)由散点图的变化趋势可以判断, y c d 适宜作为年销售量 y关于年宣传x费 x的回归方程类型(2)令 w ,先建立 y关于 w的线性回归方程x由于 68,d 8i 1 wi w yi y 8i 1 wi w 2 108.81.6 563686.8100.6,c y d w 所以 y关于 w的线性回归方程为 100.668 w,因此 y关于 x的回归方程为y 100.668 .y x(3)由(2)知,当 x49 时,年销售量 y的预报值 100.668 576.6,y 49年利润 z的预报值

19、576.60.24966.32.z 根据(2)的结果知,年利润 z的预报值0.2(100.668 ) x x13.6 20.12.z x x11所以当 6.8,即 x46.24 时, 取得最大值x13.62 z 故年宣传费为 46.24千元时,年利润的预报值最大1.本节课的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回归分析2本节课要重点掌握的规律方法(1)求线性回归方程,见典例 1;(2)线性回归分析,见典例 2;(3)非线性回归分析,见典例 3.3对线性回归模型的三点说明(1)线性回归模型 y bx a e与确定性函数 y a bx相比,它表示 y与 x之间是统计相关关系(非确定性关系),其中的随机误差 e提供了选择模型的准则以及在模型合理的情况下探求最佳估计值 a, b的工具(2)线性回归方程 x 中 , 的意义是:以 为基数, x每增加 1个单位, y相应地y b a a b a 平均增加 个单位b (3)线性回归模型中随机误差的主要来源线性回归模型与真实情况引起的误差;省略了一些因素的影响产生的误差;观测与计算产生的误差12

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 中学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1