1、第1章,统计案例,1.2 回归分析,学习目标 1.会建立线性回归模型分析两个变量间的相关关系. 2.能通过相关系数判断两个变量间的线性相关程度. 3.了解回归分析的基本思想和初步应用.,1,预习导学 挑战自我,点点落实,2,课堂讲义 重点难点,个个击破,3,当堂检测 当堂训练,体验成功,知识链接 1.什么叫回归分析? 答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法.,2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗? 答 不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如
2、饮食,是否喜欢运动等.,预习导引 1.线性回归方程,(2)将yabx称为线性回归模型,其中abx是确定性函数,称为 .,随机误差,2.相关系数r的性质 (1)|r| ; (2)|r|越接近于1,x,y的线性相关程度越 ; (3)|r|越接近于0,x,y的线性相关程度越 .,强,弱,1,3.显著性检验 (1)提出统计假设H0:变量x,y ; (2)如果以95%的把握作出判断,可以根据10.950.05与 n2在附录2中查出一个r的 (其中10.950.05称为 );,不具有线性相关关系,临界值r0.05,检验水平,相关系数,(4)作出统计推断:若 ,则否定H0,表明有 的把握认为x与y之间具有
3、;若 ,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有 .,|r|r0.05,95%,|r|r0.05,线性相关关系,线性相关关系,要点一 线性相关的判断 例1 某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.,(1)画出散点图;,(2)作相关性检验;,而n10时,r0.050.632, 所以|r|r0.05, 所以有95%的把握认为数学成绩与学习时间之间具有线性相关关系.,(3)若某同学每周用于数学学习的时间为18 h,试预测其数学成绩.,规律方法 判断变量的相关性通常有两种方式:一是散点图;二是相关系
4、数r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.,跟踪演练1 暑期社会实践中,小闲所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:,(1)利用相关系数r判断y与x是否线性相关; 解 由表中数据,利用科学计算器计算得:,因为rr0.050.878, 所以y与x之间具有线性相关关系.,(2)根据上表提供的数据,求出y关于x的线性回归方程. 解 根据以上数据可得,,要点二 求线性回归方程 例2 某班5名学生的数学和物理成绩如下表:,(1)画出散点图; 解 散点图如图.,(2)求物理成绩y对数学成绩x的线性回归方程;,(3)一名学生
5、的数学成绩是96,试预测他的物理成绩.,即可以预测他的物理成绩是82.,规律方法 (1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析. (2)求线性回归方程,首先应注意到,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.,跟踪演练2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:,请画出上表数据的散点图(要求:点要描粗); 解 如图:,试根据求出的线性回归方程,预测记忆力为9的同学的判断力.,要点三 非线性回归分析 例3 某种书每
6、册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:,检验每册书的成本费y与印刷册数的倒数 之间是否具有线性相关关系;如有,求出y对x的回归方程.,解 令u ,原题中所给数据变成如下表示的数据:,查表得r0.050.632,因为rr0.05,从而认为u与y之间具有线性相关关系.,规律方法 对非线性回归问题,若给出经验公式,采用变量代换把问题转化为线性回归问题.若没有经验公式,需结合散点图挑选拟合得最好的函数.,跟踪演练3 在试验中得到变量y与x的数据如下表: 试求y与x之间的回归方程,并预测x40时,y的值.,解 作散点图如图所示, 从散点图可以看出,两个变量x,y不 呈线性相关关
7、系,根据学过的函数知 识,样本点分布的曲线符合指数型函数 ,通过对数变化把指数关系变为线性关系, 令zln y, 则zbxa(aln c1,bc2).,列表:,作散点图如图所示,,从散点图可以看出,两个变量x,z呈很强的线性相关关系. 由表中的数据得到线性回归方程为 0.277x3.998. 所以y关于x的指数回归方程为: e0.277x3.998. 所以,当x40时,ye0.277403.9981 190.347.,1.在下列各量之间,存在相关关系的是_. 正方体的体积与棱长之间的关系;一块农田的水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;家庭的支出与收入之间的关系;某户家庭用电量
8、与电价之间的关系.,1,2,3,4,2.如图是x和y的一组样本数据的散点 图,去掉一组数据_后,剩下 的4组数据的相关指数最大. 解析 经计算,去掉D(3,10)这一组数据 后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.,1,2,3,4,D(3,10),3.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为_.,1,2,3,4,答案 106.5x,1,2,3,4,4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:,1,2,3,4,(1)求年推销金额 y关于工作年限
9、x的线性回归方程;,1,2,3,4,所以年推销金额y关于工作年限x的线性回归方程为0.5x0.4.,1,2,3,4,(2)若第6名推销员的工作年限为11年,试估计他的年推销金额. 解 当x11时,0.5x0.40.5110.45.9(万元). 所以可以估计第6名推销员的年推销金额为5.9万元.,1,2,3,4,课堂小结 1.相关系数r r的大小与两个变量之间线性相关程度的强弱关系: (1)当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.当r1时,两个变量完全正相关;当r1时,两个变量完全负相关.,(2)|r|1,并且|r|越接近1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|r|越接近0,表明两个变量的线性相关程度越弱,通常当|r|r0.05时,认为两个变量有很强的线性相关程度.此时建立的回归模型是有意义的.,2.回归分析 用回归分析可以预测具有相关关系的两个随机变量的取值.但要注意: 回归方程只适用于我们所研究的样本的总体. 我们建立的回归方程一般都有时间性.,样本取值的范围影响了回归方程的适用范围. 回归方程得到预报值不是变量的精确值,是变量可能取值的平均值.,
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1