1、1第4课时 线性回归分析与统计案例1甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )A甲 B乙C丙 D丁答案 D2(2018湖北七市联考)广告投入对商品的销售额有较大影响某电商对连续5个年度的广告费x和销售额y进行统计,得到统计数据如下表(单位:万元):广告费x 2 3 4 5 6销售额y 29 41 50 59 71由上表可得回归方程为 10.2x ,据此模型,预测广告费为10万元时销售额约为( )y a A101.2万元
2、B108.8万元C111.2万元 D118.2万元答案 C解析 根据统计数据表,可得 (23456)4, (2941505971)50,而回归直线 10x 15 y 15 y .2x 经过样本点的中心(4,50),5010.24 ,解得 9.2,回归方程为 10.2x9.2,当xa a a b 10时, 10.2109.2111.2,故选C.y 3(2018赣州一模)以下四个命题:从匀速传递的产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于1;在回归直线方程 0.2x12中,当解释变量x每增加1个单位时
3、,预报变量平均增加0.2个单位;y 分类变量X与Y,对它们的随机变量K 2的观测值k来说,k越小,“X与Y有关系”的把握程度越大其中真命题为( )A BC D答案 D解析 为系统抽样;分类变量X与Y,对它们的随机变量K 2的观测值k来说,k越大,“X与Y有关系”的把握程度2越大4下面是一个22列联表y1 y2 总计x1 a 21 73x2 22 25 47合计 b 46 120其中a,b处填的值分别为( )A94 72 B52 50C52 74 D74 52答案 C解析 由a2173,得a52,a22b,得b74.故选C.5(2018湖南衡阳联考)甲、乙、丙、丁四位同学各自对A,B两个变量的线
4、性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )A甲 B乙C丙 D丁答案 D解析 r越大,m越小,线性相关性越强故选D.6(2018衡水中学调研)以下四个命题中,真命题是( )A对分类变量x与y的随机变量K 2的观测值k来说,k越小,判断“x与y有关系”的把握程度越大B两个随机变量的线性相关性越强,相关系数的绝对值越接近于0C若数据x 1,x 2,x 3,x n的方差为1,则2x 1,2x 2,2x 3,2x n的方差为
5、2D在回归分析中,可用相关指数R 2的值判断模型的拟合效果,R 2越大,模型的拟合效果越好答案 D解析 对于A,对分类变量x与y的随机变量K 2的观测值k来说,k越大,判断“x与y有关系”的把握程度越大,故A错误;对于B,两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,故B错误;对于C,若数据x 1,x2,x 3,x n的方差为1,则2x 1,2x 2,2x 3,2x n的方差为4,故C错误;对于D,根据离散变量的线性相关及相关指数的有关知识可知D正确72015年年度史诗大剧芈月传风靡大江南北,影响力不亚于以前的甄嬛传某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较好的线性
6、相关关系,年龄在10,14,15,19,20,24,25,2930,34的爱看比例分别为10%,18%,20%,30%,t%.现用这5个年龄段的中间值代表年龄段,如132代表10,14,17代表15,19,根据前四个数据求得爱看比例y关于x的线性回归方程为y(kx4.68)%,由此可推测t的值为( )A33 B35C37 D39答案 B解析 依题意,x (12172227)19.5,14y (10%18%20%30%)19.5%,14又回归直线必过点(x,y),19.5%(k19.54.68)%,解得k ,当x32时,( 324.62 4181 950 2 4181 9508)%35%,t35
7、.8(2018广西南宁月考)某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:偏爱蔬菜 偏爱肉类 合计50岁以下 4 8 1250岁以上 16 2 18合计 20 10 30则可以说其亲属的饮食习惯与年龄有关的把握为( )附:K 2 .n( ad bc) 2( a b) ( c d) ( a c) ( b d)P(K2k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828A.90% B95%C99% D99.9%答案 C解析 由22列联表知,K 2 1
8、0.K 26.635,K 27.879,故有99.5%的把握认为“心率小于6050( 828 212) 220301040次/分与常年进行系统的身体锻炼有关”14(2018山东日照一模)某学校高三年级有学生500人,其中男生300人,女生200人为了研究学生的数学成绩是否与性别有关,现采用分层抽样的方法,从中抽取了100名学生,先统计了他们期中考试的数学分数,然后按性别分为男、女两组,再将两组学生的分数分成5组:100,110),110,120),120,130),130,140),140,150分别加以统计,得到如图所示的频率分布直方图(1)从样本中分数低于110分的学生中随机抽取两人,求这
9、两人恰好为一男一女的概率;(2)若规定分数不低于130分的学生为“数学尖子生”,请你根据已知条件完成22列联表,并判断是否有90%的把握认为“数学尖子生与性别有关”附:K 2n( ad bc) 2( a b) ( c d) ( a c) ( b d)P(K2k 0) 0.10 0.05 0.010 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828答案 (1) (2)有关35解析 (1)由已知得,抽取的100名学生中,男生60名,女生40名分数低于110分的学生中,男生有600.053(人),记为A 1,A 2,A 3;女生有400.052(人),记为B
10、1,B 2.从中随机抽取两名学生,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2)(B1,B 2);其中两名学生恰好为一男一女的可能结果共有6种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2)所求概率为P .610 35(2)由频率分布直方图可知,在抽取的100名学生中,分数不低于130分的男生人数为600.2515,分数不低于130分的女生人数为400.41
11、6,据此可得22列联表如下:7数学尖子生 非数学尖子生 合计男生 15 45 60女生 16 24 40合计 31 69 100K 2 2.5250.75,所以x与y之间具有很强的线性相关关系11(4)当x10时, 1.23100.0812.38,即估计使用年限为10年时,维修费用约为12.38万元y 5(2018广东韶关期末)某商店为了更好地规划某种商品的进货量,从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下表所示(x为该商品的进货量,y为销售天数)x/吨 2 3 4 5 6 8 9 11y/天 1 2 3 3 4 5 6 8(1)根据上表数据在下图所示的网格中绘制散点图;(2)
12、根据上表提供的数据,求出y关于x的线性回归方程 x ;y b a (3)根据(2)中的计算结果,若该商店准备一次性进货24吨,预测需要销售的天数参考公式和数据: , y x;b n i 1xiyi nxy n i 1xi2 nx2 a b xi2356, xiyi241.8 i 1 8 i 1答案 (1)略 (2) x (3)17天y 4968 1134解析 (1)散点图如图所示:(2)依题意,得x (234568911)6,18y (12334568)4,18又 xi2356, xiyi241,8 i 1 8 i 112所以 , 4 6 ,b 8 i 1xiyi 8xy 8 i 1xi2 8x2 241 864356 862 4968 a 4968 1134故线性回归方程为 x .y 4968 1134(3)由(2)知,当x24时, 24 17,y 4968 1134故若该商店一次性进货24吨,则预计需要销售17天