1、1第三节 变量间的相关关系与统计案例限时规范训练(限时练夯基练提能练)A 级 基础夯实练1(2018吉林长春质检)下面四个残差图中可以反映出回归模型拟合精度较高的为( )A图 1 B图 2C图 3 D图 4解析:选 A.根据残差图显示的分布情况即可看出,图 1 显示的残差点比较均匀地落在水平的带状区域中,所以拟合精度较高,故选 A.2(2018贵州普通高等学校适应性考试)利用独立性检验来考虑两个分类变量 X 和 Y是否有关系时,通过查阅下表来确定“ X 和 Y 有关系”的可信度如果 K23.841,那么有把握认为“ X 和 Y 有关系”的百分比为( )P(K2 k0)0.50 0.40 0.2
2、5 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.87910.828A.5% B75%C99.5% D95%解析:选 D.由图表中数据可得,当 K23.841 时,有 0.05 的概率说明这两个变量之间没有关系是可信的,即有 95%的把握认为变量之间有关系,故选 D.3根据如下样本数据:x 3 4 5 6 7 8y 4.0 2.5 1.0 0.5 2.0 3.0得到的回归方程为 bx a,则( )y A a0, b0 B a0, b02C a0, b0 D a
3、0, b0解析:选 B.在平面直角坐标系中描点作出散点图(图略),观察图象可知,回归直线 bx a 的斜率 b0,截距 a0.故选 B.y 4(2018山东省实验中学诊断考试)某中学学生会为了调查爱好游泳运动与性别是否有关,随机询问了 110 名高中生是否爱好游泳运动并得到如下的列联表(表 1)由 K2,并参照附表(表 2),得到的正确结论是( )n ad bc 2 a b c d a c b d表 1男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110表 2P(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828A.在犯错误
4、的概率不超过 0.01 的前提下,认为“爱好游泳运动与性别有关”B在犯错误的概率不超过 0.01 的前提下,认为“爱好游泳运动与性别无关”C有 99.9%的把握认为“爱好游泳运动与性别有关”D有 99.9%的把握认为“爱好游泳运动与性别无关”解析:选 A.由题意得 K2 7.822.110 4030 2020 2605060507.8226.635,在犯错误的概率不超过 0.01 的前提下,认为“爱好游泳运动与性别有关” 5(2018湖北宜昌联考)下表提供了某厂节能降耗技术改造后在生产某产品的过程中记录的产量 x(吨)与相应的生产能耗 y(吨)的几组对应数据,根据下表提供的数据,求出 y关于
5、x 的线性回归方程为 0.7 x0.35,则下列结论错误的是( )y x 3 4 5 6y 2.5 t 4 4.5A.回归直线一定过点(4.5,3.5)B产品的生产能耗与产量呈正相关C t 的值为 3.15D该产品每多生产 1 吨,则相应的生产能耗约增加 0.7 吨解析:选 C. (3456) 4.5,则 0.74.50.353.5,即回归直线x14 184 y3一定过点(4.5,3.5),故 A 正确0.70,产品的生产能耗与产量呈正相关,故 B 正确 (2.5 t44.5)3.5, t3,故 C 错误该产品每多生产 1 吨,则相应的y14生产能耗约增加 0.7 吨,故 D 正确6从某地高中
6、男生中随机抽取 100 名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图),由直方图可知( )A估计体重的众数为 50 或 60B a0.03C学生体重在50,60)有 35 人D从这 100 名男生中随机抽取一人,体重在60,80)的概率为13解析:选 C.根据频率分布直方图知,最高的小矩形对应的底边中点为 55,所50 602以估计众数为 55,A 错误;根据频率和为 1,计算( a0.0350.0300.0200.010)101,解得 a0.005,B 错误;体重在50,60)内的频率是 0.35,估计体重在50,60)有 1000.3535 人,C 正确;体重在60,8
7、0)内的频率为 0.30.20.5,用频率估计概率,知这 100 名男生中随机抽取一人,体重在60,80)的概率为 ,D 错误127(2018赣州摸底考试)在一组样本数据( x1, y1),( x2, y2),( x6, y6)的散点图中,若所有样本点( xi, yi)(i1,2,6)都在曲线 y bx2 附近波动经计算13i11, i13, 21,则实数 b 的值为_6i 1x6i 1y6i 1x2i解析:令 t x2,则曲线的回归方程变为线性回归方程,即 y bt ,此时13 , ,代入 y bt ,得 b ,解得 b .t6i 1x2i6 72 y6i 1yi6 136 13 136 7
8、2 13 574答案:578有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表:优秀 不优秀 总计甲班 10 35 45乙班 7 38 45总计 17 73 90利用列联表的独立性检验估计,则成绩与班级_(填“有关”或“无关”)解析:成绩与班级有无关系,就是看随机变量的值与临界值 2.706 的大小关系由公式得 K2的观测值 K2 0.6532.706,所以成绩90 1038 735 217734545与班级无关答案:无关9(2018广东省六校联考)某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分
9、以下为非优秀统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优秀的概率为 .311优秀 非优秀 总计甲班 10乙班 30总计 110(1)请完成上面的列联表;(2)根据列联表中的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关系”参考公式与临界值表: K2 .n ad bc 2 a b c d a c b dP(K2 k0) 0.100 0.050 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.828解:(1)列联表如下:优秀 非优秀 总计甲班 10 50 60乙班 20 30 50总计 30
10、 80 110(2)根据列联表中的数据,得到5K2 7.48610.828.110 1030 2050 260503080因此按 99.9%的可靠性要求,不能认为“成绩与班级有关系” 10某品牌 2019 款汽车即将上市,为了对这款汽车进行合理定价,某公司在某市五家4S 店分别进行了两天试销售,得到如下数据:4S 店 甲 乙 丙 丁 戊单价 x/万元 18.0 18.6 18.2 18.8 18.4 19.0 18.3 18.5 18.5 18.7销量 y/辆 88 78 85 75 82 66 82 78 80 76(1)分别以五家 4S 店的平均单价与平均销量为散点,求出单价与销量的回归直
11、线方程 x ;y b a (2)在大量投入市场后,销量与单价仍服从(1)中的关系,且该款汽车的成本为 12 万元/辆,为使该款汽车获得最大利润,则该款汽车的单价约为多少万元(保留一位小数)?附: , .b ni 1 xi x yi yni 1 xi x 2 a y b x解:(1)五家 4S 店的平均单价和平均销量分别为(18.3,83)(18.5,80),(18.7,74),(18.4,80),(18.6,78), 18.5,x18.3 18.5 18.7 18.4 18.65 79,y83 80 74 80 785b 0.24 01 0.2 5 0.1 1 0.1 10.04 0 0.04
12、 0.01 0.01 20. 20.1 79(20)18.579370449,a y b x 20 x449.y (2)设该款汽车的单价应为 x 万元,则利润 f(x)( x12)(20 x449)20 x2689 x5 388,f( x)40 x689,令40 x6890,解得 x17.2,故当 x17.2 时, f(x)取得最大值6要使该款汽车获得最大利润,该款汽车的单价约为 17.2 万元B 级 能力提升练11某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如下表:(1
13、)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面 22 列联表,问是否有 99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂 乙厂 总计优质品非优质品总计P(K2 k) 0.05 0.01k 3.841 6.635解:(1)甲厂抽查的 500 件产品中有 360 件优质品,从而估计甲厂生产的零件的优质品率为 72%;360500乙厂抽查的 500 件产品中有 320 件优质品,从而估计乙厂生产的零件的优质品率为64%.320500(2)完成的 22 列联表如下:7甲厂 乙厂 总计优质品 360 320 680非优质品 140 180 320总计 500 500 1 0
14、00由表中数据计算得 K2的观测值k 7.356.635,1 000 360180 320140 2500500680320所以有 99%的把握认为“两个分厂生产的零件的质量有差异 ”12某电视厂家准备在元旦期间举办促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出广告费 xi(万元)和销售量 yi(万台)的数据如下.年份 2011 2012 2013 2014 2015 2016 2017广告费 xi 1 2 4 6 11 13 19销售量 yi 1.9 3.2 4.0 4.4 5.2 5.3 5.4(1)若用线性回归模型拟合 y 与 x 的关系,求出 y 关于 x 的线性回归方
15、程;(2)若用 y c d 模型拟合 y 与 x 的关系可得回归方程 1.630.99 ,经计算线x y x性回归模型及该模型的 R2分别为 0.75 和 0.88,请用 R2说明选择哪个回归模型更好;(3)已知利润 z 与 x, y 的关系为 z200 y x,根据(2)的结果,当广告费 x20 时,销售量及利润的预报值是多少?参考公式: , .b ni 1xiyi n x yni 1x2i n x2 a y b x参考数据: 2.24.5解:(1) 8, 4.2, iyi279.4, 708,x y7i 1x7i 1x2i 0.17, 4.20.1782.84.b 7i 1xiyi 7x
16、y7i 1x2i 7 x2 279.4 784.2708 782 a y b x y 关于 x 的线性回归方程为 0.17 x2.84.y (2)R2越大反映残差平方和越小,拟合效果越好,0.750.88,8选用非线性回归模型 1.630.99 更好y x(3)由(2)知,当 x20 时,销售量的预报值 1.630.99 6.06(万台),y 20利润的预报值 200(1.630.99 )201 191.48(万元)z 2013微信已成为人们常用的社交软件, “微信运动”是微信里由腾讯开发的一个类似计步数据库的公众帐号,手机用户可以通过关注“微信运动”公众号查看自己每天行走的步数,同时也可以和
17、好友进行运动量的 PK 或点赞现从小明的微信朋友圈内随机选取了 40人(男、女各 20 人),记录了他们某一天的走路步数,并将数据整理如下表:若某人一天的走路步数超过 8 000 步被系统评定为“积极型” ,否则被系统评定为“懈怠型” (1)利用样本估计总体的思想,试估计小明的所有微信好友中每日走路步数超过 10 000 步的概率;(2)根据题意完成下面的 22 列联表,并据此判断能否有 90%的把握认为“评定类型”与“性别”有关?积极型 懈怠型 总计男女总计附: K2 ,其中 n a b c d.n ad bc 2 a b c d a c b dP(K2 k) 0.100 0.050 0.0
18、10 0.005 0.001k 2.706 3.841 6.635 7.879 10.828解:(1)根据表中数据可知,40 位好友中走路步数超过 10 000 步的有 8 人,利用样本估计总体的思想,估计小明的所有微信好友中每日走路步数超过 10 000 步的概率 P 0.2.840(2)根据题意完成 22 列联表如下:9积极型 懈怠型 总计男 13 7 20女 8 12 20总计 21 19 40 K2 2.52.706,40 1312 78 220202119没有 90%的把握认为“评定类型”与“性别”有关14 “双十一网购狂欢节”源于淘宝商城(天猫)2009 年 11 月 11 日举办
19、的促销活动,当时参与的商家数量和促销力度均有限,但营业额远超预想的效果,于是 11 月 11 日成为天猫举办大规模促销活动的固定日期如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日” 某淘宝电商分析近 8 年“双十一”期间的宣传费用 x(单位:万元)和利润 y(单位:十万元)之间的关系,得到下列数据:x 2 3 4 5 6 8 9 11y 1 2 3 3 4 5 6 8(1)请用相关系数 r 说明 y 与 x 之间是否存在线性相关关系(当| r|0.81 时,说明 y与 x 之间具有线性相关关系);(2)根据(1)的判断结果,建立 y 与 x 之间的回归方程,并预测当 x24
20、时,对应的利润 为多少( , 精确到 0.1)y b a y 附参考公式:回归方程中 x 中 和 最小二乘估计分别为y b a b a , ,b ni 1xiyi n x yni 1x2i n x2 a y b x相关系数 r .ni 1xiyi n x yni 1 xi x 2ni 1 yi y 2参考数据:iyi241, 356, 8.25, 6.8i 1x8i 1x2i8i 1 xi x 28i 1 yi y 2解:(1)由题意得 6, 4.x y10又 iyi241, 8.25,8i 1x8i 1 xi x 26,8i 1 yi y 2所以 r 0.990.81,8i 1xiyi 8x y8i 1 xi x 28i 1 yi y 2 241 8648.256所以 y 与 x 之间存在线性相关关系(2)因为 0.7,b 8i 1xiyi 8x y8i 1x2i 8 x2 241 864356 862 40.760.2,a y b x所以回归直线方程为 0.7 x0.2.y 当 x24 时, 0.7240.216.6,y 所以预测当 x24 时,对应的利润 为 16.6.y 11