1、1课时规范练 50 相关性、最小二乘估计与统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程 y=3+1.2x,当变量 x每增加一个单位时,则 y的变化情况正确的是( )A.y平均增加约 1.2个单位B.y平均增加约 3个单位C.y平均减少约 1.2个单位D.y平均减少约 3个单位2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为 y=0.8x-155,后因某未知原因使第 5组数据的 y值模糊不清,此位置数据记为 m(如下表所示),则利用回归方程可求得实数 m的值为( )x 196 197 200 203
2、204y 1 3 6 7 mA.8.3 B.8.2 C.8.1 D.83.(2018广东佛山二模,5)某同学用收集到的 6组数据对( xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线 l的方程为 y=bx+a,相关系数为 r.现给出以下 3个结论: r 0; 直线 l恰好过点 D;b 1.其中正确结论是( )A. B.C. D.4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程 y=bx+a,其中 a=10.5,则当 x=6时, y的估计值是( )x 4 2 3 5y 49 26 39 54A.57.5 B
3、.61.5C.64.5 D.67.55.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响 .部分统计数据如下表:使用智能手机 不使用智能手机 总计学习成绩优秀 4 8 12学习成绩不优秀 16 2 18总 计 20 10 30附表:P( 2k0) 0.10 0.05 0.010k0 2.706 3.841 6.635经计算 2=10,则下列选项正确的是( )A.有 99%的把握认为使用智能手机对学习有影响B.有 99%的把握认为使用智能手机对学习无影响C.有 95%的把握认为使用智能手机对学习有影响D.有 95%的把握认为使用智能手机对学习无影响26.(2
4、018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,得到如下数据 .单价 x/元 4 5 6 7 8 9销量 y/件 90 84 83 80 75 68由表中数据求得线性回归方程 y=-4x+a,则 x=10元时预测销量为 件 . 7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量 x,y之间的几组数据如下表所示:x 2 4 6 8 10y 3 6 7 10 12(1)请根据上表提供的数据,用最小二乘法求出 y关于 x的线性回归方程 y=bx+a,并估计当 x=20时,y的值;(2)将表格中的数据看作五个点的坐标,则从这五个点中随
5、机抽取 2个点,求恰有 1个点落在直线2x-y-4=0右下方的概率 .参考公式: b= ,a= -b .=1- =12-()2 综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量 x,y,设其样本点为 Ai(xi,yi)(i=1,2,8),回归直线方程为 y=x+a,若 + =(6,2),(O为原点),则 a=( )1+2 8A. B.- C. D.-9.(2018安徽合肥一中最后 1卷,文 13)为了研究某班学生的脚长 x(单位:cm)和身高 y(单位:cm)的关系,从该班随机抽取 10名学生,根据测量数据的散点图可以看出 y与 x之间有线性相关关系,设其回归直线方程为 y=b
6、x+a.已知 xi=225, yi=1 600,b=4.该班某学生的脚长为 24,据此估计其10=1 10=1身高为 . 10.(2018安徽蚌埠一模,文 19)某图书公司有一款图书的历史收益率(收益率 =利润 每本收入)的频率分布直方图如图所示:(1)试估计平均收益率;(用区间中点值代替每一组的数值)(2)根据经验,若每本图书的收入在 20元的基础上每增加 x元,对应的销量 y(万本)与 x(元)有较强线性相关关系,从历史销售记录中抽样得到如下 5组 x与 y的对应数据:x元 25 30 38 45 52销量 y万本 7.5 7.1 6.0 5.6 4.8据此计算出的回归方程为 y=10.0
7、-bx.3 求参数 b的估计值; 若把回归方程 y=10.0-bx当作 y与 x的线性关系, x取何值时,此产品获得最大收益?求出该最大收益 .11.(2018山东日照 5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量 .某地车牌竞价的基本规则是: “盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数; 竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额 .某人拟参加 2018年 5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近 5个月参与竞拍的人数(见下表):月
8、份 2017.12 2018.01 2018.02 2018.03 2018.04月份编号 t 1 2 3 4 5竞拍人数 y(万人) 0.5 0.6 1 1.4 1.7(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数 y(万人)与月份编号 t之间的相关关系 .请用最小二乘法求出 y关于 t的线性回归方程: y=bt+a,并预测 2018年 5月份参与竞拍的人数 .(2)某市场调研机构从拟参加 2018年 5月份车牌竞拍人员中,随机抽取了 200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:报价区间(万元) 1,2) 2,3) 3,4) 4,5) 5,6) 6
9、,7) 7, 8)频数 10 30 a 60 30 20 10 求 a,b的值及这 200位竞拍人员中报价大于 5万元的人数; 若 2018年 5月份车牌配额数量为 3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价 .参考公式及数据: y=bx+a ,其中 b= ,a= -b ; =55, tiyi=18.8.=1- =12-2 5=12 5=14创新应用组12.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才
10、的培养力度,据不完全统计:年份(届) 2014 2015 2016 2017学科竞赛获省级一等奖及以上学生人数 x 51 49 55 57被清华、北大等世界名校录取的学生人数 y 103 96 108 107根据上表可得回归方程 y=bx+a中的 b为 1.35,我校 2018届同学在学科竞赛中获省级一等奖以上学生人数为 63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为( )A.111 B.115 C.117 D.12313.(2018湖北七校联盟 2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度 x(单位:),对某种
11、鸡的时段产蛋量 y(单位:t)和时段投入成本 z(单位:万元)的影响,为此,该企业收集了 7个鸡舍的时段控制温度 xi和产蛋量yi(i=1,2,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值 . 7=1(-)217.40 82.30 3.6 1407=1(-)2 (xi- )(yi-7=1 )(xi- )(ki- )7=1 9.7 2 935.1 35.0其中 ki=ln yi, ki.=177=1(1)根据散点图判断, y=bx+a与 y=c1 哪一个更适宜作为该种鸡的时段产蛋量 y关于鸡舍时段控2制温度 x的回归方程类型?(给判断即可,不必说明理由)(2)若用 y=c
12、1 作为回归方程模型,根据表中数据,建立 y关于 x的回归方程;2(3)已知时段投入成本 z与 x,y的关系为 z=e-2.5y-0.1x+10,当时段控制温度为 28 时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?5附: 对于一组具有有线性相关关系的数据( i,vi)(i=1,2,3,n),其回归直线 v=u+ 的斜率和截距的最小二乘估计分别为 = ,= -=1(-)(-)=1(-)2 e-2.5 e-0.75 e e3 e70.08 0.47 2.72 20.09 1 096.636课时规范练 50 相关性、最小二乘估计与统计案例1.A 令 x=a,y=3+1.2a,令 x=a+1,
13、则 y=3+1.2(a+1)=4.2+1.2a,所以当变量 x每增加一个单位时,则y平均增加约 1.2个单位,故选 A.2.D 由题意可得: =200, ,回归=196+197+200+203+2045 =1+3+6+7+5 =17+5方程过样本中心点,则: =0.8200-155,解得 m=8,故选 D.17+53.A 由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数 r0;因为 =3, =3,=0+1+2+3+5+76 =1.5+2+2.3+3+5+4.26所以回归直线 l的方程必过点(3,3),即直线 l恰好过点 D.因为直线 l斜率接近于 AD斜率,而kAD=
14、6.635,据此结合独立性检验的思想可知:有 99%的把握认为使用智能手机对学习有影响,故选 A.6.66 由已知得 (4+5+6+7+8+9)= (90+84+83+80+75+68)=80,=16 132,=16a= 80+4 =106, 当 x=10时, y=106-40=66,故答案为 66.1327.解 (1) (2+4+6+8+10)=6, (3+6+7+10+12)=7.6,=15 =15=4+16+36+64+100=220, xiyi=6+24+42+80+120=272,5=12 5=1b= =1.1,a= 7.6-61.1=1,5=1-5 5=12-5()2=272-56
15、7.6220-562 =4440 回归直线方程为 y=1.1x+1,故当 x=20时, y=23.(2)可以判断,落在直线 2x-y-4=0右下方的点满足 2x-y-40,故符合条件的点的坐标为(6,7),(8,10),(10,12),共有 10种取法,满足条件的有 6种,所以 P=.610=358.B 因为 + =(x1+x2+x8,y1+y2+y8)=(8 ,8 )=(6,2),所以 8 =6,8 =21+2 8 ,因此 +a,即 a=-,故选 B.=34,=14 14=12349.166 由 xi=225, yi=1 600,利用平均值公式求得 =22.5, =160,10=1 10=1
16、 b= 4,a= 160-422.5=70,从而当 x=24时, y=424+70=166,故答案为 166.10.解 (1)区间中值依次为:0 .05,0.15,0.25,0.35,0.45,0.55,取值的估计概率依次为:0.1,0.2,0.25,0.3,0.1,0.05,故平均收益率为0.050.10+0.150.20+0.250.25+0.350.30+0.450.10+0.550.05=0.275.(2) =38, =6.2,=25+30+38+45+525 =1905 =7.5+7.1+6.0+5.6+4.85 =3157将(38,6 .2)代入 y=10-bx,得 b= =0.1
17、0.10.0-6.238 设每本图书的收入是 20+x元,则销量为 y=10-0.1x,则图书总收入为f(x)=(20+x)(10-0.1x)=200+8x-0.1x2=360-0.1(x-40)2(万元),当 x=40时,图书公司总收入最大为 360万元,预计获利为 3600.275=99万元 .11.解 (1)易知 =3, =1.04,b=1+2+3+4+55 =0.5+0.6+1+1.4+1.75=0.32,a= -b=1.04-0.323=0.08,5=1-5 5=12-52=18.8-531.0455-532 则 y关于 t的线性回归方程为 y=0.32t+0.08,当 t=6时,
18、y=2.00,即 2018年 5月份参与竞拍的人数估计为 2万人 .(2) 由 =0.20解得 a=40.由频率和为 1,得(0 .052+0.10+2b+0.20+0.30)1=1,解得200b=0.15,200位竞拍人员报价大于 5万元的人数为(0 .05+0.10+0.15)200=60人 . 2018年 5月份实际发放车牌数量为 3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为 100%=15%;又由频率分布直方图知竞拍报价大于 6万元的频率为3 00020 0000.05+0.10=0.15,所以,根据统计思想(样本估计总体)可预测 2018年 5月份竞拍的最低成交价
19、为 6万元 .12.C 由题意得 =53, =103.5.=51+49+55+574 =103+96+108+1074 数据的样本中心点在线性回归直线上, y=bx+a中的 b为 1.35, 103.5=1.3553+a,即a=31.95, 线性回归方程是 y=1.35x+31.95. 2018届同学在学科竞赛中获省级一等奖以上学生人数为 63人, 今年被清华、北大等世界名校录取的学生人数为 1.3563+31.95=117,故选 C.13.解 (1) y=c1 适宜 .2(2)由 y=c1 得 ln y=c2x+ln c1,令 ln y=k,c2= ,= ln c1,由图表中的数据可知2= ,=- ,k= x- ,y 关于 x的回归方程为 y= =0.47 .35140=14 34 14 34 4-34 4(3)当 x=28时,由回归方程得 y=0.471 096.63=515.4,z=0.08515.4-2.8+10=48.432.即鸡舍的温度为 28 时,鸡的时段产量的预报值为 515.4,投入成本的预报值为 48.432.