1、111.6 变量间的相关关系、统计案例考纲解读考点 内容解读 要求 高考示例 常考题型 预测热 度变量的相关性、统计案例(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(2)了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.独立性检验:了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用;回归分析:了解回归分析的基本思想、方法及其简单应用了解2017山东,5;2016课标全国,18;2015课标,19;2015福建,4;2014课标,19;2014重庆,3选择题解答题 分析解
2、读 1.理解用回归分析处理变量相关关系的数学方法,理解最小二乘法.2.了解独立性检验的基本思想,认识统计方法在决策中的作用.3.了解回归的基本思想方法及其简单应用.4.回归分析与独立性检验在今后的高考中分值可能会提高.本节在高考中主要以选择题、解答题的形式呈现,分值约为5分或12分,小题为容易题,解答题属中档题.五年高考考点 变量的相关性、统计案例1.(2017山东,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为=x+.已知x i=225,yi=1 600,=4.该
3、班某学生的脚长为24,据此估计其身高为( )A.160 B.163C.166 D.170答案 C2.(2015福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元) 8.2 8.6 10.0 11.3 11.9支出y(万元) 6.2 7.5 8.0 8.5 9.8根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元 B.11.8万元C.12.0万元 D.12.2万元答案 B3.(2014湖北,4,5分)根据如下样本数据x 3 4 5 6 7 8y 4.0
4、2.5 -0.5 0.5 -2.0 -3.0得到的回归方程为=bx+a,则( )2A.a0,b0 B.a0,b0 D.a0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2015年的年份代号t=9代入(1)中的回归方程,得=0.59+2.3=6.8,故预测该地区2015年农村居民家庭人均纯收入为6.8千元.三年模拟A组 20162018年模拟基础题组考点 变量的相关性、统计案例1.(2018云南昆明一中第一次摸底,2)当变量x的取值为3,4,5,6,7时,变量y对应的值依次为4.0,2.5,-0.5,-1,-2;当变量u的取值为1,2,3,4时,变量v
5、对应的值依次为2,3,4,6,则变量x和y,变量u和v的相关关系是( )A.变量x和y是正相关,变量u和v是正相关B.变量x和y是正相关,变量u和v是负相关C.变量x和y是负相关,变量u和v是负相关D.变量x和y是负相关,变量u和v是正相关答案 D2.(2017湖南邵阳二模,3)假设有两个分类变量X和Y的22列联表:y1 y2 总计x1 a 10 a+10x2 c 30 c+30总计 60 40 100对同一样本,以下数据能说明X与Y有关系的可能性最大的一组为( )A.a=45,c=15 B.a=40,c=20C.a=35,c=25 D.a=30,c=30答案 A3.(2017湖南益阳调研,4
6、)某公司20102015年的年利润(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:年份 2010 2011 2012 2013 2014 2015利润x(百万元) 12.2 14.6 16 18 20.4 22.3支出y(百万元) 0.62 0.74 0.81 0.89 1.00 1.11根据统计资料,则( )A.年利润中位数是16,y与x具有正的线性相关关系4B.年利润中位数是17,y与x具有正的线性相关关系C.年利润中位数是17,y与x具有负的线性相关关系D.年利润中位数是18,y与x具有负的线性相关关系答案 B4.(2016江西鹰潭一模,3)以下四个命题:从匀速传送的
7、产品生产流水线上,质检员每20分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样.两个随机变量相关性越强,则相关系数的绝对值越接近于1.在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位.对分类变量X与Y的随机变量K 2的观测值k来说,k越小,“X与Y有关系”的把握程度越大其中正确的是( )A. B.C. D.答案 B5.(2017广东惠州第三次调研,14)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表):零件数x(个) 10 20 30 40 50加工时间y(分钟) 62 68 75 81
8、89由最小二乘法求得回归方程为=0.67x+,则的值为 . 答案 54.9B组 20162018年模拟提升题组(满分:40分 时间:50分钟)一、选择题(每小题5分,共15分)1.(2018山东实验中学上学期第二次诊断,11)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下列联表:男 女 总计爱好 40 20 60不爱好 20 30 50总计 60 50 110由K 2=并参照附表,得到的正确结论是 ( )附表:P(K2k) 0.050 0.010 0.001k 3.841 6.635 10.828A.在犯错误的概率不超过1%的前提下
9、,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”答案 A2.(2017江西南城一中、高安中学等九校3月联考,7)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.非一线 一线 总计愿生 45 20 65不愿生 13 22 35总计 58 42 1005由K 2=,得K 2=9.616.参照下表,P(K2k) 0.050 0.010 0.001k 3.
10、841 6.635 10.828正确的结论是( )A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”答案 C3.(2017福建福州外国语学校适应性考试(一),5)如下表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归方程为=0.8x-155,后因某未知原因第5组数据的y值模糊不清,此位置数据记为m(如表所示),则利用回归方程可求得实数m的值为( )x 196 197 200
11、203 204y 1 3 6 7 mA.8.3 B.8.2 C.8.1 D.8答案 D二、解答题(共25分)4.(2018广东东莞模拟,19)某城市随机抽取一年(365天)内100天的空气质量指数AQI的监测数据,结果统计如下:AQI 0,50 (50,100 (100,150 (150,200 (200,250 (250,300 300空气质量 优 良轻微污染轻度污染中度污染中度重污染重度污染天数 4 13 18 30 9 11 15记某企业每天由空气污染造成的经济损失为S(单位:元),空气质量指数AQI为.在区间0,100对企业没有造成经济损失;在区间(100,300对企业造成经济损失成直
12、线模型(当AQI为150时,造成的经济损失为500元,当AQI为200时,造成的经济损失为700元);当AQI大于300时,造成的经济损失为2 000元.(1)试写出S()的表达式;(2)试估计在本年内随机抽取一天,该天经济损失S大于200元且不超过600元的概率;(3)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染,完成下面22列联表,并判断能否有95%的把握认为该城市本年空气重度污染与供暖有关.非重度污染 重度污染 合计供暖季非供暖季合计 100附:P(K2k 0)0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 1.32 2.07
13、2.70 3.84 8.02 6.63 7.87 10.826K2=.解析 (1)由已知可得S()=(2)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A,由2003.84,所以有95%的把握认为该城市本年空气重度污染与供暖有关.5.(2017河南百校联盟4月模拟,18)国内某知名连锁店分店开张营业期间,在固定的时间段内消费达到一定标准的顾客可参加一次抽奖活动,随着抽奖活动的有效开展,参与抽奖活动的人数越来越多,该分店经理对开业前7天参加抽奖活动的人数进行统计,y表示开业第x天参加抽奖活动的人数,得到统计表格如下:x 1 2 3 4 5 6 7y 5 8 8 10
14、 14 15 17经过进一步统计分析,发现y与x具有线性相关关系.(1)根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;(2)若该分店此次抽奖活动自开业起,持续10天,参加抽奖的每位顾客抽到一等奖(奖品价值200元)的概率为,抽到二等奖(奖品价值100元)的概率为,抽到三等奖(奖品价值10元)的概率为.试估计该分店在此次抽奖活动结束时共送出价值多少元的奖品.参考公式:=,=-.解析 (1)依题意知=(1+2+3+4+5+6+7)=4,=(5+8+8+10+14+15+17)=11,=2,=-=11-24=3,则y关于x的线性回归方程为=2x+3.(2)设一位参加抽奖的顾客获得
15、的奖品价值X元,则X的分布列为X 200 100 10PEX=200+100+10=.由y关于x的线性回归方程为=2x+3,得x=8时,=19,x=9时,=21,x=10时,=23,则此次活动参加抽奖的人数约为5+8+8+10+14+15+17+19+21+23=140,又140=8 800,所以估计该分店在此次抽奖活动结束时共送出价值8 800元的奖品.C组 20162018年模拟方法题组方法1 回归直线方程的求解1.(2017陕西汉中一模,3)已知两个随机变量x,y之间的相关关系如表所示:x -4 -2 1 2 4y -5 -3 -1 -0.5 1根据上述数据得到的回归方程为=x+,则大致可以判断( )A.0,0 B.0,0 D.5.024,所以在犯错误的概率不超过0.025的前提下认为课程的选择与性别有关.