1、1专题 15 统计的命题规律【学习目标】1会收集现实问题中两个有关联变量的数据并作出散点图,会利用散点图直观认识变量间的相关关系;2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;3了解独立性检验(只要求 22 列联表)的基本思想、方法及其简单应用;4了解回归的基本思想、方法及简单应用【知识要点】1抽样方法(1)抽样要具有随机性、等可能性,这样才能通过对样本的分析和研究更准确的反映总体的情况,常用的抽样方法有简单随机抽样、系统抽样和分层抽样(2)简单随机抽样是指一个总体的个数为 (较小的有限数),通过逐个抽取一个样本,且每次抽取时每个个体被抽取的概率相等简单随机抽样的两
2、种常用方法为抽签法和随机数表法(3)分层抽样是总体由差异明显的几部分组成,常将总体按差异分成几个部分,然后按各部分所占比例抽样,其中所分成的各部分叫做层(4)系统抽样是当总体中的个数较多时,将总体均分成几部分,按事先按确定的在各部分抽取2总体分布的估计(1)作频率分布直方图的步骤:求极差(即一组数据中最大值与最小值的差)决定组距与组数将数据分组列频率分布表(下图)分组 频数 频率 累计频率01)t,1r1f 1f2,22 2 1kt ,krkf2画频率分布直方图,将区间 )ab, 标在横轴上,纵轴表示频率与组距的比值,以每个组距为底,以各频率除以组距的商为高,分别画矩形,共得 k个矩形,这样得
3、到的图形叫频率分布直方图频率分布直方图的性质:第 i个矩形的面积等于样本值落入区间 1)iit , 的频率;由于,所以所有小矩形的面积的和为 1. 三高考命题类型分析(一)随机抽样例 1从 2018 名学生中选取 50 名学生参加某一活动,若采用下面的方法选取:先用简单随机抽样从 2018人中剔除 18 人,剩下的 2000 人再按系统抽样的方法抽取 50 人,则在这 2018 人中,每个人入选的概率 ( )A不全相等 B均不相等 C都相等,且为 D都相等,且为【答案】C【解析】【详解】因为简单随机抽样和系统抽样都是等可能抽样,从 个个体中抽取 个个体,则每个个体被抽到的概率都等于 ,即从 2
4、 018 名学生中选取 50 名学生参加全国数学联赛,每人入选的概率都相等,且为,故选 C.练习 1下列说法中错误的是( )A先把高二年级的 2000 名学生编号为 1 到 2000,再从编号为 1 到 50 的 50 名学生中随机抽取 1 名学生,其编号为 ,然后抽取编号为 , , 的学生,这样的抽样方法是系统抽样法;B独立性检验中, 越大,则越有把握说两个变量有关;C若两个随机变量的线性相关性越强,则相关系数 的值越接近于 1;D若一组数据 1、 a、3 的平均数是 2,则该组数据的方差是 .【答案】C【解析】对于 A,根据个体数目较多,且没有明显的差异,抽取样本间隔相等,知这种抽样方法是
5、系统抽样法, A 正确;对应 B,独立性检验中, 越大,应该是说明两个变量有关系的可能性大,即有足够的把握说明两个变量有3关, B 正确;对于 C,两个随机变量的线性相关性越强,则相关系数| r|的值越接近于 1, C 错误;对于 D,一组数据 1、 a、3 的平均数是 2, a2;该组数据的方差是 s2 (12) 2+(22) 2+(32) 2 , D 正确故选:C. 上购物经历的人数,所得数据的茎叶图如图所示,则这 20 个班有网购经历的人数的众数为( )A24 B37 C35 D48【答案】C【解析】这 20 个班有网购经历的人数最多的数字为 35; 所以众数为 35,故选 C【点睛】本
6、题主要考查利用茎叶图求众数,意在考查对基础知识的掌握与应用,是基础题练习 2已知一组数据 3,4,5, a, b 的平均数是 4,中位数是 m,从 3,4,5 , a, b, m 这组数据中任取一数,取到数字 4 的概率为 ,那么 3,4,5, a, b 这组数据的方差为( )A B2 C D【答案】D【解析】根据 3,4,5, a, b 的平均数是 4,中位数是 m,从 3,4,5, a, b, m 这组数据中任取一数,取到数字 4 的概率为 ,可知 ,由方差公式求解即可.(三)频率分布直方图例 3.例 3.2017 年 APEC 会议于 11 月 10 日至 11 日在越南岘港举行,某研究
7、机构为了了解各年龄层对APEC 会议的关注程度,随机选取了 100 名年龄在20,45内的市民举行了调查,并将结果绘制成如图所示4的频率分布直方图(分组区间分布为20,25) ,25.30) ,30,35) ,35,40) ,40,45) (1)求选取的市 民年龄在30,35)内的人数;(2)若从第 3,4 组用分层抽样的方法选取 5 名市民进行座谈,再从中选取 2 人参与 APEC 会议的宣传活动,求参与宣传活动的市民中至少有一人的年龄在35,40)内的概率【答案】 (1)30; (2) . 【解析】 (1)由频率分布直方图可得年龄在 内的频率为 ,从而可得结果;(2)利用分层抽样的方法可知
8、,所选的 5 人中,从第 3 组选 3 人,从第 4 组选 2 人,利用列举法,求出总事件以及至少有一人的年龄在 内的事件,再利用古典概型概率公式即可得出结果.【详解】 (1)由频率分布直方图可得年龄在30,35)内的频率为 0.065=0.3,则选取的市民年龄在30,35)内的人数 0.3100=30;【点睛】本题考查古典概率概率公式与频率分布直方图的应用,属于中档题利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有 (1)枚举法:适合给定的基本事件个数较5少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺
9、序逐个写出:先 , . ,再 , 依次 . 这样才能避免多写、漏写现象的发生. 练习 3某市要对 2000 多名出租车司机的年龄进行调査,现从中随机抽出 100 名司机,已知该市的司机年龄都在20,45之间,根据调査结果得出司机的 年龄情况的频率分布直方图如图所示,估计该市出租车司机年龄在 频率是( )A0.02 B0.04 C0.2 D0.84【答案】C(四)茎叶图例 4将甲、乙两名同学 5 次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是( )A ;乙比甲成绩稳定 B ;甲比乙成绩稳定C ;乙比甲成绩稳定 D ;甲比乙成绩稳定【答案】A 6练习 1为比较
10、甲、乙两地某月 12 时的气温状况,随机选取该月中的 5 天,将这 5 天中 12 时的气温数据(单位: )制成如图所示的茎叶图.考虑以下结论:甲地的平均气温低于乙地的平均气温;甲地的平均气温高于乙地的平均气温;甲地气温的标准差小于乙地气温的标准差;甲地气温的标准差大于乙地气温的标准差.其中根据茎叶图能得到的统计结论的标号为( )A B C D【答案】B【解析】由已知的茎叶图,我们易分析出甲、乙两地某月 12 时的气温抽取的样本温度,进而求出两组数据的平均数、方差,可得答案【详解】由茎叶图中的数据,我们可得甲,乙两地某月 12 时的气温抽取的样本温度分别为:甲:26,28,29,31,31乙:
11、28,29,30,31,32;7所以甲地该月 12 时的气温的标准差大于乙地该月 12 时的气温标准差.正确,故选 B. 故数据的方差是 ,故标准差是 ,故选: D【点睛】本题考查了解方程组问题,考查求数据的平均数和方差问题,是一道基础题练习 2若样本 的平均数是 ,方差是 ,则对样本,下列结论正确的是 ( )A平均数为 14,方差为 5 B平均数为 13,方差为 25C平均数为 13,方差为 5 D平均数为 14,方差为 2【答案】C【解析】根据平均数和方差的定义和性质进行求解即可8【点睛】本题主要考查样本数据的方差和平均数的计算,根据相应的公式进行计算是解决本题的关键(七)极差、方差、标准
12、差例 7已知某 7 个数的平均数为 3,方差为 ,现又加入一个新数据 3,此时这 8 个数的平均数为 x,方差为 ,则( )A , B , C , D ,【答案】B【解析】由题设条件,利用平均数和方差的计算公式,进行求解,即可得到答案.【详解】由题意,根据这 7 个数的平均数为 3,方差为 ,即 , ,即 ,现又加入一个新数据 3,此时这 8 个数的平均数为 ,方差为 ,即 ,故选 B. 练习 1在下列命题中,下列选项正确的是( )A在回归直线 中,变量 时,变量 的值一定是 15.B两个变量相关性越强,则相关系数 就越接近于 1.C在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的
13、模型比较合适,与带状区域的宽度无关.9D若 是两个相等的非零实数,则 是纯虚数.【答案】D【解析】根据回归方程的定义判断 ;根据相关系数的定义判断 ;根据残差图的性质判断 ;根据纯虚数的定义判断 .【点睛】本题主要通过对多个命题真假的判断,主要综合考查回归方程的定义、相关系数的定义、残差图的性质、纯虚数的定义,属于中档题.这种题型综合性较强,也是高考的命题热点,做这类题目要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的、自己已经掌握的知识点入手,然后集中精力突破较难的命题.(九)回归分析例 926已知某商品的价格 (元)与需求量 (件)之间的关系有如下一组数据:x 14 16
14、18 20 22y 12 10 7 5 3; 参考: ;当 时 , ,(1)求 , ;(2)求出回归直线方程;(3)计算相关系数 r 的值,并说明回归模型拟合程度的好坏。【答案】 (1) ;(2) ;(3) ,拟合效果好.【解析】 (1)由平均数公式计算 x, y 的平均值即可;10(2)结合回归方程系数公式和(1)的结论求解回归方程即可;(3)利用相关系数的计算公式求得相关系数即可比较拟合效果的好坏【点睛】本题考查了线性回归方程的实际应用,线性回归方程的性质,相关系数的概念等,重点考查学生的计算能力和对基础概念的理解,属于中等题 练习 1某工厂每日生产一种产品 吨,每日生产的产品当日销售完毕
15、,日销售额为 万元 ,产品价格随着产量变化而有所变化,经过一段时间的产销,得到了 的一组统计数据如下表: (1)请判断 与 中,哪个模型更适合刻画 之间的关系?可从函数增长趋势方面给出简单的理由; (2)根据你的判断及下面的数据和公式,求出 关于 的回归方程,并估计当日产量 时,日销售额是多少?(结果保留整数)参考公式及数据:线性回归方程 中, , ., ,【答案】(1)答案见解析;(2)23 万元.11【解析】分析:(1)从函数增长趋势考虑可知 更适合刻画 之间的关系.(2)由题意可得非线性回归方程为 ,据此预测当日产量 时,日销售额是 23 万元.点睛:本题主要考查非线性回归方程的求解,回
16、归分析的数学思想等知识,意在考查学生的转化能力和计算求解能力.(十一)独立性检验例 11 中华人民共和国道路交通安全法第 47 条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线” , 中华人 民共和国道路交通安全法 第90 条规定:对不礼让行人的驾驶员处以扣 3 分,罚款 50 元的处罚.下表是某市一主干路口监控设备所抓拍的 5 个月内驾驶员不“礼让斑马线”行为统计数据:月份 1 2 3 4 5违章驾驶员人数 120 105 100 90 85(1)请利用所给数据求违章人数 与月份之间的回归直线方程 ;(2)交警从这 5 个月内通过该路口的驾驶员中随机抽查了 50 人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下 列联表:能否据此判断有 的把握认为“礼让斑马线”行为与驾龄有关?不礼让斑马线 礼让斑马线 合计驾龄不超过 1 年 22 8 30驾龄 1 年以上 8 12 2012合计 30 20 50参考公式及数据:.(其中 )【答案】 (1) ;(2)有 的把握认为“礼让斑马线”行为与驾龄关【解析】 (1)利用所给数据计算 、 ,求出回归系数,写出回归直线方程;(2)由列联表中数据计算 K2,对照临界值得出结论 (2) 的可能取值为 , , , ,所以 的分布列为