2019高考数学二轮复习第15讲统计与统计案例课件理.pptx

上传人:rimleave225 文档编号:1101029 上传时间:2019-04-17 格式:PPTX 页数:41 大小:1.37MB
下载 相关 举报
2019高考数学二轮复习第15讲统计与统计案例课件理.pptx_第1页
第1页 / 共41页
2019高考数学二轮复习第15讲统计与统计案例课件理.pptx_第2页
第2页 / 共41页
2019高考数学二轮复习第15讲统计与统计案例课件理.pptx_第3页
第3页 / 共41页
2019高考数学二轮复习第15讲统计与统计案例课件理.pptx_第4页
第4页 / 共41页
2019高考数学二轮复习第15讲统计与统计案例课件理.pptx_第5页
第5页 / 共41页
点击查看更多>>
资源描述

1、第15讲 统计与统计案例,总纲目录,考点一 抽样方法抽样方法主要有简单随机抽样、系统抽样、分层抽样三种, 这三种抽样方法各自适用不同特点的总体,但无论哪种抽样方法, 每一个个体被抽到的概率都是相等的,都等于样本容量和总体容 量的比值.,1.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们 随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法 抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问 卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C,则 抽到的人中,做问卷B的人数为 ( ) A.7 B.9 C.10 D.15,答案 C 抽取号码的间隔为

2、=30,从而区间451,750包含的 段数为 - =10,则编号落入区间451,750的人数为10人,即做 问卷B的人数为10.,2.(2018课标全国文,14,5分)某公司有大量客户,且不同年龄段 客户对其服务的评价有较大差异.为了解客户的评价,该公司准备 进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样 和系统抽样,则最合适的抽样方法是 .,答案 分层抽样,解析 因为客户数量大,且不同年龄段客户对其服务的评价有较 大差异,所以最合适的抽样方法是分层抽样.,3.(2018惠州第二次调研)某班共有56人,学号依次为1,2,3,56,现 用系统抽样的方法抽取一个容量为4的样本,已知学号为

3、2,30,44 的同学在样本中,则样本中还有一位同学的学号为 .,答案 16,解析 由题意得,需要将56人按学号从小到大排列后分成4组,每 组抽取第2个学号对应的同学,所以还有一位同学的学号为114+ 2=16.,方法归纳,解决抽样问题的方法 (1)解决此类题目的关键是深刻理解各种抽样方法的特点和适用 范围. (2)在系统抽样的过程中,要注意分段间隔,需要抽取n个个体,样本 就需要分成n个组,则分段间隔为 (N为样本容量),首先确定在第 一组中抽取的个体的号码,再从后面的每组中按规则抽取每个个 体.,考点二 用样本估计总体,1.直方图的两个结论 (1)小长方形的面积=组距 =频率. (2)各小

4、长方形的面积之和等于1.,2.统计中的四个数字特征 (1)众数:在样本数据中,出现次数最多的那个数据. (2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如 果数据的个数为偶数,就取中间两个数据的平均数作为中位数.,(3)平均数:样本数据的算术平均数,即= (x1+x2+xn). (4)方差与标准差 方差:s2= (x1- )2+(x2- )2+(xn- )2. 标准差:s= .,命题角度一 样本的数字特征,例1 在一个容量为5的样本中,数据均为整数,已求出其平均数为 10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损, 即9,10,11,1,那么这组数据的方差s2可能的

5、最大值是 .,答案 32.8,解析 设这组数据的最后两个数分别是10+x,y(x为0,9中的自然 数,y为整数),则9+10+11+(10+x)+y=50,得x+y=10,故y=10-x,故s2= = + x2,显然x取9时,s2有最大值32.8.,方法归纳,关于平均数、方差的计算 样本数据的平均数与方差的计算关键在于准确记忆公式,要特别 注意区分方差与标准差,不能混淆,标准差是方差的算术平方根.,例2 (2018课标全国文,19,12分)某家庭记录了未使用节水龙 头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用 水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频

6、数分布表,命题角度二 直方图与茎叶图,使用了节水龙头50天的日用水量频数分布表,(1)作出使用了节水龙头50天的日用水量数据的频率分布直 方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;,(3)估计该家庭使用节水龙头后,一年能节省多少水.(一年按365天 计算,同一组中的数据以这组数据所在区间中点的值作代表),解析 (1)如图所示.(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35 m3的频率为0.20.1+10.1+2.60.1+20.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计 值为0.48. (3)该家庭未使用节

7、水龙头50天日用水量的平均数为= (0.051+0.153+0.252+0.354+0.459+0.5526+0.655) =0.48. 该家庭使用了节水龙头后50天日用水量的平均数为= (0.051+0.155+0.2513+0.3510+0.4516+0.555)=0.3 5. 估计使用节水龙头后,一年可节省水(0.48-0.35)365=47.45(m3).,方法归纳,众数、中位数、平均数与直方图的关系 (1)众数为频率分布直方图中最高矩形的底边中点的横坐标. (2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横 轴交点的横坐标. (3)平均数等于频率分布直方图中每个小矩形的面积乘

8、小矩形底 边中点的横坐标之和.,1.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中 两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是 88,乙组学生成绩的中位数是89,则n-m的值是 ( )A.5 B.6 C.7 D.8,答案 B 由题意得:解得m=3,n=9, 所以n-m=9-3=6.,2.(2018贵阳第一学期检测)在某中学举行的环保知识竞赛中,将 三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的 频率分布直方图,图中从左到右依次为第一、第二、第三、第 四、第五小组,已知第二小组的频数是40,则成绩在80100分的学 生人数是 ( ),A.15 B.18 C.2

9、0 D.25,答案 A 根据频率分布直方图,得第二小组的频率是0.0410= 0.4,第二小组的频数是40,样本容量是 =100,又成绩在801 00分的频率是(0.01+0.005)10=0.15,成绩在80100分的学生人 数是1000.15=15.选A.,3.(2018兰州诊断考试)已知样本数据a1,a2,a2 018的方差是4,如果 有bi=ai-2(i=1,2,2 018),那么数据b1,b2,b2 018的标准差为 .,答案 2,解析 bi=ai-2(i=1,2,2 018),数据b1,b2,b2 018的方差和样本 数据a1,a2,a2 018的方差相等,均是4,所以数据b1,b

10、2,b2 018的标准 差为2.,考点三 统计案例,1.线性回归方程= - ;( , ) 称为样本点的中心.,2.随机变量 K2= (K2也可表示为2). 若K23.841,则有95%的把握说两个事件有关; 若K26.635,则有99%的把握说两个事件有关.,命题角度一 回归分析,例1 (2018课标全国,18,12分)下图是某地区2000年至2016年 环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间,变量t的两个线性回归模型.根据2000年至2016年的数据(时间变 量t的值依次为1,2,17)建立模型: =-30.4+13.5t;根

11、据2010年 至2016年的数据(时间变量t的值依次为1,2,7)建立模型: =9 9+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额 的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.,解析 (1)利用模型,可得该地区2018年的环境基础设施投资额 的预测值为 =-30.4+13.519=226.1(亿元). 利用模型,可得该地区2018年的环境基础设施投资额的预测值 为 =99+17.59=256.5(亿元). (2)利用模型得到的预测值更可靠. 理由如下: (i)从折线图可以看出,2000年至2016年的数据对应的点没有随机 散布在直线y=

12、-30.4+13.5t上下,这说明利用2000年至2016年的数 据建立的线性模型不能很好地描述环境基础设施投资额的变 化趋势.2010年相对2009年的环境基础设施投资额有明显增加,20,10年至2016年的数据对应的点位于一条直线的附近,这说明从20 10年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010年至2016年的数据建立的线性模型 =99+17.5t可以较好地 描述2010年以后的环境基础设施投资额的变化趋势,因此利用模 型得到的预测值更可靠. (ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元, 由模型得到的预测值226.1亿元的增幅明显偏低,而利

13、用模型 得到的预测值的增幅比较合理,说明利用模型得到的预测值更 可靠. (以上给出了2种理由,考生答出其中任意一种或其他合理理由均,可得分),方法归纳,求回归直线方程的方法 (1)若所求的回归直线方程是在选择题中,常利用回归直线必经过 样本点的中心( , )快速解决. (2)若所求的回归直线方程是在解答题中,则求回归直线方程的一 般步骤:依据样本数据画出散点图,确定两个变量具有线性相关 关系;计算 , , , xiyi的值;计算回归系数 , ;写出回归 直线方程 = x+ .,例2 (2018西安八校联考)某工厂有25周岁以上(含25周岁)工人3 00名,25周岁以下工人200名.为研究工人的

14、日平均生产件数是否 与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统 计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以 上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日 平均生产件数分成5组:50,60),60,70),70,80),80,90),90,100,分 别加以统计,得到如图所示的频率分布直方图.,命题角度二 独立性检验,(1)根据“25周岁以上(含25周岁)组”的频率分布直方图,求25岁 以上(含25周岁)组工人日平均生产件数的中位数的估计值(四舍 五入保留整数);,(2)规定日平均生产件数不少于80的工人为生产能手,请你根据已 知条件完成22

15、列联表,并判断是否有90%的把握认为“生产能 手与工人所在的年龄组有关”.,附:K2= .,解析 采用分层抽样,“25周岁以上(含25周岁)组”应抽取工人1 00 =60(名),“25周岁以下组”应抽取工人100=40(名). (1)由“25周岁以上(含25周岁)组”的频率分布直方图可知,其中 位数为70+10 =70+ 73(件). 综上,25周岁以上(含25周岁)组工人日平均生产件数的中位数的 估计值为73件. (2)由频率分布直方图可知,25周岁以上(含25周岁)的生产能手共 有60(0.020 0+0.005 0)10=15(名),25周岁以下的生产能手共有,40(0.032 5+0.

16、005 0)10=15(名),则22列联表如下:,K2= = 1.7862.706, 所以没有90%的把握认为“生产能手与工人所在的年龄组有 关”.,方法归纳,独立性检验的关键 (1)根据22列联表准确计算K2的观测值k0,若没有列出22列联表, 要先列出此表. (2)K2的观测值k0越大,对应假设事件H0成立(两类变量相互独立) 的概率越小,H0不成立的概率越大.,1.某医疗研究所为了检验某种血清能起到预防感冒的作用,把500 名使用血清的人与另外500名未使用血清的人一年中的感冒记录 作比较,利用22列联表计算得K2的观测值k03.918. 附表:,则作出“这种血清能起到预防感冒的作用”出

17、错的可能性不超 过( ) A.95% B.5% C.97.5% D.2.5%,答案 B 因为观测值k03.9183.841,所以对照题目中的附表, 得P(K2k0)=0.05=5%.,2.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售 市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的 产品销量x(单位:千箱)与单位成本y(单位:元)的资料进行线性回 归分析,得到结果如下:= , =71, =79, xiyi=1 481. 则销量每增加1千箱,单位成本约下降 元(结果保留5位 有效数字). 附:回归直线的斜率和截距的最小二乘估计分别为 = ,= - .,答案 1.818 2,解析 由题意知 = -1.818 2,=71-(-1.818 2) 77.364, 所以 =-1.818 2x+77.364, 所以销量每增加1千箱,则单位成本约下降1.818 2元.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教学课件 > 中学教育

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1