(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc

上传人:feelhesitate105 文档编号:1220057 上传时间:2019-06-07 格式:DOC 页数:16 大小:2.88MB
下载 相关 举报
(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc_第1页
第1页 / 共16页
(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc_第2页
第2页 / 共16页
(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc_第3页
第3页 / 共16页
(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc_第4页
第4页 / 共16页
(新课改省份专用)2020版高考数学一轮复习第九章统计与统计案例第一节统计讲义(含解析).doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、1第一节 统计突破点一 随机抽样基 本 知 识 1简单随机抽样(1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本( n N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数法2系统抽样在抽样时,将总体分成均衡的几个部分,然后按照事先确定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样方法叫做系统抽样(也称为机械抽样)3分层抽样在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样4

2、三种抽样方法的比较类别 共同点 各自特点 相互联系 适用范围简单随机抽样 从总体中逐个抽取是后两种方法的基础总体中的个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样元素个数很多且均衡的总体抽样分层抽样均为不放回抽样,且抽样过程中每个个体被抽取的机会相等 将总体分成几层,分层按比例进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成基 本 能 力 一、判断题(对的打“” ,错的打“”)(1)简单随机抽样是一种不放回抽样( )(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关( )(3)系统抽样在起始部分抽样时采用简单随机抽

3、样( )2(4)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除 2 个学生,这样对被剔除者不公平( )(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关( )答案:(1) (2) (3) (4) (5)二、填空题1在“世界读书日”前夕,为了了解某地 5 000 名居民某天的阅读时间,从中抽取了200 名居民的阅读时间进行统计分析在这个问题中,5 000 名居民的阅读时间的全体是_答案:总体2某班共有 52 人,现根据学生的学号,用系统抽样的方法,抽取一个容量为 4 的样本,已知 3 号,29 号,42 号学生在样本中,那么样本中还有一个学生的学号是_答案

4、:163甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法从中抽取一个容量为 80 的样本进行质量检测若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为_件答案:1 8001系统抽样的最基本特征是“等距性” ,一般地,每组内所抽取的号码依据第一组抽取的号码和组距确定每组抽取的号码依次构成一个以第一组抽取的号码 m 为首项、组距d 为公差的等差数列 an,第 k 组抽取的号码为 ak m( k1) d.2分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .样 本 容 量总 体 容 量 各 层 样 本 数 量各 层 个 体 数 量典 例 感 悟 1

5、(2018河北石家庄二中三模)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取 40 名同学进行检查,将学生从 11 000 进行编号,现已知第 18 组抽取的号码为 443,则第一组用简单随机抽样抽取的号码为( )A16 B17C18 D19解析:选 C 从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样的分段间隔为 25,设第一组随机抽取的号码为 x,则抽取的第 18 组的号码为1 00040x1725443, x18.故选 C.2(2019吉林通化模拟)分层抽样是将总体分成互不交叉的层,然后按照一定的比例,3从各层独立地抽取一定数量的个体,组

6、成一个样本的抽样方法在九章算术第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱欲以钱多少衰出之,问各几何?”其译文为:今有甲持 560 钱,乙持 350 钱,丙持 180 钱,甲、乙、丙三人一起出关,关税共 100 钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法错误的是( )A甲应付 51 钱41109B乙应付 32 钱24109C丙应付 16 钱56109D三者中甲付的钱最多,丙付的钱最少解析:选 B 依题意由分层抽样可知,100(560350180) ,10109则甲应付: 56051 (钱);10109 411

7、09乙应付: 35032 (钱);10109 12109丙应付: 18016 (钱)10109 56109方 法 技 巧 系统抽样和分层抽样中的计算(1)系统抽样总体容量为 N,样本容量为 n,则要将总体均分成 n 组,每组 个(有零头时要先去掉)Nn若第一组抽到编号为 k 的个体,则以后各组中抽取的个体编号依次为k , k( n1) .Nn Nn(2)分层抽样按比例抽样,计算的主要依据是:各层抽取的数量之比总体中各层的数量之比针 对 训 练 1(2019唐山模拟)用简单随机抽样的方法从含有 100 个个体的总体中抽取一个容量为 5 的样本,则个体 M 被抽到的概率为( )A. B.1100

8、199C. D.120 1504解析:选 C 一个总体含有 100 个个体,每个个体被抽到的概率为 ,用简单随机抽1100样方法从该总体中抽取容量为 5 的样本,则每个个体被抽到的概率为 5 .1100 1202(2019江西八校联考)从编号为 001,002,500 的 500 个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为 007,032,则样本中最大的编号应该为( )A480 B481C482 D483解析:选 C 根据系统抽样的定义可知样本的编号成等差数列,令 a17, a232,则d25,所以 725( n1)500,所以 n20,最大编号为 7251948

9、2.3(2019陕西部分学校摸底检测)某单位有老年人 27 人,中年人 54 人,青年人 81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为 42 的样本,则应分别抽取老年人、中年人、青年人的人数是( )A7,11,18 B6,12,18C6,13,17 D7,14,21解析:选 D 因为该单位共有 275481162(人),样本容量为 42,所以应当按 的比例分别从老年人、中年人、青年人中抽取样本,且应分别抽取的人数是42162 7277,14,21.故选 D.4(2018全国卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异为了解客户的评价,该公司准备进行抽样

10、调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是_解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样答案:分层抽样突破点二 用样本估计总体基 本 知 识 1频率分布直方图和茎叶图(1)作频率分布直方图的步骤求极差(即一组数据中最大值与最小值的差);决定组距与组数;将数据分组; 列频率分布表;画频率分布直方图(2)频率分布折线图和总体密度曲线5频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲

11、线,统计中称这条光滑曲线为总体密度曲线(3)茎叶图的优点茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便2众数、中位数、平均数数字特征 定义与求法 优点与缺点众数 一组数据中重复出现次数最多的数众数体现了样本数据的最大集中点,不受极端值的影响但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点平均数如果有 n 个数据 x1, x2, xn,那么这 n 个数的平均数

12、x x1 x2 xnn平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低3.标准差、方差(1)标准差:样本数据到平均数的一种平均距离,一般用 s 表示, s .1n x1 x 2 x2 x 2 xn x 2(2)方差:标准差的平方 s2 (x1 )2( x2 )2( xn )2,其中1n x x x xi(i1,2,3, n)是样本数据, n 是样本容量, 是样本平均数x (3)方差与标准差相比,都是衡量样本数据离散程度的统计量,但方差因为对标准差进行了平方运算,夸大了样本的偏差程度4平均数、方差公式的推广6若

13、数据 x1, x2, xn的平均数为 ,方差为 s2,则数据x mx1 a, mx2 a, mxn a 的平均数为 m a,方差为 m2s2.x 基 本 能 力 一、判断题(对的打“” ,错的打“”)(1)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数( )(2)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的( )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次( )(5)平均数、众数与中位数从不同的角度描述了一组数据的集中趋

14、势( )(6)一组数据的众数可以是一个或几个,中位数也具有相同的结论( )答案:(1) (2) (3) (4) (5) (6)二、填空题1在样本频率分布直方图中,共有 9 个小长方形若中间一个小长方形的面积等于其他 8 个小长方形面积之和的 ,且样本容量为 140,则中间一组的频数为_25答案:402某学校组织学生参加数学测试,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100,若低于 60 分的人数是 15,则该班的学生人数是_答案:503如图是某班 8 位学生诗词比赛得分的茎叶图,那么这 8 位学生得分的众数和中位数分别为_答案

15、:93,924已知一组正数 x1, x2, x3的方差 s2 (x x x 12),则数据13 21 2 23x11, x21, x31 的平均数为_7答案:3全 析 考 法 考法一 折线图、饼图的应用 例 1 (1)(2018全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A新农村建设后,种植收入减少B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半(2

16、)(2019昆明市高三质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高如图是 2018 年 9 月到 2019 年 2 月这半年来,某个关键词的搜索指数变化的统计图根据该统计图判断,下列结论正确的是( )A这半年来,网民对该关键词相关的信息关注度呈周期性变化B这半年来,网民对该关键词相关的信息关注度不断减弱C从该关键词的搜索指数来看,2018 年 10 月的方差小于 11 月的方差D从该关键词的搜索指数来看,2018 年 12 月的平均值大于 2019 年 1 月的平均值解析 (1)

17、设新农村建设前,农村的经济收入为 a,则新农村建设后,农村经济收入为 2a.新农村建设前后,各项收入的对比如下表:新农村建设前 新农村建设后 新农村建设后 结论8变化情况种植收入 60%a 37%2a74% a 增加 A 错其他收入 4%a 5%2a10% a 增加一倍以上 B 对养殖收入 30%a 30%2a60% a 增加了一倍 C 对养殖收入第三产业收入(30%6%) a36% a(30%28%)2a116% a超过经济收入2a 的一半D 对故选 A.(2)由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,排除 A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不

18、显著,排除 B;由统计图可知,2018 年 10 月该关键词的搜索指数波动较大,11 月的波动较小,所以 2018 年 10月的方差大于 11 月的方差,排除 C;由统计图可知,2018 年 12 月该关键词的搜索指数大多高于 10 000,该月平均值大于 10 000,2019 年 1 月该关键词的搜索指数大多低于 10 000,该月平均值小于 10 000,选 D.答案 (1)A (2)D方 法 技 巧 利用饼图、折线图分析问题的关键是读懂图形,读准图形中给的数据,明确图形中的变化等 考法二 频率分布直方图的应用 例 2 (2018安徽黄山二模)全世界越来越关注环境保护问题,某监测站点于

19、2018年 8 月某日起连续 n 天监测空气质量指数(AQI),数据统计如下表:空气质量指数(g/m 3)0,50 (50,100 (100,150 (150,200 (200,250空气质量等级 优 良 轻度污染 中度污染 重度污染天数 20 40 m 10 5(1)根据所给统计表和频率分布直方图中的信息求出 n, m 的值,并完成频率分布 直方图;(2)由频率分布直方图,求该组数据的平均数与中位数;(3)在空气质量指数分别为(50,100和(150,200的监测数据中,用分层抽样的方法抽9取 5 天,从中任意选取 2 天,求事件 A“两天空气质量等级都为良”的概率解 (1)0.00450

20、, n100,20n2040 m105100, m25.0.008; 0.005; 0.002; 0.001.4010050 2510050 1010050 510050由此完成频率分布直方图,如图:(2)由频率分布直方图得该组数据的平均数为250.00450750.008501250.005501750.002502250.0015095,0,50的频率为 0.004500.2,(50,100的频率为 0.008500.4,中位数为 50 5087.5.0.5 0.20.4(3)由题意知在空气质量指数为(50,100和(150,200的监测天数中分别抽取 4 天和 1天,在所抽取的 5 天中

21、,将空气质量指数为(50,100的 4 天分别记为 a, b, c, d;将空气质量指数为(150,200的 1 天记为 e,从中任取 2 天的基本事件为( a, b),( a, c),( a, d),( a, e),( b, c),( b, d),(b, e),( c, d),( c, e),( d, e),共 10 个,其中事件 A“两天空气质量等级都为良”包含的基本事件为( a, b),( a, c),( a, d),(b, c),( b, d),( c, d),共 6 个,所以 P(A) .610 35方 法 技 巧 1由频率分布直方图进行相关计算时,需掌握的两个关系式(1) 组距频率

22、频 率组 距(2) 频率,此关系式的变形为 样本容量,样本容量频率频数频 数样 本 容 量 频 数频 率2利用频率分布直方图估计样本的数字特征的方法10(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和(3)众数:最高的矩形的中点的横坐标 考法三 茎叶图的应用 例 3 某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民根据这 50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的

23、市民对甲、乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价解 (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为 67,所以该市的市民对乙部门评分的中位数的估计值是 67.66 682(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为 0.1,5500.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别

24、为 0.1,0.16.850(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大方 法 技 巧 1茎叶图的绘制需注意(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据2茎叶图的用途(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎

25、对称,数据分布是否均匀等11(2)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小 考法四 样本的数字特征及其应用 例 4 (2019河南周口上学期期末抽测调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示:(1)请填写下表(写出计算过程):平均数 方差 命中 9 环及 9 环以上的次数甲乙(2)从下列三个不同的角度对这次测试结果进行分析:从平均数和方差相结合看(分析谁的成绩更稳定);从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些);从折线图上两人射击命中环数的走势看(分析谁更有潜力)解 由题

26、图,知甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7.将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9.乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10.将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10.(1) 甲 (56274829)7(环),x110乙 (24672829210)7(环),x110s (57) 2(67) 22(77) 24(87) 22(97) 22甲110 (42024)1.2,110s (27) 2(47) 2(67) 2(77) 22(87) 22(97)2乙11022(107) 2 (259

27、10289)5.4.11012填表如下:平均数 方差 命中 9 环及 9 环以上的次数甲 7 1.2 1乙 7 5.4 3(2)平均数相同, s s ,2甲 2乙甲成绩比乙稳定平均数相同,命中 9 环及 9 环以上的次数甲比乙少,乙成绩比甲好些甲成绩在平均数上下波动;而乙处于上升势头,从第三次以后就没有比甲少的情况发生,乙更有潜力方 法 技 巧 利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定(2)用样本估计总体就是利用样本的数

28、字特征来描述总体的数字特征 集 训 冲 关 1. 某城市收集并整理了该市 2018 年 1 月份至 10 月份各月最低气温与最高气考 法 一 温(单位:)的数据,绘制了下面的折线图已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是( )A最低气温与最高气温为正相关B10 月的最高气温不低于 5 月的最高气温C月温差(最高气温减最低气温)的最大值出现在 1 月D最低气温低于 0 的月份有 4 个解析:选 D 在 A 中,最低气温与最高气温为正相关,故 A 正确;在 B 中,10 月的最高气温不低于 5 月的最高气温,故 B 正确;在 C 中,月温差(最高气温减最

29、低气温)的最大值出现在 1 月,故 C 正确;在 D 中,最低气温低于 0 的月份有 3 个,故 D 错误故选 D.132. 近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按考 法 二 年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间30,40)内的有 2 500 人,在区间20,30)内的有 1 200 人,则 m 的值为( )A0.013 B0.13C0.012 D0.12解析:选 C 由题意,得年龄在区间30,40)内的频率为 0.025100.25,则赞成高校招生改革的市民有 10 000(人),因为年龄在区间20,30)内的有 1 200 人,所以2 5000

30、.25m 0.012.1 20010 000103 一次数学考试后,某老师从甲、乙两个班级中各抽取 5考 法 三 人,记录他们的考试成绩,得到如图所示的茎叶图,已知甲班 5 名同学成绩的平均数为 81,乙班 5 名同学成绩的中位数为 73,则 x y 的值为( )A2 B2C3 D3解析:选 D 由茎叶图知Error!解得 x0, y3,所以 x y3,故选 D.4. 在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的 6 次模考 法 三 、 四 拟测试成绩(百分制)的茎叶图.若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由解:学生甲的平均成绩 甲 82,

31、x68 76 79 86 88 956学生乙的平均成绩 乙 82,x71 75 82 84 86 94614又 s (6882) 2(7682) 2(7982) 2(8682) 2(8882) 2(9582) 22甲1677,s (7182) 2(7582) 2(8282) 2(8482) 2(8682) 2(9482) 22乙16,1673则 甲 乙 , s s ,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,x x 2甲 2乙故可选择学生乙参加知识竞赛5. (2018全国卷)某家庭记录了未使用节水龙头 50 天的日用水量数据考 法 二 、 四 (单位:m 3)和使用了节水龙头 5

32、0 天的日用水量数据,得到频数分布表如下:未使用节水龙头 50 天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)0.6,0.7)频数 1 3 2 4 9 26 5使用了节水龙头 50 天的日用水量频数分布表日用水量0,0.1)0.1,0.2)0.2,0.3)0.3,0.4)0.4,0.5)0.5,0.6)频数 1 5 13 10 16 5(1)在下图中作出使用了节水龙头 50 天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于 0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多

33、少水?(一年按 365 天计算,同一组中的数据以这组数据所在区间中点的值作代表)解:(1)频率分布直方图如图所示15(2)根据频率分布直方图知,该家庭使用节水龙头后 50 天日用水量小于 0.35 m3的频率为 0.20.110.12.60.120.050.48,因此该家庭使用节水龙头后,日用水量小于 0.35 m3的概率的估计值为 0.48.(3)该家庭未使用节水龙头 50 天日用水量的平均数为1 (0.0510.1530.2520.3540.4590.55260.655)x1500.48.该家庭使用了节水龙头后 50 天日用水量的平均数为2 (0.0510.1550.25130.35100.45160.555)0.35.x150估计使用节水龙头后,一年可节省水(0.480.35)36547.45(m 3)16

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 中学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1