1、10.3 统计图表、数据的数字特征、 用样本估计总体,-2-,知识梳理,考点自诊,1.常用统计图表 四种常用的统计图表: 、折线统计图、扇形统计图、 . 2.数据的数字特征 (1)平均数: ,它反映了一组数据的平均水平. (2)中位数:将数据从小到大排列,若有奇数个数则最中间的数是中位数;若有偶数个数则中间两数的平均数是中位数. (3)众数:一组数据中出现次数最多的数. (4)极差:一组数值中最大值与 的差,它反映了一组数据的波动情况. (5)方差:s2= ,它反映了样本数据的离散程度.,条形统计图,茎叶图,最小值,-3-,知识梳理,考点自诊,-4-,知识梳理,考点自诊,3.用样本估计总体 (
2、1)频率分布直方图 含义:频率分布直方图由一些小矩形来表示,每个小矩形的宽度为 ,高为 ,小矩形的面积恰为相应的 ,图中所有小矩形的面积之和为 . 绘制频率分布直方图的步骤为: ;决定组距与组数; ;列频率分布表;画频率分布直方图. (2)频率分布折线图:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线.,xi(分组的宽度),频率fi,1,求极差,将数据分
3、组,-5-,知识梳理,考点自诊,1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 2.若数据x1,x2,xn的平均数为 ,方差为s2,则数据mx1+a,mx2+a,mx3+a,mxn+a的平均数是 ,方差为m2s2.,-6-,知识梳理,考点自诊,1.判断下列结论是否正确,正确的画“”,错误的画“”. (1)平均数、众数与中位数都可以描述数据的集中趋势. ( ) (2)一组数据的方差越大
4、,说明这组数据的波动越大. ( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大. ( ) (4)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次. ( ) (5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. ( ) (6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数. ( ),-7-,知识梳理,考点自诊,2.(2018全国1,文3)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:,-8-
5、,知识梳理,考点自诊,则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半,A,解析:设建设前经济收入为1,则建设后经济收入为2,建设前种植收入为0.6,建设后种植收入为20.37=0.74,故A不正确;建设前的其他收入为0.04,养殖收入为0.3,建设后其他收入为0.1,养殖收入为0.6,故B、C正确;建设后养殖收入与第三产业收入的总和所占比例为58%,故D正确,故选A.,-9-,知识梳理,考点自诊,3.(2018广西柳州中学5月模拟,5
6、)根据下图给出的2000年至2016年我国实际利用外资情况,以下结论正确的是( )A.2000年以来我国实际利用外资规模与年份负相关 B.2010年以来我国实际利用外资规模逐年增加 C.2008年我国实际利用外资同比增速最大 D.2010年以来我国实际利用外资同比增速最大,C,-10-,知识梳理,考点自诊,解析:对于选项A,2000年以来我国实际利用外资规模,基本上是逐年上升的,利用外资规模与年份正相关,所以选项A是错误的;对于选项B,2010年以来我国实际利用外资规模,2012年比2011年少,所以选项B是错误的;对于选项C,从折线图可以看出,2008年我国实际利用外资同比增速最大,所以选项
7、C是正确的;对于选项D,2008年以来我国实际利用外资同比增速最大,所以选项D是错误的.故选C.,-11-,知识梳理,考点自诊,4.(2018宁夏平罗中学5月模拟,3)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20,20,22.5, 22.5,25,25,27.5,27.5,30.根据直方图,这320名学生中每周的自习时间不足22.5小时的人数是( )A.68 B.72 C.76 D.80,B,解析:由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是320(0.02+
8、0.07)2.5=72人,故选B.,-12-,知识梳理,考点自诊,5.(2018江苏,3)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .,90,解析:由题中茎叶图可知, 5位裁判打出的分数分别为89,89,90,91,91, 故平均数为,-13-,考点1,考点2,考点3,频率分布直方图及其应用 例1(2018江西南昌模拟,19)我国是世界严重缺水的国家,城市缺水问题较为突出,某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),用水量不超过x的部分按平价收费,超过x的部分按议价收费,为了了解全市民月
9、用水量的分布情况,通过抽样,获得了100位居民某年的月用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5),分成9组,制成了如图所示的频率分布直方图.,-14-,考点1,考点2,考点3,(1)求直方图中a的值; (2)已知平价收费标准为4元/吨,议价收费标准为8元/吨,当x=3时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替),-15-,考点1,考点2,考点3,解 (1)由频率分布直方图, 可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)0.5=1, 解得a=0.30. (2)设居民月用水量为t吨,相应的水费为y元,由题
10、设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:,-16-,考点1,考点2,考点3,根据题意,该市居民的月平均水费估计为 10.04+30.08+50.15+70.20+90.26+110.15+14 0.06+180.04+220.02=8.42元.,-17-,考点1,考点2,考点3,对点训练1(1)(2018黑龙江大庆二模,11)下面是追踪调查200个某种电子元件寿命(单位:h)的频率分布直方图如图. 其中300400、400500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是( )寿命在300400的频数是90; 寿命在400500的矩形的
11、面积是0.2; 用频率分布直方图估计电子元件的平均寿命为: 1500.1+2500.15+3500.45+4500.15+5500.15; 寿命超过400 h的频率为0.3. A. B. C. D.,B,-18-,考点1,考点2,考点3,(2)(2018四川成都石室中学二诊,12)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).,若要从身高在120,130),130,140),140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为 .,3,-19-,考点1,考点2,考点3,解析: (1)若
12、正确,则300400对应的频率为0.45,则400500对应的频率为0.15,则错误;电子元件的平均寿命为1500.1+2500.15+3500.45+4500.15+5500.15,则正确;寿命超过400 h的频率为0.15+0.15=0.3,则正确,故不符合题意;若正确,则300400对应的频率为0.4,则错误;电子元件的平均寿命为1500.1+2500.15+3500.4+4500.2+5500.15,则错误;寿命超过400 h的频率为0.2+0.15=0.35,则错误,故符合题意.故选B. (2)0.035+a+0.02+0.01+0.005=0.1,解得a=0.03.三组的比值为0.
13、030.020.01=321,故140,150内取18 =3(人).,-20-,考点1,考点2,考点3,茎叶图的应用 例2(1)(2018黑龙江模拟一,4)如图是某样本数据的茎叶图,则该样本的中位数、众数、极差分别是( ) A.32 34 32 B.33 45 35 C.34 45 32 D.33 36 35,B,-21-,考点1,考点2,考点3,(2)(2018河北石家庄二模,9)某学校A、B两个班的数学兴趣小组在一次数学对抗赛中的成绩绘制茎叶图如下,通过茎叶图比较两个班数学兴趣小组成绩的平均值及方差.A班数学兴趣小组的平均成绩高于B班的平均成绩; B班数学兴趣小组的平均成绩高于A班的平均成
14、绩; A班数学兴趣小组成绩的标准差大于B班成绩的标准差; B班数学兴趣小组成绩的标准差大于A班成绩的标准差. 其中正确结论的编号为( ) A. B. C. D.,A,-22-,考点1,考点2,考点3,解析: (1)从茎叶图中知共有16个数据,按照从小到大排序后中间的两个数据为32,34,所以这组数据的中位数为33;45出现的次数最多,所以这组数据的众数为45;最大值是47,最小值是12,故极差为35,故选B. (2)A班平均值78,标准差11.03.B班平均值66,标准差13.24,故A班平均值高,标准差小,故选A.,-23-,考点1,考点2,考点3,思考如何制作茎叶图?使用茎叶图统计数据有什
15、么优缺点?如何用茎叶图估计样本数据特征? 解题心得1.一般制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序由上到下列出. 2.茎叶图的优缺点如下: (1)优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况. (2)缺点:样本数据较多或数据位数较多时,不方便表示数据. 3.对于给定两组数据的茎叶图,可根据“重心”下移者平均数较大,数据集中者方差较小来估计数字特征.,-24-,考点1,考点2,考点3,对点训练2(1)(2018湖北5月冲刺,2)某学校在校艺术节活动中,有24名学生参加了学校组
16、织的唱歌比赛,他们比赛的成绩的茎叶图如图所示,将他们的比赛成绩从低到高编号为124号,再用系统抽样方法抽出6名同学周末到某音乐学院参观学习,则样本中比赛成绩不超过85分的学生人数为( ) A.1 B.2 C.3 D.不确定 (2)(2018安徽芜湖5月模拟,13)某校开展“爱我家乡”演讲比赛,9位评委给小明同学打分的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字在茎叶图中无法看清,若记分员计算无误,则数字x= .,B,1,-25-,考点1,考点2,考点3,-26-,考点1,考点2,考点3,样本的数字特征及其应用 例3(1)(2018云南
17、曲靖一中4月模拟,5)我校高三8个学生参加数学竞赛的得分用茎叶图表示,其中茎为十位数,叶为个位数,则这组数据的平均数和方差分别是( )A.91 9.5 B.91 9 C.92 8.5 D.92 8,A,-27-,考点1,考点2,考点3,C,-28-,考点1,考点2,考点3,-29-,考点1,考点2,考点3,思考众数、中位数、平均数及方差的意义有什么不同? 解题心得1.众数、中位数、平均数及方差的意义: (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述; (2)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. 2.平均数、方差的公式推广:,-30-,考点1,考点2,考
18、点3,对点训练3(1)(2018河北衡水模拟,3改编)若x1,x2,x2 021的平均数为3,方差为4,且yi=-2(xi-2),i=1,2,2 021,则新数据y1,y2,y2 021的平均数和标准差分别为( ) A.-4 -4 B.-4 16 C.2 8 D.-2 4 (2)(2018四川乐山四校联考,14)已知总体的各个体的值从小到大为:-3,0,3,x,y,6,8,10,且总体的中位数为4.若要使该总体的方差最小,则2x-y= .,D,4,-31-,考点1,考点2,考点3,-32-,考点1,考点2,考点3,-33-,考点1,考点2,考点3,1.两个易误点 (1)易忽视频率分布直方图中纵
19、轴表示的应为 . (2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中“茎”与“叶”的含义. 2.众数、中位数和平均数的异同,-34-,考点1,考点2,考点3,3.标准差和方差的异同相同点:标准差和方差描述了一组数据围绕平均数波动的大小. 不同点:方差与原始数据的单位不同,且平方后可能夸大了偏差程度,标准差则不然. 4.频率与频率比,-35-,考点1,考点2,考点3,不要搞混直方图与条形图: (1)条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)是固定的;直方图是用面积表示各组频率的多少,矩形的高度表示每一组的频率除以组距,宽度则表示各组的组距
20、,因此其高度与宽度均有意义. (2)由于分组数据具有连续性,因此直方图的各矩形通常是连续排列,而条形图则是分开排列.,-36-,数学核心素养例释数据分析 数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,并形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型,对信息进行分析、推断,获得结论. 在数据分析核心素养的形成过程中,学生能够提升数据处理的能力,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯,积累依托数据探索事物本质、关联和规律的活动经验.,-37-,典例(2018全国1,文19)某家庭记录了未使用节水龙头50天的日用水量数据(单
21、位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:,-38-,(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.),-39-,解 (1),-40-,-41-,解题指导该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果. 反思提升1.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.频率分布表在数量表示上比较准确,频率分布直方图比较直观. 2.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以所有小长方形的面积的和等于1.,