1、1微专题 1 统计与统计案例命 题 者 说考 题 统 计 考 情 点 击2018全国卷T 3统计图表的应用2018江苏高考T 3茎叶图的应用2017全国卷T 3折线图的识别与应用统计与统计案例的选择题、填空题涉及的内容较为简单,主要有抽样方法、统计图表的应用、用样本的数字特征估计总体、线性回归及统计案例。涉及的分值一般为 5 分。考向一 抽样方法【例 1】 (1)从编号为 01,02,49,50 的 50 个个体中利用下面的随机数表选取 5个个体,选取方法从随机数表第 1 行第 5 列的数开始由左到右依次抽取,则选出来的第 5个个体的编号为( )7816 6572 0812 1463 0782
2、 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481A14 B07C32 D43(2)某班 50 名学生中有女生 20 名,按男女比例用分层抽样的方法,从全班学生中抽取部分学生进行调查,已知抽到的女生有 4 名,则本次调查抽取的人数是( )A8 B10C12 D15解析 (1)由题意知选定的第一个数为 65(第 1 行的第 5 列和第 6 列),按由左到右选取两位数(大于 50 的跳过、重复的不选取),前 5 个个体编号为 08,12,14,07,43。故选出来的第 5 个个体的编号为 43。故选 D。(2)因为 50 名学生中有女生 2
3、0 名,按男女比例用分层抽样的方法,抽到的女生有 4 名,所以本次调查抽取的人数是 50 10。故选 B。420答案 (1)D (2)B(1)解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围。但无论哪种抽样2方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值。(2)在系统抽样的过程中,要注意分段间隔,需要抽取 n 个个体,样本就需要分成 n 个组,则分段间隔即为 (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从Nn后面的每组中按规则抽取每个个体。 变|式|训|练1某班有学生 60 人,将这 60 名学生随机编号为 160 号,用系统抽样的方法从中抽出
4、4 名学生,已知 3 号、33 号、48 号学生在样本中,则样本中另一个学生的编号为( )A28 B23C18 D13解析 抽样间隔为 15,故另一个学生的编号为 31518。故选 C。604答案 C2某校有高级教师 90 人,一级教师 120 人,二级教师 75 人,现按职称用分层抽样的方法抽取 38 人参加一项调查,则抽取的一级教师人数为( )A10 B12C16 D18解析 根据分层抽样性质,设抽取的一级教师人数为 m,则 ,解得12090 120 75 m38m16。故选 C。答案 C考向二 用样本估计总体微考向 1:统计图表的应用【例 2】 (1)(2018全国卷)某地区经过一年的新
5、农村建设,农村的经济收入增加了一倍,实现翻番。为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是( )A新农村建设后,种植收入减少3B新农村建设后,其他收入增加了一倍以上C新农村建设后,养殖收入增加了一倍D新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半(2)(2018湖北部分重点中学模拟)某商场对某一商品搞活动,已知该商品每一个的进价为 3 元,销售价为 8 元,每天售出的第 20 个及之后的半价出售。该商场统计了近 10 天这种商品的销量,如图所示,设 x(个)为每天商品的销量, y(元)为该
6、商场每天销售这种商品的利润。从日利润不少于 96 元的几天里任选 2 天,则选出的这 2 天日利润都是 97 元的概率为( )A B19 110C D15 18解析 (1)设新农村建设前的经济收入为 M,而新农村建设后的经济收入为 2M,则新农村建设前种植收入为 0.6M,而新农村建设后的种植收入为 0.74M,所以种植收入增加了,所以 A 项不正确;新农村建设前其他收入为 0.04M,新农村建设后其他收入为 0.1M,故增加了一倍以上,所以 B 项正确;新农村建设前养殖收入为 0.3M,新农村建设后为 0.6M,所以增加了一倍,所以 C 项正确;新农村建设后养殖收入与第三产业收入的总和占经济
7、收入的 30%28%58%50%,所以超过了经济收入的一半,所以 D 正确。故选 A。(2)由题意知 yError!即 yError!当日销量不少于 20 个时,日利润不少于 96 元。当日销量为 20 个时,日利润为 96 元,当日销量为 21 个时,日利润为 97 元,日利润为 96 元的有 3 天,日利润为 97 元的有 2 天,故所求概率为 。故选 B。C2C25 110答案 (1)A (2)B(1)饼图显示了各种不同成份所占的比例,但要注意本题的两个饼图总量是不同的,应分别计算出两个饼图的各组成部分的量的大小,才能进行比较。4(2)频率分布直方图中横坐标表示组距,纵坐标表示 ,频率组
8、距 。频率分频 率组 距 频 率组 距布直方图中各小长方形的面积之和为 1。 变|式|训|练1(2018南宁摸底联考)已知某地区中小学生人数和近视情况分别如图和图所示。为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A100,20 B200,20C200,10 D100,10解析 由题图可知学生总人数是 10 000,样本容量为 10 0002%200,抽取的高中生人数是 2 0002%40,由题图可知高中生的近视率为 50%,所以高中生的近视人数为 4050%20。故选 B。答案 B2(2018贵阳监测考试)在某中学
9、举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为 5 组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是 40,则成绩在 80100 分的学生人数是( )A15 B18 5C20 D25解析 根据频率分布直方图,得第二小组的频率是 0.04100.4,因为频数是 40,所以样本容量是 100,又成绩在 80100 分的频率是(0.0100.005)100.15,所400.4以成绩在 80100 分的学生人数是 1000.1515。故选 A。答案 A微考向 2:用样本的数字特征估计总体【例 3】 某班男女生各 10 名同学最近一
10、周平均每天的锻炼时间(单位:分钟)用茎叶图记录如下:假设每名同学最近一周平均每天的锻炼时间是互相独立的。男生每天锻炼的时间差别小,女生每天锻炼的时间差别大;从平均值分析,男生每天锻炼的时间比女生多;男生平均每天锻炼时间的标准差大于女生平均每天锻炼时间的标准差;从 10 个男生中任选一人,平均每天的锻炼时间超过 65 分钟的概率比同样条件下女生锻炼时间超过 65 分钟的概率大。其中符合茎叶图所给数据的结论是( )A BC D解析 由茎叶图知,男生每天锻炼时间差别小,女生差别大,正确。男生平均每天锻炼时间超过 65 分钟的概率 P1 ,女生平均每天锻炼时间超过 65 分钟的概率 P2510 12
11、, P1P2,因此正确。设男生、女生两组数据的平均数分别为 甲 , 乙 ,标准差分别410 25 x x为 s 甲 , s 乙 。易求 甲 65.2, 乙 61.8,知 甲 乙 ,正确。又根据茎叶图,男生锻炼时x x x x间较集中,女生锻炼时间较分散,所以 s 甲 6.635,所以有 99%的把握认50 105 2015 225253020为对电视节目的满意度与性别有关,故选 C。答案 C2设某市现代中学的男生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系,根据样本数据( xi, yi)(i1,2, n),用最小二乘法建立的回归方程为0.95 x99.88,给出下列结论:y
12、y 与 x 具有正的线性相关关系;回归直线过样本点的中心( , );x y 若该中学某男生身高增加 1 cm,则其体重约增加 0.95 kg;若该中学某男生身高为 180 cm,则可预测其体重约为 71.12 kg。其中正确的结论是_。9解析 依题意知正确;因为 0.95 x99.88,0.950,故正确;若身高 x 增加y 1,则其体重约为 0.95( x1)99.880.95 x99.880.95,约增加 0.95 kg,故正y 确;若男生身高为 180 cm,则其体重约为 0.9518099.8871.12 kg,故正确。y 答案 1(考向一)(2018福州质检)为了解某地区的“微信健步
13、走”活动情况,拟从该地区的人群中抽取部分人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大。在下面的抽样方法中,最合理的抽样方法是( )A简单随机抽样 B按性别分层抽样C按年龄段分层抽样 D系统抽样答案 C2(考向二)(2018新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为 100 的样本,其中城镇户籍与农村户籍各 50 人;男性 60 人,女性 40 人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下
14、列叙述中错误的是( )A是否倾向选择生育二胎与户籍有关B是否倾向选择生育二胎与性别无关C倾向选择生育二胎的人员中,男性人数与女性人数相同D倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为 6060%36,女性人数为 4060%24,不相同。故选 C。答案 C3(考向二)(2018榆林模拟)某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为 n 的样本,其频率分布直方图如图所示,其中支出的钱数在30,40)的同学10比支出的
15、钱数在10,20)的同学多 26 人,则 n 的值为_。解析 由频率分布直方图可得支出的钱数在30,40)的同学有 0.03810n0.38 n 个,支出的钱数在10,20)的同学有 0.01210n0.12 n 个,又支出的钱数在30,40)的同学比支出的钱数在10,20)的同学多 26 人,所以 0.38n0.12 n0.26 n26,所以 n100。答案 1004(考向三)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5 次试验。根据收集到的数据(如下表),由最小二乘法求得回归方程为 0.67 x54.9。y 零件数 x(个) 10 20 30 40 50加工时间 y(
16、min) 62 75 81 89现发现表中有一个数据模糊看不清,则该数据为_。解析 设表中那个模糊看不清的数据为 m。由表中数据得 30, ,所以样x ym 3075本点的中心为 ,因为样本点的中心在回归直线上,所以(30,m 3075 )0.673054.9,解得 m68。m 3075答案 685(考向三)假设有两个分类变量 X 和 Y 的 22 列联表如下:Y X y1 y2 总计x1 a 10 a10x2 c 30 c30总计 60 40 100对同一样本,以下数据能说明 X 与 Y 有关系的可能性最大的一组为( )A a45, c15 B a40, c20C a35, c25 D a30, c3011解析 根据 22 列联表与独立性检验可知,当 与 相差越大时, X 与 Y 有关aa 10 cc 30系的可能性越大,即 a、 c 相差越大, 与 相差越大。故选 A。aa 10 cc 30答案 A