1、1第 1讲 小题考法统计、统计案例与概率一、主干知识要记牢1概率的计算公式(1)古典概型的概率计算公式P(A) ;事 件 A包 含 的 基 本 事 件 数 m基 本 事 件 总 数 n(2)互斥事件的概率计算公式: P(A B) P(A) P(B);(3)对立事件的概率计算公式: P( )1 P(A);A (4)几何概型的概率计算公式P(A) 构 成 事 件 A的 区 域 长 度 面 积 或 体 积 试 验 的 全 部 结 果 所 构 成 的 区 域 长 度 面 积 或 体 积 2抽样方法(1)三种抽样方法的比较类别 共同点 各自特点 相互联系 适用范围简单随机抽样从总体中逐个抽取总体中的个数
2、较少系统抽样将总体均分成几部分,按事先确定的规则,在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个数比较多分层抽样是不放回抽样,抽样过程中,每个个体被抽到的机会(概率)相等将总体分成几层,分层进行抽取各层抽样时,采用简单随机抽样或者系统抽样总体由差异明显的几部分组成_(2)分层抽样中公式的运用抽样比 ;样 本 容 量个 体 总 量 各 层 样 本 容 量各 层 个 体 数 量层 1的数量层 2的数量层 3的数量样本 1的容量样本 2的容量样本 3的容量3用样本数字特征估计总体(1)众数、中位数、平均数定义 特点2众数 在一组数据中出现次数最多的数据体现了样本数据的最大集中点,不受极端值
3、的影响,而且不唯一中位数将一组数据按大小顺序依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)中位数不受极端值的影响,仅利用了排在中间数据的信息,只有一个平均数 样本数据的算术平均数 与每一个样本数据有关,只有一个(2)方差和标准差方差和标准差反映了数据波动程度的大小方差: s2 (x1 )2( x2 )2( xn )2;1n x x x 标准差: s 1n x1 x 2 x2 x 2 xn x 2二、二级结论要用好1频率分布直方图的 3个结论(1)小长方形的面积组距 频率频 率组 距(2)各小长方形的面积之和等于 1(3)小长方形的高 ,所有小长方形高的和为 频 率组 距 1组
4、距2与平均数和方差有关的 4个结论(1)若 x1, x2, xn的平均数为 ,那么 mx1 a, mx2 a, mxn a的平均数为 mx a;x (2)数据 x1, x2, xn与数据 x1 x1 a, x2 x2 a, xn xn a的方差相等,即数据经过平移后方差不变;(3)若 x1, x2, xn的方差为 s2,那么 ax1 b, ax2 b, axn b的方差为 a2s2;(4)s2 (xi )2 2,即各数平方的平均数减去平均数的平方1nni 1 x 1nni 1x2i x 求 s2时,可根据题目的具体情况,结合题目给出的参考数据,灵活选用公式形式3线性回归方程线性回归方程 x 一
5、定过样本点的中心( , )y b a x y 三、易错易混要明了1应用互斥事件的概率加法公式,一定要注意首先确定各事件是否彼此互斥,然后求3出各事件分别发生的概率,再求和2正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件, “互斥”是“对立”的必要不充分条件3混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错4在求解几何概型的概率时,要注意分清几何概型的类别(体积型、面积型、长度型、角度型等). 考点一 用样本估计总体1方差的计算与含义(1)计算:计算方差首先要计算平均数,然后再按照方差的计算
6、公式进行计算(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大2与频率分布直方图有关问题的常见类型及解题策略(1)已知频率分布直方图中的部分数据,求其他数据可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于 1就可以求出其他数据(2)已知频率分布直方图,求某个范围内的数据可利用图形及某范围结合求解1(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了 2014年 1月至 2016年 12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图根据该折线图,下列结论错误的是( A )A月接待游客量逐月增加B年接待游客量逐年增加C各
7、年的月接待游客量高峰期大致在 7,8月D各年 1月至 6月的月接待游客量相对于 7月至 12月,波动性更小,变化比较平稳4解析 对于选项 A,由图易知月接待游客量每年 7,8月份明显高于 12月份,故 A错;对于选项 B,观察折线图的变化趋势可知年接待游客量逐年增加,故 B正确;对于选项C,D,由图可知显然正确故选 A2(2018齐齐哈尔二模)某高校调查了 320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这 320名学生中
8、每周的自习时间不足 22.5小时的人数是( B )A68 B72C76 D80解析 由频率分布直方图可得,320 名学生中每周的自习时间不足 22.5小时的人数是320(0.020.07)2.572 人选 B3某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中 A点表示十月的平均最高气温约为 15, B点表示四月的平均最低气温约为 5.下面叙述不正确的是( D )A各月的平均最低气温都在 0以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于 20的月份有 5个解析 由图形可得各月的平均最低气温都在 0以上,A
9、正确;七月的平均温差约为 10,而一月的平均温差约为 5 ,B 正确;三月和十一月的平均最高气温都在 10左右,基本相同,C 正确;平均最高气温高于 20的月份有 2个,故 D错误4(2018南充三联)为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的 6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均5成绩分别是 x 甲 , x 乙 ,则下列说法正确的是( D )A x 甲 x 乙 ,乙比甲成绩稳定,应选乙参加比赛B x 甲 x 乙 ,甲比乙成绩稳定,应选甲参加比赛C x 甲 x 乙 ,甲比乙成绩稳定,应选甲参加比赛D x 甲 x 乙 ,乙比甲成绩稳定,应选
10、乙参加比赛解析 由茎叶图知,甲的平均成绩是 82,72 78 79 85 86 926乙的平均成绩是 87,78 86 87 87 91 936所以乙的平均成绩大于甲的平均成绩,从茎叶图看出乙的成绩稳定,故选 D考点二 变量间的相关关系、统计案例求回归直线方程的关键及实际应用(1)求回归直线方程的关键是正确理解 , 的计算公式和准确地求解b a (2)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值1(2018永州三模)党的十九大报告明确提出:在共享经济等领域培育增长点、形成新动能共享经济是
11、公众将闲置资源通过社会化平台与他人共享,进而获得收入的经济现象为考察共享经济对企业经济活跃度的影响,在四个不同的企业各取两个部门进行共享经济对比试验,根据四个企业得到的试验数据画出如下四个等高条形图,最能体现共享经济对该部门的发展有显著效果的图形是( D )6解析 根据四个列联表中的等高条形图可知,图 D中共享与不共享的企业经济活跃度的差异最大,它最能体现共享经济对该部门的发展有显著效果,故选 D2已知某种商品的广告费支出 x(单位:万元)与销售额 y(单位:万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 50 m 70根据表中提供的全部数据,用最小二乘法得出 y与 x的线性回
12、归方程为6.5 x17.5,则表中 m的值为( D )y A45 B50C55 D60解析 5,x 2 4 5 6 85 y 30 40 50 m 705 190 m5当 5 时, 6.5517.550,x y 50,解得 m60190 m53利用独立性检验来考虑两个分类变量 X和 Y是否有关系时,通过查阅下表来确定“X和 Y有关系”的可信度如果 k3.841,那么有把握认为“ X和 Y有关系”的百分比为( D )P(K2k0) 0.50 0.40 0.25 0.15 0.10k0 0.455 0.708 1.323 2.072 2.7067P(K2k0) 0.05 0.025 0.010 0
13、.005 0.001k0 3.841 5.024 6.635 7.879 10.828A5% B75%C99.5% D95%解析 由表中数据可得,当 k3.841时,有 0.05的机率说明这两个变量之间的关系是不可信的,即有 10.050.95 的机率,也就是有 95%的把握认为变量之间有关系,故选D考点三 古典概型与几何概型1利用古典概型求概率的关键及注意点(1)正确求出基本事件总数和所求事件包含的基本事件总数(2)对于较复杂的题目条件计数时要正确分类,分类时应不重不漏2几何概型的适用条件及求解关键(1)当构成试验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型求解(2)求
14、解关键是寻找构成试验的全部结果的区域和事件发生的区域,有时需要设出变量,在坐标系中表示所需要的区域1(2018攀枝花一模)中国人民银行发行了 2018中国戊戌(狗)年金银纪念币一套,如图所示是一枚 3克圆形金质纪念币,直径 18 mm,某同学为了算图中装饰狗的面积他用 1枚针向纪念币上投掷 500次,其中针尖恰有 150次落在装饰狗的身体上,据此可估计装饰狗的面积大约是( C )A mm2 B mm24865 2435C mm2 D mm224310 24320解析 由题意得,纪念币的面积为 S 281,设装饰狗的面积为 S1,则(182)8 ,所以 S1 S 81 mm2,故选 CS1S 1
15、50500 150500 150500 243102(2018菏泽二模)甲乙两名运动员各自等可能地从红、白、蓝 3种颜色的运动服中选择 1种,则他们选择相同颜色运动服的概率为( A )A B13 12C D23 34解析 甲,乙两名运动员各自等可能地从红、白、蓝 3种颜色的运动服中选择 1种有9种不同的结果,分别为(红,红),(红,白),(红,蓝),(白,红),(白,白),(白,蓝),(蓝,红),(蓝,白),(蓝,蓝)他们选择相同颜色运动服有 3种不同的结果,即(红,红),(白,白),(蓝,蓝),故他们选择相同颜色运动服的概率为 ,故选 A39 133(2018延安二模)某广播电台只在每小时的整点和半点开始播送新闻,时长均为 5分钟,则一个人在不知道时间的情况下打开收音机收听该电台,能听到新闻的概率是_ _16解析 由题意知这是一个几何概型,电台在每小时的整点和半点开始播送新闻,事件总数包含的时间长度是 30,时长均为 5分钟,一个人在不知道时间的情况下打开收音机收听该电台,能听到新闻的概率是 P 16