1、1第 1 讲统计与统计案例1抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点1抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围2统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数(3)平均数:样本数据的算术平均数,即 x (x1 x2 xn)1n(4)方差与标准差s2 (x1
2、 )2( x2 )2( xn )2,1ns 1n( x1 ) 2 ( x2 ) 2 ( xn ) 23直方图的两个结论(1)小长方形的面积组距 频率频 率组 距(2)各小长方形的面积之和等于 14回归分析与独立性检验(1)回归直线 x 经过样本点的中心点( x, y),若 x 取某一个值代入回归直线方程 x 中,可求出y b a y b a y 的估计值(2)独立性检验对于取值分别是 x1, x2和 y1, y2的分类变量 X 和 Y,其样本频数列联表是:y1 y2 总计x1 a b a bx2 c d c d总计 a c b d n考向预测2则 K2 (其中 n a b c d 为样本容量)
3、n( ad bc) 2( a b) ( c d) ( a c) ( b d)型更合适,并用此模型预测 A 超市广告费支出为 8 万元时的销售额参数数据及公式: x8, y42, xiyi2 794, x 708,7 i 1 7 i 12i(1)解析 k39183841,且 P(K2 k03841)005,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过 5%答案 B(2)解 x8, y42, xiyi2 794, x 7087 i 1 7 i 12i因此 y x42178284a b 所以, y 关于 x 的线性回归方程是 17 x284y 0750, 0 B 0, 0 D
4、 50%的一半,所以 D 正确;故选 A3 【解题思路】由题可知满足分层抽样特点【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样4 【解题思路】 (1)两个回归直线方程中无参数,所以分别求自变量为 2018 时所对应的函数值,就得结果,(2)根据折线图知 2000 到 2009,与 2010 到 2016 是两个有明显区别的直线,且 2010 到 2016 的增幅明显高于 2000 到 2009,也高于模型 1 的增幅,因此所以用模型 2 更能较好得到 2018 的预测【答案】 (1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为 =y304+13519=226
5、1(亿元) 利用模型,该地区 2018 年的环境基础设施投资额的预测值为 =99+1759=2565(亿元) y(2)利用模型得到的预测值更可靠理由如下:(i)从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线 y=304+135 t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的变化趋势2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010 年至 2016 年
6、的数据建立的线性模型 =99+175 t 可以较好地描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型y得到的预测值更可靠9(ii)从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值 2261 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠以上给出了 2 种理由,考生答出其中任意一种或其他合理理由均可得分点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点 求参数(x,y)1 【解题思路】根据 6070 岁这个年龄段中 128 人中
7、抽查了 8 人,可知分层抽样的抽样比为 ,8128=116因为共抽出 30 人,所以总人数为 人,即可求出 2030 岁年龄段的人数3016=480【答案】根据 6070 岁这个年龄段中 128 人中抽查了 8 人,可知分层抽样的抽样比为 ,8128=116因为共抽出 30 人,所以总人数为 人,3016=480所以,2030 岁龄段的人有 ,故选 D480-128-192=1602 【解题思路】由题图可知,2014 年 8 月到 9 月的月接待游客量在减少,则 A 选项错误【答案】A3 【解题思路】由回归直线方程过样本点中心可得 a 【答案】由题意, x45, y3625,代入 065 x
8、,可得 7,当产量为 80 吨时,预计需要生产y a a 能耗为 06580759故填 594 【解题思路】(1)根据题中所给的使用了节水龙头 50 天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;(2)结合直方图,算出日用水量小于 035 的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得 50 天日用水量的平均值,作差乘以 365 天得到一年能节约用水多少,从而求得结果m3【答案】 (1)10(2)根据以上数据,该家庭使用节水龙头后 50 天日用水量小于 035m 3的
9、频率为0201+101+2601+2005=048,因此该家庭使用节水龙头后日用水量小于 035m 3的概率的估计值为 048(3)该家庭未使用节水龙头 50 天日用水量的平均数为x1 =150(0051+0153+0252+0354+0459+05526+0655)=048该家庭使用了节水龙头后 50 天日用水量的平均数为x2=150(0051+0155+02513+03510+04516+0555)=035估计使用节水龙头后,一年可节省水 (048-035)365=4745(m3)1 【解题思路】作出散点图,画出回归直线直观判定 0, 2706n( ad bc) 2( a b) ( c d) ( a c) ( b d) 100( 3820 3012) 250506832所以有 90%的把握认为“微信控”与“性别”有关