1、1问题 42 实际应用中的统计解答题一、考情分析概率统计在高考中扮演着很重要的角色,概率统计解答题是全国卷及多数省市高考数学必考内容,内容主要涉及古典概型、相互独立事件的概率、条件概率、二项分布、正态分布、频率分布直方图、回归分析、离散型随机变量的分布列、期望与方差的实际应用等.回顾近几年的高考试题,可以看出概率统计解答题,大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.该类问题阅读量一般比较大,但难度多为中
2、等或中等偏易.二、经验分享(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为 1. 利用分布列中各概率之和为 1 可求参数的值,此时要注意检验,以保证每个概率值均为非负数对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据一般先比较均值,若均值相同,再用方差来决定(3)解决正态分布问题有三个关键点:(1)对称轴 x ;(2)标准差 ;(3)分布区间利用对称性可求指定范围
3、内的概率值;由 , ,分布区间的特征进行转化,使分布区间转化为 3 特殊区间,从而求出所求概率注意只有在标准正态分布下对称轴才为 x0.(4)判定两个变量正、负相关性的方法画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关相关系数: r0 时,正相关; r0 时,正相关; 0 时,负相关b b (5) 回归分析是处理变量相关关系的一种数学方法主要解决:确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式; 根据一组观测值,预测变量的取值及判断变量取值的变化趋势; 求出线性回归方程线性回归分析问题的类型及解题方法求线性回归方程2利用公式,求
4、出回归系数 ,或待定系数法:利用回归直线过样本点的中心求系数b 利用回归方程进行预测,把线性回归方程看作一次函数,求函数值利用回归直线判断正、负相关;决定正相关还是负相关的是系数 .b (6)回归方程的拟合效果,可以利用相关系数判断,当| r|越趋近于 1 时,两变量的线性相关性越强 (7)比较几个分类变量有关联的可能性大小的方法通过计算 K2的大小判断: K2越大,两变量有关联的可能性越大通过计算| ad bc|的大小判断:| ad bc|越大,两变量有关联的可能性越大(8)独立性检验的一般步骤根据样本数据制成 22 列联表根据公式计算 K2的观测值 k.比较 k 与临界值的大小关系,作统计
5、推断三、知识拓展四、题型分析(一) 期望与方差的应用数学期望反应的是随机变量取值的平均水平,而方差则是反应随机变量取值在其平均值附近的离散程度.现代实际生活中,越来越多的决策需要应用数学期望与方差这思想来对事件发生大小的可能性进行评估,通过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.品种的优劣、仪器的好坏、预报的准确与否等很多问题都与这两个特征两量有关.(1)若我们希望实际的平均水平较理想,则先求随机变量 12, 的期望,当 12E时,不应认为它们一定一样好,需要用 12,D来比较这两个随机变量的方差,确定它们的偏离程度.(2)若我们希望比较稳定性,
6、应先考虑方差,再考虑均值是否相等或接近.【例 1】例 3.7(2018 新课标 I 卷理 20)某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中任取 20 件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为 ,且各件产品是否为不合格品相互独立 (1)记 20 件产品中恰有 2 件不合格品的概率为 ,求 的最大值点 (2)现对一箱产品检验了 20 件,结果恰有 2 件不合格品,以(1)中确定的 作为 的值已知每件产品的检验费用为 2 元,若有不合格品进入用户手中,则工厂要
7、对每件不合格品支付 25 元的赔偿费用 3(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求 ;(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【分析】 利用独立重复实验成功次数对应的概率,求得 ,之后对其求导,利用导数确定其单调性,再求最大值点,注意 ;(2)先根据第一问的条件,确定出 ,在解(i)的时候,先求件数对应的期望,之后应用变量之间的关系,求得赔偿费用的期望;在解(ii)的时候,就通过比较两个期望的大小,得到结果.【解析】 (1)20 件产品中恰有 2 件不合格品的概率为 .因此.令 ,得 .当 时, ;当 时, .所
8、以 的最大值点为 .(2)由(1)知, .(i)令 表示余下的 180 件产品中的不合格品件数,依题意知 , ,即.所以 .(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为 400 元.由于 ,故应该对余下的产品作检验.【点评】随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据一般先比较均值,若均值相同,再用方差来决定【小试牛刀】【广东省江门市 2019 届第一次模拟】甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司的底薪 元,每单提成 元;乙公司无底薪, 单以内(含 单)的部
9、分每单提成 元,大于 单的部分每单提成 元,假设同一公司送餐员一天的送餐单数相同,现从两家公司各随机抽取一名送餐员,并分别记录其 天的送餐单数,得到如下频数表:甲公司送餐员送餐单数频数表乙公司送餐员送餐单数频数表4(1)若将大于 单的工作日称为“繁忙日” ,根据以上频数表能否在犯错误的概率不超过 的前提下认为“繁忙日”与公司有关?(2)若将频率视为概率,回答下列两个问题:记乙公司送餐员日工资为 (单位:元) ,求 的分布列和数学期望;小王打算到甲、乙两家公司中的一家应聘,你会推荐小王去哪家?为什么?参考公式和数据:【解析】(1)依题意得,公司与“繁忙日”列联表,,所以,能在犯错误的概率不超过
10、的前提下认为“繁忙日”与公司有关 .(2)设乙公司送餐员送餐单数为 ,则当 时, ,当 时, ,当时, ,当 时, ,当 时,.所以, 的所有可能取值为 、 、 、 、 , 的分布列为:5.依题意,甲公司送餐员日平均送餐单数为,所以甲公司送餐员日平均工资为 (元),因为 ,故从更高收入角度考虑推荐小王去乙公司应聘;因为乙公司比甲公司繁忙,故从工作闲适角度考虑推荐小王去甲公司应聘(二)正态分布的应用 正态分布随处可见,处处显现着他神秘的身影.对于某一件事或者某个要达到的目标,很多很多的个体发挥出来的水平大致上服从正态分布.也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中”束缚着整体
11、的状态. 对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会发挥失常.这种东西应该也可以抽象为围绕期望水平的正态分布. 而对于若干数据,包括发挥水平、排位情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去估计其他的分布情况.这是反向推导的过程. 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述.例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一
12、物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等. 【例 2】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取 16个零件,并测量其尺寸(单位: cm) 根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布 2,N(1)假设生产状态正常,记 X表示一天内抽取的 16个零件中其尺寸在 3,之外的零件数,求PX及 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在 3,之外的零件,就认为这条生产线在这一天的6生产过程可能出现了异常情况,需对当天的生产过程进行检查()试说明上述监控生产过程方法的合理性;()下面是检
13、验员在一天内抽取的 16个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得169.7ix,161622()()0.12i iisxx,其中 ix为抽取的第i个零件的尺寸, 2, , , 用样本平均数 x作为 的估计值 ,用样本标准差 s作为 的估计值 ,利用估计值判断是否需对当天的生产过程进行检查?剔除 3之外的数据,用剩下的数据估计 和 (精确到 0.1) 附:若随机变量 Z服从正态分布2N,则 330.974PZ, 6952,0.8.9【分析】 (
14、1)先确定 160.2XB, ,再利用 EXnp求期望;(2)(i)判断监控生产过程的方法是否合理,可通过一天内抽取的 个零件中,尺寸落 3,之外概率的大小判断,(ii)剔除异常数据,在利用公式求 和 .【解析】 (1)由题可知尺寸落在 3,之内的概率为 0.974,落在 3,之外的概率为 0.26 001616C.974952PX,528,由题可知 .B, ,所以 0416EX.(2)(i)尺寸落在 3,之外的概率为 2,由正态分布知尺寸落 3,之外为小概率事件,因此上述监控生产过程的方法合理(ii) 39.70.219.4, 39.70.1.6,46,,因为 .24, ,所以需对当天的生产
15、过程检查因此剔除 9.2,剔除数据之后:9.716.0.2522 222510.10.9.61.0.1.7222229.10.9.810410610.9.10.1.355.0.85.所以 0.8.9.【点评】正态分布是概率统计中相对较独立的一个考点,且已经从冷点转化为热点,求解此类问题,一般从入手,对于应用问题,要注意从较大的阅读量中提取有用的信息.以下两类问题是正态分布中的基本问题:(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线 x 对称,及曲线与 x 轴之间的面积为 1.(2)利用 3 原则求概率问题时,要注意把给出的区间或范围与正态变量的 , 进行对
16、比联系,确定它们属于( , ),( 2 , 2 ),( 3 , 3 )中的哪一个.【小试牛刀】 【山东省济宁市 2019 届高三第一次模拟】某学校为了了解全校学生的体重情况,从全校学生中随机抽取了 100 人的体重数据,结果这 100 人的体重全部介于 45 公斤到 75 公斤之间,现将结果按如下方式分为 6 组:第一组45,50),第二组50,55),第六组70,75),得到如下图(1)所示的频率分布直方图,并发现这 100 人中,其体重低于 55 公斤的有 15 人,这 15 人体重数据的茎叶图如图(2)所示,以样本的频率作为总体的概率(I)求频率分布直方图中 的值;(II)从全校学生中随
17、机抽取 3 名学生,记 X 为体重在55,65)的人数,求 X 的概率分布列和数学期望;(III)由频率分布直方图可以认为,该校学生的体重 近似服从正态分布 ,其中 若,则认为该校学生的体重是正常的试判断该校学生的体重是否正常?并说明理由【解析】解:()由图(2)知,100 名样本中体重低于 50 公斤的有 2 人,8用样本的频率估计总体的概率,可得体重低于 50 公斤的概率为 ,则 ,在 上有 13 人,该组的频率为 0.13,则 ,所以 ,即 c=0.07.()用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在 的概率为0.0710=0.7,随机抽取 3 人,相当于三次独立重
18、复试验,随机变量 X 服从二项分布 ,则 ,所以,X 的概率分布列为:X 0 1 2 3P 0.027 0.189 0.441 0.343E(X)=30.7=2.1()由 N(60,25)得由图(2)知 .所以可以认为该校学生的体重是正常的. (三) 用样本估计总体频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计
19、频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频 率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误9【例 3】2018 年 9 月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达 亿元.某青年志愿者组织调查了某地区的 个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:, , , , (单位:元) ,得到如图所示的频率分布直方图.(1)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表) ;(2)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这 户损失超过元
20、的农户中随机抽取 户进行重点帮扶,设抽出损失超过 元的农户数为 ,求 的分布列和数学期望.【分析】 (1)根据频率分布直方图计算每个农户的平均损失;(2)根据频率分布直方图计算随机变量 X 的可能取值,再求 X 的分布列和数学期望值【解析】 (1)记每个农户的平均损失为 元,则;(2)由频率分布直方图,可得损失超过 1000 元的农户共有(0.00009+0.00003+0.00003)20005015(户) ,损失超过 8000 元的农户共有 0.000032000503(户) ,随机抽取 2 户,则 X 的可能取值为 0,1,2;计算 P(X0) ,P(X1) ,P(X2) ,所以 X 的
21、分布列为; 10X 0 1 2P数学期望为 E(X)0 +1 +2 【点评】用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分 布去估计总体分布的两种主要方法分布表在数量表示上比较准确,直方图比较直观【小试牛刀】中国农业银行开始为全国农行 ATM 机安装刷脸取款系统.某农行营业点为调查居民对刷脸取款知识的了解情况,制作了刷脸取款知识有奖调查问卷,发放给 2018 年度该行的所有客户,并从参与调查且年龄(单位:岁)在25,55内的客户中随机抽取 100 名给予物质奖励,再从中选出一名客户参加幸运大抽奖.调查结果按年龄分成 6 组,制作成如下的频数分布表和
22、女客户的年龄茎叶图,其中 a b c=245.年龄 /岁25,30) 30,35) 35,40) 40,45) 45,50) 50,55频数 /人5 a b c 15 25女客户的年龄茎叶图幸运大抽奖方案如下:客户最多有两次抽奖机会,每次抽奖的中奖率均为 ,第一次抽奖,若未中奖,则抽奖结束.若中奖,则通过抛掷一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:抛出的硬币,若反面朝上,则客户获得 5000 元奖金,不进行第二次抽奖;若正面朝上,客户需进行第二次抽奖,且在第二次抽奖中,如果中奖,则获得奖金 10000 元,如果未中奖,则所获得的奖金为 0 元.(1)求 a,b,c 的值,若分别从
23、男、女客户中随机选取 1 人,求这 2 人的年龄均在40,45)内的概率;(2)若参加幸运大抽奖的客户所获奖金(单位:元)用 X 表示,求 X 的分布列与数学期望 E(X).11【解析】(1)由频数分布表知,a+b+c=100-45=55.因为 abc=245,所以 a= 55=10,b= 55=20,c= 55=25,由茎叶图可知年龄在25,30)内的女客户有 2 人,年龄在30,35)内的女客户有 4 人,年龄在35,40)内的女客户有 8 人,年龄在40,45)内的女客户有 10 人,年龄在45,50)内的女客户有 6 人,年龄在50,55内的女客户有 10 人,故年龄在40,45)内的
24、男客户有 15 人,在 100 名客户中,男客户有 60 人,女客户有 40 人,所以从男客户中随机选取 1 人,年龄恰在40,45)内的概率 P1= ,从女客户中随机选取 1 人,年龄恰在40,45)内的概率 P2= ,则分别从男、女客户中随机选取 1 人,这 2 人的年龄均在40,45)内的概率 P=P1P2= .(2)由题意可知, X 的所有可能取值为 0,5000,10000,则P(X=0)= ,P(X=5000)= ,P(X=10000)= .X 的分布列为X 0 5 000 10 000PE(X)=0 +5000 +10000 =5200(元).(四) 回归分析回归分析是对具有相关
25、关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义根据回归方程进行的估计仅是一个预测值,而不是真实发生的值用最小二乘法求回归方程,关键在于正确求出系数 ,由于 , 的计算量较大,计算应仔细小心a b a b 【例 4】 【湖北省黄冈市 2019 届模拟】某基地蔬菜大棚采用无土栽培方式种植各类蔬菜.根据过去 50 周的资料显示,该基地周光照量 (小时)都在 30 小时以上,其中不足 50 小时的有 5 周,不低于 50 小时且不12超过 70 小时的有 35 周,超过 70 小时的有 10 周.根据统计,该基地的西红柿增加量 (千克)与使用某种
26、液体肥料的质量 (千克)之间的关系如图所示.(1)依据上图,是否可用线性回归模型拟合 与 的关系?请计算相关系数 并加以说明(精确到 0.01).(若 ,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量 限制,并有如下关系:周光照量 (单位:小时)光照控制仪运行台数 3 2 1若某台光照控制仪运行,则该台光照控制仪周利润为 3000 元;若某台光照控制仪未运行,则该台光照控制仪周亏损 1000 元.以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数公式 ,参
27、考数据: , .【分析】(1)根据公式得到相关系数的值,通过比较得到判断;(2)分别求出安装一台,两台,三台时的利润均值,得到结果.【解析】 (1)由已知数据可得 , . ,.13相关系数 . ,可用线性回归模型拟合 与 的关系.(2)记商家周总利润为 元,由条件可知至少需安装 1 台,最多安装 3 台光照控制仪.安装 1 台光照控制仪可获得周总利润 3000 元.安装 2 台光照控制仪的情形:当 时,只有 1 台光照控制仪运行,此时周总利润 (元) ,当 时,2 台光照控制仪都运行,此时周总利润 (元) ,故 的分布列为2000 60000.2 0.8 (元).安装 3 台光照控制仪的情形:
28、当 时,只有 1 台光照控制仪运行,此时周总利润 (元) ,当 时,有 2 台光照控制仪运行,此时周总利润 (元) ,当 时,3 台光照控制仪都运行,周总利润 (元) ,故 的分布列为1000 5000 9000140.2 0.7 0.1 (元).综上可知,为使商家周总利润的均值达到最大,应该安装 2 台光照控制仪.【点评】判断两个变量是否具有相关关系的常用方法:(1)利用散点图进行判断;(2)利用相关系数 r 进行判断【小试牛刀】 【江西省临川第一中学等九校 2019 届高三 3 月联考】某商场营销人员进行某商品 市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,
29、经过试点统计得到以下表:反馈点数 1 2 3 4 5销量(百件)/天 0.5 0.6 1 1.4 1.7(1)经分析发现,可用线性回归模型拟合当地该商品销量 (千件)与返还点数 之间的相关关系.请用最小二乘法求 关于 的线性回归方程 ,并预测若返回 6 个点时该商品当天销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的 200 名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:返还点数预期值区间(百分比)频数 20 60 60 30 20 10(i)求这 200 位拟购买该商品的消费者对返点点数的心理预期值 的样
30、本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到 0.1) ;(ii)将对返点点数的心理预期值在 和 的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的 30 名消费者中随机抽取 6 名,再从这 6 人中随机抽取 3 名进行跟踪调查,设抽出的 3 人中“欲望膨胀型”消费者的人数为随机变量 ,求 的分布列及数学期望.参考公式及数据: , ; .【解析】(1)易知 , ,15,.则 关于 的线性回归方程为 ,当 时, ,即返回 6 个点时该商品每天销量约为 2百件.(2) (i)根据题意,这 200 位拟购买该商品的消
31、费者对返回点数的心里预期值 的平均值 ,及中位数的估计值分别为: ,中位数的估计值为.(ii)抽取 6 名消费者中“欲望紧缩型”消费者人数为 , “欲望膨胀型”消费者人数为 ., , ,故随机变量 的分布列为1 2 3.(五) 独立性检验独立性检验的一般步骤(1)假设两个分类变量 x 与 y 没有关系;(2)计算出 K2的观测值,其中K2 ;(3)把 K2的值与临界值比较,作出合理的判断n( ad bc) 2( a b) ( c d) ( a c) ( b d)【例 5】 【福建省莆田市 2019 届高三下学期教学质量检测】为推进“千村百镇计划” , 年 月某新能源公司开展“电动莆田绿色出行”
32、活动,首批投放 台 型新能源车到莆田多个村镇,供当地村民免费试用三个月。试用到期后,为了解男女试用者对 型新能源车性能的评价情况,该公司要求每位试用者填写一份性能综合评分表(满分为 分) 。最后该公司共收回有效评分表 份,现从中随机抽取 份(其中男、女的评分表各 份)作为样本,经统计得到如下茎叶图:16(1)求 个样本数据的中位数 ;(2)已知 个样本数据的平均数 ,记 与 的最大值为 。该公司规定样本中试用者的“认定类型”:评分不小于 的为“满意型” ,评分小于 的为“需改进型” 。请以 个样本数据的频率分布来估计收回的 份评分表中,评分小于 的份数;请根据 个样本数据,完成下面 列联表:根
33、据 列联表判断能否有 99的把握认为“认定类型”与性别有关?【分析】 (1)取位于中间两个数,计算平均数,即可。 (2)结合茎叶图,完善列 联表,计算卡方值,判断,即可。【解析】(1)由茎叶图知 (2)因为 m=81, a=80,所以 M=81。由茎叶图知,女性试用者评分不小于 81 的有 15 个,男性试用者评分不小于 81 的有 5 个,所以在 40 个样本数据中,评分不小于 81 的频率为 可以估计收回的 600 份评分表中,评分不小于 81 的份数为 6000.5=300;17根据题意得 22 列联表:满意型 需改进型 合计女性 15 5 20男性 5 15 20合计 20 20 40
34、由于 , 查表得 , 所以有 99%的把握认为“认定类型”与性别有关。【点评】(1)在列联表中注意事件的对应及相关值的确定,不可混淆(2)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错(3)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他【小试牛刀】 【重庆市第一中学校 2019 届高三 3 月月考】党的十九大报告中多次出现的“绿色” “低碳”“节约”等词语,正在走入百姓生活,绿色出行的理念已深入人心,骑自行车或步行渐渐成为市民的一种出行习惯.某市环保机构随机抽查统计了该市 1800 名 成年市民某月骑车次数在各区间的人
35、数,统计如下表:次数年龄0,10) 10,20) 20,30) 30,40) 40,50) 50,60)18 岁至 31 岁 8 12 20 60 140 15032 岁至 44 岁 12 28 20 140 60 15045 岁至 59 岁 25 50 80 100 225 45060 岁及以上 25 10 10 19 4 2联合国世界卫生组织于 2013 年确定新的年龄分段:44 岁及以下为青年人,45 岁至 59 岁为中年人,60 岁及以上为老人.(1)若从被抽查的该月骑车次数在 的老年人中随机选出两名幸运者给予奖励,求其中一名幸运者18该月骑车次数在 之间,另一名幸运者该月骑车次数在
36、之间的概率;(2)若月骑车次数不少于 30 次者被称为“骑行爱好者” ,将上面提供的数据进行统计后,把答卷中的列联表补充完整,并计算说明能否在犯错误不超过 0.001 的前提下认为“骑行爱好者”与“青年人”有关?参考数据:0.100 0.050 0.025 0.010 0.0012.706 3.841 5.024 6.635 10.828,其中【解析】(1)将 6 位老人分别记为 和 ,则所有的抽法有:, , , , , , , , , , , , , , 共15 种,其中满足条件的抽法有:, , , , , , , 共 8 种,故其中一名幸运者该月骑车次数在 之间,另一名幸运者该月骑车次数在
37、 之间的概率为 .(2)根据题意,得出如下 列联表骑行爱好者非骑行爱好者 总计青年人 700 100 800非青年人 800 200 1000总计 1500 300 1800 ,故能在犯错误的概率不超过 0.001 的前提下认为“骑行爱好者”与“青年人”有关.四、迁移运用1 【辽宁省大连市 2019 届高三下学期第一次测试】随着电子阅读的普及,传统纸质媒体遭受到了强烈的19冲击某杂志社近 9 年来的纸质广告收入如下表所示:根据这 9 年的数据,对 和 作线性相关性检验,求得样本相关系数的绝对值为 0.243;根据后 5 年的数据,对 和 作线性相关性检验,求得样本相关系数的绝对值为 0.984
38、.(1)如果要用线性回归方程预测该杂志社 2019 年的纸质广告收入,现在有两个方案,方案一:选取这 9 年数据进行预测,方案二:选取后 5 年数据进行预测从实际生活背景以及线性相关性检验的角度分析,你觉得哪个方案更合适?附:相关性检验的临界值表:(2)某购物网站同时销售某本畅销书籍的纸质版本和电子书,据统计,在该网站购买该书籍的大量读者中,只购买电子书的读者比例为 ,纸质版本和电子书同时购买的读者比例为 ,现用此统计结果作为概率,若从上述读者中随机调查了 3 位,求购买电子书人数多于只购买纸质版本人数的概率【解析】(1)选取方案二更合适,理由如下:题中介绍了,随着电子阅读的普及,传统纸媒受到
39、了强烈的冲击,从表格中的数据中可以看出从 2014年开始,广告收入呈现逐年下降的趋势,可以预见,2019 年的纸质广告收入会接着下跌,前四年的增长趋势已经不能作为预测后续数据的依据. 相关系数 越接近 1,线性相关性越强,因为根据 9 年的数据得到的相关系数的绝对值 ,我们没有理由认为 与 具有线性相关关系;而后 5 年的数据得到的相关系数的绝对值 ,所以有 的把握认为 与 具有线性相关关系. (2) 因为在该网站购买该书籍的大量读者中,只购买电子书的读者比例为 ,纸质版本和电子书同时购买的读者比例为 ,所以从该网站购买该书籍的大量读者中任取一位,购买电子书的概率为 ,只购买纸质书的概率为 ,
40、 购买电子书人数多于只购买纸质书人数有两种情况: 3 人购买电子书,2 人购20买电子书一人只购买纸质书.概率为: .2 【黑龙江省齐齐哈尔市 2019 届高三第一次模拟】中学为研究学生的身体素质与体育锻炼时间的关系,对该校 200 名高三学生平均每天体育锻炼时间进行调查,如表:(平均每天锻炼的时间单位:分钟)平均每天锻炼的时间/分钟总人数 20 36 44 50 40 10将学生日均体育锻炼时间在 的学生评价为“锻炼达标”.(1)请根据上述表格中的统计数据填写下面的 列联表;锻炼不达标 锻炼达标 合计男女 20 110合计并通过计算判断,是否能在犯错误的概率不超过 0.025 的前提下认为“
41、锻炼达标”与性别有关?(2)在“锻炼达标”的学生中,按男女用分层抽样方法抽出 10 人,进行体育锻炼体会交流,(i)求这 10 人中,男生、女生各有多少人?(ii)从参加体会交流的 10 人中,随机选出 2 人作重点发言,记这 2 人中女生的人数为 ,求 的分布列和数学期望.参考公式: ,其中 .临界值表0.10 0.05 0.025 0.0102.706 3.841 5.024 6.635【解析】(1)锻炼不达标 锻炼达标 合计男 60 30 9021女 90 20 110合计 150 50 200由 列联表中数据,计算得到 的观测值为 .所以 在犯错误的概率不超过 0.025 的前提下能判
42、断“锻炼达标”与性别有关.(2) (i) “锻炼达标”的学生有 50 人,男、女生人数比为 ,故用分层抽样方法从中抽出 10 人,男生有6 人,女生有 4 人. (ii) 的可能取值为 0,1,2;, 的分布列为0 1 2 的数学期望 .3 【江西省南昌市 2019 届高三第一次模拟】市面上有某品牌 型和 型两种节能灯,假定 型节能灯使用寿命都超过 5000 小时,经销商对 型节能灯使用寿命进行了调查统计,得到如下频率分布直方图:某商家因原店面需要重新装修,需租赁一家新店面进行周转,合约期一年.新店面需安装该品牌节能灯 522支(同种型号)即可正常营业.经了解, 型 20 瓦和 型 55 瓦的
43、两种节能灯照明效果相当,都适合安装.已知 型和 型节能灯每支的价格分别为 120 元、25 元,当地商业电价为 0.75 元/千瓦时.假定该店面一年周转期的照明时间为 3600 小时,若正常营业期间灯坏了立即购买同型灯管更换.(用频率估计概率)()根据频率直方图估算 型节能灯的平均使用寿命;()根据统计知识知,若一支灯管一年内需要更换的概率为 ,那么 支灯管估计需要更换 支.若该商家新店面全部安装了 型节能灯,试估计一年内需更换的支数;()若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由.【解析】()由图可知,各组中值依次为 ,对应的频率依次为 ,故 型节能灯的平均使
44、用寿命为 小时.()由图可知,使用寿命不超过 小时的频率为 ,将频率视为概率,每支灯管需要更换的概率为,故估计一年内 支 型节能灯需更换的支数为 .()若选择 型节能灯,一年共需花费 元;若选择 型节能灯,一年共需花费 元.因为 ,所以该商家应选择 A 型节能灯.4 【山东省潍坊市 2019 届高三一模】某水果种植基地引进一种新水果品种,经研究发现该水果每株的产量 (单位: )和与它“相近”的株数 具有线性相关关系(两株作物 “相近”是指它们的直线距离不超过 ) ,并分别记录了相近株数为 0,1,2,3,4 时每株产量的相关数据如下:0 1 2 3 415 12 11 9 8(1)求出该种水果
45、每株的产量 关于它“相近”株数 的回归方程;(2)该种植基地在如图所示的长方形地块的每个格点(横纵直线的交点)处都种了一株该种水果,其中每个小正方形的面积都为 ,现从所种的该水果中随机选取一株,试根据( 1)中的回归方程,预测它的产量的平均数.附:回归方程 中斜率和截距的最小二乘法估计公式分别为: , .23【解析】(1)由题意得: ,所以 ,所以 .(2)由回归方程得:当 时, ,当 时, ,当 时, ,故平均数为: .所以一株产量的平均数为 .5 【贵州省贵阳市普通中学 2019 届高三年级第一学期期末】如今我们的互联网生活日益丰富,除了可以很方便地网购,网络外卖也开始成为不少人日常生活中
46、不可或缺的一部分 市某调查机构针对该市市场占有率最高的两种网络外卖企业 以下简称外卖 A、外卖 的服务质量进行了调查,从使用过这两种外卖服务的市民中随机抽取了 1000 人,每人分别对这两家外卖企业评分,满分均为 100 分,并将分数分成 5 组,得到以下频数分布表:24分数人数种类外卖 A 50 150 100 400 300外卖 B 100 100 300 200 300表中得分越高,说明市民对网络外卖服务越满意 若得分不低于 60 分,则表明该市民对网络外卖服务质量评价较高 现将分数按 “服务质量指标”划分成以下四个档次:分数服务质量指标 0 1 2 3视频率为概率,解决下列问题:从该市
47、使用过外卖 A 的市民中任选 5 人,记对外卖 A 服务质量评价较高的人数为 X,求 X 的数学期望从参与调查的市民中随机抽取 1 人,试求其评分中外卖 A 的“服务质量指标”与外卖 B 的“服务质量指标”的差的绝对值等于 2 的概率;在 M 市工作的小王决定从外卖 A、外卖 B 这两种网络外卖中选择一种长期使用,如果从这两种外卖的“服务质量指标”的期望角度看,他选择哪种外 卖更合适?试说明理由【解析】对外卖 A 服务质量评价较高的概率 ,从该市使用过外卖 A 的市民中任选 5 人,记对外卖 A 服务质量评价较高的人数为 X,则 ,的数学期望 从参与调查的市民中随机抽取 1 人,其评分中外卖
48、A 的“服务质量指标”与外卖 B 的“服务质量指标”的差的绝对值等于 2 的概率:25,的服务质量指标的期望高于 B,故选外卖 A 更合适6 【陕西省汉中市重点中学 2019 届高三下学期 3 月联考】随着科技的发展,网购已经逐渐融入了人们的生活.在家里面不用出门就可以买到自己想要的东西,在网上付款即可,两三天就会送到自己的家门口,如果近的话当天买当天就能送到,或者第二天就能送到,所以网购是非常方便的购物方式.某公司组织统计了近五年来该公司网购的人数 (单位:人)与时间 (单位:年)的数据,列表如下:1 2 3 4 524 27 41 64 79(1)依据表中给出的数据,是否可用线性回归模型拟合 与 的关系,请计算相关系数 并加以说明(计算结果精确到 0.01).(若 ,则线性相关程度很高,可用线性回归模型拟合)附:相关系数公式 ,参考数据 .(2)某网购专营店为吸引顾客,特推出两种促销方案.方案一:每满 600 元可减 100 元;方案二:金额超过 600 元可抽奖三次,每次中奖的概率