1、1概率与统计问题重在“辨”辨析、辨型技法指导迁移搭桥思 维 流 程 找 突 破 口 概率与统计问题辨析、辨型的策略(1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关系,如互斥、对立、独立等;(2)理清事件以什么形式发生,如同时发生、至少有几个发生、至多有几个发生、恰有几个发生等;(3)明确抽取方式,如放回还是不放回、抽取有无顺序等;(4)准确选择排列组合的方法来计算基本事件发生数和事件总数,或根据概率计算公式和性质来计算事件的概率;(5)确定随机变量取值并求其对应的概率,写出分布列后再求期望、方差(6)会套用求 、 K2的公式,再作进一步求值与分析.b 典例 (2018全国卷)某工厂的
2、某种产品成箱包装,每箱 200 件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中任取 20 件作检验,再根据检验结果决定是否对余下的所有产品作检验设每件产品为不合格品的概率都为 p(00;当 p(0.1,1)时, f( p)400,故应该对余下的产品作检验题后悟道 解决概率与统计问题的关键点(1)会利用两个基本计数原理、排列与组合,以及古典概型的概率公式求随机变量的概率;能准确判断随机变量 X 的所有可能取值,然后求出随机变量 X 取每个值时的概率,即可得随机变量 X 的分布列;还需活用定义,即会活用随机变量的数学期望的定义进行计算(2)独立性
3、检验是用来考察两个分类变量是否有关系,根据统计量 K2的计算公式确定K2的值, K2越大,说明两个分类变量有关系的可能性越大3针对训练为了调查观众对电视剧传奇大亨的喜爱程度,浙江电视台在甲、乙两地各随机抽取了 8 名观众做问卷调查,并对问卷进行评分(满分 100 分),被抽取的各位观众的问卷得分结果如图所示.(1)计算甲地被抽取的观众问卷得分的中位数和乙地被抽取的观众问卷得分的极差;(2)用频率估计概率,若从乙地的所有观众中再随机抽取 7 人进行问卷调查,记抽取的7 人中问卷得分不低于 85 分的人数为 X,求 X 的分布列、期望与方差;(3)从甲、乙两地分别抽取的 8 名观众中各抽取一人,在
4、已知有人问卷得分不低于 85分的条件下,求乙地被抽取的观众问卷得分低于 85 分的概率解:(1)由茎叶图可知,甲地被抽取的观众问卷得分的中位数是 83,乙地被抽83 832取的观众问卷得分的极差是 977621.(2)记“从乙地抽取 1 人进行问卷调查,其问卷得分不低于 85 分”为事件 M,则 P(M) .48 12随机变量 X 的所有可能取值为 0,1,2,3,4,5,6,7,且 X B ,(7,12)所以 P(X k)C k 7 kC 7, k0,1,2,3,4,5,6,7.k7(12)(12) k7(12)所以 X 的分布列为X 0 1 2 3 4 5 6 7P 1128 7128 2
5、1128 35128 35128 21128 7128 1128故 E(X)7 , D(X)7 .12 72 12 12 74(3)由茎叶图可得,甲地被抽取的 8 名观众中有 3 名观众问卷得分不低于 85 分,乙地被抽取的 8 名观众中有 4 名观众问卷得分不低于 85 分设事件 A 为“从甲、乙两地分别抽取的 8 名观众中各抽取一人,已知有人问卷得分不低于 85 分” ,事件 B 为“从甲、乙两地分别抽取的 8 名观众中各抽取一人,乙地观众问卷得分低于 85 分” 4所以 P(AB) , P(A)1 ,3488 316 5488 1116根据条件概率公式,得 P(B|A) .P ABP A
6、3161116 311所以在已知有人问卷得分不低于 85 分的条件下,乙地被抽取的观众问卷得分低于 85分的概率为 .311总结升华概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件、独立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件 专 题 过 关 检 测 A 组“633”考点落实练一、选择题1利用系统抽样法从编号分别为 1,2,3,80 的 80 件不同产品中抽出一个容量为16
7、的样本,如果抽出的产品中有一件产品的编号为 13,则抽到产品的最大编号为( )A73 B78C77 D76解析:选 B 样本的分段间隔为 5,所以 13 号在第三组,则最大的编号为801613(163)578.故选 B.2(2019 届高三南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A100,20 B200,20C200,10 D100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 0002%200,抽5取的高中生人数是
8、 2 0002%40,由题图乙可知高中生的近视率为 50%,所以高中生的近视人数为 4050%20,故选 B.3从某地高中男生中随机抽取 100 名同学,将他们的体重(单位:kg)数据绘制成频率分布直方图(如图),由直方图可知( )A估计体重的众数为 50 或 60B a0.03C学生体重在50,60)有 35 人D从这 100 名男生中随机抽取一人,体重在60,80)的概率为13解析:选 C 根据频率分布直方图知,最高的小矩形对应的底边中点为 55,50 602所以估计众数为 55,A 错误;根据频率和为 1,计算( a0.0350.0300.0200.010)101,解得 a0.005,B
9、 错误;体重在50,60)内的频率是 0.35,估计体重在50,60)内的学生有 1000.3535 人,C 正确;体重在60,80)内的频率为 0.30.20.5,用频率估计概率,知这 100 名男生中随机抽取一人,体重在60,80)的概率为 ,D 错误124如图是民航部门统计的 2019 年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )A深圳的变化幅度最小,北京的平均价格最高B深圳和厦门的春运期间往返机票价格同去年相比有所下降C平均价格从高到低居于前三位的城市为北京、深圳、广州D平均价格的涨幅从高到低居于前三位的城市为天
10、津、西安、厦门6解析:选 D 由图可知深圳对应的小黑点最接近 0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故 A 正确;由图可知深圳和厦门对应的小黑点在 0%以下,故深圳和厦门的价格同去年相比有所下降,故 B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故 C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故 D 错误,选 D.5一个样本容量为 10 的样本数据,它们组成一个公差不为 0 的等差数列 an,若a38,且 a1, a3, a7成等比数列,则此样本的平均数和中位数分别是( )A13,12 B13,13C12,13 D13,14
11、解析:选 B 设等差数列 an的公差为 d(d0), a38, a1a7 a 64,(82 d)23(84 d)64,即 2d d20,又 d0,故 d2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为 13,中位数为 13. 4 22 510 12 1426(2017山东高考)为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系,设其回归直线方程为 x ,已知 i225, i1 600, 4.该班某学y b a 10i 1x 10i 1y b 生的脚长为
12、 24,据此估计其身高为( )A160 B163C166 D170解析:选 C 由题意可知 4 x ,y a 又 22.5, 160,x y因此 16022.54 ,解得 70,a a 所以 4 x70.y 当 x24 时, 42470166.y 二、填空题7如图是某学校一名篮球运动员在 10 场比赛中所得分数的茎叶图,则该运动员在这10 场比赛中得分的中位数为_解析:把 10 场比赛的所得分数按顺序排列:5,8,9,12,14,16,16,19,21,24,中间两个为 14 与 16,故中位数为 15.14 1627答案:158已知一组数据 x1, x2, xn的方差为 2,若数据ax1 b
13、, ax2 b, axn b(a0)的方差为 8,则 a 的值为_解析:根据方差的性质可知, a228,故 a2.答案:29某新闻媒体为了了解观众对央视开门大吉节目的喜爱与性别是否有关系,随机调查了观看该节目的观众 110 名,得到如下的列联表:女 男 总计喜爱 40 20 60不喜爱 20 30 50总计 60 50 110试根据样本估计总体的思想,估计在犯错误的概率不超过_的前提下(约有_的把握)认为“喜爱该节目与否和性别有关” 参考附表:P(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828参考公式: K2 ,其中 n a b c dn ad bc
14、 2 a b c d a c b d解析:分析列联表中数据,可得 K2的观测值k 7.8226.635,所以在犯错误的概率不超过 0.01110 4030 2020 260506050的前提下(有 99%的把握)认为“喜爱该节目与否和性别有关” 答案:0.01 99%三、解答题10某市教育学院从参加市级高中数学竞赛的考生中随机抽取 60 名学生,将其竞赛成绩(均为整数)分成六段:40,50),50,60),60,70),90,100,得到如图所示的频率分布直方图8(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);(2)用分层抽样的方法
15、在各分数段的考生中抽取一个容量为 20 的样本,则各分数段抽取的人数分别是多少?解:(1)由频率分布直方图可知,(0.0100.0150.015 a0.0250.005)101,所以 a0.03.所以参加高中数学竞赛的考生的成绩的平均数为450.1550.15650.15750.3850.25950.0571,成绩的众数为 75.设参加高中数学竞赛的考生的成绩的中位数为 x,则 0.10.150.15( x70)0.030.5,解得 x73.3,所以中位数为 73.3.(2)因为各层人数分别为 6,9,9,18,15,3,各层抽取比例为 ,2060 13所以各分数段抽取人数依次为 2,3,3,
16、6,5,1.112017 年 8 月 22 日金乡县首届“诚信文艺奖”评选暨 2017“百姓大舞台”第一季大型才艺大赛决赛在红星美凯龙举行在比赛现场,12 名专业人士和 12 名观众代表分别组成评判小组 A, B,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图:(1)求 A 组数据的众数和极差, B 组数据的中位数;(2)对每一组计算用于衡量相似性的数值,回答:小组 A 与小组 B 哪一个更像是由专业人士组成的?并说明理由解:(1)由茎叶图可得: A 组数据的众数为 47,极差为 554213;B 组数据的中位数为 56.5.55 582(2)小组 A 更像是由专业人士组成的理由如下:
17、小组 A, B 数据的平均数分别为A (424244454647474749505055)47,x112B (364246474955586266687073)56,x1129所以小组 A, B 数据的方差分别为s (4247) 2(4247) 2(5547) 22A112 (252594149964)12.5,112s (3656) 2(4256) 2(7356) 22B112 (40019610081491436100144196289)133.112因为 s 2.706.80 1220 2820 24040324811故有 90%以上的把握认为“数学成绩优秀与教学改革有关” (2)从乙班
18、70,80),80,90),90,100分数段中抽取的人数分别为 2,3,2,依题意随机变量 X 的所有可能取值为 0,1,2,3,P(X0) , P(X1) , P(X2) , P(X3) .C34C37 435 C24C13C37 1835 C14C23C37 1235 C3C37 135其分布列为X 0 1 2 3P 435 1835 1235 135所以 E(X)0 1 2 3 .435 1835 1235 135 972社会公众人物的言行在一定程度上影响着年轻人的人生观、价值观某媒体机构为了解大学生对影星、歌星以及著名主持人方面的新闻(简称“星闻”)的关注情况,随机调查了某大学的 2
19、00 位大学生,得到信息如下表:男大学生 女大学生不关注“星闻” 80 40关注“星闻” 40 40(1)从所抽取的 200 人内关注“星闻”的大学生中,再抽取 3 人做进一步调查,求这 3人性别不全相同的概率;(2)是否有 95%以上的把握认为关注“星闻”与性别有关?并说明理由;(3)把以上的频率视为概率,若从该大学被调查的男大学生中随机抽取 4 人,设这 4 人中关注“星闻”的人数为 ,求 的分布列及数学期望附:P(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828K2 , n a b c d.n ad bc 2 a b c d a c b d解:(
20、1)由已知得,所求概率 P1 .2C340C380 6079(2)由于 K2 5.5563.841,200 8040 4040 21208012080 509故有 95%以上的把握认为关注“星闻”与性别有关12(3)由题意可得,从被调查的男大学生中抽取一位关注“星闻”的男大学生的概率为 ,不关注“星闻”的概率为 , 的所有可能取值为 0,1,2,3,4.40120 13 23P( 0) 4 ; P( 1)C 3 ;(23) 1681 14 13 (23) 3281P( 2)C 2 2 ;24 (13) (23) 2481 827P( 3)C 3 ;34 (13) 23 881P( 4) 4 .
21、(13) 181所以 的分布列为 0 1 2 3 4P 1681 3281 827 881 181因为 B ,所以 E( ) .(4,13) 433(2018潍坊统一考试)某机构为研究某种图书每册的成本费 y(单位:元)与印刷数量 x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值x y u(xi )28i 1 x (xi )(yi )8i 1 x y (ui )28i 1 u (ui )(yi )8i 1 u y15.253.630.2692 085.5 230.3 0.787 7.049表中 ui , i.1xi u 188i 1u(1)根据散点图判
22、断: y a bx 与 y c 哪一个模型更适合作为该图书每册的成本费dxy(单位:元)与印刷数量 x(单位:千册)的回归方程?(只要求给出判断,不必说明理由)13(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程(回归系数的结果精确到0.01)(3)若该图书每册的定价为 10 元,则至少应该印刷多少册才能使销售利润不低于 78 840 元?(假设能够全部售出结果精确到 1)附:对于一组数据( 1, v1),( 2, v2),( n, vn),其回归直线 的v 斜率和截距的最小二乘估计分别为 , . ni 1 i vi vni 1 i 2 v 解:(1)由散点图判断, y c
23、 更适合作为该图书每册的成本费 y(单位:元)与印刷dx数量 x(单位:千册)的回归方程(2)令 u ,先建立 y 关于 u 的线性回归方程,1x由于 8.9578.96,d 8i 1 ui u yi y8i 1 ui u 2 7.0490.787 3.638.9570.2691.22,c y d u y 关于 u 的线性回归方程为 1.228.96 u,y y 关于 x 的回归方程为 1.22 .y 8.96x(3)假设印刷 x 千册,依题意得 10x1.22 x78.840,8.96x x10,至少印刷 10 000 册才能使销售利润不低于 78 840 元4(2019 届高三广州调研)某
24、基地蔬菜大棚采用无土栽培方式种植各类蔬菜根据过去 50 周的资料显示,该地周光照量 X(小时)都在 30 小时以上,其中不足 50 小时的有 5周,不低于 50 小时且不超过 70 小时的有 35 周,超过 70 小时的有 10 周根据统计,该基地的西红柿增加量 y(千克)与使用某种液体肥料的质量 x(千克)之间的关系为如图所示的折线图14(1)依据折线图,是否可用线性回归模型拟合 y 与 x 的关系?请计算相关系数 r 并加以说明(精确到 0.01)(若| r|0.75,则线性相关程度很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每
25、周光照控制仪运行台数受周光照量 X 限制,并有如下关系:周光照量 X(单位:小时) 3070光照控制仪运行台数 3 2 1若某台光照控制仪运行,则该台光照控制仪周利润为 3 000 元;若某台光照控制仪未运行,则该台光照控制仪周亏损 1 000 元以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数公式 r ,ni 1 xi x yi yni 1 xi x 2ni 1 yi y 2参考数据: 0.55, 0.95.0.3 0.9解:(1)由已知数据可得 5,x2 4 5 6 85 4.y3 4 4 4 55因为 (xi )(yi )(3)(1)000316,5i
26、 1 x y 2 ,5i 1 xi x 2 3 2 1 2 02 12 32 5 .5i 1 yi y 2 1 2 02 02 02 12 2所以相关系数 r 0.95.5i 1 xi x yi y5i 1 xi x 25i 1 yi y 2 6252 910因为 r0.75,所以可用线性回归模型拟合 y 与 x 的关系(2)记商家周总利润为 Y 元,由条件可知至少需安装 1 台,最多安装 3 台光照控制仪15安装 1 台光照控制仪可获得周总利润 3 000 元安装 2 台光照控制仪的情形:当 X70 时,只有 1 台光照控制仪运行,此时周总利润 Y3 0001 0002 000(元),P(Y
27、2 000) 0.2,1050当 3070 时,只有 1 台光照控制仪运行,此时周总利润 Y13 00021 000 1 000(元),P(Y1 000) 0.2,1050当 50 X70 时,有 2 台光照控制仪运行,此时周总利润 Y23 00011 000 5 000(元),P(Y5 000) 0.7,3550当 30X50 时,3 台光照控制仪都运行,周总利润 Y33 0009 000(元), P(Y9 000) 0.1,550故 Y 的分布列为Y 1 000 5 000 9 000P 0.2 0.7 0.1所以 E(Y)1 0000.25 0000.79 0000.14 600(元)综上可知,为使商家周总利润的均值达到最大,应该安装 2 台光照控制仪16