2019高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx

上传人:amazingpat195 文档编号:1079822 上传时间:2019-04-07 格式:DOCX 页数:19 大小:763.81KB
下载 相关 举报
2019高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx_第1页
第1页 / 共19页
2019高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx_第2页
第2页 / 共19页
2019高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx_第3页
第3页 / 共19页
2019高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx_第4页
第4页 / 共19页
2019高考数学二轮复习第一篇微型专题微专题16概率与统计的综合应用练习理.docx_第5页
第5页 / 共19页
点击查看更多>>
资源描述

1、116 概率与统计的综合应用1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100.若低于 60 分的人数是 15,则该班的学生人数是( ).A.45 B.50C.55 D.60解析 由频率分布直方图知,低于 60 分的频率为(0 .010+0.005)20=0.3, 该班学生人数 n= =50,故选 B.150.3答案 B2.有一个容量为 66 的样本,数据的分组及各组的频数如下:11.5,15.5),2;15.5,19.5),4;19.5,23.5),9;23.5,27.5),18;27.5,31.5),11;3

2、1.5,35.5),12;35.5,39.5),7;39.5,43.5,3.根据样本的频率分布估计,数据落在27 .5,43.5内的概率是 . 解析 由条件可知,落在27 .5,43.5内的数据有 11+12+7+3=33(个),故所求概率是= .336612答案 123.已知某运动员每次投篮命中的概率都为 40%,现采用随机模拟的方法估计该运动员三次投篮恰有两次命中的概率:先由计算机产生 0 到 9 之间取整数值的随机数,指定 1,2,3,4表示命中,5,6,7,8,9,0 表示不命中,再以每三个随机数为一组,代表三次投篮的结果 .经随机模拟产生了如下 20 组随机数:907 966 191

3、 925 271 932 812 458 569 6832431 257 393 027 556 488 730 113 537 989据此估计,该运动员三次投篮恰有两次命中的概率为 . 解析 20 组随机数中表示三次投篮恰好有两次命中的是 191,271,932,812,393,其频率为 =0.25,以此估计该运动员三次投篮恰有两次命中的概率为 0.25.520答案 0.254.如图所示的茎叶图是甲、乙两人在 4 次模拟测试中的成绩,其中一个数字被污损,则甲的平均成绩不超过乙的平均成绩的概率为 . 解析 依题意,设题中被污损的数字为 x,若甲的平均成绩不超过乙的平均成绩,则有(8+9+2+1

4、)-(5+3+x+5)0,解得 x7,即此时 x 的可能取值是 7,8,9,因此甲的平均成绩不超过乙的平均成绩的概率 P= =0.3.310答案 0.3能力 1 概率与随机抽样的交汇问题【例 1】 已知某中学高三理科班学生的数学与物理的水平测试成绩抽样统计如下表:x人数yA B CA 14 40 10B a 36 bC 28 8 343若抽取学生 n 人,成绩分为 A(优秀), B(良好), C(及格)三个等级,设 x 与 y 分别表示数学成绩与物理成绩,例如:表中物理成绩为 A 等级的共有 14+40+10=64(人),数学成绩为B 等级且物理成绩为 C 等级的共有 8 人 .已知 x 与

5、y 均为 A 等级的概率是 0.07.(1)设在该样本中,数学成绩的优秀率是 30%,求 a,b 的值;(2)已知 a7, b6,求数学成绩为 A 等级的人数比 C 等级的人数多的概率 .解析 (1)由题意知 =0.07,解得 n=200,14n 100%=30%,解得 a=18,14+a+28200易知 a+b=30,b= 12.(2)由 14+a+2810+b+34 得 ab+2.又 a+b=30 且 a7, b6,则( a,b)的所有可能结果为(7,23),(8,22),(9,21),(24,6),共 18 种,而 ab+2 的可能结果为(17,13),(18,12),(24,6),共

6、8 种,则所求概率 P= = .81849求解古典概型与抽样方法交汇问题的思路(1)依据题目中抽样方法的信息,提炼需要的信息 .(2)进行统计与古典概型概率的正确计算 .某险种的基本保费为 a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 5保费(元)0.85aa1.25a1.5a1.75a2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 5概率 0.300.150.200.200.100.05(1)求一续保人本年度的保费比基本保费高出 60%的概率;4(2)若一续保人本年度的

7、保费高于基本保费,求其保费比基本保费高出 60%的概率;(3)求续保人本年度的平均保费与基本保费的比值 .解析 (1)设 A 表示事件“一续保人本年度的保费比基本保费高出 60%”,则事件 A 发生即为当且仅当一年内出险次数大于 3,故 P(A)=0.1+0.05=0.15.(2)设 B 表示事件“一续保人本年度的保费高于基本保费”,则事件 B 发生当且仅当一年内出险次数大于 1,故 P(B)=0.2+0.2+0.1+0.05=0.55.又 P(AB)=P(A),故 P(A|B)= = = = .P(AB)P(B)P(A)P(B)0.150.55311(3)记续保人本年度的保费为 X,则 X

8、的分布列为X 0.85a a 1.25a 1.5a 1.75a 2aP 0.30 0.15 0.20 0.20 0.10 0.05E(X)=0.85a0.30+a0.15+1.25a0.20+1.5a0.20+1.75a0.10+2a0.05=1.23a.因此续保人本年度的平均保费与基本保费的比值为 1.23.能力 2 概率与频率分布直方图的综合应用【例 2】 PM2.5 是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的 PM2.5 值的数据中随机抽取 40 天的数据,其频率分布直方图如图所示 .现将 PM2.5 值划分为如下等级PM2.5值0,100)100,150)15

9、0,200)200,250等级 一级 二级 三级 四级用频率估计概率 .5(1)估计该市在下一年的 360 天中空气质量为一级的天数;(2)在样本中,按照分层抽样的方法抽取 8 天的 PM2.5 值的数据,再从这 8 个数据中随机抽取 5 个,求一级、二级、三级、四级天气都有的概率;(3)如果该市对环境进行治理,治理后经统计,每天 PM2.5 值 X 近似满足 XN(115,752),求治理后的 PM2.5 值的均值比治理前大约下降了多少 .解析 (1)由样本空气质量 PM2.5 的数据的频率分布直方图可知,其频率分布如下表:PM2.5值0,50)50,100)100,150)150,200)

10、200,250频率 0.125 0.125 0.375 0.25 0.125由上表可知,如果该市维持现状不变,那么该市下一年的某一天空气质量为一级的概率为 0.25,因此在 360 天中约有 3600.25=90(天) .(2)在样本中,按照分层抽样的方法抽取 8 天的 PM2.5 值数据,则这 8 个数据中一级、二级、三级、四级天气的数据分别有 2 个、3 个、2 个、1 个 .从这 8 个数据中随机抽取 5 个,则这四种天气都有三种情况:一级天气的数据有 2 个,其余的均为 1 个;二级天气的数据有 2 个,其余的均为 1 个;三级天气的数据有 2 个,其余的均为 1 个 .情况有: +

11、+ =24 种 .C22C13C12C11C12C23C12C11C12C13C22C11而从 8 个数据中随机抽取 5 个,有 =56 种情况 .C58故所求概率为 = .245637(3)如果该市维持现状不变,那么该市的 PM2.5 值的均值约为E(Y)=250.125+750.125+1250.375+1750.25+2250.125=131.25.如果该市对环境进行治理,那么该市的 PM2.5 值 X 的均值为 E(X)=115,因此该市治理后的 PM2.5 值的均值比治理前大约下降了 16.25.有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点 .概率与

12、统计综合题,无论是直接描述还是利用概率分布表、频率分布直方图、茎叶图等给出信息,准确从题中提炼信息是解题的关键 .6从某企业生产的某种产品中抽取 100 件,测量这些产品的质量指标值 .由测量结果得到如图所示的频率分布直方图,质量指标值落在区间55,65),65,75),75,85内的频率之比为 4 2 1.(1)求这些产品质量指标值落在区间75,85内的频率;(2)若将频率视为概率,从该企业生产的这种产品中随机抽取 3 件,记这 3 件产品中质量指标值位于区间45,75)内的产品件数为 X,求 X 的分布列 .解析 (1)设这些产品质量指标值落在区间75,85内的频率为 x,则落在区间55,

13、65),65,75)内的频率分别为 4x,2x.依题意得(0 .004+0.012+0.019+0.030)10+4x+2x+x=1,解得 x=0.05.所以这些产品质量指标值落在区间75,85内的频率为 0.05.(2)由(1)得,这些产品质量指标值落在区间45,75)内的频率为 0.3+0.2+0.1=0.6,将频率视为概率得 p=0.6.从该企业生产的这种产品中随机抽取 3 件,相当于进行了 3 次独立重复试验,所以 X 服从二项分布 B(n,p),其中 n=3,p=0.6.因为 X 的所有可能取值为 0,1,2,3,且 P(X=0)= 0.600.43=0.064,C03P(X=1)=

14、 0.610.42=0.288,C13P(X=2)= 0.620.41=0.432,C23P(X=3)= 0.630.40=0.216,C33所以 X 的分布列为X 0 1 2 37P 0.064 0.288 0.432 0.216能力 3 概率与统计案例的综合应用【例 3】 某校计划面向高一年级 1200 名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了 180 名学生对社会科学类、自然科学类这两大类校本选修课程的选课意向进行调查,其中男生有 105 人 .在这 180 名学生中选择社会科学类的男生、女生均为 45 人 .(1)分别计算抽取的样本中男生、女生选择社会

15、科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;(2)根据抽取的 180 名学生的调查结果,完成 22 列联表,并判断能否在犯错误的概率不超过 0.025 的前提下认为“科类的选择与性别有关” .选择自然科学类选择社会科学类合计男生女生合计附: K2= ,其中 n=a+b+c+d.n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2 k0)0.500 0.400 0.250 0.150 0.100k0 0.455 0.708 1.323 2.072 2.706P(K2 k0)0.050 0.025 0.010 0.005 0.001k0 3.841

16、5.024 6.635 7.87910.8288解析 (1)由条件知,抽取的男生有 105 人,女生有 180-105=75(人),所以男生选择社会科学类的频率为 = ,女生选择社会科学类的频率为 = .4510537 457535由题意知,男生总数为 1200 =700,女生总数为 1200 =500,所以估计选择社会科105180 75180学类的学生人数为 700 +500 =600.37 35(2)根据统计数据,可得列联表如下:选择自然科学类选择社会科学类合计男生 60 45 105女生 30 45 75合计 90 90 180则 K2的观测值 k= 5 .14295.024,180(

17、6045-3045)2105759090所以在犯错误的概率不超过 0.025 的前提下能认为“科类的选择与性别有关” .(1)本题常见的错误是对独立性检验思想理解不深刻,做出错误判定 .(2)进行独立性检验时,提出的假设是两者无关 .近几年出现各种食品问题,食品添加剂会引起血脂增高、血压增高、血糖增高等疾病 .为了解三高疾病是否与性别有关,医院随机对入院的 60 人进行了问卷调查,得到了如下的列联表:患三高疾病 不患三高疾病 合计男 6 30女合计 36(1)请将列联表补充完整 .若用分层抽样的方法在患三高疾病的人群中抽取 9 人,其中女性抽取多少人?9(2)为了研究患三高疾病是否与性别有关,

18、请计算出统计量 K2的观测值 k,并说明是否可以在犯错误的概率不超过 0.005 的前提下认为“患三高疾病与性别有关” .临界值表:P(K2 k0)0.1500.1000.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828参考公式: K2= ,其中 n=a+b+c+d.n(ad-bc)2(a+b)(c+d)(a+c)(b+d)解析 (1)补充列联表如下:患三高疾病 不患三高疾病 合计男 24 6 30女 12 18 30合计 36 24 60在患三高疾病的人群中抽取 9 人,则抽取比例为 = ,93614所以女性应该抽取 1

19、2 =3(人) .14(2)由 22 列联表,得 K2的观测值k= =107.879,60(2418-612)230303624所以可以在犯错误的概率不超过 0.005 的前提下认为“患三高疾病与性别有关” .能力 4 统计与概率的综合应用【例 4】 一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示 .10将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立 .(1)求在未来连续 3 天里,有连续 2 天的日销售量都不低于 100 个且另 1 天的日销售量低于 50 个的概率;(2)用 X 表示在未来 3 天里日销售量不低于 100 个的天数,求随机变量

20、X 的分布列、数学期望 E(X)及方差 D(X).解析 (1)设 A1表示事件“日销售量不低于 100 个”, A2表示事件“日销售量低于 50个”, B 表示事件“在未来连续 3 天里,有连续 2 天的日销售量都不低于 100 个且另 1 天的日销售量低于 50 个”,因此P(A1)=(0.006+0.004+0.002)50=0.6,P(A2)=0.00350=0.15,P(B)=0.60.60.152=0.108.(2)X 可能取的值为 0,1,2,3,相应的概率为P(X=0)= (1-0.6)3=0.064,C03P(X=1)= 0.6(1-0.6)2=0.288,C13P(X=2)=

21、 0.62(1-0.6)=0.432,C23P(X=3)= 0.63=0.216.C33X 的分布列为X 0 1 2 3P 0.064 0.288 0.432 0.216因为 XB(3,0.6),所以数学期望 E(X)=30.6=1.8,方差 D(X)=30.6(1-0.6)=0.72.二项分布的期望与方差 .11(1)如果 XB(n,p),那么用公式 E(X)=np;D(X)=np(1-p)求解,可大大减少计算量 .(2)有些随机变量虽然不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用 E(aX+b)=aE(X)+b 以及 E(X)=np 求出 E(aX+b)

22、,同样还可求出D(aX+b).空气质量指数(AQI)是定量描述空气质量状况的指数,空气质量按照 AQI 大小分为六级:050 为优;51 100 为良;101 150 为轻度污染;151 200 为中度污染;201 300 为重度污染;300 以上为严重污染 .一环保人士记录去年某地六月中的 10 天的 AQI 的茎叶图如图所示 .(1)利用该样本估计该地六月空气质量为优良(AQI100)的天数;(2)将频率视为概率,从六月中随机抽取 3 天,记 3 天中空气质量为优良的天数为 ,求 的分布列 .解析 (1)从茎叶图中可以发现样本中空气质量为优的天数为 2,空气质量为良的天数为 4, 该样本中

23、空气质量为优良的频率为 = ,61035从而估计该地六月空气质量为优良的天数为 30 =18.35(2)由(1)估计六月某天空气质量为优良的概率为 ,35 的所有可能取值为 0,1,2,3,且 B .(3,35)P (= 0)= = ,(25)3 8125P(= 1)= = ,C13(35) (25)236125P(= 2)= = ,C23(35)2 2554125P(= 3)= = ,(35)327125故 的分布列为12 0 1 2 3P 8125 36125 54125 27125一、选择题1.已知随机变量 x,y 的值如表所示,如果 x 与 y 线性相关且回归直线方程为 =bx+ ,那

24、么实y 72数 b=( ).x 2 3 4y 5 4 6A.- B.12 12C.- D.110 110解析 因为 =3, =5,由回归直线过样本点的中心(3,5),得 5=3b+ ,所以 b= .-x -y 72 12答案 B2.把样本容量为 20 的数据分组,分组区间与频数如下:10,20),2;20,30),3;30,40),4;40,50),5;50,60),4;60,70,2.则在区间10,50)上的数据的频率是( ).A.0.05 B.0.25C.0.5 D.0.7解析 由题知,在区间10,50)上的数据的频数是 2+3+4+5=14,故其频率为 =0.7,故1420选 D.答案

25、D3.在一个容量为 N 的总体中抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1,p2,p3,则( ).A.p1=p2 .-x甲 -x乙 s2甲 s2乙说明甲、乙的平均水平一样,但乙的方差小,乙发挥更稳定,故选择乙同学 .(2)从 6 个成绩中随机选择 2 个,共有 15 个基本事件,分别是102,105,102,112,102,113,102,117,102,123,105,112,105,113,105,117,105,123,112,113,112,117,112,123,113,117,113,123,117,

26、123,其中满足条件的基本事件有 5 个,故所求概率 P= = .51513168.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:( a,b),(a, ),(a,b),( ,b),( , ),(a,b),(a,b),(a, ),( ,b),-b -a -a -b -b -a(a, ),( , ),(a,b),(a, ),( ,b),(a,b),其中 a 和 分别表示甲组研发成功和失败; b-b -a -b -b -a -a和 分别表示乙组研发成功和失败 .-b(1)若某组成功研发一种新产品,则给该组记 1 分,否则记 0 分 .试计算甲、乙两

27、组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平 .(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率 .解析 (1)甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数= = ;-x甲 101523方差 = s2甲115(1-23)210+(0-23)25= .29乙组研发新产品的成绩为 1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数 = = ;-x乙 91535方差 = s2乙115(1-35)29+(0-35)26= .625因为 , ,所以甲组的研发水平优于乙组 .-x甲 -x乙 s2甲

28、 s2乙(2)记“恰有一组研发成功”为事件 E,在所抽得的 15 个结果中,恰有一组研发成功的结果有( a, ),( ,b),(a, ),( ,b),(a, ),(a, ),( ,b),共 7 个 .因此事件 E 发生-b -a -b -a -b -b -a的频率为 .用频率估计概率 ,即得所求概率 P(E)= .715 7159.某工厂有 25 周岁以上(含 25 周岁)的工人 300 名,25 周岁以下的工人 200 名 .为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25 周岁以上(含 25

29、周岁)”和“25 周岁以下”分为两组,再将两组工人的日平均生产件数分成 5 组:50,60),60,70),70,80),80,90),90,100,分别加以统计,得到如图所示的频率分布直方图 .17(1)从样本中日平均生产件数不足 60 的工人中随机抽取 2 人,求至少抽到一名“25 周岁以下组”工人的概率 .(2)规定日平均生产件数不少于 80 的为“生产能手”,请你根据已知条件完成 22 列联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关” .附: K2= ,n=a+b+c+d.n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2 k0) 0.100 0

30、.050 0.010 0.001k0 2.706 3.841 6.63510.828解析 (1)由已知得,样本中有 25 周岁以上(含 25 周岁)组工人 60 名,25 周岁以下组工人 40 名 .所以样本中日平均生产件数不足 60 的工人中,25 周岁以上(含 25 周岁)组工人有600.05=3(人),记为 A1,A2,A3;25 周岁以下组工人有 400.05=2(人),记为 B1,B2.从中随机抽取 2 名工人,所有的可能结果共有 10 种,它们是( A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,

31、B2),(B1,B2).其中,至少有 1 名“25 周岁以下组”工人的可能结果共有 7 种,它们是( A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求的概率 P= .710(2)由频率分布直方图可知,在抽取的 100 名工人中,25 周岁以上(含 25 周岁)组中的生产能手有 600.25=15(人),25 周岁以下组中的生产能手有 400.375=15(人),据此可得22 列联表如下:生产能手非生产能手合计25 周岁以上(含 25周岁)组15 45 6025 周岁以下组 15 25 4018合计 30 70 100所以 K2

32、的观测值 k= 1 .79.100(1525-1545)260403070因为 1.792.706,所以没有 90%的把握认为“生产能手与工人所在的年龄组有关” .10.某校高三期中考试后,数学教师对本次全部数学成绩按 1 20 进行分层抽样,随机抽取了20 名学生的成绩作为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:分数段(分 )50,70)70,90)90,110)110,130)130,150总计频数 b频率 a 0.25(1)求表中 a,b 的值及成绩在90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在90,150

33、范围内为及格);(2)若从茎叶图中成绩在100,130)范围内的样本中一次性抽取两个,求取出的两个样本数字之差的绝对值小于或等于 10 的概率 .解析 (1)由茎叶图知成绩在50,70)范围内的有 2 人,在110,130)范围内的有 3 人,a= 0.1,b=3. 成绩在90,110)范围内的频率为 1-0.1-0.25-0.25=0.4, 成绩在90,110)范围内的样本数为 200.4=8.估计这次考试全校高三学生数学成绩的及格率为P=1-0.1-0.25=0.65.19(2)所有可能的结果为(100,102),(100,106),(100,106),(100,116),(100,118

34、),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共 21 个,取出的两个样本中数字之差的绝对值小于或等于 10 的结果为(100,102),(100,106),(100,106),(102,106),(102,106),(106,106),(106,116),(106,116),(116,118),(118,128),共10 个 . 所求概率为 .1021

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 中学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1