1、高考大题专项六 高考中的概率、统计与统计案例,-2-,从近五年的高考试题来看,在高考的解答题中,对概率、统计与统计案例的考查主要有三个方面:一是统计与统计案例,以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,其中回归分析、独立性检验、用样本的数据特征估计总体的数据特征是考查重点,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生的数据处理能力;二是统计与概率综合,以现实生活为背景,利用频率估计概率,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查;三是古典概型的综合应用,以现实生活为背景,求某些事件发生的概率,常与抽样方法、茎叶图等统计知识
2、交汇考查.,-3-,-4-,-5-,4.独立性检验:对于取值分别是x1,x2和y1,y2的分类变量X和Y,其样本频数列联表是:,-6-,5.概率的基本性质 (1)随机事件的概率:0P(A)1;必然事件的概率是1;不可能事件的概率是0. (2)若事件A,B互斥,则P(AB)=P(A)+P(B). (3)若事件A,B对立,则P(AB)=P(A)+P(B)=1. 6.两种常见的概率模型 (1)古典概型;(2)几何概型.,-7-,题型一,题型二,题型三,题型四,题型五,题型六,题型一 样本的数字特征的应用 例1(2018全国3,文18)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两
3、种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:,-8-,题型一,题型二,题型三,题型四,题型五,题型六,(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:,(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?,-9-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)第二种生产方
4、式的效率更高. 理由如下: 由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高. 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. 由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.,-10-,题型一,题型二,题型三,
5、题型四,题型五,题型六,由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高. 以上给出了4种理由,考生答出其中任意一种或其他合理理由即可.,-11-,题型一,题型二,题型三,题型四,题型五,题型六,-12-,题型一,题型二,题型三,题型四,题型五,题型六,对点训练1(2018河南新乡
6、一模,18)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:,-13-,题型一,题型二,题型三,题型四,题型五,题型六,(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值; (2)轮胎的宽度在194,196内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?,-14-,题型一,题型二,题型三,题型四,题型五,题型六,-15-,题型一,题型二,题型三,题型四,题型五,题型六,题
7、型二 利用回归方程进行回归分析 例2(2018广东茂名二模,18)某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:,-16-,题型一,题型二,题型三,题型四,题型五,题型六,(1)从这5天中任选2天,求这2天发芽的种子数均不小于25的概率; (2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另外三天的数据,求出y关于x的线性回归方程y=bx+a; (3)若由线性回归方程得到的估计数据与所选出的检验数据的误差
8、均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为,-17-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)由题意,设这两天发芽的种子数分别为m,n,m、n的所有取值有(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26), (30,16),(26,16),共有10个, 设“m、n均不小于25”为事件A,则事件A包含的基本事件有(25,30),(25,26),(30,26),-18-,题型一,题型二,题型三,题型四,题型五,
9、题型六,-19-,题型一,题型二,题型三,题型四,题型五,题型六,解题心得在求两变量相关系数和两变量的回归方程时,由于r和b的计算公式比较复杂,求它们的值时计算量比较大,因此为了计算准确,可将它们分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度.,-20-,题型一,题型二,题型三,题型四,题型五,题型六,对点训练2为了调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:,(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有99%的把握判定该地区的老年人需要志愿者提供帮助与性别有关? (3)根据(2)的结论
10、,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.,-21-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)调查的500位老年人中有70位需要志愿者提供帮助, 因此该地区老年人中,需要帮助的老年人的比例的估计值为,因为9.9676.635,所以有99%的把握判定该地区的老年人需要志愿者提供帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此,在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样的方法取得样本
11、.可知分层抽样的方法比采用简单随机抽样方法更好.,-22-,题型一,题型二,题型三,题型四,题型五,题型六,题型三 频率分布直方图与独立性检验的综合 例3(2018四川广元一诊,19)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:分钟)进行调查,将收集的数据分成0,10),10,20),20,30),30,40),40,50),50,60)六组,并作出频率分布直方图(如图),将日均课外体育锻炼时间不低于40分钟的学生评价为“课外体育达标”. (1)请根据直方图中的数据填写下面的22列联表,并通过计算是否有99%的把握认为“课外体育
12、达标”与性别有关?,-23-,题型一,题型二,题型三,题型四,题型五,题型六,(2)在0,10),40,50)这两组中采取分层抽样,抽取6人,再从这6名学生中随机抽取2人参加体育知识问卷调查,求这2人中一人来自“课外体育达标”和一人来自“课外体育不达标”的概率.,-24-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)由题意得“课外体育达标”人数为200(0.02+0.005)10=50人, 则不达标人数为150人, 列联表如下:,-25-,题型一,题型二,题型三,题型四,题型五,题型六,设在0,10)抽取的人为A,B,在40,50)抽取的人为a,b,c,d, 从这6人中随机抽取2
13、人的情况为 AB,Aa,Ab,Ac,Ad,Ba,Bb,Bc,Bd,ab,ac,ad,bc,bd,cd共15种, 2人中一人来自“课外体育达标”和一人来自“课外体育不达标”共有:Aa,Ab,Ac,Ad,Ba,Bb,Bc,Bd共8种,-26-,题型一,题型二,题型三,题型四,题型五,题型六,解题心得有关独立性检验的问题解题步骤:(1)作出22列联表;(2)计算随机变量2的值;(3)查临界值,检验作答.,-27-,题型一,题型二,题型三,题型四,题型五,题型六,对点训练3(2018四川达州高考一诊试卷,19)某市去年外出务工返乡创业人员中有1 000名个人年收入在区间1,41(单位:万元)上,从这1
14、 000名中随机抽取100名,得到这100名人员年收入频率分布直方图.这些数据区间是1,5,(37,41.,(1)用样本估计总体,试用直方图估算这1 000名外出务工返乡创业人员年收入为(33,41万元的人数; (2)调查发现这1 000名返乡创业人员中有600人接受了职业技术教育,其中340人个人年收入超过17万元.请完成个人年收入与接受职业教育22列联表,判断是否有99%的把握认为该市这1 000人返乡创业收入与创业人员是否接受职业技术教育有关?请说明理由.,-28-,题型一,题型二,题型三,题型四,题型五,题型六,-29-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)收入在
15、(33,41上的返乡创业人员频率为0.0104+0.0054=0.06,估算这1 000名外出务工返乡创业人员年收入为(33,41万元的人数为1 0000.06=60(人). (2)根据题意,这1 000名返乡创业人员中年收入超过17万元的人数是1 0001-(0.01+0.02+0.03+0.04)4=600,其中参加职业技术教育的人数是340人. 由此填写22列联表如下:,-30-,题型一,题型二,题型三,题型四,题型五,题型六,所以有99%的把握认为该市这1 000人返乡创业收入与创业人员是否接受职业技术教育有关.,-31-,题型一,题型二,题型三,题型四,题型五,题型六,题型四 频率分
16、布表(图)与概率的综合 例4(2018四川南充一诊,18)某厂家为了了解某新产品使用者的年龄情况,现随机调査100位使用者的年龄整理后画出的频率分布直方图如图所示.(1)求100名使用者中各年龄组的人数,并利用所给的频率分布直方图估计所有使用者的平均年龄; (2)若已从年龄在35,45),45,55的使用者中利用分层抽样选取了6人,再从这6人中选出2人,求这2人在不同的年龄组的概率.,-32-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)由图可得,各组年龄的人数分别为10,30,40,20, 估计所有使用者的平均年龄为: 0.120+0.330+0.440+0.250=37(岁)
17、. (2)由题意可知抽取的6人中,年龄在35,45)范围内的人数为4人,记为a,b,c,d,年龄在45,55范围内的人数为2人,记为m,n. 从这6人中选取2人,结果共有15种: (ab),(ac),(ad),(am),(an),(bc),(bd),(bm),(bn),(cd),(cm),(cn),(dm), (dn),(mn). 设“这2人在不同年龄组”为事件A.,-33-,题型一,题型二,题型三,题型四,题型五,题型六,解题心得在统计中,某事件的概率无法知道,可以通过计算现实生活中某事件的频率来代替概率,再用概率计算其他事件的数量.,-34-,题型一,题型二,题型三,题型四,题型五,题型六
18、,对点训练4(2018北京,文17)电影公司随机收集了电影的有关数据,经分类整理得到下表:,好评率是指一类电影中获得好评的部数与该类电影的部数的比值.,-35-,题型一,题型二,题型三,题型四,题型五,题型六,(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)随机选取1部电影,估计这部电影没有获得好评的概率; (3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化,假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?
19、(只需写出结论),解 (1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2 000部. 第四类电影中获得好评的电影部数是2000.25=50部,-36-,题型一,题型二,题型三,题型四,题型五,题型六,(2)(方法一)由题意知,样本中获得好评的电影部数是 1400.4+500.2+3000.15+2000.25+8000.2+5100.1 =56+10+45+50+160+51=372部.,(方法二)设“随机选取1部电影,这部电影没有获得好评”为事件B. 没有获得好评的电影共有 1400.6+500.8+3000.85+2000.75+8000.8+5100.9
20、 =1 628(部).,(3)第五类电影的好评率增加0.1,第二类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大.,-37-,题型一,题型二,题型三,题型四,题型五,题型六,题型五 抽样与古典概型的综合 例5(2018天津,文15)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动. (1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人? (2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作. 试用所给字母列举出所有可能的抽
21、取结果; 设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.,-38-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)由已知,甲、乙、丙三个年级的学生志愿者人数之比为322,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人. (2)从抽出的7名同学中随机抽取2名同学的所有可能结果为A,B,A,C,A,D,A,E,A,F,A,G,B,C,B,D,B,E,B,F,B,G,C,D,C,E,C,F,C,G,D,E,D,F,D,G,E,F,E,G, F,G,共21种. 由(1),不妨设抽出的7名同学中,来自甲年级的是A,B,
22、C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为A,B,A,C,B,C, D,E,F,G,共5种. 所以,事件M发生的概率P(M)=,-39-,题型一,题型二,题型三,题型四,题型五,题型六,解题心得解决抽样与古典概型的综合问题的方法:(1)定数,利用统计知识确定频数;(2)定型,根据事件“有限性和等可能性”判断是否为古典概型;(3)定性,由题意用列举的方法确定试验的基本事件总数和某事件所含的基本事件数;(4)代入公式求解.,-40-,题型一,题型二,题型三,题型四,题型五,题型六,对点训练5(2018甘肃张掖一模,18)共享单
23、车是企业在校园、地铁站点、公交站点、居民区、商业区、公共服务区等提供的自行车共享服务,是一种分时租赁模式,某共享单车企业为更好服务社会,随机调查了100人,统计了这100人每日平均骑行共享单车的时间(单位:分钟),由统计数据得到如下频率分布直方图,已知骑行时间在60,80),20,40),40,60)三组对应的人数依次成等差数列.,-41-,题型一,题型二,题型三,题型四,题型五,题型六,(1)求频率分布直方图中a,b的值. (2)若将日平均骑行时间不少于80分钟的用户定义为“忠实用户”,将日平均骑行时间少于40分钟的用户定义为“潜力用户”,现从上述“忠实用户”与“潜力用户”的人中按分层抽样选
24、出5人,再从这5人中任取3人,求恰好1人为“忠实用户”的概率.,-42-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)由(0.002 52+0.007 5+3a)20=1,解得a=0.012 5, 又b+0.016 5=2a=0.025,b=0.008 5. (2)“忠实用户”“潜力用户”的人数之比为: (0.007 5+0.002 5)(0.012 5+0.002 5)=23,记事件A为:从5人中任取3人恰有1人为“忠实用户”, 设两名“忠实用户”的人记为B1,B2,三名“潜力用户”的人记为b1,b2,b3, 则这5人中任选3人有(B1,B2,b1),(B1,B2,b2),(B
25、1,B2,b3),(B1,b1,b2), (B1,b1,b3),(B1,b2,b3),(B2,b1,b2),(B2,b1,b3),(B1,b2,b3),(b1,b2,b3),共10种情形,符合题设条件的有(B1,b1,b2),(B1,b1,b3),(B1,b2,b3),(B2,b1,b2), (B2,b1,b3),(B1,b2,b3)共有6种, 因此恰好1人为“忠实用户”的概率为,-43-,题型一,题型二,题型三,题型四,题型五,题型六,题型六 独立性检验与古典概型的综合 例6(2018河南一诊,19)近年来我国电子商务行业迎来蓬勃发展的新机遇,2017年双11期间,某购物平台的销售业绩高达1
26、 271亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系,现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次.,-44-,题型一,题型二,题型三,题型四,题型五,题型六,(1)完成下面的22列联表,并回答能否有99%的把握认为商品好评与服务好评有关?,(2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求至少有一次好评的概率. 附:,-45-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)根据题意,对商品好评次数
27、为2000.6=120, 对服务好评次数为2000.75=150, 填写22列联表如下:,-46-,题型一,题型二,题型三,题型四,题型五,题型六,-47-,题型一,题型二,题型三,题型四,题型五,题型六,解题心得1.古典概型是基本事件个数有限,每个基本事件发生的概率相等的一种概率模型,计算概率时,要先判断再计算. 2.独立性检验的步骤:列表、计算、检验.,-48-,题型一,题型二,题型三,题型四,题型五,题型六,对点训练6(2018河南信阳二模,18)2017年10月份郑州市进行了高三学生的体育学业水平测试,为了考察高中学生的身体素质情况,现抽取了某校1 000名(男生800名,女生200名
28、)学生的测试成绩,根据性别按分层抽样的方法抽取100名进行分析,得到如下统计图表:,-49-,题型一,题型二,题型三,题型四,题型五,题型六,(1)现从抽取的1 000名且测试等级为“优秀”的学生中随机选出两名学生,求选出的这两名学生恰好是一男一女的概率; (2)若测试等级为“良好”或“优秀”的学生为“体育达人”,其他等级的学生(含病残免试)为“非体育达人”,根据以上统计数据填写下面列联表,并回答能否有99%的把握认为“是否为体育达人”与性别有关?,-50-,题型一,题型二,题型三,题型四,题型五,题型六,-51-,题型一,题型二,题型三,题型四,题型五,题型六,解 (1)按分层抽样男生应抽取
29、80名,女生应抽取20名, x=80-(5+10+15+47)=3, y=20-(2+3+10+2)=3, 抽取的100名且测试等级为优秀的学生中有三位男生,设为A,B,C; 两位女生设为a,b,从5名任意选2名,总的基本事件有AB,AC,Aa,Ab, BC,Ba,Bb,Ca,Cb,ab,共10个, 设“选出的两名学生恰好是一男一女”为事件A,则事件包含的基本事件有Aa,Ab,Ba,Bb,Ca,Cb共6个,-52-,题型一,题型二,题型三,题型四,题型五,题型六,-53-,解决概率与统计相结合的综合问题,其中解决题目中有关概率问题的关键是读懂题意,能从题目的统计背景中抽取有关概率的相关信息,然后将信息转化为概率试验中的基本关系,按照求某事件概率的方法,计算试验的基本事件数和所求事件包含的基本事件数,进而依据古典概型的概率公式求解.,