2019届高考数学二轮复习专题四概率与统计1.4.1统计、统计案例课件文.ppt

上传人:explodesoak291 文档编号:919023 上传时间:2019-03-03 格式:PPT 页数:94 大小:2.39MB
下载 相关 举报
2019届高考数学二轮复习专题四概率与统计1.4.1统计、统计案例课件文.ppt_第1页
第1页 / 共94页
2019届高考数学二轮复习专题四概率与统计1.4.1统计、统计案例课件文.ppt_第2页
第2页 / 共94页
2019届高考数学二轮复习专题四概率与统计1.4.1统计、统计案例课件文.ppt_第3页
第3页 / 共94页
2019届高考数学二轮复习专题四概率与统计1.4.1统计、统计案例课件文.ppt_第4页
第4页 / 共94页
2019届高考数学二轮复习专题四概率与统计1.4.1统计、统计案例课件文.ppt_第5页
第5页 / 共94页
点击查看更多>>
资源描述

1、第一讲 统计、统计案例,热点题型1 随机抽样 【感悟经典】 【典例】1.某企业在甲、乙、丙、丁四个城市分别有 150个,120个,190个,140个销售点.为了调查产品的质 量,需从这600个销售点中抽取一个容量为100的样本, 记这项调查为;在丙城市有20个特大型销售点,要从,中抽取8个调查,记这项调查为,则完成,这两项调查宜采用的抽样方法依次为 ( ) A.分层抽样法、系统抽样法 B.分层抽样法、简单随机抽样法 C.系统抽样法、分层抽样法 D.简单随机抽样法、分层抽样法,2.为了调研雄安新区的空气质量状况,某课题组对雄 县、容城、安新3县空气质量进行调查,按地域特点在 三县内设置空气质量观

2、测点,已知三县内观测点的个 数分别为6,y,z,依次构成等差数列,且6,y,z+6成等比 数列,若用分层抽样的方法抽取12个观测点的数据,则 容城应抽取的数据个数为 ( ) A.8 B.6 C.4 D.2,【联想解题】1.看到调查需从600个样本中抽取,想到用分层抽样;看到调查样本容量较小,想到用简单随机抽样. 2.利用三县内观测点的个数分别为6,y,z,依次构成等差数列,且6,y,z+6成等比数列,求出y,z,根据分层抽样的定义建立比例关系即可.,【规范解答】1.选B.四个城市销售点数量不同,个体存在差异比较明显,选用分层抽样; 丙城市特大销售点数量不多,使用简单随机抽样即可.故选B.,2.

3、选C.因为三县内观测点的个数分别为6,y,z,依次构 成等差数列,且6,y,z+6成等比数列,所以 所以y=12,z=18,若用分层抽样抽取12个观测点,则容 城应该抽取的数据个数为 12=4.,【规律方法】 1.简单随机抽样需满足的条件 (1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.,2.系统抽样的求解思路 系统抽样又称“等距抽样”,所以依次抽取的样本对应的号码就组成一个等差数列,首项就是第1组所抽取的样本号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组所要抽取的样本号码,但有时也不是按一定间隔抽取的.,3.分层抽样的关注点 为了保证每

4、个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比.,【对点训练】 1.我校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样方法,抽取4个班进行调查,若抽到编号之和为48,则抽到的最小编号为 ( ) A.2 B.3 C.4 D.5,【解析】选B.系统抽样的抽取间隔为 =6.设抽到的 最小编号x,则x+(6+x)+(12+x)+(18+x)=48,所以x=3.,2.福利彩票“双色球”中红球的号码可以01,02,03, 32,33这33个二位号码中选取,小明利用如图所示的随机数表选取红色球的6

5、个号码,选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字,则第四个被选中的红色球号码为 ( ),A.12 B.33 C.06 D.16,【解析】选C.第1行第9列和第10列的数字为63,从左到右依次选取两个数字,依次为17,12,33,06,则第四个被选中的红色球号码为06.,【提分备选】1.某工厂生产A,B,C三种不同型号的产品, 其数量之比依次是347,现在用分层抽样的方法抽 出样本容量为n的样本,样本中A型号产品有15件,那么 n等于 ( ) A.50 B.60 C.70 D.80,【解析】选C.根据分层抽样的定义和方法,可得 = ,解得n=70.,2.采用系统抽样方

6、法从1 000人中抽取50人做问卷调 查,为此将他们随机编号为1,2,1 000,适当分组后 在第一组采用简单随机抽样的方法抽到的号码为8,抽 到的50人中,编号落入区间1,400的人做问卷A,编号 落入区间401,750的人做问卷B,其余的人做问卷C,则 抽到的人中,做问卷C的人数为 ( ) A.12 B.13 C.14 D.15,【解析】选A.由1 00050=20,故由题意可得抽到的号码构成以8为首项、以20为公差的等差数列,且此等差数列的通项公式为an=8+(n-1)20=20n-12. 由75120n-121 000,解得38.2n50.6. 再由n为正整数可得39n50,且nZ,

7、故做问卷C的人数为12.,热点题型2 用样本估计总体 【感悟经典】 【典例】1.某城市公交公司为了更精准地服务于民,统计了某线路的10个车站上车的人数如下:70、60、60、60、50、40、40、30、30、10,则这组数据的众数、中位数、平均数的和为 ( ) A.170 B.165 C.160 D.150,2.(2018广东六校三模)随着社会的发展,终身学习成 为必要,工人知识要更新,学习培训必不可少,现某工厂 有工人1 000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B类工 人),从该工厂的工人中共抽查了100名工人,调查他们,的生产能力(

8、此处生产能力指一天加工的零件数)得到A类工人生产能力的茎叶图(左图),B类工人生产能力的频率分布直方图(右图).,(1)问A类、B类工人各抽查了多少工人,并求出直方图中的x. (2)求A类工人生产能力的中位数,并估计B类工人生产能力的平均数(同一组中的数据用该组区间的中点值作代表).,【联想解题】1.看到求众数、中位数、平均数,想到按照定义去求解. 2.看到茎叶图、频率分布直方图,想到茎叶图的特点和由频率分布直方图求平均数的方法.,【规范解答】1.选D.这10个数的众数为60,中位数 为 =45, 平均数为 所以这组数据的众数、中位数、平均数的和为60+45+45 =150.,2.(1)由茎叶

9、图知A类工人中抽查人数为25名, 所以B类工人中应抽查100-25=75(名). 由频率分布直方图得 (0.008+0.02+0.048+x)10=1,得x=0.024.,(2)由茎叶图知A类工人生产能力的中位数为122,由(1) 及频率分布直方图,估计B类工人生产能力的平均数为 =1150.00810+1250.02010+1350.04810 +1450.02410=133.8.,【规律方法】 1.众数、中位数、平均数与直方图的关系 (1)众数为频率分布直方图中最高矩形的底边中点的横坐标.,(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标. (3)平均数等于频率分布

10、直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和.,2.方差的计算与含义 计算方差首先要计算平均数,然后再按照方差的计算公式进行计算,方差和标准差是描述一个样本和总体的波动大小的特征数,标准差大说明波动大.,【对点训练】 1.(2018黔东南州二模)甲乙两名同学6次考试的成绩 统计如图,甲乙两组数据的平均数分别为 标准差 分别为甲,乙则 ( ) A. 乙 C. ,甲 ,甲乙,【解析】选C.由图可知,甲同学除第二次考试成绩略低 于乙同学,其他次考试都远高于乙同学,可知 , 图中数据显示甲同学的成绩比乙同学稳定,故甲乙.,2.(2018泸州二模)如图是2017年第一季度五省GDP情况图,

11、则下列陈述中不正确的是 ( ),A.2017年第一季度GDP总量和增速由高到低排位均居同 一位的省只有1个 B.与去年同期相比,2017年第一季度五个省的GDP总量均 实现了增长 C.去年同期河南省的GDP总量不超过4000亿元 D.2017年第一季度GDP增速由高到低排位第5的是浙江省,【解析】选A.因为由图中数据可知2017年第一季度GDP总量和增速由高到低排位均居同一位的省,江苏都是第一位,河南都是第4位,所以A不正确,与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长,去年同期河南省的GDP总量不超过4000亿元,2017年第一季度GDP增速由高到低排位第5的是浙江省,所

12、以B,C,D都是正确的.,【提分备选】 1.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位数分别为 ( ),A.19,13 B.13,19 C.20,18 D.18,20,【解析】选A.由茎叶图知甲的分数是6,8,9,15,17,19, 23,24,26,32,41,共有11个数据,中位数是最中间一个 19,乙的数据是5,7,8,11,11,13,20,22,30,31,40,共 有11个数据,中位数是最中间一个13.,2.某次知识竞赛中,四个参赛小队的初始积分都是100分,在答题过程中,各小组每答对1题都可以使自己小队的

13、积分增加5分,若答题过程中四个小队答对的题数分别是4道,7道,7道,2道,则四个小组积分的方差为( ) A.50 B.75.5 C.112.5 D.225,【解析】选C.由已知得四个小组积分分别为:120,135, 135,110,所以四个小组积分的平均值为(120+135+135+110)=125, 所以四个小组积分的方差为: s2= (120-125)2+(135-125)2+(135-125)2+ (110-125)2=112.5.,热点题型3 线性回归分析与独立性检验 【感悟经典】 【典例】1.(2018 厦门二模)为了解学生的课外阅读时间情况,某学校随机抽取了 50人进行统计分析,把

14、这50人每天阅读的时间(单位:分钟)绘制成频数分布表,如下表所示:,若把每天阅读时间在60分钟以上(含60分钟)的同学称为“阅读达人”,根据统计结果中男女生阅读达人的数据,制作出如图所示的等高条形图.,(1)根据抽样结果估计该校学生的每天平均阅读时间(同一组数据用该区间的中点值作为代表). (2)根据已知条件完成下面的22列联表,并判断是否有99%的把握认为“阅读达人”跟性别有关?,附:参考公式 K2= ,其中n=a+b+c+d. 临界值表:,2.(2018湖北八校二诊)近年来,某地区积极践行“绿水青山就是金山银山”的绿色发展理念,2012年年初至2018年年初,该地区绿化面积y(单位:平方公

15、里)的数据如下表:,(1)求y关于t的线性回归方程. (2)利用(1)中的回归方程,预测该地区2022年年初的绿化面积,并计算2017年年初至2022年年初,该地区绿化面积的年平均增长率约为多少.,(附:回归直线的斜率与截距的最小二乘法估计公式分别为 lg 30.477,lg 20.301,100.03521.084),【联想解题】 1.看到22列联表,想到独立性检验的计算公式,及判断是否有关. 2.看到线性回归,想到代入回归系数公式求回归直线方程.,【规范解答】1.(1)该校学生的每天平均阅读时间为:=1.6+6+12+15.4+12.6+4.4=52(分钟),(2)由频数分布表得,“阅读达

16、人”的人数是11+7+2= 20人,根据等高条形图得22列联表,K2的观测值k= = 4.327, 由于4.3276.635,故没有99%的把握认为“阅读达人” 跟性别有关.,2.(1) =4, =4.3, =0.5, =2.3, 线性回归方程为 =0.5t+2.3. (2)将2022年年号11代入,预测绿化面积为7.8平方公里. 设年平均增长率为x,则(1+x)5= ,5lg(1+x)=lg , x= -10.084. 所以年平均增长率约为8.4%.,【规律方法】 1.对两个变量的相关关系的判断有两个方法 一是根据散点图,具有很强的直观性,直接得出两个变量是正相关或负相关;二是计算相关系数法

17、,这种方法能比较准确地反映相关程度.,2.回归直线方程 = x+ 必过样本点中心 ( , ). 3.利用独立性检验,进行合理推断和预测的关注点 独立性检验就是考查两个分类变量是否有关系,并能较 为准确地给出这种判断的可信度,K2(或2)值越大,说 明“两个变量有关系”的可能性越大.,【对点训练】 1.(2018芜湖一模)某城市随机抽取一年(365天)内100天的空气质量指数API的监测数据,结果统计如下:,记某企业每天由空气污染造成的经济损失S(单位:元),空气质量指数API为x.当0x100时,企业没有造成经济损失;当100300时造成的经济损失为2 000元.,(1)试写出S(x)的表达式

18、. (2)在本年内随机抽取一天,试估计该天经济损失超过350元的概率.,(3)若本次抽取的样本数据有30天是在供暖季,其中有12天为重度污染,完成下面22列联表,并判断能否有99%的把握或在犯错误的概率不超过0.01的前提下认为该市本年空气重度污染与供暖有关?,【解析】(1)S(x)= (2)设“在本年内随机抽取一天,该天经济损失S超过 350元”为事件A,由(1)知:x200,频数为38,则 P(A)= =0.38.,(3)根据以上数据得到如下22列联表:则计算可得K2的观测值,所以有99%的把握或在犯错误的概率不超过0.01的前提 下认为该市本年空气重度污染与供暖有关.,2.某厂生产不同规

19、格的一种产品,根据检测标准,其合格 产品的质量y(g)与尺寸x(mm)之间近似满足关系式y= cxb(b,c为大于0的常数).按照某项指标测定,当产品 质量与尺寸的比在区间 内时为优等品.现随机抽 取6件合格产品,测得数据如下:,根据测得数据作了初步处理,得相关统计量的值如下表:,(1)根据所给统计量,求y关于x的回归方程. (2)已知优等品的收益z(单位:千元)与x,y的关系为 z=2y-0.32x,则当优等品的尺寸x为何值时,收益z的 预报值最大?(精确到0.1) 附:对于样本(vi,ui)(i=1,2,n),其回归直线u= bv+a的斜率和截距的最小二乘估计公式分别为:,【解析】(1)由

20、题意得y=cxb, ln y=ln(cxb)=ln c+ln xb. 所以ln y=bln x+ln c,所以ln =3.05,ln =4.1.,所以ln =ln - ln =3.05-0.54.1=1, ln y= ln x+1,y=e 所以y关于x的回归方程为y=e,(2)由(1)得: 令 当 时 取最大, 所以x72.3 mm时,收益 预报值最大.,【提分备选】为了解某地区某种农产品的年产量x(单位:吨)对价格y(单位:千元/吨)和利润z的影响,对近五年该农产品的年产量和价格统计如表:,(1)求y关于x的线性回归方程 = x+ . (2)若每吨该农产品的成本为2千元,假设该农产品可全 部

21、卖出,预测当年产量为多少时,年利润z取到最大值? (保留两位小数),参考公式:,【解析】所以 所以y关于x的线性回归方程为,(2)z=x(8.69-1.23x)-2x=-1.23x2+6.69x, 所以x2.72时,年利润z最大.,数据分析用样本估计总体问题中的数学素养 【相关链接】 用样本估计总体问题中需要对所给样本信息进行整理分析,然后转化到对总体数据的整体把握,这就需要我们有着迅速处理信息的能力以及转化与化归的思想.,【典例】某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.,在这10名学生中,进入立定跳远决赛的有8人,

22、同时进入立定跳远决赛和30秒跳绳决赛的有6人,则 ( ) A.2号学生进入30秒跳绳决赛 B.5号学生进入30秒跳绳决赛 C.8号选手进入30秒跳绳决赛 D.9号选手进入30秒跳绳决赛,【规范解答】选B.进入立定跳远决赛的学生是1到8号.由同时进入两项决赛的有6人可知,1号到8号恰有6人进入30秒跳绳决赛.在1号到8号的30秒跳绳决赛成绩中,3,6,7号学生的成绩高于1,4,5号学生,1号和5号成绩相同,所以1,3,5,6,7号学生必进入30秒跳绳决赛.,【通关题组】 (2018茂名一模)已知药用昆虫的产卵数y与一定范围内的温度x有关, 现收集了该种药用昆虫的6组观测数据如下表:,经计算得:

23、线性回归模型的残差平方和 其中xi, yi分别为观测 数据中的温度和产卵数,i=1, 2, 3, 4, 5, 6.,(1)若用线性回归模型,求y关于x的回归方程 = x+ (精确到0.1). (2)若用非线性回归模型求得y关于x的回归方程为 且相关指数R2=0.952 2.,试与(1)中的回归模型相比,用R2说明哪种模型的拟合效果更好. 用拟合效果好的模型预测温度为35 时该种药用昆虫的产卵数(结果取整数).,附:一组数据(x1,y1), (x2,y2), ,(xn,yn), 其回归直 线 的斜率和截距的最小二乘估计为相关指数,【解析】 (1)依题意,n=6, 所以y关于x的线性回归方程为,(2)利用所给数据, 得, 线性回归方程 的相关指数,因为0.939 80.952 2, 因此,回归方程 比线性回归方程 拟合效果更好;,由得温度x=35 时, 又因为e8.060 53 167, 所以 所以当温度x=35 时,该种药用昆虫的产卵数估计为 190个.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 中学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1