1、1第一章 统计案例章末复习学习目标 1.理解独立性检验的基本思想及实施步骤.2.会求回归直线方程,并用回归直线进行预报122 列联表22 列联表如表所示:B B 合计A n11 n12 n1A n21 n22 n2合计 n1 n2 n其中 n1 n11 n21, n2 n12 n22,n1 n11 n12, n2 n21 n22,n n11 n21 n12 n22.2最小二乘法对于一组数据( xi, yi), i1,2, n,如果它们线性相关,则回归直线方程为 x ,其中 , .y b a b ni 1xi xyi yni 1xi x2ni 1xiyi nx yni 1x2i nx2 a y
2、b x3独立性检验常用统计量 2 来检验两个变量是否有关系nn11n22 n12n212n1 n2 n 1n 2类型一 独立性检验2例 1 为了解某班学生喜爱打篮球是否与性别有关,对本班 48 人进行了问卷调查得到了如下的 22 列联表:喜爱打篮球 不喜爱打篮球 合计男生 6女生 10合计 48已知在全班 48 人中随机抽取 1 人,抽到喜爱打篮球的学生的概率为 .23(1)请将上面的 22 列联表补充完整;(不用写计算过程)(2)能否在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关?说明你的理由考点 独立性检验及其基本思想题点 独立性检验的综合应用解 (1)列联表补充如下:喜
3、爱打篮球 不喜爱打篮球 合计男生 22 6 28女生 10 10 20合计 32 16 48(2)由 2 4.286.48220 60228203216因为 4.2863.841,所以能在犯错误的概率不超过 0.05 的前提下认为喜爱打篮球与性别有关反思与感悟 通过公式 2nn11n22 n12n212n1 n2 n 1n 2计算出 2的值,再与临界值作比较,最后得出结论跟踪训练 1 奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了 60 人,结果如下:是否愿意提供志愿者服务性别愿意 不愿意男生 20 10女生 10 203(1)用分层抽样的方法在愿意提供志愿
4、者服务的学生中抽取 6 人,其中男生抽取多少人?(2)你能否在犯错误的概率不超过 0.01 的前提下认为该高校学生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:P( 2 x0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001x0 2.072 2.706 3.841 5.024 6.635 7.879 10.828考点 独立性检验思想的应用题点 独立性检验在分类变量中的应用解 (1)由题意,可知男生抽取 6 4(人)2020 10(2) 2 6.667,由于 6.6676.635,所以能在犯错误的概602020 1010230303030率不超过 0.01
5、 的前提下认为该高校学生是否愿意提供志愿者服务与性别有关类型二 线性回归分析例 2 某城市理论预测 2010 年到 2014 年人口总数与年份的关系如表所示:年份 201x(年 ) 0 1 2 3 4人口数 y(十万 ) 5 7 8 11 19(1)请画出上表数据的散点图;(2)请根据上表提供的数据,求出 y 关于 x 的回归直线方程 x ;y b a (3)据此估计 2019 年该城市人口总数考点 回归分析思想的应用题点 回归分析思想的应用解 (1)散点图如图:(2)因为 2,x0 1 2 3 45 10,y5 7 8 11 1954iyi051728311419132,5i 1x0 21
6、22 23 24 230,5i 1x2i所以 3.2,b 132 521030 522 3.6.a y b x所以回归直线方程为 3.2 x3.6.y (3)令 x9,则 3.293.632.4,y 故估计 2019 年该城市人口总数为 32.4(十万)反思与感悟 解决回归分析问题的一般步骤(1)画散点图根据已知数据画出散点图(2)判断变量的相关性并求回归方程通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程(3)实际应用依据求得的回归方程解决实际问题跟踪训练 2 某运动员训练次数与运动成绩之间的数据关系如下:次数 x 30 33 35 3
7、7 39 44 46 50成绩 y 30 34 37 39 42 46 48 51(1)作出散点图;(2)求出回归直线方程;(3)计算相关系数并进行相关性检验;(4)试预测该运动员训练 47 次及 55 次的成绩解 (1)作出该运动员训练次数 x 与成绩 y 之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系(2)列表计算:次数 xi 成绩 yi x2i y2i xiyi530 30 900 900 90033 34 1 089 1 156 1 12235 37 1 225 1 369 1 29537 39 1 369 1 521 1 44339 42 1 521 1 764 1
8、63844 46 1 936 2 116 2 02446 48 2 116 2 304 2 20850 51 2 500 2 601 2 550由上表可求得 39.25, 40.875, x 12 656,x y 8 i 12iy 13 731, xiyi13 180,8 i 12i 8 i 1 1.041 5, 0.003 88,b 8 i 1xiyi 8x y 8 i 1x2i 8x2 a y b x回归直线方程为 y1.041 5 x0.003 88.(3)计算相关系数 r0.992 7,因此运动员的成绩和训练次数两个变量有较强的相关关系(4)由上述分析可知,我们可用回归直线方程 y1.
9、041 5x0.003 88 作为该运动员成绩的预报值将 x47 和 x55 分别代入该方程可得 y49 和 y57.故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57.1从某地区老人中随机抽取 500 人,其生活能否自理的情况如下表所示,则( )性别人数生活能否自理男 女能 178 278不能 23 21A.有 95%的把握认为老人生活能否自理与性别有关B有 99%的把握认为老人生活能否自理与性别有关C没有充分理由认为老人生活能否自理与性别有关6D以上都不对考点 独立性检验及其基本思想题点 独立性检验的思想答案 C解析 经计算,得 250017821 278232178 2
10、3178 278278 2123 212.9253.841 时,认为事件 A 与事件 B( )A有 95%的把握有关B有 99%的把握有关C没有理由说它们有关D不确定答案 A2下表显示出样本中变量 y 随变量 x 变化的一组数据,由此判断它最可能是( )x 4 5 6 7 8 9 10y 14 18 19 20 23 25 28A.线性函数模型 B二次函数模型8C指数函数模型 D对数函数模型考点 回归分析题点 建立回归模型的基本步骤答案 A解析 画出散点图(图略)可以得到这些样本点在某一条直线上或在该直线附近,故最可能是线性函数模型3下表是某厂 14 月份用水量(单位:百吨)的一组数据:月份
11、x 1 2 3 4用水量 y 4.5 4 3 2.5由散点图可知,用水量 y 与月份 x 之间有较好的线性相关关系,其回归直线方程是0.7 x ,则 等于( )y a a A10.5 B5.15 C5.2 D5.25考点 回归直线方程题点 样本中心点的应用答案 D解析 样本点的中心为(2.5,3.5),将其代入回归直线方程可解得 5.25.a 4据统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系,对某小组每周用于数学学习时间 x 与数学成绩 y 进行数据收集如表:x 15 16 18 19 22y 102 98 115 115 120由表中样本数据求回归直线方程 x
12、,则点( , )与直线 x18 y110 的位置关系为( )y b a a b A点在直线左侧 B点在直线右侧C点在直线上 D无法确定考点 回归直线方程题点 样本点中心的性质答案 C解析 由题意知 18, 110,样本点中心为(18,110)在回归直线上,故 11018 ,x y b a 即点( , )在直线上a b 5某考察团对全国 10 大城市进行职工人均工资水平 x(单位:千元)与居民人均消费水平9y(单位:千元)统计调查, y 与 x 具有线性相关关系,回归直线方程为 0.66 x1.562.若y 某城市居民人均消费水平为 7.675 千元,估计该城市人均消费额占人均工资收入的百分比约
13、为( )A83% B72% C67% D66%考点 线性回归分析题点 回归直线方程的应用答案 A解析 将 y7.675 代入回归直线方程,可计算得 x9.26,所以该城市人均消费额占人均工资收入的百分比约为 7.6759.260.83,即约为 83%.6已知变量 x 和 y 满足关系 y0.1 x1,变量 y 与 z 正相关下列结论中正确的是( )A x 与 y 正相关, x 与 z 负相关B x 与 y 正相关, x 与 z 正相关C x 与 y 负相关, x 与 z 负相关D x 与 y 负相关, x 与 z 正相关考点 线性回归分析题点 回归直线方程的应用答案 C解析 因为 y0.1 x
14、1,0.10),所以 z0.1 ax a b,0.1 a5.024,所以我们有 97.5%以上的把握认为“文化程度与月收入有关系” 10某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用” ,利用 22 列联表计算得 23.918,经查临界值表知 P( 23.841)0.05.则下列结论中,正确结论的序号是_11在犯错误的概率不超过 5%的前提下认为“这种血清能起到预防感冒的作用” ;若某人未使用该血清,则他在一年中有 95%的可能性得感冒;这种血清预防感冒的有效率为 9
15、5%.考点 独立性检验及其基本思想题点 独立性检验的方法答案 解析 查临界值表知 P( 23.841)0.05,故有 95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清与预防感冒有关”的可信程度,但也有“在 100 个使用血清的人中一个患感冒的人也没有”的可能故答案为.三、解答题11某城区为研究城镇居民家庭月人均生活费支出和月人均收入的相关关系,随机抽取 10户进行调查,其结果如下:月人均收入 x(元) 300 390 420 520 570月人均生活费 y(元) 255 324 335 360 450月人均收入 x(元) 700 760 800 850 1 080月人均生活
16、费 y(元) 520 580 600 630 750(1)作出散点图;(2)求出回归直线方程;(3)试预测月人均收入为 1 100 元和月人均收入为 1 200 元的两个家庭的月人均生活费考点 题点 解 (1)作出散点图如图所示,由图可知月人均生活费与月人均收入之间具有较强的线性相关关系(2)通过计算可知 639, 480.4,x yx 4 610 300, xiyi3 417 560,10 i 12i 10 i 112 0.659 9, 58.723 9,b 10 i 1xiyi 10xy10 i 1x2i 10x2 a y b x回归直线方程为 0.659 9 x58.723 9.y (3
17、)由以上分析可知,我们可以利用线性回归方程0.659 9 x58.723 9 来计算月人均生活费的预测值y 将 x1 100 代入,得 y784.61,将 x1 200 代入,得 y850.60.故预测月人均收入分别为 1 100 元和 1 200 元的两个家庭的月人均生活费分别为 784.61 元和 850.60 元12某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.
18、02)30.02,30.06)30.06,30.10)30.10,30.14频数 12 63 86 182 92 61 4乙厂:分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14频数 29 71 85 159 76 62 18(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写下面的 22 列联表,并问能否在犯错误的概率不超过 0.01 的前提下认为“两个分厂生产的零件的质量有差异”?甲厂 乙厂 合计优质品非优质品合计13考点 独立性检验及其基本思想题点 独
19、立性检验的方法解 (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件的优质品率估计为 72%;360500乙厂抽查的产品中有320 件优质品,从而乙厂生产的零件的优质品率估计为 64%.320500(2)22 列联表如下:甲厂 乙厂 合计优质品 360 320 680非优质品 140 180 320合计 500 500 1 000 2 7.3536.635 ,1 000360180 3201402500500680320所以在犯错误的概率不超过 0.01 的前提下认为“两个分厂生产的零件的质量有差异 ”四、探究与拓展13某校高一年级理科有 8 个班,在一次数学考试中成绩情况分析如下
20、:班级 1 2 3 4 5 6 7 8大于 145 分的人数 6 6 7 3 5 3 3 7不大于 145 分的人数 39 39 38 42 40 42 42 38附: xiyi171, x 204.8 i 1 8 i 12i求 145 分以上人数 y 对班级序号 x 的回归直线方程(精确到 0.000 1)考点 独立性检验思想的应用题点 独立性检验与回归直线方程、期望的综合应用解 4.5, 5, xiyi171, x 204,x y 8 i 1 8 i 12i b 8 i 1xiyi 8x y 8 i 1x2i 8x2 171 84.55204 84.52 0.214 3,314 5(0.214 3)4.55.964 4,a y b x14回归直线方程为 0.214 3 x5.964 4.y