1、1第一章 统计案例滚动训练一(1.11.2)一、选择题1下列语句表示的事件中的因素不具有相关关系的是( )A瑞雪兆丰年 B名师出高徒C吸烟有害健康 D喜鹊叫喜,乌鸦叫丧考点 回归分析题点 回归分析的概念和意义答案 D解析 “喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选 D.2对两个变量 y 与 x 进行回归分析,分别选择不同的模型,它们的相关系数 r 如下,其中相关性最强的模型是( )模型的相关系数 r 为0.98;模型的相关系数 r 为 0.80;模型的相关系数 r为0.50;模型的相关系数 r 为 0.25.A B C D考点 线性相关系数题点 线性相关系数的应用答案 A解
2、析 相关系数的绝对值越大,其相关性越强,模型相关系数为0.98,其绝对值最大,相关性也最强,故选 A.3下列关于 2的说法正确的是( )A 2在任何相互独立的问题中都可以用来检验有关系还是无关系B 2的值越大,两个事件的相关性就越大C 2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适用D 2nn11n22 n12n21n1 n2 n 1n 2考点 独立性检验及其基本思想题点 独立性检验的方法答案 C解析 本题主要考查对 2的理解, 2是用来判断两个分类变量是否有关系的随机变量,所以 A 错; 2的值越大,说明我们能以更大的把握认为两个分类变量有关系,不能判断相2关性的大小,所以
3、 B 错;D 中( n11n22 n12n21)应为( n11n22 n12n21)2.34下列说法中,错误说法的个数是( )将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;回归直线方程 37 x,变量 x 增加 1 个单位时, 平均增加 7 个单位;y y 在一个 22 列联表中,若 213.079,则有 99%以上的把握认为两个变量之间有关系A0 B1 C2 D3考点 线性回归分析题点 回归直线方程的应用答案 B解析 数据的方差与加了什么样的常数无关,故正确;对于回归直线方程 37 x,变量y x 增加 1 个单位时, 平均减少了 7 个单位,故错误;若 213.0796.63
4、5,则有 99%以y 上的把握认为这两个变量之间有关系,故正确5某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了 3 000 人,计算发现 26.023,则市政府认为市民收入增减与旅游愿望有关系的可信度是( )A90% B95% C97% D99%考点 独立性检验及其基本思想题点 独立性检验的方法答案 B解析 由 6.0233.841,所以认为市民收入增减与旅游愿望有关系的可信度为 95%.6高三某班学生每周用于数学学习的时间 x(单位:小时)与数学成绩 y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13y 92 79 97 89 6
5、4 47 83 68 71 59根据上表可得回归方程的系数 3.53.若某学生每周用于数学学习的时间为 18 小时,则可b 预测该学生的数学成绩(结果保留整数)是( )A71 分 B80 分 C74 分 D77 分考点 线性回归分析题点 回归直线方程的应用答案 D解析 学生每周用于数学学习的时间的平均值 17.4(小时),数学成绩的平均值x24 15 23 19 16 11 20 16 17 13104 74.9(分),所以y92 79 97 89 64 47 83 68 71 5910 74.93.5317.413.478.a y b x当 x18 时, 3.531813.47877.018
6、77,y 所以预测该学生的数学成绩为 77 分二、填空题7某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验根据收集到的数据(如下表),由最小二乘法求得回归方程 0.67 x54.9.y 零件数 x(个) 10 20 30 40 50加工时间 y(min) 62 75 81 89现发现表中有一个数据模糊看不清,请你推断出该数据的值为_考点 回归直线方程题点 样本点中心的应用答案 68解析 由表知 30,设模糊不清的数据为 m,则 (62 m758189) ,因为x y15 307 m50.67 54.9,即 0.673054.9,解得 m68.y x307 m58面对
7、竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产成本,某白酒酿造企业市场部对该企业 9 月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下: , 71, 79, iyi1 x72 y 6i 1x2i 6i 1x481, 1.818 2, 71(1.818 2) 77.36,则销量每增b 1 481 6727179 6(72)2 a 72加 1 千箱,单位成本下降_元考点 线性回归分析题点 回归直线方程的应用答案 1.818 2解析 由已知得 1.818 2x77.36,销售量每增加 1 千箱,则单位成本下降 1.818 2y 元9为了调查患慢性气管炎是否与吸
8、烟有关,调查了 100 名 50 岁以下的人,调查结构如下表:5患慢性气管炎 未患慢性气管炎 合计吸烟 20 20 40不吸烟 8 52 60合计 28 72 100根据列联表数据,求得 2_(保留 3 位有效数字),根据下表,在犯错误的概率不超过_的前提下认为患慢性气管炎与吸烟有关附:P( 2 x0) 0.050 0.010x0 3.841 6.635 2 .nn11n22 n12n212n1 n2 n 1n 2考点 独立性检验及其基本思想题点 独立性检验的方法答案 16.005 0.01解析 2 16.0056.635.1002052 208240602872所以在犯错误的概率不超过 0.
9、01 的前提下认为患慢性气管炎与吸烟有关三、解答题10从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储藏yi(单位:千元)的数据资料,算得 i80, i20, iyi184, 720.10i 1x10i 1y10i 1x10i 1x2i(1)求家庭的月储蓄 y 对月收入 x 的回归直线方程 x ;y b a (2)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄附: , .b ni 1xiyi nxyni 1x2i nx2 a y b x考点 线性回归分析题点 回归直线方程的应用6解 (1)由题意, n10, i80, i20,10i 1x10i 1
10、y 8, 2.x8010 y 2010又 10 2720108 280,10i 1x2i xiyi10 184108224,10i 1x xy由此得 0.3,b 10i 1xiyi 10x y10i 1x2i 10x2 2480 20.380.4,a y b x故所求回归直线方程为 0.3 x0.4.y (2)将 x7 代入回归直线方程可以预测该家庭的月储蓄为 0.370.41.7(千元)y 11某高校共有学生 15 000 人,其中男生 10 500 人,女生 4 500 人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300 位学生每周平均体育运动时间(单位:时)的样
11、本数据(1)应收集多少位女生样本数据?(2)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为0,2),2,4),4,6),6,8),8,10),10,12)估计该校学生每周平均体育运动时间超过 4 小时的概率;(3)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4 个小时,请完成每周平均体育运动时间与性别的列联表,并判断在犯错误的概率不超过 0.05 的前提下是否认为“该校学生的每周平均体育运动时间与性别有关” 附:7P( 2 x0) 0.050 0.010 0.005x0 3.841 6.635 7.879 2 .nn
12、11n22 n12n212n1 n2 n 1n 2考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由分层抽样可得 300 90,所以应收集 90 位女生的样本数据4 50015 000(2)由频率分布直方图得学生每周平均体育运动超过 4 小时的频率为 12(0.1000.025)0.75,所以该校学生每周平均体育运动时间超过 4 小时的概率的估计值为 0.75.(3)由(2)知,300 位学生中有 3000.75225(人)的每周平均体育运动时间超过 4 小时,75人的每周平均体育运动时间不超过 4 小时样本数据中有 210 份是关于男生的,90 份是关于女生的,可得
13、每周平均体育运动时间与性别列联表:男生 女生 合计每周平均体育运动时间不超过 4 小时 45 30 75每周平均体育运动时间超过 4 小时 165 60 225合计 210 90 300结合列联表可算得 2 4.7623.841.3004560 3016527522521090所以有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关” ,即能在犯错误的概率不超过 0.05 的前提下认为“该校学生的每周平均体育运动时间与性别有关” 四、探究与拓展12已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数 y3e 2x1 的图象附近,则可通过转换得到的回归直线方程为_考点 非线性
14、回归分析题点 非线性回归分析答案 u1ln 32 v解析 由 y3e 2x1 ,得 ln yln(3e 2x1 ),即 ln y2 x1ln 3,令 uln y, v x,则回归直线方程为 u1ln 32 v.13甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸 x(单位:cm)及个数8y,如下表:零件尺寸 x 1.01 1.02 1.03 1.04 1.05甲 3 7 8 9 3零件个数 y 乙 7 4 4 4 a由表中数据得 y 关于 x 的回归直线方程为 91100 x(1.01 x1.05),其中合格零件尺y 寸为 1.030.01(cm)完成下面列联表,并判断是否有 99%的把握认为加工零件的质量与甲、乙有关?合格零件数 不合格零件数 合计甲乙合计考点 独立性检验思想的应用题点 独立性检验与回归直线方程的综合应用解 1.03, ,由 91100 x 知, 911001.03,所以 a11,由x ya 495 y a 495于合格零件尺寸为 1.030.01 cm,故甲、乙加工的合格与不合格零件的数据表为:合格零件数 不合格零件数 合计甲 24 6 30乙 12 18 30合计 36 24 60所以 2 10,602418 612230303624因为 2106.635,故有 99%的把握认为加工零件的质量与甲、乙有关