1、1第一章 统计案例章末检测试卷(一)(时间:120 分钟 满分:150 分)一、选择题(本大题共 12 小题,每小题 5 分,共 60 分)1下列说法中正确的是( )A相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B独立性检验对分类变量关系的研究没有 100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D独立性检验如果得出的结论有 99%的可信度,就意味着这个结论一定是正确的考点 回归分析题点 回归分析的概念和意义答案 C解析 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量
2、的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义故选 C.2根据一位母亲记录儿子 3 岁9 岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的回归直线方程 7.19 x73.93,用此方程预测儿子 10 岁的身高,则下列有关叙述正y 确的是( )A身高一定为 145.83 cmB身高大于 145.83 cmC身高小于 145.83 cmD身高在 145.83 cm 左右考点 线性回归分析题点 回归直线方程的应用答案 D解析 用回归直线方程预测的不是精确值,而是估计值,当 x10
3、时, 145.83,只能说y 身高在 145.83 cm 左右3已知两个变量 x 和 y 之间具有线性相关性,甲、乙两个同学各自独立做了 10 次和 15 次试验,并且利用线性回归的方法求得回归直线分别为 l1和 l2.已知两个人在试验中发现对变2量 x 的观测数据的平均数都为 s,对变量 y 的观测数据的平均数都是 t,则下列说法正确的是( )A l1和 l2必有交点( s, t)B l1与 l2相交,但交点一定不是( s, t)C l1与 l2必定平行D l1与 l2必定重合考点 回归直线方程题点 样本中心点的应用答案 A解析 由于回归直线 x 恒过( , )点,又两人对变量 x 的观测数
4、据的平均数都为 s,y b a x y对变量 y 的观测数据的平均数都为 t,所以 l1和 l2恒过点( s, t)4某大学体育部为了解新生的身高与地域是否有关,在全校一年级学生中进行了抽样调查,调查结果如下表所示:不低于 170 cm 低于 170 cm 合计北方学生 60 20 80南方学生 10 10 20合计 70 30 100则下列说法正确的是( )A有 95%的把握认为“学生的身高是否超过 170 cm 与地域有关”B没有 90%的把握认为“学生的身高是否超过 170 cm 与地域有关”C有 97.5%的把握认为“学生的身高是否超过 170 cm 与地域有关”D没有 95%的把握认
5、为“学生的身高是否超过 170 cm 与地域有关”附: 2nn11n22 n12n212n1 n2 n 1n 2P( 2 x0) 0.25 0.15 0.10 0.05 0.025x0 1.323 2.072 2.706 3.841 5.024考点 独立性检验及其基本思想题点 独立性检验的方法答案 A解析 将 22 列联表中的数据代入公式计算,得 2 4.762,1006010 2010270308020 100213由于 4.7623.841,所以有 95%的把握认为“学生的身高是否超过 170 cm 与地域有关” 故选 A.5为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了 1
6、00 位居民进行调查,经过计算 20.99,根据这一数据分析,则下列说法正确的是( )A有 99%的人认为该栏目优秀B有 99%的人认为该栏目是否优秀与改革有关系C有 99%的把握认为电视栏目是否优秀与改革有关系D没有理由认为电视栏目是否优秀与改革有关系考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 只有 26.635 才能有 99%的把握认为电视栏目是否优秀与改革有关系,而即使 26.635 也只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论6某车间加工零件的数量 x 与加工时间 y 的统计数据如下表:零件数 x(个) 10 20 30加工时间 y(分钟)
7、 21 30 39现已求得上表数据的回归直线方程 x 中的 值为 0.9,则据此回归模型可以预测,加y b a b 工 100 个零件所需要的加工时间约为( )A84 分钟 B94 分钟C102 分钟 D112 分钟考点 线性回归分析题点 回归直线方程的应用答案 C解析 由已知可得 20, 30,x y又 0.9, 300.92012.b a y b x回归直线方程为 0.9 x12.y 当 x100 时, 0.910012102.y 故选 C.7某调查者从调查中获知某公司近年来科研费用支出 x(万元)与公司所获得利润 y(万元)的统计资料如下表:4序号 科研费用支出 xi 利润 yi xiy
8、i x2i1 5 31 155 252 11 40 440 1213 4 30 120 164 5 34 170 255 3 25 75 96 2 20 40 4合计 30 180 1 000 200则利润 y 对科研费用支出 x 的回归直线方程为( )A. 2 x20 B. 2 x20y y C. 20 x2 D. 20 x2y y 考点 回归直线方程题点 求回归直线方程答案 A解析 设回归直线方程为 x .y b a 由表中数据得, 2,b 1 000 6530200 652 302520,a y b x回归直线方程为 2 x20.y 8已知 x, y 取值如表:x 0 1 3 5 6y
9、1 m 3m 5.6 7.4画散点图分析可知, y 与 x 线性相关,且求得回归直线方程为 x1,则 m 等于( )y A0.5 B1 C1.5 D2考点 回归直线方程题点 样本中心点的性质答案 C解析 根据题意,得 (01356)3,x155 (1 m3 m5.67.4) ,y15 14 4m5故样本点中心为 ,(3,14 4m5 )代入回归直线方程,得 31,解得 m1.5.14 4m59独立性检验中,假设 H0:变量 X 与变量 Y 没有关系,则在 H0成立的情况下,P( 26.635)0.010 表示的意义是( )A变量 X 与变量 Y 有关系的概率为 1%B变量 X 与变量 Y 没有
10、关系的概率为 99.9%C变量 X 与变量 Y 没有关系的概率为 99%D变量 X 与变量 Y 有关系的概率为 99%考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 由题意知变量 X 与 Y 没有关系的概率为 0.01,即认为变量 X 与 Y 有关系的概率为 99%.10根据某班学生数学、外语成绩得到的 22 列联表如下:数优 数差 合计外优 34 17 51外差 15 19 34合计 49 36 85那么统计量 2约为( )A10.3 B8 C4.25 D9.3考点 分类变量与列联表题点 求观测值答案 C解析 由公式得统计量 2 4.25.853419 17152513449
11、3611下表给出 5 组数据( x, y),为选出 4 组数据使其线性相关程度最大,且保留第 1 组数据(5,3),则应去掉( )i 1 2 3 4 5xi 5 4 3 2 4yi 3 2 4 1 66A.第 2 组 B第 3 组C第 4 组 D第 5 组答案 B解析 画出散点图如图,应除去第三组,对应点的坐标是(3,4)故选 B.12某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机抽查 52名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是( )表 1成绩性别不及格 及格 合计男 6 14 20女 10 22 32合计 16 36 52表 2
12、视力性别好 差 合计男 10 10 20女 6 26 32合计 16 36 52表 3智商性别偏高 正常 合计男 8 12 20女 8 24 32合计 16 36 52表 47阅读量性别丰富 不丰富 合计男 7 13 20女 9 23 32合计 16 36 52A成绩 B视力C智商 D阅读量考点 独立性检验及其基本思想题点 独立性检验的方法答案 B解析 结合各列联表中数据,得统计量分别为 , , , .21 2 23 24因为 ,2152622 1410216363220 528216363220 ,2521026 106216363220 52200216363220 ,2352824 12
13、8216363220 5296216363220 ,2452723 139216363220 5244216363220则 ,2 23 24 21所以视力与性别有关联的可能性最大二、填空题(本大题共 4 小题,每小题 5 分,共 20 分)13下列是关于出生男婴与女婴调查的列联表:晚上 白天 合计男婴 45 A B女婴 E 35 C合计 98 D 180那么 A_, B_, C_, D_, E_.考点 分类变量与列联表题点 求列联表中的数据答案 47 92 88 82 53解析 45 E98, E53, E35 C, C88,898 D180, D82, A35 D, A47,45 A B,
14、B92.14已知样本容量为 11,计算得 i510, i214,回归方程为 0.3 x ,则ni 1xni 1y y a _, _.(精确到 0.01)x a 考点 回归直线方程题点 样本点中心的应用答案 46.36 5.55解析 由题意得 i , i ,x11111i 1x 51011 y 11111i 1y 21411因为 0.3 ,所以 0.3 ,可得 5.55.y x a 21411 51011 a a 15某单位为了了解用电量 y(度)与气温 x()之间的关系,随机统计了某 4 天的用电量与当天气温,并制作了对照表,由表中数据得回归直线方程 x ,其中 2.现预测当y b a b 气
15、温为4 时,用电量的度数约为_.气温 x() 18 13 10 1用电量 y(度 ) 24 34 38 64考点 回归直线方程题点 回归直线方程的应用答案 68解析 由题意可知 (1813101)10,x14 (24343864)40, 2.y14 b 又回归直线 2 x 过点(10,40),故 60.y a a 所以当 x4 时, 2(4)6068.y 16在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁为了考察某种埃博拉病毒疫苗的效果,现随机抽取 100 只小鼠进行试验,得到如下列联表:感染 未感染 合计服用 10 40 509未服用 20 30 50合计 30 70 10
16、0附表:P( 2 x0) 0.10 0.05x0 6.635 3.841参照附表,在犯错误的概率不超过_(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关” 考点 独立性检验及其基本思想题点 独立性检验的方法答案 5%解析 2 4.7623.841 ,所以在犯错误的概率不超过 5%的1001030 2040230705050前提下,认为“小鼠是否被感染与服用疫苗有关” 三、解答题(本大题共 6 小题,共 70 分)17(10 分)已知 10 只狗的血球体积 x(单位:mm 3)及红血球数 y(单位:百万)的测量值如下:x 45 42 46 48 42 35 58 40 39 50y 6.
17、53 6.30 9.25 7.50 6.99 5.90 9.49 6.20 6.55 7.72(1)画出散点图;(2)求出 y 对 x 的回归直线方程;(3)若血球体积为 49 mm3,预测红血球数大约是多少?考点 回归直线方程题点 求回归直线方程解 (1)散点图如图所示10(2)设回归直线方程为 x ,由表中数据代入公式,得 0.16,y b a b 10i 1xiyi 10x y10i 1x2i 10x2 0.12.a y b x所以所求回归直线方程为 0.16 x0.12.y (3)把 x49 代入回归直线方程得0.16490.127.96,计算结果表明,当血球体积为 49 mm3时,红
18、血球数大约为 7.96y 百万18(12 分)为了调查某大学学生在某天上网的时间,随机对 100 名男生和 100 名女生进行了不记名的问卷调查,得到了如下的统计结果:11表 1:男生上网时间与频数分布表上网时间(分)30,40) 40,50) 50,60) 60,70) 70,80)人数 5 25 30 25 15表 2:女生上网时间与频数分布表上网时间(分)30,40) 40,50) 50,60) 60,70) 70,80)人数 10 20 40 20 10(1)若该大学共有女生 750 人,试估计其中上网时间不少于 60 分钟的人数;(2)完成下面的 22 列联表,并回答能否有 95%的
19、把握认为“大学生上网时间与性别有关”.上网时间少于 60 分钟 上网时间不少于 60 分钟 合计男生女生合计考点 独立性检验及其基本思想题点 独立性检验的综合应用解 (1)设上网时间不少于 60 分钟的女生人数为 x,依题意有 ,解得 x225,x750 30100所以估计上网时间不少于 60 分钟的女生有 225 人(2)填 22 列联表如下:上网时间少于 60 分钟 上网时间不少于 60 分钟 合计男生 60 40 100女生 70 30 100合计 130 70 200由表中数据可得统计量 22006030 40702100100130702.206.635,2102060 904021
20、1010060150所以若按照 99%的可靠性要求,则能够判断成绩与班级有关20(12 分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的 ,男生喜欢韩剧的人数占男生人数的 ,女生喜欢韩剧的人数占女生人数的 ,若12 16 23在犯错误的概率不超过 0.05 的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?考点 独立性检验及其基本思想题点 独立性检验的综合应用解 设男生人数为 x,依题意可得列联表如下:喜欢韩剧 不喜欢韩剧 合计 男生 x6 5x6 x女生 x3 x6 x2合计 x2 x 3x213若在犯错误的概率不超过 0.05 的前提下认为是否喜欢韩剧
21、和性别有关,则 23.841,由 2 x3.841,3x2(x6x6 5x6x3)2xx2x2x 38解得 x10.24, , 为正整数,若在犯错误的概率不超过 0.05 的前提下认为是否喜欢韩剧和性别有关,x2 x6则男生至少有 12 人21(12 分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验室每天每 100 颗种子中的发芽数,得到如下资料:日期 12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日12 月 5日温差 x() 10 11 13 12 8发芽数 y(颗
22、) 23 25 30 26 16该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求回归直线方程,再对被选取的 2 组数据进行检验(1)求选取的 2 组数据恰好是不相邻 2 天数据的概率;(2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求出 y 关于 x 的回归直线方程 x ;y b a (3)若由回归直线方程得到的估计数据与所选出的检验数据的误差均不超过 2 颗,则认为得到的回归直线方程是可靠的,试问(2)中所得的回归直线方程是否可靠?考点 线性回归分析题点 回归直线方程的应用解 (1)设事件 A
23、 表示“选取的 2 组数据恰好是不相邻 2 天的数据” ,12 月 1 日12 月 5 日分别记为 1,2,3,4,5,则从 5 组数据选取 2 组数据,共 10 种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)事件 A 包括的基本事件有 6 种, P(A) .610 35(2) 12, 27, iyi977, 434,x y3i 1x3i 1x2i14 2.5,b 3i 1xiyi 3x y3i 1x2i 3x2 977 31227434 3122 272.5123, 2.5 x3.a y b x y (3)由(2
24、)知:当 x10 时, 22,误差不超过 2 颗;y 当 x8 时, 17,误差不超过 2 颗y 故所求得的回归直线方程是可靠的22(12 分)如图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图:注:年份代码 17 分别对应年份 20082014(1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明;(2)建立 y 关于 t 的回归直线方程(系数精确到 0.01),预测 2018 年我国生活垃圾无害化处理量附注:参考数据: i9.32, iyi40.17, 0.55, 2.646.7i 1y7i 1t7i 1yi y2 7参考公式:相
25、关系数 r ,回归直线方程 t 中斜率和截距最ni 1ti tyi yni 1ti t2ni 1yi y2 y a b 小二乘估计公式分别为 , .b ni 1ti tyi yni 1ti t2 a y b t考点 线性回归分析题点 回归直线方程的应用15解 (1)由折线图中数据和附注中参考数据,得4, (ti )228, 0.55,t7i 1 t7i 1yi y2(ti )(yi )7i 1 t y iyi i40.1749.322.89, r 0.99.7i 1t t7i 1y 2.890.5522.646因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系(2)由 1.331 及(1)得y9.327 0.103. 1.3310.10340.92.b 7i 1ti tyi y7i 1ti t2 2.8928 a y b t所以 y 关于 t 的回归直线方程为 0.920.10 t.y 将 2018 年对应的 t11 代入回归直线方程得 0.920.10112.02.y 所以预测 2018 年我国生活垃圾无害化处理量约为 2.02 亿吨