1、11.1 独立性检验学习目标 1.理解 22 列联表的意义,会依据列联表中数据判断两个变量是否独立.2.掌握统计量 2的意义和独立性检验的基本思想知识点一 22 列联表和统计量 2122 列联表一般地,对于两个研究对象和,有两类取值类 A 和类 B,也有两类取值类 1 和类2,得到如下列联表所示的抽样数据:类 1 类 2 合计类 A n11 n12 n1类 B n21 n22 n2合计 n1 n2 n上述表格称为 22 列联表2统计量 2 2 ,其中 n n11 n12 n21 n22.nn11n22 n12n212n1 n2 n 1n 2知识点二 独立性检验独立性检验要推断“与有关系” ,可
2、按下面的步骤进行:(1)作 22 列联表;(2)根据 22 列联表计算 2的值;(3)查对临界值,作出判断1事件 A 与 B 的独立性检验无关,即两个事件互不影响( )2 2的大小是判断事件 A 与 B 是否相关的统计量( )23列联表中的数据是两个分类变量的频数( )类型一 22 列联表和 2统计量命 题 角 度 1 22列 联 表 及 应 用例 1 为了解人们对于国家新颁布的“生育二孩放开”政策的热度,现在某市进行调查,随机抽调了 50 人,他们年龄的频数分布及支持“生育二孩放开”人数如下表:年龄 5,15) 15,25) 25,35) 35,45) 45,55)55,65)频数 5 10
3、 12 10 5 8支持“生育二孩放开”4 5 9 8 2 4由以上统计数据填下面 22 列联表:年龄不低于 45 岁的人数 年龄低于 45 岁的人数 合计支持 a c不支持 b d合计考点 分类变量与列联表题点 求列联表中的数据解 22 列联表如下:年龄不低于 45 岁的人数 年龄低于 45 岁的人数 合计支持 a6 c26 32不支持 b7 d11 18合计 13 37 50反思与感悟 准确理解给定信息,找准分类变量,然后依次填入相应空格内数据跟踪训练 1 某校高二年级共有 1 600 名学生,其中男生 960 名,女生 640 名,该校组织了3一次满分为 100 分的数学学业水平模拟考试
4、根据研究,在正式的学业水平考试中,本次成绩在80,100)的学生可取得 A 等(优秀),在60,80)的学生可取得 B 等(良好),在40,60)的学生可取得 C 等(合格),不到 40 分的学生只能取得 D 等(不合格)为研究这次考试成绩优秀是否与性别有关,现按性别采用分层抽样的方法抽取 100 名学生,将他们的成绩按从低到高分成30,40),40,50),50,60),60,70),70,80),80,90),90,100),七组加以统计,绘制成如图所示的频率分布直方图(1)估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数;(2)请你根据已知条件将下列 22 列联表补充完整.
5、数学成绩优秀 数学成绩不优秀 合计男生 a12 b女生 c d34合计 n100考点 分类变量与列联表题点 求列联表中的数据解 (1)设抽取的 100 名学生中,本次考试成绩不合格的有 x 人,根据题意得x100110(0.0060.01220.0180.0240.026)2.据此估计该校高二年级学生在正式的数学学业水平考试中成绩不合格的人数为 1 210060032.(2)根据已知条件得 22 列联表如下:数学成绩优秀 数学成绩不优秀 合计男生 a12 b48 60女生 c6 d34 404合计 18 82 100命 题 角 度 2 2统 计 量 及 计 算例 2 根据下表计算:不看电视 看
6、电视男 37 85女 35 143则 2_.(保留 3 位小数)考点 定性分析的两类方法题点 利用列联表定性分析答案 4.514解析 2 4.514.30037143 8535212217872228反思与感悟 列联表中的数据信息与 2统计量之间的关系要对应,其次,需对“卡方”公式的结构有清醒的认识跟踪训练 2 已知列联表:药物效果与动物试验列联表患病 未患病 合计服用药 10 45 55未服药 20 30 50合计 30 75 105则 2_.(结果保留 3 位小数)考点 定性分析的两类方法题点 利用列联表定性分析答案 6.109解析 2 6.109.1051030 204523075555
7、0类型二 独立性检验例 3 某班主任对班级 50 名学生进行了作业量多少的调查,数据如下表:在喜欢玩电脑游5戏的 26 人中,有 20 人认为作业多,6 人认为作业不多;在不喜欢玩电脑游戏的 24 人中,有 7 人认为作业多,17 人认为作业不多(1)根据以上数据建立一个 22 列联表;(2)试问喜欢玩电脑游戏与认为作业多少是否有关系?考点 独立性检验及其基本思想题点 独立性检验的思想解 (1)根据题中所给数据,得到如下列联表:认为作业多 认为作业不多 合计喜欢玩电脑游戏 20 6 26不喜欢玩电脑游戏 7 17 24合计 27 23 50(2)由公式得 2 11.458.502017 762
8、2624272311.4586.635,有 99%的把握认为喜欢玩电脑游戏与认为作业多少有关反思与感悟 独立性检验可以通过 22 列联表计算 2的值,然后和临界值对照作出判断跟踪训练 3 调查在 23 级风的海上航行中男女乘客的晕船情况,结果如下表所示:晕船 不晕船 合计男人 12 25 37女人 10 24 34合计 22 49 71根据此资料,你是否认为在 23 级风的海上航行中男人比女人更容易晕船?考点 独立性检验及其基本思想题点 独立性检验的思想解 由公式得 2 0.08.711224 2510222493734因为 26.635,则断77520445 1030023074532045
9、5定秃发与患心脏病有关系,那么这种判断出错的可能性为( )A0.1 B0.05 C0.025 D0.01考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 因为 26.635,所以有 99%的把握说秃发与患心脏病有关,故这种判断出错的可能7性为 10.990.01.3若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有 99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A100 个吸烟者中至少有 99 人患有肺癌B1 个人吸烟,那么这个人有 99%的概率患有肺癌C在 100 个吸烟者中一定有患肺癌的人D在 100 个吸烟者中可能一个
10、患肺癌的人也没有考点 独立性检验及其基本思想题点 独立性检验的方法答案 D解析 独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生4某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据包括_.考点 独立性检验及其基本思想题点 独立性检验的方法答案 女正教授人数、男正教授人数、女副教授人数、男副教授人数5高中流行这样一句话“文科就怕数学不好,理科就怕英语不好” 下表是一次针对高三文科学生的调查所得的数据.总成绩好 总成绩不好 合计数学成绩好 478 a 490数学成绩不好 399 24 423合计 b c 913(1)计
11、算 a, b, c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗?考点 独立性检验及其基本思想题点 独立性检验的方法8解 (1)由 478 a490,得 a12.由 a24 c,得 c122436.由 b c913,得 b91336877.(2)根据表中数据计算得 2 6.2333.841,91347824 39912249042387736所以有 95%的把握认为文科学生总成绩不好与数学成绩不好有关系1利用 2 求出 2的值,再利用临界值的大小来判断假设是否成nn11n22 n12n212n1 n2 n 1n 2立2解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.一、选
12、择题1在 22 列联表中,四个变量的取值 n11, n12, n21, n22应是( )A任意实数 B正整数C大于 5 的整数 D非负整数考点 分类变量与列联表题点 求列联表中的数据答案 C2如果有 99%的把握认为“ x 与 y 有关系” ,那么 2满足( )A 26.635 B 25.024C 27.879 D 23.841考点 独立性检验思想的应用题点 独立性检验在分类变量中的应用答案 A3在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A若 26.635,我们有 99%的把握认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病9B从独立性检验可知,有
13、99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有 99%的可能患有肺病C若从 2统计量中得出有 95%的把握认为吸烟与患肺病有关系,是指有 5%的可能性使得推断出现错误D以上三种说法都不正确考点 独立性检验及其基本思想题点 独立性检验的思想答案 C4根据下面的列联表得到如下四个判断:有 95%的把握认为“患肝病与嗜酒有关” ;有 99%的把握认为“患肝病与嗜酒有关” ;在犯错误的概率不超过 0.01 的前提下认为“患肝病与嗜酒有关” ;在犯错误的概率不超过0.01 的前提下认为“患肝病与嗜酒无关”.嗜酒 不嗜酒 合计患肝病 700 60 760未患肝病 200 32 232合计
14、900 92 992其中正确命题的个数为( )A0 B1 C2 D3考点 分类变量与列联表题点 求观测值答案 C解析 由列联表中数据可求得 2 7.3496.635,所以在犯错误的概率不超过 0.01 的99270032 60200276023290092前提下,认为“患肝病与嗜酒有关系” ,即有 99%的把握认为“患肝病与嗜酒有关系” 因此正确,故选 C.5在 22 列联表中,两个分类变量有关系的可能性越大,相差越大的两个比值为( )A. 与 B. 与n11n11 n12 n21n21 n22 n11n21 n22 n21n11 n1210C. 与 D. 与n11n11 n22 n21n12
15、 n21 n11n12 n22 n21n11 n21考点 分类变量与列联表题点 求列联表中的数据答案 A解析 以表格为例,B B 合计A n11 n12 n1A n21 n22 n2合计 n1 n2 n事件 B 发生与 A 相关性越强,则两个频率 与 相差越大n11n1 n21n26高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀 及格 合计甲班 11 34 45乙班 8 37 45合计 19 71 90则统计量 2约为( )A0.600 B0.828 C2.712 D6.004考点 分类变量与列联表题点 求观测值答案 A解析 根据列联表中的数据,
16、可得 2 0.600.故选 A.901137 348245451971二、填空题7在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是_(填11序号)若统计量 26.635,则我们在犯错误的概率不超过 0.01 的前提下认为吃零食与性别有关系,那么在 100 个吃零食的人中必有 99 人是女性;由独立性检验可知在犯错误的概率不超过 0.01 的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为 99%;由独立性检验可知在犯错误的概率不超过 0.01 的前提下认为吃零食与性别有关系时,是指每进行 100 次这样的推断,平均有 1 次推断错误考点 独立性检验及其基
17、本思想题点 独立性检验的方法答案 解析 统计量 2是支持确定有多大的把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过 0.01 的前提下认为吃零食与性别有关系时,是指每进行 100 次这样的推断,平均有 1 次推断错误,故填.8为研究某新药的疗效,给 100 名患者服用此药,跟踪调查后得下表中的数据:无效 有效 合计男性患者 15 35 50女性患者 6 44 50合计 21 79 100设 H0:服用此药的效果与患者的性别无关,则统计量 2_(小数点后保留 3 位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为_
18、考点 独立性检验及其基本思想题点 独立性检验的方法答案 4.882 5%解析 由公式计算得统计量 24.882, 23.841,我们有 95%的把握认为服用此药的效果与患者的性别有关,从而有 5%的可能性判断出错9某一电视台对年龄高于 40 岁和不高于 40 岁的人是否喜欢西班牙队进行调查,对高于 4012岁的调查了 50 人,不高于 40 岁的调查了 50 人,所得数据制成如下列联表:不喜欢西班牙队 喜欢西班牙队 合计高于 40 岁 p q 50不高于 40 岁 15 35 50合计 a b 100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为 ,则有_35的把握认为年龄与
19、西班牙队的被喜欢程度有关考点 独立性检验及其基本思想题点 独立性检验的方法答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙的人”为事件 A,由已知得 P(A) ,q 35100 35所以 p25, q25, a40, b60. 2 4.1673.841.1002535 2515240605050 256故有 95%的把握认为年龄与西班牙队的被喜欢程度有关10某高校“统计初步”课程的教师随机调查了一些学生,具体数据如下表所示,为了判断选修统计专业是否与性别有关系,根据表中数据,得到 2 4.844,因为 4.8443.841.所以选修统计专业与性别有501320 1072232720
20、30关系,那么这种判断出错的可能性为_.没选统计专业 选统计专业男 13 10女 7 20考点 独立性检验及其基本思想题点 独立性检验的方法答案 5%三、解答题1311在对人们的休闲方式的一次调查中,共调查了 124 人,其中女性 70 人,男性 54 人女性中有 43 人主要的休闲方式是看电视,另外 27 人主要的休闲方式是运动;男性中有 21 人主要的休闲方式是看电视,另外 33 人主要的休闲方式是运动(1)根据以上数据建立一个 22 列联表;(2)判断性别与休闲方式是否有关系考点 定性分析的两类方法题点 利用列联表定性分析解 (1)列联表如下:休闲方式性别看电视 运动 合计女 43 27
21、 70男 21 33 54合计 64 60 124(2) 2 6.201,1244333 2721270546460 23.841,有 95%的把握认为性别与休闲方式有关四、探究与拓展12为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射 14 天内的结果如表所示:死亡 存活 合计第一种剂量 14 11 25第二种剂量 6 19 25合计 20 30 50进行统计分析时的统计假设是_考点 独立性检验及其基本思想题点 独立性检验答案 小白鼠的死亡与剂量无关14解析 根据独立性检验的基本思想可知,类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,
22、首先假设该结论不成立对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与剂量无关” 13某市调研考试后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于 120 分为优秀,120 分以下为非优秀统计成绩后,得到如下的列联表,且已知在甲、乙两个文科班全部 110 人中随机抽取 1 人为优秀的概率为 .311优秀 非优秀 合计甲班 10乙班 30合计 110(1)请完成上面的列联表;(2)根据列联表的数据,若按 99.9%的可靠性要求,能否认为“成绩与班级有关系” ;P( 2 x0) 0.050 0.010 0.001x0 3.841 6.635 10.828(3)若按下面的方法从
23、甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号试求抽到 9 号或10 号的概率考点 题点 解 (1)由题意知,优秀的概率 P ,故优秀人数为 30,故 22 列联表如下:311优秀 非优秀 合计甲班 10 50 60乙班 20 30 50合计 30 80 110(2)根据列联表中的数据,得到15 2 7.48610.828.1101030 2050260503080因此按 99.9%的可靠性要求,不能认为“成绩与班级有关系” (3)设“抽到 9 或 10 号”为事件 A,先后两次抛掷一枚均匀的骰子,出现的点数为( x, y),所有的基本事件有(1,1),(1,2),(1, 3),(6,6),共 36 个事件 A 包含的基本事件有(3,6),(4,5),(5,4),(6,3),(5,5),(4,6),(6,4),共 7 个所以 P(A) ,即抽到 9 号或 10 号的概率为 .736 736
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1