1、- 1 -11 独立性检验学习目标 1.理解列联表的意义,会根据列联表中数据大致判断两个变量是否独立.2.理解统计量 2的意义和独立性检验的基本思想知识链接1什么是列联表?怎样从列联表判断两个分类变量有无关系?答 一般地,假设两个分类变量 X 和 Y,它们的值域分别为 x1, x2和 y1, y2,列出两个变量的频数表,称为列联表(如下图):y1 y2 合计x1 a b a bx2 c d c d合计 a c b d a b c d|ad bc|越小,说明两个分类变量 x、 y 之间的关系越弱;|ad bc|越大,说明两个分类变量 x、 y 之间的关系越强2统计量 2有什么作用?答 2 ,用
2、2的大小可判断事件 A、 B 是否有关联n(ad bc)2(a b)(c d)(a c)(b d)预习导引122 列联表:一般地,对于两个研究对象和,有两类取值类 A 和类 B,也有两类取值类 1 和类2,得到如下列联表所示的抽样数据:类 1 类 2 合计类 A a b a b 类 B c d c d合计 a c b d a b c d上述表格称为 22 列联表2统计量 2 2 .n(ad bc)2(a b)(c d)(a c)(b d)3独立性检验- 2 -要推断“与有关系” ,可按下面的步骤进行:(1)提出假设 H0:与没有关系;(2)根据 22 列联表计算 2的值;(3)查对临界值,作出
3、判断要点一 22 列联表和 2统计量例 1 根据下表计算:不看电视 看电视男 37 85女 35 143 2_.(结果保留 3 位小数)答案 4.514解析 2 4.514.300(37143 8535)212217872228规律方法 利用 2 ,准确代数与计算,求出 2的值n(ad bc)2(a b)(c d)(a c)(b d)跟踪演练 1 已知列联表:药物效果与动物试验列联表患病 未患病 合计服用药 10 45 55未服药 20 30 50合计 30 75 105则 2_.(结果保留 3 位小数)答案 6.109解析 2 6.109.105(1030 2045)230755550要点二
4、 独立性检验例 2 为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480 名男性中有 39 名患有色盲,520 名女性中有 6 名患有色盲,能在犯错误的概率不超过0.001 的前提下认为人的性别与患色盲有关系吗?解 由题意列出 22 列联表:患色盲 未患色盲 总计男性 39 441 480女性 6 514 520- 3 -总计 45 955 1000由公式得 2的观测值x0 28.225.1000(39514 4416)248052045955因为 P( 210.828)0.001,且 28.22510.828,所以在犯错误的概率不超过 0.001 的前提下认为患色盲
5、与人的性别有关系,男性患色盲的概率要比女性大得多规律方法 独立性检验可以通过 22 列联表计算 2的值,然后和临界值对照作出判断跟踪演练 2 调查在 23 级风的海上航行中男女乘客的晕船情况,结果如下表所示:晕船 不晕船 合计男人 12 25 37女人 10 24 34合计 22 49 71根据此资料,你是否认为在 23 级风的海上航行中男人比女人更容易晕船?解 假设 H0:海上航行和性别没有关系, 2 0.08.71(1224 2510)222493734因为 26.635,我们有 99%的把握认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有99 人患有肺病;从独立性检验可知,有 9
6、9%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有 99%的可能患有肺病;- 6 -若从 2统计量中得出有 95%的把握认为吸烟与患肺病有关系,是指有 5%的可能性使得推断出现错误答案 解析 对于,99%的把握是通过大量的试验得出的结论,这 100 个吸烟的人中可能全患肺病也可能都不患,是随机的,所以错;对于,某人吸烟只能说其患病的可能性较大,并不一定患病;的解释是正确的4为研究学生的数学成绩与学生学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:成绩优秀 成绩较差 合计兴趣浓厚的 64 30 94兴趣不浓厚的 22 73 95合计 86 103 189学生的数学成绩好坏与对
7、学习数学的兴趣是否有关?解 由公式得: 2 38.459.189(6473 2230)286103959438.45910.828,有 99.9%的把握认为,学生学习数学的兴趣与数学成绩是有关的1.独立性检验的思想:先假设两个事件无关,计算统计量 2的值若 2值较大,则假设不成立,认为两个事件有关2独立性检验的步骤:(1)作出假设 H0:与没有关系;(2)计算 2的值;(3)查对临界值,作出判断一、基础达标1当 22.706 时,就有_的把握认为“ x 与 y 有关系” 答案 90%2高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀 及格 总计甲班
8、 11 34 45乙班 8 37 45总计 19 71 90则随机变量 2的观测值约为_- 7 -答案 0.600解析 根据列联表中的数据,可得随机变量 2的观测值x0 0.600.90(1137 348)2454519713分类变量 X 和 Y 的列表如下,则下列说法判断正确的是_(填序号)y1 y2 合计x1 a b a bx2 c d c d合计 a c b d a b c d ad bc 越小,说明 X 与 Y 的关系越弱; ad bc 越大,说明 X 与 Y 的关系越强;( ad bc)2越大,说明 X 与 Y 的关系越强;( ad bc)2越接近于 0,说明 X 与 Y 的关系越强
9、答案 4通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 合计爱好 40 20 60不爱好 20 30 50合计 60 50 110由 2 算得,n(ad bc)2(a b)(c d)(a c)(b d) 2 7.8.110(4030 2020)260506050附表:P( 2 k) 0.050 0.010 0.001k 3.841 6.635 10.828参照附表,得到的正确结论是_在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关” ;在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关” ;有 99%以上的把握认为“爱好
10、该项运动与性别有关” ;有 99%以上的把握认为“爱好该项运动与性别无关” 答案 解析 根据独立性检验的定义,由 27.86.635 可知我们有 99%以上的把握认为“爱好该项运动与性别有关” 5为了研究男子的年龄与吸烟的关系,抽查了 100 个男子,按年龄超过和不超过 40 岁,吸- 8 -烟量每天多于和不多于 20 支进行分组,如下表:年龄不超过 40岁超过 40 岁合计吸烟量不多于 20 支/天 50 15 65吸烟量多于 20 支/天 10 25 35合计 60 40 100则有_的把握确定吸烟量与年龄有关答案 99.9%解析 利用题中列联表,代入公式计算 222.1610.828,1
11、00(5025 1015)265356040所以我们有 99.9%的把握确定吸烟量与年龄有关6某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:专业性别 非统计专业 统计专业 合计男 13 10 23女 7 20 27合计 20 30 50为了判断主修统计专业是否与性别有关,根据表中的数据,得 24.844.因为 24.8443.841,所以判断主修统计专业与性50(1320 107)223272030别有关系,那么这种判断出错的可能性为_答案 5%解析 因为 4.8443.841,则有 95%的把握认为两事件有关系,因此判断出错的可能性为 5%.7在某测试中,卷面满分为
12、 100 分,60 分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:分数段29404150516061707180819091100午休考生人数 23 47 30 21 14 31 14不午休考生人数 17 51 67 15 30 17 3- 9 -(1)根据上述表格完成列联表:及格人数 不及格人数 合计午休不午休合计(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义?解 (1)根据题表中数据可以得到列联表如下:及格人数 不及格人数 合计午休 80 100 180不午休 65 135 200合计 1
13、45 235 380(2)计算可知,午休的考生及格率为 P1 ,不午休的考生的及格率为 P2 ,则80180 49 65200 1340P1P2,因此,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态二、能力提升8在 22 列联表中,若每个数据变为原来的 2 倍,则 2的值变为原来的_倍答案 2解析 由公式 2 中所有值变为原来的 2 倍,n(ad bc)2(a b)(c d)(a c)(b d)得( 2) 2 2,2n(2a2d 2b2c)2(2a 2b)(2c 2d)(2a 2c)(2b 2d)故 2也变为原来的 2 倍9
14、下列说法正确的是_(填序号)对事件 A 与 B 的检验无关,即两个事件互不影响;事件 A 与 B 关系越密切, 2就越大; 2的大小是判断事件 A 与 B 是否相关的唯一数据;若判定两事件 A 与 B 有关,则 A 发生 B 一定发生答案 解析 对于,事件 A 与 B 的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故错是正确的对于,判断 A 与 B 是否相关的方式很多,可以用列联表,也可以借助于概率运算,故错对于,两事件 A 与 B 有关,说明两者同时发生的可能性相对来说较大,但并不是 A 发生 B 一定发生,故错10为研究某新药的疗效,给 50 名患者服用此药,跟踪调查后得下
15、表中的数据:无效 有效 合计- 10 -男性患者 15 35 50女性患者 6 44 50合计 21 79 100设 H0:服用此药的效果与患者的性别无关,则 2的值约为_,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为_答案 4.882 5%解析 由公式计算得 24.8823.841,我们有 95%的把握认为服用此药的效果与患者的性别有关,从而有 5%的可能性出错11下表是关于男婴与女婴出生时间调查的列联表:晚上 白天 总计男婴 45 A B女婴 E 35 C总计 98 D 180那么, A_, B_, C_, D_, E_.答案 47 92 88 82 53解析 由列
16、联表知识得Error!解得Error!12对 196 个接受心脏搭桥手术的病人和 196 个接受血管清障手术的病人进行 3 年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.又发作过心脏病未发作过心脏病合计心脏搭桥手术 39 157 196血管清障手术 29 167 196合计 68 324 392试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系由表中数据得a39, b157, c29, d167, a b196, c d196, a c68, b d324, n392,由公式得 2 1.779.因
17、为 21.77910.828.1240(228737 132143)2360880371869列出数学成绩与化学成绩的 22 列联表如下:化学优秀 化学非优秀 合计数学优秀 225 135 360数学非优秀 156 724 880合计 381 859 1240将表中数据代入公式,得 的观测值为2x2 240.610.828.1240(225724 156135)2360880381859列出数学成绩与总分成绩的 22 列联表如下:总分优秀 总分非优秀 合计数学优秀 267 93 360数学非优秀 99 781 880合计 366 874 1240将表中数据代入公式,得 的观测值为23x3 486.110.828.1240(267781 9399)2360880366874由上面的分析知, 2的观测值都大于 10.828,说明在犯错误的概率不超过 0.001 的前提下认为数学成绩优秀与物理、化学、总分成绩优秀都有关系
copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1