1、13.1 独立性检验122 列联表的定义对于两个研究对象和,有两类取值,即类 A 和类 B;也有两类取值,即类 1和类 2.这些取值可用下面的 22 列联表表示.2. 2统计量的求法公式 2 n( ad bc) 2( a c) ( b d) ( a b) ( c d)3独立性检验的概念用统计量 2研究两变量是否有关的方法称为独立性检验4独立性检验的步骤要判断“与有关系” ,可按下面的步骤进行:(1)提出假设 H0:与没有关系;(2)根据 22 列联表及 2公式,计算 的值; 2(3)查对临界值,作出判断其中临界值如表所示:P( 2x 0) 0.50 0.40 0.25 0.15 0.10 0.
2、05 0.025 0.010 0.005 0.001 0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828表示在 H0成立的情况下,事件“ 2x 0”发生的概率5变量独立性判断的依据(1)如果 10.828 时,那么有 99.9%的把握认为“与有关系” ; 2(2)如果 6.635 时,那么有 99%的把握认为“与有关系” ; 2(3)如果 2.706 时,那么有 90%的把握认为“与有关系” ; 2(4)如果 2.706 时,那么就认为没有充分的证据显示“与有关系” ,但也不能 22作出结论“H 0成立” ,即与没有关系
3、1在 22 列联表中,通常要求 a, b, c, d 的值均不小于 5.2表中| ad bc|越小,与关系越弱;| ad bc|越大,与关系越强同时要记准表中 a, b, c, d 四个数据是交叉相乘然后再作差取绝对值,一定不要乘错3表中类 A 与类 B,以及类 1 与类 2 的关系:对于对象来说,类 A 与类 B 是对立的,也就是说类 A 发生,类 B 一定不发生,类 A 不发生,则类 B 一定发生;同样对于对象来说,类 1 与类 2 的关系也是如此例 1 在一项有关医疗保健的社会调查中,发现调查的男性为 530 人,女性为 670 人,其中男性中喜欢吃甜食的为 117 人,女性中喜欢吃甜食
4、的为 492 人,请作出性别与喜欢吃甜食的列联表思路点拨 在 22 列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可精解详析 作列联表如下:喜欢甜食 不喜欢甜食 合计男 117 413 530女 492 178 670合计 609 591 1 200一点通 分清类别是列联表的作表关键步骤表中排成两行两列的数据是调查得来的结果1下面是 22 列联表:y1 y2 合计x1 a 21 73x2 2 25 27合计 b 46则表中 a, b 的值分别为_,_解析: a2173, a52.又 a2 b, b54.3答案:52 542某学校对高三学生作一项调查后发现:在平
5、时的模拟考试中,性格内向的 426 名学生中有 332 名在考前心情紧张,性格外向的 594 名学生中在考前心情紧张的有 213 人 .作出 22 列联表解:作列联表如下:性格内向 性格外向 合计考前心情紧张 332 213 545考前心情不紧张 94 381 475合计 426 594 1 020例 2 下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计干净水 52 466 518不干净水 94 218 312合计 146 684 830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病 5 人,不得病 50 人,饮用不干净水得病 9 人,不得病 22
6、人按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异思路点拨 (1)根据表中的信息计算 2的值,并根据临界值表来分析相关性的大小,对于(2)要列出 22 列联表,方法同(1)精解详析 (1)假设 H0:传染病与饮用水无关把表中数据代入公式,得 2 54.21,830( 52218 46694) 2146684518312因为当 H0成立时, 210.828 的概率约为 0.001,所以我们有 99.9%的把握认为该地区这种传染病与饮用不干净水有关(2)依题意得 22 列联表:得病 不得病 合计干净水 5 50 55不干净水 9 22 31合计 14 72 86此时, 2
7、 5.785.86( 522 509) 214725531由于 5.7852.706,所以我们有 90%的把握认为该种疾病与饮用不干净水有关两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有 90%的把握肯定一点通 解决独立性检验问题的基本步骤是:指出相关数据,作列联表;求4 2的值;判断可能性,注意与临界值作比较,得出事件有关的可能性大小3某保健药品,在广告中宣传:“在服用该药品的 105 人中有 100 人未患 A 疾病”经调查发现,在不使用该药品的 418 人中仅有 18 人患 A 疾病,请用所学知识分析该药品对患
8、 A 疾病是否有效?解:依题意得 22 的列联表:患病 不患病 合计使用 5 100 105不使用 18 400 418合计 23 500 523要判断该药品对患 A 疾病是否有效,即进行独立性检验提出假设 H0:该药品对患 A 疾病没有效根据列联表中的数据可以求得 2 0.041 457.879,所以我们有 99.5%的把握认为大学生的性别与看不看营养说明有关答案:有关5有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 合计多看电视 68 42 110少看电视 20 38 58合计 88 80 168则由表可知大约有_的把握认为多看电视与人变冷漠有关系解析
9、:由公式得 2 11.37710.828,所以我们168( 6838 4220) 2110588880有 99.9%的把握说,多看电视与人变冷漠有关答案:99.9%二、解答题6为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:成绩优秀 成绩较差 合计兴趣浓厚的 64 30 94兴趣不浓厚的 22 73 95合计 86 103 189学生的数学成绩好坏与对学习数学的兴趣是否有关?解析:提出假设 H0:学生数学成绩的好坏与对学习数学的兴趣无关由公式得 2的值为 2 38.459.189( 6473 2230) 2861039594当 H0成立时, 210.828 的
10、概率约为 0.001,而这里 238.45910.828,有 99.9%的把握认为学生数学成绩的好坏与对学习数学的兴趣是有关的7考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表.种子灭菌种子未灭菌 合计有黑穗病 26 184 210无黑穗病 50 200 250合计 76 384 460试按照原试验目的作统计推断7解:提出假设 H0:种子是否灭菌与有无黑穗病无关由公式得, 2 4.804.460( 26200 18450) 221025076384由于 4.8043.841,即当 H0成立时, 23.841 的概率约为 0.05,所以我们有 95%的把握认为种子是否灭
11、菌与有无黑穗病是有关系的8为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990 件产品中有合格品 982 件,次品 8 件;甲不在生产现场时,510 件产品中有合格品 493 件,次品 17 件试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响解:22 列联表如下合格品数 次品数 合计甲在生产现场 982 8 990甲不在生产现场 493 17 510合计 1 475 25 1 500提出假设 H0:质量监督员甲是否在生产现场与产品质量的好坏无明显关系根据 2公式得 2 13.097.1 500( 98217 4938) 29905101 47525因为 H0成立时, 210.828 的概率约为 0.001,而这里 213.09710.828,所以有 99.9%的把握认为质量监督员甲是否在生产现场与产品质量的好坏有关系