1、13.2 独立性检验的基本思想及其初步应用, A 基础达标1观察下列各图,其中两个分类变量 x, y 之间关系最强的是( )解析:选 D.在四幅图中,D 图中两个深色条高相差最明显,说明两个分类变量之间关系最强2经过对 K2的统计量的研究,得到了若干个临界值,当 K22.706 时,我们认为事件 A与 B( )A有 95%的把握认为 A 与 B 有关系B有 99%的把握认为 A 与 B 有关系C没有充分理由说明事件 A 与 B 有关系D不能确定解析:选 C.当 K22.706 时,有 90%以上的把握说明 A 与 B 有关系,但当 K22.706 时,只能说明 A 与 B 是否有关系的理由不够
2、充分,故选 C.3为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了 60 名高中生,通过问卷调查,得到以下数据:作文成绩优秀 作文成绩一般 总计课外阅读量较大 22 10 32课外阅读量一般 8 20 28总计 30 30 60由以上数据,计算得到 K2的观测值 k9.643,根据临界值表,以下说法正确的是( )A没有充足的理由认为课外阅读量大与作文成绩优秀有关B有 0.5%的把握认为课外阅读量大与作文成绩优秀有关C在犯错误的概率不超过 0.001 的前提下认为课外阅读量大与作文成绩优秀有关D在犯错误的概率不超过 0.005 的前提下认为课外阅读量大与作文成绩优秀有关2解析:选
3、 D.根据临界值表,9.6437.879,在犯错误的概率不超过 0.005 的前提下,认为课外阅读量大与作文成绩优秀有关4某班主任对全班 50 名学生进行了作业量的评价调查,所得数据如下表所示:认为作业量大 认为作业量不大 总计男生 18 9 27女生 8 15 23总计 26 24 50则认为作业量的大小与学生的性别有关的犯错误的概率不超过( )A0.01 B0.025C0.10 D无充分证据解析:选 B.因为 K2的观测值为 k 5.0595.024,所以50( 1815 98) 227232624认为作业量的大小与学生的性别有关的犯错误的概率不超过 0.025.5独立性检验所采用的思路是
4、:要研究 X, Y 两个分类变量彼此相关,首先假设这两个分类变量彼此_,在此假设下构造随机变量 K2.如果 K2的观测值较大,那么在一定程度上说明假设_解析:独立性检验的前提是假设两个分类变量无关系,然后通过随机变量 K2的观测值来判断假设是否成立答案:无关系 不成立6在吸烟与患肺病是否相关的判断中,有下面的说法:若 K2的观测值 k6.635,则在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系,那么在 100 个吸烟的人中必有 99 人患有肺病;从独立性检验可知在犯错误的概率不超过 0.01 的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有 99%的可能患有肺病;从独立
5、性检验可知在犯错误的概率不超过 0.05 的前提下,认为吸烟与患肺病有关系时,是指有 5%的可能性使得推断错误其中说法正确的是_解析: K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案:7为研究某新药的疗效,给 100 名患者服用此药,跟踪调查后得下表中的数据:3无效 有效 总计男性患者 15 35 50女性患者 6 44 50总计 21 79 100设 H0:服用此药的效果与患者的性别无关,则 K2的观测值 k_,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能
6、性为_解析:由公式计算得 K2的观测值 k4.882.因为 k3.841,所以我们有 95%的把握认为服用此药的效果与患者的性别有关,从而出错的可能性为 5%.答案:4.882 5%8在调查的 480 名男性中有 38 名患有色盲,520 名女性中有 6 名患有色盲,请列出 22列联表,并估计色盲与性别是否有关系解:性别与色盲列联表色盲 不色盲 合计男 38 442 480女 6 514 520合计 44 956 1 000因为在调查的 480 名男性中,色盲占 ,3838 442 19240在调查的 520 名女性中,色盲占 ,66 514 3260 ,且两个比例的值相差较大,19240 3
7、260故估计色盲与性别有关系9某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩的平均分(采用百分制),剔除平均分在 30 分以下的学生后,共有男生 300名,女生 200 名现采用分层抽样的方法,从中抽取了 100 名学生,按性别分为两组,并将两组学生成绩分为 6 组,得到如下所示频数分布表分数段40,50)50,60)60,70)70,80)80,90)90,100男 3 9 18 15 6 9女 6 4 5 10 13 2(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数4学成绩与性别是否有关;(2)规定 80 分
8、以上为优秀(含 80 分),请你根据已知条件作出 22 列联表,并判断是否在犯错误的概率不超过 0.1 的前提下认为数学成绩与性别有关优秀 非优秀 总计男生女生总计 100解:(1) x 男 450.05550.15650.3750.25850.1950.1571.5,x 女 450.15550.1650.125750.25850.325950.0571.5,因为 x 男 x 女 ,所以从男、女生各自的平均分来看,并不能判断数学成绩与性别是否有关(2)由频数分布表可知,在抽取的 100 名学生中, “男生组”中数学成绩优秀的有 15 人,“女生组”中数学成绩优秀的有 15 人,据此可得 22
9、列联表如下:优秀 非优秀 总计男生 15 45 60女生 15 25 40总计 30 70 100可得 K2的观测值为k 1.79,100( 1525 1545) 260403070 2514因为 1.792.706,所以在犯错误的概率不超 0.1 的前提下不能认为数学成绩与性别有关B 能力提升10某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总成绩优秀的人数如下表所示,能否在犯错误的概率不超过 0.001 的前提下认为数学成绩优秀与物理、化学、总成绩优秀有关系?物理优秀 化学优秀 总成绩优秀数学优秀 228 225 267数学非优秀 143 156 99注:
10、该年级在此次考试中数学成绩优秀的有 360 人,非优秀的有 880 人解:列出数学成绩与物理成绩的 22 列联表如下:5物理优秀 物理非优秀 总计数学优秀 228 132 360数学非优秀 143 737 880总计 371 869 1 240将表中数据代入公式,得 K 的观测值为21k1 270.110.828.1 240( 228737 132143) 2360880371869列出数学成绩与化学成绩的 22 列联表如下:化学优秀 化学非优秀 总计数学优秀 225 135 360数学非优秀 156 724 880总计 381 859 1 240将表中数据代入公式,得 K 的观测值为2k2
11、240.610.828.1 240( 225724 156135) 2360880381859列出数学成绩与总成绩的 22 列联表如下:总成绩优秀 总成绩非优秀 总计数学优秀 267 93 360数学非优秀 99 781 880总计 366 874 1 240将表中数据代入公式,得 K 的观测值为23k3 486.110.828.1 240( 267781 9399) 2360880366874由上面的分析知, K2的观测值都大于 10.828,说明在犯错误的概率不超过 0.001 的前提下认为数学成绩优秀与物理、化学、总成绩优秀都有关系11(选做题)2018 年春节, “抢红包”成为社会热议
12、的话题之一某机构对春节期间用户利用手机“抢红包”的情况进行调查,如果一天内抢红包的总次数超过 10 次为“关注点高”,否则为“关注点低” ,调查情况如下表所示:关注点高 关注点低 总计男性用户 56女性用户 7 8总计 10 16(1)把上表补充完整,并判断能否在犯错误的概率不超过 0.05 的前提下认为性别与关注点高低有关?(2)现要从上述男性用户中随机选出 3 名参加一项活动,以 X 表示选中的同学中抢红包总次数超过 10 次的人数,求随机变量 X 的分布列及数学期望 E(X)下面的临界值表供参考:P(K2 k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.00
13、1k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828独立性检验统计量 K2 ,其中 n a b c d.n( ad bc) 2( a b) ( c d) ( a c) ( b d)解:(1)根据题意得 22 列联表如下:关注点高 关注点低 总计男性用户 3 5 8女性用户 7 1 8总计 10 6 16K2的观测值为 k 4.273.841.16( 31 75) 210688所以,在犯错误的概率不超过 0.05 的前提下认为性别与关注点高低有关(2)随机变量 X 的所有可能取值为 0,1,2,3.P(X0) , P(X1) ,528 1528P(X2) , P(X3) .1556 156得 X 的分布列为X 0 1 2 3P 528 1528 1556 156E(X)0 1 2 3 .528 1528 1556 156 987