版选修2_3.doc

上传人:orderah291 文档编号:1091103 上传时间:2019-04-09 格式:DOC 页数:9 大小:2.15MB
下载 相关 举报
版选修2_3.doc_第1页
第1页 / 共9页
版选修2_3.doc_第2页
第2页 / 共9页
版选修2_3.doc_第3页
第3页 / 共9页
版选修2_3.doc_第4页
第4页 / 共9页
版选修2_3.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

1、13.2 独立性检验的基本思想及其初步应用教材研读预习教材 P9196 ,思考以下问题1分类变量与列联表分别是如何定义的?2独立性检验的基本思想是怎样的?要点梳理1与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表:列出的两个分类变量的频数表,称为列联表一般地,假设有两个分类变量 X和 Y,它们的取值分别为 x1, x2和 y1, y2,其样本频数列联表(称为 22列联表)为:YX y1 y2 总计x1 a b a bx2 c d c d总计 a c b d a b c d2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分

2、类变量间是否相互影响,常用等高条形图展示列表数据的频率特征3独立性检验的基本思想(1)定义:利用随机变量 K2来判断“两个分类变量有关系”的方法称为独立性检验(2)公式: K2 ,其中 n a b c d.n ad bc 2 a b c d a c b d(3)独立性检验的具体做法:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 ,然后查表确定临界值 k0.利用公式计算随机变量 K2的观测值 k.2如果 k k0,就推断“ X与 Y有关系” ,这种推断犯错误的概率不超过 ;否则,就认为在犯错误的概率不超过 的前提下不能推断“ X与 Y有关系” ,或者在样本数据中没有发现足

3、够证据支持结论“ X与 Y有关系” 自我诊断判断(正确的打“” ,错误的打“”)1分类变量中的变量与函数中的变量是同一概念( )2列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中 K2取值则可通过统计表从数据上说明两分类变量的相关性的大小( )3独立性检验的方法就是反证法( )答案 1. 2. 3.题型一 用等高条形图分析两个分类变量间的关系为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别 阳性数 阴性数 总计铅中毒病人 29 7 36对照组 9 28 37总计 38 35 73试画出列联表的等高条形图,分析铅中

4、毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?思路导引 依据表中数据,画出等高条形图,由图形进行分析解 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系(1)判断两个分类变量是否有关系的两种常用方法3利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法一般地,在等高条形图中, 与 相差越大,两个分类变量有关系的可能性就aa b cc d越大(2)利用等高条形图判断两个分类变量是否相关的

5、步骤跟踪训练在调查的 480名男人中有 38名患有色盲,520 名女人中有 6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关?你所得到的结论在什么范围内有效?解 根据题目所给的数据作出如下的列联表:色盲 不色盲 总计男 38 442 480女 6 514 520总计 44 956 1000根据列联表作出相应的等高条形图,如图所示从等高条形图来看,男性患色盲的频率要高一些,因此直观上可以认为色盲与性别有关根据列联表中所给的数据可以有a38, b442, c6, d514, a b480, c d520,a c44, b d956, n1000,4由公式 K2 ,n ad bc

6、 2 a b c d a c b d得 K2的观测值k 27.110.828.1000 38514 6442 248052044956因此,在犯错误的概率不超过 0.001的前提下,认为色盲与性别是有关的题型二 用 22列联表分析两个分类变量间的关系思考:下面是 22列联表.y1 y2 总计x1 33 21 54x2 a 13 46总计 b 34 100则表中 a, b处的值应为多少?提示: a461333, b33 a333366.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了 361名高二在校学生,调查结果如下:理科对外语有兴趣的有 138人,无兴趣的有 98人,文科对外语有

7、兴趣的有 73人,无兴趣的有 52人能否在犯错误的概率不超过 0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?解 根据题目所给的数据得到如下列联表:理科 文科 总计有兴趣 138 73 211无兴趣 98 52 150总计 236 125 361根据列联表中数据由公式计算得随机变量 K2的观测值k 1.87110 4 .361 13852 7398 2211150236125因为 1.871104 6.635.300 13236 11418 224654150150故在犯错误的概率不超过 0.01的前提下认为该种药物对“H1N1”病毒有治疗效果题 型 三 独 立 性 检 验某高校共

8、有学生 15000人,其中男生 10500人,女生 4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这 300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估计该校学生每周平均体育运动时间超过 4小时的概率6(3)在样本数据中,有 60位女生的每周平均体育运动时间超过 4小时请完成每周平均体育运动时间与性别的列联表,并判断是否有 95%的把握认为“该校学

9、生的每周平均体育运动时间与性别有关” 附: K2n ad bc 2 a b c d a c b dP(K2 k0) 0.10 0.05 0.010 0.005k0 2.706 3.841 6.635 7.879解 (1)300 90,所以应收集 90位女生的样本数据450015000(2)由频率分布直方图得 2(0.1500.1250.0750.025)0.75,所以该校学生每周平均体育运动时间超过 4小时的概率的估计值为 0.75.(3)由(2)知,300 位学生中有 3000.75225 人的每周平均体育运动时间超过 4个小时,75 人的每周平均体育运动时间不超过 4个小时又因为样本数据中

10、有 210份是关于男生的,90 份是关于女生的,所以每周平均体育运动时间与性别的列联表如下:平均体育运动时间与性别列联表男生 女生 总计每周平均体育运动时间不超过 4个小时 45 30 75每周平均体育运动时间超过 4个小时 165 60 225总计 210 90 300结合列联表可算得 K2的观测值7k 4.7623.841.300225027522521090 10021有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关” (1)独立性检验问题是常与统计、概率相结合,解题时一定要认真审题,找出各数据的联系(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论跟踪训练

11、某中学将 100名高一新生分成水平相同的甲、乙两个“平行班” ,每班 50人陈老师采用 A, B两种不同的教学方式分别在甲、乙两个班级进行教改实验为了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取 20名学生的成绩进行统计,作出茎叶图如图记成绩不低于 90分者为“成绩优秀”.(1)在乙班样本的 20个个体中,从不低于 86分的成绩中随机抽取 2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据作出列联表,并判断能否在犯错误的概率不超过 0.1的前提下认为:“成绩优秀”与教学方式有关解 (1)由题意知本题是一个等可能事件的概率,试验发生包含的事件是从不低于86分的成绩中随机抽取

12、两个包含的基本事件是:(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),8(97,99),(99,99),共有 15种结果,符合条件的事件数(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共有 10种结果,根据等可能事件的概率得到 P .1015 23(2)由已知数据得甲班 乙班 总计成绩优秀 1 5 6成绩不优秀 19 15

13、34总计 20 20 40根据列联表中的数据,计算得随机变量 K2的观测值k 3.137,40 115 519 26342020由于 3.1372.706,所以在犯错误的概率不超过 0.1的前提下认为:“成绩优秀”与教学方式有关1.本节课的重点是用 22列联表、等高条形图分析两个分类变量间的关系以及独立性检验2本节课要重点掌握的规律方法(1)用等高条形图分析两个分类变量间的关系,见典例 1;(2)用 22列联表分析两个分类变量间的关系,见典例 2;(3)独立性检验,见典例 3.3解决一般的独立性检验问题的步骤(1)通过列联表确定 a, b, c, d, n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用 K2 求出 K2的观测值 k;n ad bc 2 a b c d a c b d(3)如果 k k0,就推断“两个分类变量有关系” ,这种推断犯错误的概率不超过 ,否则就认为在犯错误的概率不超过 的前提下不能推断“两个分类变量有关系” 9其中第(2)步易算错 K2的值,是本节课的易错点

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试资料 > 中学考试

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1