1、第1章,统计案例,1.1 独立性检验,学习目标 1.理解列联表的意义,会根据列联表中数据大致判断两个变量是否独立. 2.理解统计量2的意义和独立性检验的基本思想.,1,预习导学 挑战自我,点点落实,2,课堂讲义 重点难点,个个击破,3,当堂检测 当堂训练,体验成功,知识链接 1.什么是列联表?怎样从列联表判断两个分类变量有无关系? 答 一般地,假设两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,列出两个变量的频数表,称为列联表(如下图):,|adbc|越小,说明两个分类变量x、y之间的关系越弱; |adbc|越大,说明两个分类变量x、y之间的关系越强.,2.统计量2有什么作用?,预
2、习导引 1.22列联表: 一般地,对于两个研究对象和,有两类取值类A和类B,也有两类取值类1和类2,得到如下列联表所示的抽样数据:,上述表格称为22列联表.,2.统计量2 2 .,3.独立性检验 要推断“与有关系”,可按下面的步骤进行: (1)提出假设H0: ; (2)根据22列联表计算_的值; (3)查对临界值,作出判断.,与没有关系,2,要点一 22列联表和2统计量 例1 根据下表计算:,2_.(结果保留3位小数),解析 2 4.514.答案 4.514,规律方法 利用2 ,准确代数与 计算,求出2的值.,跟踪演练1 已知列联表:药物效果与动物试验列联表,则2_.(结果保留3位小数),解析
3、 2 6.109. 答案 6.109,要点二 独立性检验 例2 为了研究人的性别与患色盲是否有关系,某研究所进行了随机调查,发现在调查的480名男性中有39名患有色盲,520名女性中有6名患有色盲,能在犯错误的概率不超过0.001的前提下认为人的性别与患色盲有关系吗?,解 由题意列出22列联表:,由公式得2的观测值 x0 28.225. 因为P(210.828)0.001,且28.22510.828, 所以在犯错误的概率不超过0.001的前提下认为患色盲与人的性别有关系,男性患色盲的概率要比女性大得多.,规律方法 独立性检验可以通过22列联表计算2的值,然后和临界值对照作出判断.,跟踪演练2
4、调查在23级风的海上航行中男女乘客的晕船情况,结果如下表所示:,根据此资料,你是否认为在23级风的海上航行中男人比女人更容易晕船? 解 假设H0:海上航行和性别没有关系,20.08. 因为22.706,所以我们没有理由认为男人比女人更容易晕船.,要点三 独立性检验的应用 例3 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表:,甲厂,乙厂,(1)试分别估计两个分厂生产的零件的优质品率;,解 甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为 72%; 乙厂
5、抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为 64%.,(2)由以上统计数据填下面22列联表,并计算是否有99%的把握认为“两个分厂生产的零件的质量有差异”.,解 2 7.3536.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.,规律方法 (1)解答此类题目的关键在于正确利用2计算2的值,再用它与临界值的大小作比较来判断假设检验是否成立,从而使问题得到解决. (2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.,跟踪演练3 下表是某地区的一种传染病与饮用水的调查表:,(1)这种传染病是否与饮用水的卫生程度有关,请
6、说明理由; 解 (1)假设H0:传染病与饮用水无关.把表中数据代入公式得:2 54.21, 54.2110.828,所以假设H0不成立. 因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关.,(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.,依题意得22列联表:,此时,2 5.785. 由于5.7855.024所以我们有97.5%的把握认为该种疾病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)中我们有99.9%的把握肯定结
7、论的正确性,(2)中我们只有97.5%的把握肯定结论的正确性.,1.下面是一个22列联表:,1,2,3,4,则表中a_.b_.,解析 a2173, a52,ba852860. 答案 52 60,1,2,3,4,1,2,3,4,2.为了考查长头发与女性头晕是否有关系,随机抽查301名女性,得到如表所示的列联表,试根据表格中已有数据填空.,1,2,3,4,则空格中的数据分别为:_;_; _;_. 解析 最右侧的合计是对应行上的两个数据的和,由此可求出和;而最下面的合计是相应列上的两个数据的和,由刚才的结果可求得. 答案 86 180 229 301,3.在吸烟与患肺病这两个分类变量的计算中,下列说
8、法正确的是_.(填序号) 若26.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;,1,2,3,4,若从2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 解析 对于,99%的把握是通过大量的试验得出的结论,这100个吸烟的人中可能全患肺病也可能都不患,是随机的,所以错;,1,2,3,4,对于,某人吸烟只能说其患病的可能性较大,并不一定患病; 的解释是正确的. 答案 ,1,2,3,4,4.为研究学生的数学成绩与学生学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:,1,2,3,4,1,2,3,4,学生的数学成绩好坏与对学习数学的兴趣是否有关? 解 由公式得:2 38.459. 38.45910.828, 有99.9%的把握认为,学生学习数学的兴趣与数学成绩是有关的.,课堂小结 1.独立性检验的思想:先假设两个事件无关,计算统计量2的值.若2值较大,则假设不成立,认为两个事件有关. 2.独立性检验的步骤:(1)作出假设H0:与没有关系;(2)计算2的值;(3)查对临界值,作出判断.,