1、第五章 t检验统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括 假设检验 ( test of hypothesis) 和参数估计( parametric estimation) 二个内容。下一张 主 页 退 出 上一张 假 设 检 验 又叫 显著性 检验 ( test of significance)。 显著性检验的方法很多 ,常用的有 t检验、 F检验和 2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本章以两个平均数的差异显著性检验为例来阐明显著检验的原理, 介绍 几种 t检验的方法,然 后 介 绍 总 体 参 数 的 区 间 估计( i
2、nterval estimation)。 下一张 主 页 退 出 上一张 第一节 显著性检验的基本原理 一、显著性检验的意义随机抽测 10头长白猪和 10头大白猪经产母猪的产仔数,资料如下:长白: 11, 11, 9, 12, 10, 13, 13, 8, 10, 13大白: 8, 11, 12, 10, 9, 8 , 8, 9, 10, 7经计算,得长白猪 10头经产母猪产仔平均数 =11头,标准差 S1=1.76头;大白猪 10头经产母猪产仔平均数 =9.2头, 标 准 差 S2=1.549头。 下一张 主 页 退 出 上一张 能否仅凭这两个平均数的差值 - =1.8头,立即得出长白与大白
3、两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的 。这是因为如果 我们再分别随机抽测10 头长白猪和 10头大白猪经产母猪的产仔数,又可得到两个样本资料 。由于 抽样误差的 随机性,两样本平均数就不一定是 11头和 9.2头,其差值也不一定是 1.8头 。造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。 下一张 主 页 退 出 上一张 对两个样本进行比较时 ,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。两个总体间的差异
4、如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体 ,或者 是 包含个体很多的有限总体。因此 ,不得不采用另一种方法 ,即研究样下一张 主 页 退 出 上一张 样本,通过样本研究其所代表的总体。例如,设长白猪经产母猪产仔数的总体平均数为 , 大白猪经产母猪产仔数的总体平均数为 ,试 验研究的目的,就是要给 、 是否相同 做出推断。由于总体平均数 、 未知 ,在进行显著性检验时只能以样本平均数 、 作为检验对象,更确切地说,是以( - )作为检验对象。为什么以样本平均数作为检验对象呢?
5、这是因为样本平均数具有下述特征: 1、离均差的平方和 ( - ) 2最小。说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。下一张 主 页 退 出 上一张 2、样本平均数 是 总体平均数的 无偏估计值 ,即 E( ) =。3、 根据统计学中心极限定理,样本平均数服从或逼近正态分布。所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。由上所述,一方面我们有依据由 样本平均数 和 的差异来推断总体平均数 、 相 同 与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于 试 验 误差(或抽样误差)的不可避免性 。下一
6、张 主 页 退 出 上一张 通过试验测定得到的每个观测值 ,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值 由两部分组成,即= +总体平均数 反映了总体特征,表示误差。若 样本含量 为 n ,则 可 得 到 n 个 观 测值: , , , 。于是样本平均数 下一张 主 页 退 出 上一张 说明样本平均数并非总体平均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:= + , = + 这说明两个样本平均数之差( - )也包括了两部分:一部分是两个总体平均数的差( - ),叫 做 试 验 的 处 理 效 应 ( treatment effec
7、t); 另一部分是 试验误差 ( - )。下一张 主 页 退 出 上一张 也就是说样本平均数的差( - )包含有试验误差,它只是试验的表面效应。因此,仅凭( - )就对总体平均数 、 是否相同 下结论是不可靠的。只有 通过 显著性检验 才能从( - )中提取结论。 对( - )进行显著性检验就是要分析:试验的表面效应( - )主要由处理效应( - )引起的 ,还 是 主要 由试验误差所造成。下一张 主 页 退 出 上一张 虽然处理效应( - )未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可 从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,
8、这就是显著性检验的基本思想。二、显著性检验的基本步骤(一)首先对试验样本所在的总体作假设 下一张 主 页 退 出 上一张 这里假设 = 或 - =0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应: - =1.8头是试验误差,处理无效,这种假设称为 无效假设 ( null hypothesis), 记作 : = 或。 无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出 : = 或 - =0的同时,相应地提出一对应假设,称为 备择假设( alternative hypothesis),记作 。备择假设是在无效假设被否定时准备接受的假设。下一张 主 页
9、 退 出 上一张 本例的备择假设是 : 或 - 0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数 与 不相等或 与 之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。 (二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率 下一张 主 页 退 出 上一张 对于上述例子,研究在无效假设 : = 成立的前提下,统计量( - )的抽样分布。经统计学研究,得到一个统计量 t:其中 = 叫做 均数差异标准误 ; n1、 n2为两样本的含量。 下一张 主 页 退 出 上一张 所得的统计量 t服从自由度 d
10、f =( n1-1) +(n2-1)的 t分布。根据两个样本的数据,计算得: - =11-9.2=1.8;下一张 主 页 退 出 上一张 我们需进一步估计出 |t|2.426的两尾概率,即估计 P( |t|2.426) 是多少?查附表 3,在 df =( n1-1) + (n2-1) =( 10-1) +( 10-1) =18时,两尾概率为0.05的临界值: =2.101,两尾概率为0.01的临界 t值: =2.878,即:P( |t|2.101) = P( t2.101)+ P( t 2.878) = P( t2.878)+ P( t0.05, 即表面效应属于试验误差的可能性大,不能否定 :
11、 = ,统计学上把这一检验结果表述为: “两个总体平均数 与 差异不显著 ”,在计算所得的 t值的右上方标记 “ns”或不标记符号; 下一张 主 页 退 出 上一张 若 t0.05|t| ),它们构成的抽样分布相叠加 。 有 时 我 们 从 抽样总体抽取一个( - )恰恰在 成立时的接受域内(如图中横线阴影部分),这样,实际是从 总体抽的样本,经显著性检验却不能否定 ,因而犯了 型错误。犯 型错误的概率用 表示 。 型下一张 主 页 退 出 上一张 错误概率 值的大小较难确切估计, 它只有与特定的 结合起来才有意义。一般与显著水平、原总体的标准差 、 样本含量 n、 以及相互比较的两样本所属总体平均数之差 - 等因素有关。在其它因素确定时, 值越小, 值越大;反之, 值越大, 值越小; 样本含量及 - 越大、 越小, 值越小。 下一张 主 页 退 出 上一张