第五章 t检验.ppt_麦多课文库mydoc123.com

资源描述

1、第五章 t检验统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断，它主要包括假设检验（ test of hypothesis）和参数估计（ parametric estimation）二个内容。下一张主页退出上一张假设检验又叫显著性检验（ test of significance）。显著性检验的方法很多，常用的有 t检验、 F检验和 2检验等。尽管这些检验方法的用途及使用条件不同，但其检验的基本原理是相同的。本章以两个平均数的差异显著性检验为例来阐明显著检验的原理，介绍几种 t检验的方法，然后介绍总体参数的区间估计（ i

2、nterval estimation）。下一张主页退出上一张第一节显著性检验的基本原理一、显著性检验的意义随机抽测 10头长白猪和 10头大白猪经产母猪的产仔数，资料如下：长白： 11， 11， 9， 12， 10， 13， 13， 8， 10， 13大白： 8， 11， 12， 10， 9， 8 ， 8， 9， 10， 7经计算，得长白猪 10头经产母猪产仔平均数 =11头，标准差 S1=1.76头；大白猪 10头经产母猪产仔平均数 =9.2头，标准差 S2=1.549头。下一张主页退出上一张能否仅凭这两个平均数的差值 - =1.8头，立即得出长白与大白

3、两品种经产母猪产仔数不同的结论呢？统计学认为，这样得出的结论是不可靠的。这是因为如果我们再分别随机抽测10 头长白猪和 10头大白猪经产母猪的产仔数，又可得到两个样本资料。由于抽样误差的随机性，两样本平均数就不一定是 11头和 9.2头，其差值也不一定是 1.8头。造成这种差异可能有两种原因，一是品种造成的差异，即是长白猪与大白猪本质不同所致，另一可能是试验误差（或抽样误差）。下一张主页退出上一张对两个样本进行比较时，必须判断样本间差异是抽样误差造成的，还是本质不同引起的。如何区分两类性质的差异？怎样通过样本来推断总体？这正是显著性检验要解决的问题。两个总体间的差异

4、如何比较？一种方法是研究整个总体，即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的，但常常是不可能进行的，因为总体往往是无限总体，或者是包含个体很多的有限总体。因此，不得不采用另一种方法，即研究样下一张主页退出上一张样本，通过样本研究其所代表的总体。例如，设长白猪经产母猪产仔数的总体平均数为，大白猪经产母猪产仔数的总体平均数为，试验研究的目的，就是要给、是否相同做出推断。由于总体平均数、未知，在进行显著性检验时只能以样本平均数、作为检验对象，更确切地说，是以（ - ）作为检验对象。为什么以样本平均数作为检验对象呢？

5、这是因为样本平均数具有下述特征： 1、离均差的平方和（ - ） 2最小。说明样本平均数与样本各个观测值最接近，平均数是资料的代表数。下一张主页退出上一张 2、样本平均数是总体平均数的无偏估计值，即 E（） =。3、根据统计学中心极限定理，样本平均数服从或逼近正态分布。所以，以样本平均数作为检验对象，由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。由上所述，一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否，另一方面又不能仅据样本平均数表面上的差异直接作出结论，其根本原因在于试验误差（或抽样误差）的不可避免性。下一

6、张主页退出上一张通过试验测定得到的每个观测值，既由被测个体所属总体的特征决定，又受个体差异和诸多无法控制的随机因素的影响。所以观测值由两部分组成，即= +总体平均数反映了总体特征，表示误差。若样本含量为 n ，则可得到 n 个观测值：，，，。于是样本平均数下一张主页退出上一张说明样本平均数并非总体平均数，它还包含试验误差的成分。对于接受不同处理的两个样本来说，则有：= + ， = + 这说明两个样本平均数之差（ - ）也包括了两部分：一部分是两个总体平均数的差（ - ），叫做试验的处理效应（ treatment effec

7、t）；另一部分是试验误差（ - ）。下一张主页退出上一张也就是说样本平均数的差（ - ）包含有试验误差，它只是试验的表面效应。因此，仅凭（ - ）就对总体平均数、是否相同下结论是不可靠的。只有通过显著性检验才能从（ - ）中提取结论。对（ - ）进行显著性检验就是要分析：试验的表面效应（ - ）主要由处理效应（ - ）引起的，还是主要由试验误差所造成。下一张主页退出上一张虽然处理效应（ - ）未知，但试验的表面效应是可以计算的，借助数理统计方法可以对试验误差作出估计。所以，可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在，

8、这就是显著性检验的基本思想。二、显著性检验的基本步骤（一）首先对试验样本所在的总体作假设下一张主页退出上一张这里假设 = 或 - =0，即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等，其意义是试验的表面效应： - =1.8头是试验误差，处理无效，这种假设称为无效假设（ null hypothesis），记作： = 或。无效假设是被检验的假设，通过检验可能被接受，也可能被否定。提出： = 或 - =0的同时，相应地提出一对应假设，称为备择假设（ alternative hypothesis），记作。备择假设是在无效假设被否定时准备接受的假设。下一张主页

9、退出上一张本例的备择假设是：或 - 0，即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数与不相等或与之差不等于零，亦即存在处理效应，其意义是指试验的表面效应，除包含试验误差外，还含有处理效应在内。（二）在无效假设成立的前提下，构造合适的统计量，并研究试验所得统计量的抽样分布，计算无效假设正确的概率下一张主页退出上一张对于上述例子，研究在无效假设： = 成立的前提下，统计量（ - ）的抽样分布。经统计学研究，得到一个统计量 t：其中 = 叫做均数差异标准误； n1、 n2为两样本的含量。下一张主页退出上一张所得的统计量 t服从自由度 d

10、f =（ n1-1） +(n2-1)的 t分布。根据两个样本的数据，计算得： - =11-9.2=1.8；下一张主页退出上一张我们需进一步估计出 |t|2.426的两尾概率，即估计 P（ |t|2.426）是多少？查附表 3，在 df =（ n1-1） + (n2-1) =（ 10-1） +（ 10-1） =18时，两尾概率为0.05的临界值： =2.101，两尾概率为0.01的临界 t值： =2.878，即：P（ |t|2.101） = P（ t2.101）+ P（ t 2.878） = P（ t2.878）+ P（ t0.05，即表面效应属于试验误差的可能性大，不能否定：

11、 = ，统计学上把这一检验结果表述为： “两个总体平均数与差异不显著 ”，在计算所得的 t值的右上方标记 “ns”或不标记符号；下一张主页退出上一张若 t0.05|t| ），它们构成的抽样分布相叠加。有时我们从抽样总体抽取一个（ - ）恰恰在成立时的接受域内（如图中横线阴影部分），这样，实际是从总体抽的样本，经显著性检验却不能否定，因而犯了型错误。犯型错误的概率用表示。型下一张主页退出上一张错误概率值的大小较难确切估计，它只有与特定的结合起来才有意义。一般与显著水平、原总体的标准差、样本含量 n、以及相互比较的两样本所属总体平均数之差 - 等因素有关。在其它因素确定时，值越小，值越大；反之，值越大，值越小；样本含量及 - 越大、越小，值越小。下一张主页退出上一张

展开阅读全文