第 6章 方差分析.ppt

上传人:eastlab115 文档编号:380033 上传时间:2018-10-09 格式:PPT 页数:41 大小:487KB
下载 相关 举报
第 6章 方差分析.ppt_第1页
第1页 / 共41页
第 6章 方差分析.ppt_第2页
第2页 / 共41页
第 6章 方差分析.ppt_第3页
第3页 / 共41页
第 6章 方差分析.ppt_第4页
第4页 / 共41页
第 6章 方差分析.ppt_第5页
第5页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、云南财经大学统计信息学院,第 6章 方差分析,学习目标 6.1 方差分析的基本问题 6.2 单因素方差分析 6.3 双因素方差分析,云南财经大学统计信息学院,学习重点,解释方差分析的概念 解释方差分析的基本思想和原理 掌握单因素方差分析的方法及应用 4. 掌握双因素方差分析的方法及应用,云南财经大学统计信息学院,6.1 方差分析的基本问题,什么是方差分析(ANOVA)?,检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等 研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量 两个或多个 (k 个) 处理水平或分类 一个数值型因变量 有单因素方差分析和双因素方差分析 单因

2、素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量,云南财经大学统计信息学院,什么是方差分析? (例题分析),【 例 】某饮料企业研制出的一种新型饮料。饮料有四种颜色,分别为桔黄色、粉色、绿色和无色透明。随机从五家超市上收集前一期该饮料的销售量,如下表所示:,云南财经大学统计信息学院,什么是方差分析? (例题分析),分析饮料颜色对其销售量是否有显著差异。 即检验这四种颜色饮料的销量的均值是否相等 若它们的均值相等,则意味着饮料颜色对其销售量是没有影响的,即它们之间的销量没有显著差异;若均值不全相等,则意味着饮料颜色对其销售量是有影响的,它们之间的销售量有显著差异,云南财经大

3、学统计信息学院,方差分析中的有关术语,因素或因子(factor) 所要检验的对象 要分析颜色对饮料的销量是否有影响,颜色是要检验的因素或因子 水平或处理(treatment) 因子的不同表现 无色、粉色、桔黄色、绿色就是因子的水平 观察值 在每个因素水平下得到的样本数据 每种颜色饮料的销量就是观察值,云南财经大学统计信息学院,方差分析的基本思想和原理 (两类误差),随机误差 因素的同一水平(总体)下,样本各观察值之间的差异 比如,同一颜色下不同销售地点的销量是不同的 这种差异可以看成是随机因素的影响,称为随机误差 系统误差 因素的不同水平(不同总体)下,各观察值之间的差异 比如,不同颜色饮料销

4、量之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差,云南财经大学统计信息学院,方差分析的基本思想和原理,1. 比较两类误差,以检验均值是否相等 2. 比较的基础是方差比 3. 如果系统(处理)误差明显地不同于随机误差,则均值就是不相等的;反之,均值就是相等的 4. 误差是由各部分的误差占总误差的比例来测度的,云南财经大学统计信息学院,方差分析的基本思想和原理 (误差平方和),数据的误差用平方和(sum of squares)表示 组内平方和(within groups) 因素的同一水平(同一个总体)下样本数据的

5、平方和 组内平方和只包含随机误差 组间平方和(between groups) 因素的不同水平(不同总体)下各样本之间的平方和 组间平方和既包括随机误差,也包括系统误差,云南财经大学统计信息学院,方差分析的基本思想和原理 (误差的比较),若原假设成立,组间平方和与组内平方和经过平均后的数值就应该很接近,它们的比值就会接近1 若原假设不成立,组间平方和平均后的数值就会大于组内平方和平均后的数值,它们之间的比值就会大于1 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,也就是自变量对因变量有影响 判断颜色对饮料销量是否有显著影响,也就是检验销量的差异主要是由于什么原因所引起的。如果这种

6、差异主要是系统误差,说明不同颜色对饮料销量有显著影响,云南财经大学统计信息学院,6.2 单因素方差分析,设因素有k个水平,每个水平的均值分别用1 , 2, , k 表示 要检验k个水平(总体)的均值是否相等,需要提出如下假设: H0 : 1 2 k H1 : 1 , 2 , ,k 不全相等 设1为无色饮料销量的均值,2为粉色饮料销量的均值,3为桔黄色饮料销量的均值,4为绿色饮料销量的均值,提出的假设为 H0 : 1 2 3 4 H1 : 1 , 2 , 3 , 4 不全相等,云南财经大学统计信息学院,单因素方差分析的数据结构 (one-way analysis of variance),云南财

7、经大学统计信息学院,分析步骤,提出假设 构造检验统计量 统计决策,云南财经大学统计信息学院,提出假设,一般提法 H0 : m1 = m2 = mk 自变量对因变量没有显著影响 H1 : m1 ,m2 , ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等,云南财经大学统计信息学院,构造检验的统计量,构造统计量需要计算 水平的均值 全部观察值的总均值 误差平方和 均方(MS),云南财经大学统计信息学院,构造检验的统计量 (计算水平的均值),假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部

8、观察值总和除以观察值的个数 计算公式为,式中: ni为第 i 个总体的样本观察值个数xij 为第 i 个总体的第 j 个观察值,云南财经大学统计信息学院,构造检验的统计量 (计算全部观察值的总均值),全部观察值的总和除以观察值的总个数 计算公式为,云南财经大学统计信息学院,构造检验的统计量 (计算总离差平方和 SST),全部观察值 与总平均值 的离差平方和 反映全部观察值的离散状况 其计算公式为,前例的计算结果:SST = (26.5-28.695)2+(32.8-28.695)2=115.9295,云南财经大学统计信息学院,构造检验的统计量 (计算水平项平方和 SSA),各组平均值 与总平均

9、值 的离差平方和 反映各总体的样本均值之间的差异程度,又称组间平方和 该平方和既包括随机误差,也包括系统误差 计算公式为,前例的计算结果:SSA = 76.8455,云南财经大学统计信息学院,构造检验的统计量 (计算误差项平方和 SSE),每个水平或组的各样本数据与其组平均值的离差平方和 反映每个样本各观察值的离散状况,又称组内平方和 该平方和反映的是随机误差的大小 计算公式为,前例的计算结果:SSE = 39.084,云南财经大学统计信息学院,构造检验的统计量 (三个平方和的关系),总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系,SST = SS

10、A + SSE,前例的计算结果: 115.9295=76.8455+39.084,云南财经大学统计信息学院,构造检验的统计量 (三个平方和的作用),SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小 如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差 判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小,云南财经大学统计信息学院,构造检验的统计量 (计算均方MS)

11、,各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差 计算方法是用误差平方和除以相应的自由度 三个平方和对应的自由度分别是 SST 的自由度为n-1,其中n为全部观察值的个数 SSA的自由度为k-1,其中k为因素水平(总体)的个数 SSE 的自由度为n-k,云南财经大学统计信息学院,构造检验的统计量 (计算均方 MS),组间方差:SSA的均方,记为MSA,计算公式为,组内方差:SSE的均方,记为MSE,计算公式为,云南财经大学统计信息学院,构造检验的统计量 (计算检验统计量 F ),将MSA和MSE进行对比,即得到所需要的检验统计

12、量F 当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即,云南财经大学统计信息学院,如果均值相等,F=MSA/MSE1,构造检验的统计量 (F分布与拒绝域),云南财经大学统计信息学院,统计决策, 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策 根据给定的显著性水平,在F分布表中查找与第一自由度df1k-1、第二自由度df2=n-k 相应的临界值 F 若FF ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响 若FF ,则不能拒绝原假设H0 ,无证据支持表明所检验的因素对观察值有显著影响,云南财经大学统

13、计信息学院,单因素方差分析表 (基本结构),云南财经大学统计信息学院,6.3 双因素方差分析,分析两个因素对试验结果的影响 如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析 (Two-factor without replication) 如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析 (Two-factor with replication ),云南财经大学统计信息学院,双因素方差分析的基本假定,每个总体都服从正态分布

14、 对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本 各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的 观察值是独立的,云南财经大学统计信息学院,双因素方差分析 (例题分析),【例6-1】某商品有5种包装方式(因素A),在五个不同地区(B因素)销售。现从每个地区随机抽取一个规模相同的超市,其销售资料如下表?现欲检验包装方式和销售地区对销量是否有显著影响?(=0.05),云南财经大学统计信息学院,数据结构,云南财经大学统计信息学院,数据结构, 是B(行)因素的第i个水平下各观察值的平均值, 是A(列)因素的第j个水平下的各观察值的均值, 是全部 kr 个样本数

15、据的总平均值,云南财经大学统计信息学院,分析步骤 (提出假设),提出假设 对行因素提出的假设为 H0: m1 = m2 = = mi = = mk (mi为第i个水平的均值) H1: mi (i =1,2, , k) 不全相等 对列因素提出的假设为 H0: m1 = m2 = = mj = = mr (mj为第j个水平的均值) H1: mj (j =1,2,r) 不全相等,云南财经大学统计信息学院,分析步骤 (构造检验的统计量),计算平方和(SS) 总误差平方和行因素误差平方和 列因素误差平方和 随机误差项平方和,云南财经大学统计信息学院,分析步骤 (构造检验的统计量), 总离差平方和(SST

16、 )、水平项离差平方和 (SSB和SSA) 、误差项离差平方和(SSE) 之间的关系,SST = SSB +SSA+SSE,云南财经大学统计信息学院,分析步骤 (构造检验的统计量),计算均方(MS) 误差平方和除以相应的自由度 三个平方和的自由度分别是 总离差平方和SST的自由度为 kr-1 行因素的离差平方和SSB的自由度为 k-1 列因素的离差平方和SSA的自由度为 r-1 随机误差平方和SSE的自由度为 (k-1)(r-1),云南财经大学统计信息学院,分析步骤 (构造检验的统计量),计算均方(MS) 行因素的均方,记为MSB,计算公式为列因素的均方,记为MSA,计算公式为随机误差项的均方,记为MSE ,计算公式为,云南财经大学统计信息学院,分析步骤 (构造检验的统计量),计算检验统计量(F) 检验行因素的统计量 检验列因素的统计量,云南财经大学统计信息学院,分析步骤 (统计决策), 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策 根据给定的显著性水平在F分布表中查找相应的临界值 F 若FBF ,则拒绝原假设H0 ,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响 若FA F ,则拒绝原假设H0 ,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响,云南财经大学统计信息学院,End of Chapter 6,休息片刻!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教学课件 > 大学教育

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1