1、ICS 03.120.30 A 41 中华人民=H工.、和国国家标准GB/T 3358.3-2009/ISO 3534-3: 1999 代替GB/T3358.3-1993 2009-10-15发布统计学词汇及符号第3部分:实验设计Statistics-Vocabulary and symbols一Part 3: Design of experiments CISO 3534-3: 1999 , IDT) 中华人民共和国国家质量监督检验检茂总局中国国家标准化管理委员会2010-02-01实施发布GB/T 3358.3-2009/180 3534-3: 1999 目次I 引言. . II 范围.1
2、 一般术语12 实验安排术语73 分析方法术语19参考文献. 24 索引25汉语拼音索引25英文对应词索引27GB/T 3358.3-2009/ISO 3534-3: 1999 目。吕GB/T 3358(统计学词汇及符号分为以下部分:一一第1部分:一般统计术语与用于概率的术语第2部分:应用统计一一第3部分:实验设计本部分为GB/T3358的第3部分,等同采用ISO3534-3: 1999(统计学词汇及符号第3部分:实验设计。GB/T 3358的本部分与ISO3534-3: 1999相比,订正了原文的错误,修正了原文中概念表述不够准确的部分,主要变化如下:一一将1.10处理(treatment)
3、的定义改为每个因子的特定水平或不同因子水平的组合;将1.27重复(replication)的定义改为对给定的处理实施多于一次的实验,并删去了注;一一在1.21残差(residual) 的定义中在(响应变量的)预测值前增加基于假定模型的一词,以与1.22剩余误差(residual error) 的定义相对应;在2.1. 2. 1 2k析因实验中增加了关于用1,2分别替代+一,表示因子两个水平的注;一一将2.3区组设计(blockdesign)的定义改为将全部实验单元分成若干个区组的实验设计等。与ISO3534-3: 1999相比,本部分作了必要的编辑性的修改,例如:-一为与第1部分和第2部分相一
4、致,在术语定义中增加了其他术语(包括条目编号)的引用;一一一对ISO3534-3: 1999引用ISO3534-1: 1993与ISO3534-2: 1993的条目,按等同采用ISO3534-1:2006与ISO3534-2: 2006的GB/T3358. 1-2009与GB/T3358. 2-2009的相应内容,作适当的更改。本部分代替GB/T3358.31993(统计学术语第三部分试验设计术语),与GB/T3358. 3-1993相比,主要变化如下:一一一名称改为统计学词汇及符号第3部分:实验设计); 二一在全文中用实验替代试验,作为相应英文词experiment的优先选用词,但将试验一词
5、保留为实验的同义词;调整了术语条目设置;一一增加了大量的示例及注释。本部分由全国统计方法应用标准化技术委员会提出并归口。本部分主要起草单位:中国科学院数学与系统科学研究院、北京大学、中国标准化研究院、苏州大学。本部分主要起草人:冯士雍、陈敏、石坚、艾明要、丁文兴、汪仁官、于振凡。本部分于1993年首次发布,本次为第一次修订。I GB/T 3358.3-2009/ISO 3534-3: 1999 引实验设计实质上即是对实验的策划,以便有效和经济地得到正确和相关的结论。选择具体的实验方案依赖于所涉及问题的类型、结论的普遍性程度,以及可利用的资源、(实验材料、人员与时间)。一个经过恰当设计和实施的实
6、验,常导致相对简明的统计分析和对结果的解释。近年来,实验设计的应用得到蓬勃发展,主要是由于认识到实验设计对于提高产品和服务的质量非常重要。虽然统计质量控制、管理目标(menegementresolve)、检验和其他质量工具也有此功能,实验设计代表了一种在复杂的、变化的和交互的环境中进行选择的方法。在历史上,实验设计在农业领域得到发展与繁荣,医学领域也经历了悠久历史的精心实验设计。目前,工业环境中目睹了实验设计带来的可观效益,因为实验设计便于开展工作(界面友好的软件),改进了培训,得到有影响力的倡导推广,也积累了许多成功的案例。析因实验(见2.1)为实验者提供了研究所关心的多因子之间相互关系的方
7、法。这些类型的实验,远比简单的一次仅分析一个因子的实验更为有效。析因实验特别适用于确定在其他因子取不同水平时有不同响应的因子。通常,分析质量的突破来自研究交互作用(见1.17)所揭示的内在联系。如果考虑的因子数量比较多,析因实验可能要占用过多资源而难以实施。不过,部分析因设计(见2.1. 1)提供了一种可能的折衷办法。实际上,如果最初的目标是找出哪些因素需要进一步研究,筛选设计(见2.2) 就比较可行。在计划一个实验中,有必要对由于实验条件或实验单元处理的配置造成的偏倚进行控制。随机化(见1.29)和分区组(见1.28)之类的技术即是用来最小化讨厌的、外来的因素的影响。具体分区组技术包括随机化
8、区组设计(见2.3.1)、拉丁方设计(见2.3.2)、平衡不完全区组设计-(见2.3.4.1)等。实验设计是一个渐进的过程,以不断完善为目标,响应曲面设计(见2.的扮演了举足轻重的角色。通过对关键因子的不同水平的考察,响应曲面设计方法巧妙地解释了最优点附近的曲线效应。混料设计(2.5)处理各因子在整体中比例的情况,例如合金中的成分。嵌套设计(见2.6)尤其适用于多个实验室间进行的实验。如果实验完全按方案实施,对实验数据的分析方法将是直接的。图方法(见3.1)对揭示大体结论尤为有效。根据模型进行参数估计(见1.1及其后)常使用回归分析(见3.3)。回归分析方法也可用来处理缺失数据,识别离群值,以
9、及其他问题所带来的困难。优良的实验设计应该:a) 结合在因子及其水平的选择、描述假定条件等方面的先验知识和经验;b) 以最少的精力处理相关信息;c) 实验前能确保该实验的设计可以实现实验的目标及所需的精度;d) 体现调查的连续性;e) 明确实验处理的安排及其次序,以避免实验过程中的误解。E GB/T 3358.3-2009/ISO 3534-3: 1999 统计学词汇及符号第3部分:实验设计范围GB/T 3358的本部分规定了实验设计领域和起草其他标准中常用的术语。1 一般术语. . . 模型model 关于晌应变量(1.2)与预测变量(1.3)关系及其附带假定的描述。注1:模型由三个部分组成
10、:第一部分是建模的晌应(1.2) ,第二部分是包含预测变量(1.3)的模型的确定性或系统性的部分,第三部分是模型的随机部分或随机误差,其描述可以十分详细。例如,误差项可以结合成散度效应(1.14),使响应值的变异随着响应值的增大而增加。示例1:一个零件的寿命与它所处的环境条件有关。示例2:一个典型模型:Yij =+z十岛十ij其中Yij是在因子A的i水平和因子B的j水平时的响应,是响应的总平均,Qi是因子A在i水平时的附加效应,A是因子B在j水平时的附加效应,ij是误差项。模型的响应部分仅是Yij;模型的预测部分是十z十品,由一项响应的总平均和两项因子效应组成;模型的随机或误差部分是Eij,它
11、表示产生该响应的过程的固有变异。示例3.一个常用模型:y 训= 龟E十j号+ 飞马ij十E乌zI其中Y头汕y凡与zJ卅k是第h次重复(1.27)的响应,z是由因子1造成的调整,码是由因子2造成的调整,rij是由两因子的交互效应(1.16)所造成的调整,ij是误差项。此处的典型模型中不包含总平均项,所以用术语调整代替示例2中的附加效应;此外,采用Yijk(ijk )而不是Yij(ij ) ,表明可能存在的重复。示例4:另一个典型模型:Yi = e!o+1 Xi+.卢12X;十i其中Yi是对应于Xi的响应,e!o+卢f1Z+马zj表示对应于Xi的平均响应,i是误差项。注2:模型的上述描述不仅适用于
12、带有可加误差的经典线性模型,也适用于误差可以用各种分布描述的广义线性模型,这些分布包括二项分布、泊松分布、指数分布、伽玛分布和正态分布。1. 2 响应变量response variable 表示实验结果的变量。注1:同义词是输出变量。注2:不推荐把术语因变量也作为一个同义词,避免可能与自变量混淆(见GB/T3358.1一2009的1.11)。注3:从每一个实验单元(1.9)记录多个响应时,响应变量可为向量。1. 3 预测变量predictor variable 可用来解释实验结果的变量。注1:常用同义词有输入变量、描述变量和解释变量。注2:在一个经设计的实验中,预测变量的可控程度表明了它在其中
13、所起的潜在作用。预测变量可以是可控的(固定的)、可修正的(仅在短期内或在花费昂贵代价后可控的)或不可控的(随机的)。GB/T 3358.3-2009/ISO 3534-3: 1999 1. 4 1. 5 1. 6 注3.预测变量可以包含一个随机元素,也可以是没有随机误差的可观测或设置的一些定性组。注4:不推荐把术语自变量作为一个同义词,避免可能与因变量混淆(见GB/T3358.1-2009,1.11)。设计区域design region 设计空间design space 预测变量(1.3)容许值的集合。因子factor 为评估对晌应变量(1.2)的效应而在实验中需变化的预测变量(1.3)。注1
14、:因子对实验的结果可能提供一种可解释的原因。注2:与预测变量(1.3)的使用更为一般相比,此处因子的使用则有特定含义。注3:因子可与区组(1.11)的建立有关。水平level 因子(1.5)可能的设置、取值或安排。注1:同义词是预测变量的取值。注2:术语水平形式上与定量特性有关,但它也用来描述定性特征的状态或设置。示例:表示催化剂的水平可能是有或没有;表示加热处理的有序尺度温度的四个水平可能是:100 .C、120.C、140.C和160.C;表示实验室的名义尺度变量可能为对应于不同设备的三种水平:A,B和C。1. 7 1. 8 1. 9 2 注3:在因子不同水平观测的响应提供了实验水平范围内
15、决定因子效应的信息。如果没有模型关系假定的可靠根据,在水平范围以外作外推通常是不合适的。在水平范围以内的插值可能依赖于水平个数和水平间距。内插通常认为是合理的,尽管在不连续或多峰的情况下会造成实验范围内的突然变化。水平的选取可能仅限于某些特定的固定值(已知或未知),也可以在研究范围内随机选择。实验误差experimental error 实验晌应变量(1.2)在实施中,除因子(1.5)、区组(1.11)或其他可归属原因外,不能解释的变异。注1:实验误差是实验的普遍特征。当实验重复时,尽管非常精细地控制了实验材料、环境条件和实验操作,每次实验结果仍会变化。因此实验误差是普遍存在的。实验误差给从实
16、验结果得出的结论带来了一定程度的不确定性,从而在下结论时应予以考虑。注2:将比本术语较为广泛的概念用于某单个响应变量时,术语残差(1.21)、残余误差(1.22)和纯误差(1.23)提供了更为精细的描述。注3:与实验误差有关的的术语有重复性标准差(GB/T 3358. 2-2009 , 3. 3. 7)和再现性标准差(GB/T 3358. 2 2009,3.3.12)。如果实验的实际设计符合重复性条件(GB/T3358. 2-2009 , 3. 3. 6)或再现性条件(GB/T 3358.2一2009,3.3.11),这些术语可直接用于实验设计中。方差分量variance component
17、描述因子(1.5)效应或实验误差(1.7)的随机变量的方差。注1:考虑模型Y十ri+Cij 其中句是从可能取值的元限集合中随机选择的一个水平(的效应),ri和勺的分布独立,Ti和Cij都是随机变量。一旦从可能水平的元限集合中作出了随机选择,就根据ri的实现继续进行分析。鉴于这种概率结构,考虑以下方差等式是合理的:Var(Y;j)二Var(口)十Var(Cij)。右端也可表示成;+0;,其中碍和?是Yij的方差分量。实验单元experimental unit 接收一个特定处理(1.10)、随后产生晌应变量(1.2)值的个体。注:一个实验单元对应于一次实验。GB/T 3358.3-2009/ISO
18、 3534-3: 1999 1. 10 处理treatment 每个因子(1.5)的特定水平(1.6)或不同因子水平的组合。1. 11 区组block 比实验单元(1.9)的全体更具齐性的实验单元的集合(见1.28)。注1:术语区组来源于农业实验。作实验的田地被分为若干块每块有相同条件的小区域,如有相同或相似的风的位向、地下水状况及可耕层的深度等。其他情况下,区组可根据原材料的批、操作员、一天内考察的单元数等来确定。注2:通常,识别出区组的存在会影响处理(1.10)安排到实验单元的方式。1. 12 单因子实验one-factor experiment 只考察一个因子(1.5)对晌应变量(1.2
19、)的效应(如有的话)的实验。示例:考虑模型:y=严z十E其中y是响应变量,z是在因子的i水平时的平均响应,是一个包涵所有其他效应和变异来源的随机变量。该模型将响应变量y与效应!1i(依赖于因子水平)和误差项E联系起来。中的变化反映了因子对响应变量的影响(此时平均响应值是因子水平的函数)。该模型的另一种表示形式是:y=+z十E其中y是响应变量,是总平均响应,z是因子的i水平所造成的附加效应,是一个包涵所有其他效应和变异来源的随机变量。1. 13 主效应main effect 单个因子(1.5)对晌应变量(1.2)均值的影响。注:对于两水平(1.6)因子,主效应描述了从一个水平到另一个水平时响应的
20、变化。如果水平设置为一1c低水平)和+1C高水平),那么因子的主效应可估计成因子水平为十1时的平均响应减去因子水平为一1时的平均响应。考虑模型:y=+卢X十E其中y,和E与1.12中定义一致,X是前述的+1或-l,表示因子X的调整。注意卢的估计是因子X主效应(1. 13)的一半。如果=0,那么X不影响响应变量的均值(不管X的水平是十1或一1都一样),从而X的主效应为0。1. 14 .散度效应dispersion effect 单个因子(1.5)对晌应变量(1.2)方差的影响。注:认识到对平均响应没有太大影响,但可能对响应的变异有显著效应的因子是很重要的。在此情形,使响应变异较小、数值比较一致的
21、因子的某个特定水平(1.6)正是最想要的。当然对响应变量的均值和方差都有影响的因子也是可能的。1. 15 两因子实验two-factor experiment 同时考察两个不同因子(1.5)对晌应变量(1.2)的可能效应的实验。注:如果两个因子的作用互不影响,术语主效应(1.13)仍可适用。即每个因子的主效应是它对响应变量均值的贡献。1. 16 k因子实验k-factor experiment 同时考察走(是二三2)个不同因子(1.5)对晌应变量(1.2)的可能效应的实验。注:同义词是多因子实验。3 GB/T 3358.3-2009/180 3534-3: 1999 1. 17 交互效应int
22、eraction 一个因子(1.5)对晌应变量(1.2)的影响依赖于其他一个或多个因子的效应。注1:交互效应表明一个因子对响应的主效应依赖于另一个因子水平而表现出来的不一致性。下面图形表示了这些现象。强交互效应有效互效应: /+ 低水平高水平低水平高水平无交互效应气.s十、.B一低水平中水平高水平注2:最常见的情况是考虑仅包含两个因子的交互效应,这种交互效应更准确地称为两向交互效应或一阶交互效应。也可考虑三个因子如A,B和C中,可能存在A,B的一阶交互效应依赖于因子C的水平的情况,这称为二阶交互效应。类似地,可以考虑三阶、四阶或更高阶的交互效应。注3:1. 1中示例3提供了包含两个因子和它们的
23、两向或一阶交互效应马实验的典型模型表示。1. 18 混杂confounding 有意将两个或多个效应(主效应(1.13)或交互效应(1.16)相混合,使其不可区分。注:混杂是一项重要的技术,比如在一些实验设计中,它可有效地利用指定的区组(1.11)。为应用这种技术,在设计时应有意将那些没有兴趣的效应(主效应或交互效应)与区组效应混杂,而同时避免与其他较重要的效应混杂。利用混杂技术可以减少实验方案(1.30)的实验次数。然而,混杂有时是因为实验过程中对设计的无意识改变或对设计的不完善造成的,从而程度不等地降低了实验的效率。1. 19 别名alias 统计学出实验本质造成的与其他主效应(1.13)
24、或交互效应(1.16)完全混杂(1.18)的效应主效应或交互效应)。1. 20 曲性curvature 对晌应变量(1.2)与预测变量(1.3)之间直线关系的偏离。注1:曲性只对于定量预测变量有意义,而对于分类的(名义的或定性的(有序的预测变量没有意义。检测曲性要求因子有多于两个水平。有些情况下,在中心点(因子最高水平和最低水平之间的中间点)处进行重复(1.27) 可以检测和评估曲性。另一种观测曲性的方法是,将因子水平的范围作必要的扩展。注2:对1.12示例中给出的模型,曲性容易通过下述形式建摸:y=十卢X十X2+E如果不为0,则有证据表明模型偏离了简单线性关系。1. 21 4 残差resid
25、ual 晌应变量(1.2)的观测值与相应的基于假定模型(1.1)的预测值之差。注1:响应变量的预测值所基于模型的参数要由数据来估计。注2:残差是剩余误差(1. 22)的观测值。示例1:在1.1示例2的模型中Y ai-j是对应于因子八的水平i、因子B的水平1的实验单元的残差。示例2:Yii是i -j -rij是对应于1.1示例3中模型的残差。示例3:如一efio+ 气+zzj是对应于1.1示例4中模型的残差。G/T 3358.3-2009/ISO 3534-3: 1999 1. 22 剩余误差residual error 表示晌应变量(1.2)的结果与相应的基于假定模型(1.1)的预测响应值之差
26、的随机变量。注1:在本定义中,术语预测响应值可理解为利用假定模型、从实验数据导出的经验模型确定的估计响应值。示例:如果严和卢分别是1.13注中和卢的估计量,则y-jL-r是在预测变量取值z时,给定y的观测值的剩余误差。注2:剩余误差包含实验误差和模型没有考虑的可查明变异来源。注3:实验中,剩余误差的方差通常采用从总平方和中减去假定模型所包含项的平方和,再除以相应自由度之差,即残差方差来估计(见3.3中示例1及其注和3.4中的示例)。1. 23 纯误差pure error 反映一固定处理(1.10)组合上的重复(1.27)观测之变异的随机变量。注1:若仅在设计的中心点有重复,则响应在中心点的样本
27、方差即是纯误差方差的一个估计。如果在多个处理组合上都有重复,则将这些处理组合上的估计合在一起即可得到纯误差方差的一个总估计。示例:回到1.1叫3,对固阳n叫1.;勾.j一1若在每一个川组合都有重复,纯误差方差的一个合并估计为=tuEM豆)Z ,其中山,.,I;j=l,.,J;走=1,吨。注2:纯误差在实际应用中,有两种不同的表示:一是指数学模型的总体方差2;二是指样本或经验纯误差,它和估计的剩余误差(1.22)方差(残差方差)一起是检验模型拟合不足的基础。在1.1关于模型列举的示例中,只有带有重复的示例3才容易直接估计纯误差。从数学的观点看,纯误差可构建为示例2中的Var(E、示例3中的Var
28、(E训)和示例4中的Var(E,)。1. 24 对照contrast 统计学系数不全为0,而系数和为0的响应值的线性函数。注:对观测值Yl,Yz , ,Y. ,线性函数alYJ十azYz十十a.y.是一个对照,当且仅当I十U2十十=0,且所有的a;不全为0。示例1:一个三水平因子的实验结果为Yl只和仇。在许多可能问题中,问题1关注实验在水平1和水平3上的响应之差(暂时忽略中间水平)。回答此问题的对照系数可取为(-1,0,十1),它只需要川和约的值。如果因子水平是等间隔的,问题2关注是否有迹象表明响应变化模式具有二次的)曲性(1.20),而不是一个简单的线性关系。此时需将YJ和约的平均值与Yz比
29、较。(如果没有曲性,如会靠近连接YJ和川的直线,即近似地等于它们的平均值。)响应Yl Y2 Y3 问题1的对照系数-1 0 十1对照1-Yl 十Y3问题2的对照系数一1/2+1 -1/2 对照2- YJ /2 十Yz-Y3/2 本例说明了对连续变量的一种回归型研究方法。通常使用整数作为对照系数比使用分数更加方便,因而本例中,对照2的系数可采用(-1,十2,-1)。示例2:这个处理因子离散水平的示例提出了与示例1不同的两个问题。假定有三个供方:AJ,儿,儿,其中AJ采用一种新的制造技术,而儿和儿采用常规技术。问题1:采用新技术的供方Al确实与采用常规技术的A2和儿不同吗?此时要对照的是Yl与川和
30、川的平均值。问题2:采用常规技术的两个供方有什么不同吗?此时要对照川与Y30尽管结果的解释方式不同,但对照系数的模式与前一个示例中的相似。响应Yl Y2 Y3 问题1的对照系数一2十1+1 对照1问题2的对照系数对照2-2Yl十Y2十Y3。一1十1-Yz +川5 GB/T 3358.3-2009/150 3534-3: 1999 1. 25 正交对照orthogonal contrast 对应系数乘积之和等于0的两个或一组对照(1. 24)。示伊tl1: a;I对照1a;2对照2Yl Y2 Y3 咆1nu。十11十1a;2 。o +1 a;a;2 = 1 ,因此对照I与对照2不正交。示例2:Y
31、l Y2 Y3 a;对照1。+1 a;2对照2一1十21 a; a;2 +1 。-1 a;a;2 = 0 ,因此对照l与对照2为正交对照。1. 26 正交表orthogonal array 任何一对因子(1.5)的所有可能因子水平(1.6)对出现的次数都相等的处理(1.10)的组合。注:与正交表有关的强度概念将与筛选设计(2.2)有关,筛选设计也是正交表的一种应用。一个强度d的设计是任何d个因子的完全析因设计。强度1意味着每个因子的水平出现相同次数(有时称作平衡因子)。本术语定义的正交表的强度等于2,也可以定义强度大于2的正交表。1. 27 重复replication 对给定的处理(1.10)
32、实施多于一次的实验。注:有时只做一次实验也说成一次重复。1. 28 分区组blocking 实验单元(1.9)在相对齐性区组(1.11)内的一种安排,每个区组内的实验误差(1.7)可望小于将处理随机安排在数目相近的实验单元时的实验误差(见1.11,2.3)。注1:如果在实验中,除需要研究的已作为因子(主因子)之外,还有另外一些可查明原因的效应会对实验产生影响,且这些因素在全部实验中很难甚至不可能做到对所有实验单元都保持不变。此时就应该采用分区组的技术。区组的选择应尽可能地使同区组内这些可查明原因的效应最小,从而得到一个比较齐性的实验子空间。分析实验结果时也必须考虑区组的效应。注2:一个区组若可
33、容纳全部处理,则称为完全区组;而只能容纳全部处理中的一部分的区组称为不完全区组。当将处理成对安排时,对就是区组。1. 29 随机化randomization 将处理(1.10)安排到实验单元(1.白,并使每个实验单元有同等机会被安排某特定处理.的过程。注:随机化的目的在于尽可能避免实验中没有明确考虑的因素所造成的偏倚。随机化也可缩小由于不同时间或空间对实验结果的潜在影响。1. 30 实验方案experimental plan 将处理(1.10)安排每个实验单元(1.9),同时确定其实施时间次序的过程。6 GB/T 3358.3-2009/180 3534-3: 1999 1. 31 经设计的实
34、验designed experiment 为满足特定目标所选择的实验方案(1.30)。注:设计实验的目的是使实验以最有效且经济的方法获得相关结论。为实验选择一个合适的设计基于诸多考虑,比如问题种类、所得结论的一般性程度、能以高概率(功效)检出的效应的大小、实验单元的齐性和实验的实施费用等。一个好的经设计的实验通常会导致相对简单的统计分析和对结果的解释。1. 32 调优操作evolutionary operation EVOP 在正常生产过程中实施的对生产设施及生产条件的序列实验。注:调优操作的主要目的是为了获得改善过程及其产品的知识,以最小的费用,采用因子水平相对较小的偏移(在生产容许条件内)
35、来设计实验。调优操作实验的因子变动范围通常极小,以避免生产不合格的产品,且需要大量的重复(1.27)以减小随机变异的影响。1. 33 完全随机化设计completely randomized design 将处理(1.10)随机地安排到所有实验单元(1.9)的设计。注:完全随机化设计仅适用于可以认为所有实验单元是齐性的,没有系统差异的情形。1. 34 顶点cube point 因子(1.5)水平(1.6)形如向量(1,a2 ,向)的实验点,其中ai二十1或一1。注:这些点正是二水平完全或部分析因设计(参见2.1)中点的类型。在中心复合设计中,顶点数多达2个(见2.4中示例1)。1. 35 星点
36、star point 因子(1.5)水平(1.6)形如向量(al,2 ,ak)的实验点,其中仅有一个等于非零的十或一,其余皆为0。注:所有星点仅有一个等于十或一的非零分量。在典型的中心复合设计中,一般设置放个星点(见2.4中示例1)。1. 36 中心点center point 因子(1.5)水平(1.6)形如向量(al龟,ak)的实验点,其中所有ai皆为0。注=中心点的因子水平设置向量具有形式(0,0,0),对应于编码变量设计的中心点。中心点的重复次数町,根据响应曲面设计的不同目的选定。在中心点重复有时是为估计所研究过程的纯误差。1. 37 可旋转性rotatability 从拟合模型(1.1
37、)预测的响应在与中心点等距离的点上都有相同方差的设计特征。2 实验安排术语2. 1 完全析因实验full factorial experiment 析因实验factorial expcriment 包含有两个或多个因子(1.5) ,每个因子考虑两个或多个水平(1.6)所有可能处理(1.10)的实验。注1:从完全析因实验中可估计所有交互效应(1.16)和主效应(1.13)。注2:析因实验通常从符号上表示为每个因子水平数的乘积。例如,基于三水平的因子A、二水平的因子B和四水平的因子C的实验记为3X2X4析因实验。其乘积表示处理数。7 GB/T 3358.3-2009/ISO 3534-3: 199
38、9 注3:当析因实验中所有因子有相同的水平数时,通常记为水平数的因子数的是次幕。如有两个因子,每个因子有三个水平的实验记为32析因实验(是=2),它需要9个用于安排不同处理的实验单元。注4:完全析因设计有时也称为交叉设计。2. 1. 1 部分析因实验fractional factorial experiment 由完全析因实验(2.1)的一个子集组成的实验。注:术语部分析因实验中的部分通常是处理(1.10)组合数的一个简单比例。如:1/2,1/4等。2. 1.2 二水平实验two-level experiment 所有因子(1.5)都为两个水平(1.6)的实验。2. 1. 2. 1 7析因实验
39、2k factorial experiment 有是个因子(1.5)且每个因子都为两个水平(1.6)的析因实验。示例:以下24析因实验适宜考察4个因子:压力、温度、催化剂和操作员对过程产出的效应。A表示压力(水平取为低或高),B表示温度(水平取为低或高),C表示催化剂(水平取为有或没有),D对应于操作员(水平取为两个操作员中的某一个)。实验单元处理A 1 (1) 2 a 十3 b 4 ab 十5 C 6 ac 十7 bc 8 abc 十9 d 10 ad 十11 bd 12 abd 十13 cd 14 acd 十15 bcd 16 abcd 十B C D + 十+十十十十十十十十+十十十十+
40、十十十十+ 一个24实验由上表所列的16个不同的处理组成。符号一和十表示每个因子两个水平。通常用一号表示因子的低水平,+号表示高水平。当然这种规定是任意的。上述表中的排列次序称作标准叶茨(Yates)次序,在分析阶段很有用。实验中实施这些处理的实际次序应经随机化(1.29)。因子A的一十号交替排列(-,十,一,十,);因子B是2个号和2个十号交替排列;因子C是4个一号和4个十号交替排列;最后因子D是1至8实验单元(1. 9)为一号,9至16单元为十号。在GB/T3358的本部分的其后部分中,一也记为一1,十也记为十1。上表第2列表示了处理的缩写记号。小写字母出现表示对应的大写因子的水平设置在高
41、水平;字母不出现意味着对应因子设置在低水平。所有因子都设置在低水平的情形记为(1)。GB/T 3358.3-2009/180 3534-3: 1999 一个完全析因实验能对所有主效应(1.13)和交互效应(1.16)进行估计。如对24析因实验,有4个主效应(A,B,C,D)、6个两因子(一阶)交互效应(AB,AC,AD,BC,BD,CD)、4个三因子(二阶)交互效应(ABC,ABD,ACD,BCD)和1个四因子(三阶)交互效应(ABCD)。每个效应(例如,A的主效应、A和B的交互效应,甚至A、B、C和D的四因子交互效应)都可用对照系数来估计。这将在3.3中讨论。注:在实际应用中,也可用1与2分
42、别代替示例表中的-(或-1勺与十(或十1勺,它们分别表示二水平实验中因子的两个水平。这样A、Az分别表示因子A取水平1与水平2;B、马分别表示因子B取水平1与水平2,。用这种表示方法,示例中的表有以下形式:2. 1. 2. 2 实验单元处理A B C D 1 AI BI C1 DI 1 1 2 Az BI C1 Dl 2 1 1 3 AI Bz C DI 1 2 1 4 Az Bz C1 DI 2 2 1 5 AI BI cz DI 1 2 1 6 A2Bl Cz DI 2 2 1 7 A Bz Cz DI 1 2 2 1 8 Az Bz Cz DI 2 2 2 1 9 AI BI C Dz
43、1 1 2 10 Az BI C1 Dz 2 1 2 11 AI Bz C1 D2 2 2 12 A2 Bz C1 Dz 2 2 1 2 13 AI Bl Cz Dz 1 2 2 14 A2 B1 cz Dz 2 2 2 15 Al Bl C2 D2 1 2 2 2 16 A2 Bz Cz D2 2 2 2 2 这种表示方法的优点是对处理的表示更为亘观,而且容易推广到三个或三个以上水平的情形z缺点是当由两列生成另一列时的运算规则的定义不如用符号一和十方便(见2.1. 2. 2的注。2k-p部分析因实验2k- p fractional factorial experiment 从2k完全析因实验
44、(2.1)中精心选择的包含全部实验的2寸的实验。注1:因子数很大时,2k析因实验需要的处理(1.10)数非常大,实际中不可行。通过精心选择,从部分析因实验中也可获得与从完全析因实验中几乎等量的信息。特别注意,在作选择时应使认为实际上重要的主效应和交互效应仅与那些可忽略的交互效应相混杂。注2:当=1时,相应的部分析因实验是1/2析因实验;当p=2时,相应的部分析因实验是1/4析因实验,等。注3.构造2k-p部分析因实验可通过将走个因子分成两个组来实现。第一组有是一个因子,第二组有个因子。第一组中的k-p个因子分配到有2是一P个实验单元的完全析因实验,2k-P也是设计的实验单元数。对于每个实验单元
45、,第二组中每个因子的水平由第一组因子水平定义。用第一组因子定义第二组因子的p个等式称作生成关系,因为由它可生成设计。由个生成关系可导出2庄户一1个定义关系,它们确定了设计的性质。示例:考虑有6个因子和16个处理的实验,建议使用一个26-2部分析因设计。先设计一个4个因子(A,B,C和D)的完全析因实验,另两个因子E和F可用A,B,C和D的水平设置。生成关系的一种可能形式是:E=ABC,F二BCD。(注意,由此构造方法产生的4个字母链或字符串ABCE和BCDF称作字。例如,ABC是一个3字母链的字,ACDEG是一个5字母链的字,等等。)用十1,-1记因子的水平,A,B和C的水平决定了E的对应水平
46、(通过乘积ABC);而B,C和D的水平决定了F的水平(通过乘积BCD)。例如,对于实验单元l,A至D已经显示在2.1. 2. 1中示例的表中,E和F也设置在低水平。主效应E与三因子交互效应ABC别名,主效应F与三因子交互效应BCD别名。完整的别名与混杂结构可由定义关系I=ABCE二BCDF=ADEF导出。其中I是全由十(或十1)构成的列。9 GB/T 3358.3-2009/ISO 3534-3: 1999 2. 1.3 设计分辨度design resolution 定义关系中最短字母链的长度。注1:设计分辨度提供了特定设计中别名程度的一种描述,通常用罗马数字来表示。在实际中,三种最常见的分辨
47、度是田,目和V。对于分辨度为皿的设计,最短的字母链(1 除外)是3,这意味着设计的主效应不与其他主效应别名,但至少有一个主效应与一个两因子交互效应别名。对于分辨度N设计,主效应不与其他主效应或任何两因子交互效应别名,但至少有一个两因子交互效应与另一个两因子交互效应别名。对于分辨度为V的设计,主效应和两因子交互效应不与其他任何主效应或任何交互效应别名。注2:分辨度越高,可清晰估计的效应(主效应或交互效应)就越多。如果存在两个包含相同因子和实验单元(1.9)数的可选设计,应该选择分辨度较高的设计。幸运的是,对于实际感兴趣的大多数的是和,已给出了最合适的定义关系(例如,参见参考文献5J410页)。示例:续2.1.2.2中的示例。这个26-2部分析因设计的分辨度可由其定义关系得到。准确地说,设计分辨度是定义关系中最短的字或字母链(除1之外)的长度。利用运算规则:1A二A1=A,1B=BI=B,1=A2=W=C2,生成关系E=ABC等价于EE二ABCE,它也等价于1=ABCEo类似地,由F=BCD,可导出I二BC