1、优化试验设计与数据分析,第六章 均匀设计法,本章主要内容 均匀设计法的基本原理和应用范围。 均匀设计法的结果分析方法及试验结果的评价。 均匀设计法在科学研究中的实际应用。,6-1 基本原理,正交试验设计利用: 均衡分散:试验点散布均匀 整齐可比:试验点排列规律整齐可分析,一、引言,均匀设计法: 利用试验点在试验范围内充分分散的均匀设计表来进行试验设计的科学方法 均匀设计表: 利用数论在多维数值积分中的应用原理构造出的具有均衡分散特征的代表性试验表格,均匀设计法诞生於1978年。由中国著名数学家方开泰教授和王元院士合作共同发明。 中国科学家巧妙的将“数论方法”和“统计试验设计”相结合,发明了一种
2、全新的试验设计方法,这就是均匀设计法。 中国数学会均匀设计分会,华罗庚 王元,均匀设计是一种试验设计方法。 它可以用较少的试验次数,安排多因素、多水平的析因试验,是在均匀性的度量下最好的析因试验设计方法。均匀设计也是仿真试验设计和稳健设计的重要方法。,“方开泰,均匀设计与均匀设计表,科学出版社(1994).”,正交试验可以进行部分试验而得到基本上反映全面情况的试验结果,但是,当试验中因素数或水平数比较大时,正交试验的次数很多。如5因素5水平,用正交表需要安排5225次试验。这时,可以选用均匀设计法,仅用5次试验就可能得到能满足需要的结果。,1978年,七机部由于导弹设计的要求,提出了一个五因素
3、的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,显然优选法和正交设计都不能用,方开泰与王元经过几个月的共同研究,提出了一个新的试验设计,即所谓“均匀设计”,将这一方法用于导弹设计,取得了成效。均匀设计法与正交设计法的不同: 均匀设计法不再考虑数据“整齐可比”性,只考虑试验点在试验范围内充分“均衡分散”,均匀设计是一种适用于多水平的多因素试验设计方法,具有如下特点:1 试验点分布均匀分散 2 在处理设计中各个因素每个水平只出现一次3 适用于多水平多因素模型拟合及优化试验4 试验结果采用回归分析方法,均匀设计的特点,均匀设计表符号表示的意义,二、均匀设计表,U7(76),均匀表的代
4、号,试验次数,因素的水平数,因素数,一般的均匀设计表水平数为奇数 当水平数为偶数时,用比它大1的奇数表划去最后一行即可得到水平数为偶数的均匀设计表 利用均匀设计表安排试验时,试验点是均匀的,从两因素11水平的均匀设计布点图可以直观地看到布点是均衡分散的。,均匀设计有其独特的布(试验)点方式 每个因素的每个水平做一次且仅做一次试验 任两个因素的试验点在平面的格子点上,每行每列有且仅有一个试验点以上两个性质反映了均匀设计试验安排的“均衡性”,即对各因素,每个因素的每个水平一视同仁。 均匀设计表任两列组成的试验方案一般并不等价,例如用U11(1110)的1,7 和1,2列分别画图,得到下面的图 (a
5、)和图 (b)。我们看到,(a)的点散布比较均匀,而(b)的点散布并不均匀。均匀设计表的这一性质和正交表有很大的不同,因此,每个均匀设计表必须有一个附加的使用表。,如U6(64)表示要做次6试验,每个因素有6个水平,该表有4列。,U6(64),列号,试验号,正交设计安排试验时采用的随机化过程包括: 因素顺序随机化 因素水平随机化 实验顺序随机化 而均匀设计表中的各列是不平等的,因素所应安排的列的位置是不能随意变动的 当试验中因素的个数不同时,须根据因素的多少按照均匀表的使用表确定因素所占列,每个均匀设计表都附有一个使用表,它指示我们如何从设计表中选用适当的列,以及由这些列所组成的试验方案的均匀
6、度。下表是U6(64)的使用表。它告诉我们,若有两个因素,应选用1,3两列来安排试验;若有三个因素,应选用1,2,3三列,最后1列D表示刻划均匀度的偏差(discrepancy) 。,U6(64)的使用表,偏差值越小,表示均匀度越好,均匀设计和正交设计的比较,1.试验次数的比较 正交设计用于水平数不高的试验,因为它的试验数至少为水平数的平方。例如一项试验,有五个因素,每个因素取31水平,若用正交设计,至少需要做961次试验,而用均匀设计只需31次,所以均匀设计适合于多因素多水平试验。,将目前最常用正交设计和均匀设计作一下比较,讨论两种试验设计方法的特点。,2 .试验结果的比较 正交设计可以计算
7、出因素的主效应,有时也能估算出它们的交互效应,但都只停留在事先设计好的水平数中。而均匀设计不仅可以计算出回归模型中因素的主效应和交互效应,还可预测试验最佳效果时的各因素水平数值,并比事先设计好的水平数值更加细化。,两种设计的均匀性比较,1.试验数相同时的偏差的比较 当因素s=2时,若用L8(27)安排试验,其偏差为0.4375;若用均匀设计表 ,则偏差最好时要达0.1445。显然试验数相同时均匀设计的均匀性要好得多。值得注意的是,这种比较方法对正交设计是不公平的,因为当试验数给定时,水平数减少,则偏差会增大。所以这种比较方法正交设计明显地吃亏。,很难找到正交设计和均匀设计具有相同的试验数和相同
8、的水平数。我们从如下三个角度来比较:,2.水平数相同时偏差的比较 两种设计水平数相同,但试验数不同的比较。其中当均匀设计的试验数为6时,相应正交设计的试验数为62,例如 的偏差0.1875,而L36(62)的偏差为0.1597,两者差别并不很大。所以用均匀设计安排的试验其效果虽然比不上正交设计,但其效果并不太差,而试验次数少了6倍。,3 偏差相近时试验次数的比较 刚才讲到 比不上L36(62) ,试验次数适当增加使偏差相近时,例如 的偏差为0.1445,比L36(62)的偏差略好,但试验次数可省36/8=4.5倍。,结论:如果用偏差作为均匀性的度量,均匀设计明显地优于正交设计,并可节省试验次数
9、。,利用DPS试验设计软件来直接设计均匀设计表,指定因子数和水平数,DPS软件输出结果,其偏差D只有0.1194,小于 的偏差值0.2132,其优越性更好。采用这种方法获得的均匀设计表不需要使用表,因而使用起来更为简便。,三、试验结果分析均匀设计的结果没有整齐可比性,分析结果不能采用一般的方差分析方法,通常要用回归分析或逐步回归分析的方法。,一般而言:在进行均匀设计时,应考虑水平数与因素数的适当比例,至少水平数大于因素数的2倍以上,才能使试验结果正确进行回归计算处理。,6-2 应用举例,利用均匀设计表来安排试验的步骤: (1)根据试验的目的,选择合适的因素和相应的水平。 (2)选择适合该试验的
10、均匀设计表,然后根据该表的使用表从中选出列号,将因素分别安排到这些列号上,并将这些因素的水平按所在列的指示分别对号,则试验就安排好了。,在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比(A)、吡啶量(B)和反应时间(C)三个因素,它们各取了7个水平如下: 原料配比(A):1.0,1.4,1.8,2.2,2.6,3.0,3.4 吡啶量(B)(ml):10,13,16,19,22,25,28 反应时间(C)(h):0.5,1.0,1.5,2.0,2.5,3.0,3.57全面交叉试验要N=73=343次,太多了。7个水平,需要安排7次试验,根据因素和水平,我们可以选用U7(76)完成该试验。,
11、第1步: 将试验因素的水平列成下表:,第2步: 选择相应的均匀设计表,均匀设计表的使用表,每个表还有一个使用表,将建议我们如何选择适当的列。其中偏差为均匀性的度量值,数值小的设计表示均匀性好。例如 U7 (74)的使用表为,指定因子数和水平数,DPS软件输出结果,均匀设计表的使用表,第3步:应用选择的均匀设计表, 做出试验安排。,1. 将 x1, x2和 x3放入列1,和3.,2用x1的个水平替代第一列的1到 7.,3. 对第二列,第三列做同样 的替代.,4. 完成该设计对应的试验,得到个结果,将其放入最后一列.,第3步:应用选择的均匀设计表, 做出试验安排。,x1 x2 x3,1.0 1.4
12、 1.8 2.2 2.6 3.0 3.4,13 1.5 19 3.0 25 1.0 10 2.5 16 0.5 22 2.0 28 3.5,制备阿魏酸的试验方案U7(73)和结果,根据试验方案进行试验,其收率(Y)列于表的最后一列,其中以第7号试验为最好,其工艺条件为配比3.4,吡啶量28ml,反应时间3.5h 我们可用线性回归模型来拟合上表的试验数据,第 4步: 用回归模型匹配数据,现在用逐步回归分析的方法来筛选变量:逐步回归是回归分析中的一种筛选变量的技术.开始它将贡献最大的一个变量选入回归方程,并且预先确定两个阈值Fin和Fout,用于决定变量能否入选或剔除.逐步回归在每一步有三种可能的
13、功能: 将一个新变量引进回归模型,这时相应的F统计量必须大于Fin 将一个变量从回归模型中剔除,这时相应的F统计量必须小于Fout 将回归模型内的一个变量和回归模型外的一个变量交换位置。,设先用后退法来选变量.所谓后退法,就是开始将所有的变量全部采用,然后逐步剔除对方程没有显著贡献的变量,直到方程中所有的变量都有显著贡献为止。 仍考虑线性模型,开始三个因素全部进入方程,统计软件包通常还会提供每个变量的t值,t值越大(按绝对值计)表示该因素越重要.对本例有,t0=0.204,t1=0.96,t2=-0.67,t3=2.77 这表明三个因素中以X3(反应时间)对得率(Y)影响最大,配比次之,吡啶量
14、最小。 这些t 值都是随机变量,它们遵从tn-m-1分布。 若取=0.05 ,这时n=7,m=3, tn-m-1= 的临界值t3(0.05)=3.18。t值大于该值的因素表示对方程有显著贡献,否则表示不显著。今 均小于(0.05)=3.18 ,说明回归方程(2.18)的三个变量至少有一个不起显著作用.于是我们将贡献最小的X2删去,重新建立Y和X1及X3的线性回归方程,得,方差分析(ANOVA) 表,回归方程显著,第5步: 优化 - 寻找最佳的因素水平组合,本均匀设计是73=343个全面试验的部分实施, 其中最好的试验点是值为Y= 48.2%的 #7。它不一定是全局最好的。人们想找到满足下式的x
15、1*和 x3* :,这里求取max的区域为:,等值线图, (x1*,x3*),因素 x2 没有给响应Y予显著的贡献,我们可以选x2为 其中点x2 = 19 ml.,求出的x1* = 3.4 在边界上, 我们需要扩大x1的试验上限。,在x1 = 3.4和 x3 = 2.7575的邻域,追加一些试验是必要的。,在第步,一些优化算法是很有用的。,讨论:,逐步回归分析法的应用,本例 原始 数据,选择逐步回归命令,自变量,因变量,逐步回归方法选择,选择前进法,逐步回归条件,回归系数的详细值,回归方程的 S值 R2值 调整R2值,常数项大小,自变量选择方式1,自变量选择方式2,结果1,结果2,响应面分析,
16、自定义响应面设计,选择因素x1和x3分析其交互作用,分析响应面设计,选择因变量,非编码单位,响应面和等高线,选中等高线,选中响应面,等高线,响应面,例.均匀设计法在全光亮镀镍研究中的应用,1. 均匀设计表的选取本实验的目的是提高镀层光亮性。经初步研究,取其固定组成为硫酸镍25g/L,次磷酸钠25g/L,醋酸钠25g/L。考察因素为稳定剂,主光亮剂,辅助光亮剂,润湿剂4个因素,每个因素取值范围为t个水平(t 为实验次数),4个因素的一次项及二次项各有4项,4项因素间的两两交互作用设有6项,共14项,实验数不能小于14,本实验选用U17(178)表。,均匀表U17(178),U17(178)表的使
17、用表,本实验为4因素,这4个因素安排在均匀表的1,5,7,8列,去掉U17(178)的最后一行,将实验方案及结果见下表。,指标是回归方程中的响应函数,在本实验中即是镀件质量。根据我们对镀件的要求,定义一个综合指标z,z的分值由外观评分R,沉积速度评分V,耐腐蚀性评分Q乘以不同的权重构成,z=0.5R+0.2V+0.3Q。R,V,Q的分值分别为0100。,2.指标的选择和优化,试样为10cm5cm0.2cm的低碳钢板,在8890 的恒温水浴槽内施镀,镀液pH值控制在4.5-5.0。镀前处理按常规进行,按均匀设计表中确定的组成分别配成16种化学镀液,挂镀法施镀1h,清洗,晾干,对试样进行外观的评定
18、。 沉积速度测定:沉积速度,样片增加的重量/样片的面积(g/cm2 ) 耐腐蚀性测定:10硫酸浸泡24h,根据失重及腐蚀后外观评分,3.实验方法,实验结果用计算机处理,主要运用软件为SPSS和Matlab。 4.1建立数学模型及筛选变量 考虑到可能有的数学关系,将各因素的一次项,二次项,两因子间的交互作用项均作为考察对象,回归方程模型为:R=b0+bixi+bijxixj+biixi2 (i=1,2,3,4;ij) b为各项系数。将给因素的值及综合指标输入计算机,用自后淘汰变量法(backward selection)进行回归分析和变量筛选,sigF0.10的变量被淘汰,最后得到指标与相关组成
19、的回归方程。,4.结果处理及分析,Z=86.726+6.555d4.554p21.384c20.0164123.177pc0.1932p0.1209c0.3779d c为主光亮剂;d为辅助光亮剂;为润湿剂;p为稳定剂。,4.2对回归方程的优化处理 用求条件极值的强约束优化法对回归方程进行优化,用Matlab语言编程 ,用BFGS拟牛顿(Quasi-Newton)算法及最小二乘法寻优,本实验找到的最优解为:主光亮剂HC3.7mg/L,辅助光亮剂HD1.1ml/g,稳定剂0.2mg/L,润湿剂19.7mg/L,乳酸6mol/L。,4.3优化结果的验证 按最优解所得到的组成配成镀液进行施镀,所得试样
20、外观达到镜面全光亮,镀件经各种腐蚀介质分别浸泡24h后外观仍然光亮,镀层无明显变化。镀片综合指数评定值为96.2,优于实验中最好的5号试样。镀速可达115m /h,镀液使用周期可达8周期以上。,4.4各因素对镀层质量影响的分析 回归方程中各项系数的大小反映了该因素对指标影响的大小,但由于给系数的单位不同不能进行比较,因此需对给变量的系数进行标准化,将回归方程系数变为标准回归系数,主光亮剂c2 辅助光亮剂d 稳定剂p2 润湿剂2 b0 0.384 0.384 0.759 0.418交互pc 交互pw 交互cw 交互dwb0 0.485 0.233 0.229 0.714,从以上数据看出,但因素对
21、综合指标影响最大的是稳定 剂,其次是润湿剂。根据交互作用项的系数可看出,润 湿剂与辅助光亮剂的交互作用dw影响最大,其次主光亮 剂与稳定剂的交互作用影响液也较大。,6-3 混合水平的均匀设计表,在应用均匀设计时会面临许多新情况,需要灵活加以应用 有如下三种方法: a)均匀设计与调优方法共用;b)分组试验;c)拟水平法 本节仅介绍拟水平法在均匀设计法中的应用 若在一个试验中,有二个因素A和B为三水平,一个因素C为二水平分别记它们的水平为A1,A2,A3,B1,B2,B3和C1,C2这个试验可以用正交表L18(2x 37)来安排,这等价于全面试验,并且不可能找到比L18更小的正交表来安排这个试验
22、可以用拟水平技术均匀设计来安排这个试验。我们选用均匀设计麦U6*(66),按使用表的推荐用1,2,3前3列,若将A和B放在前两列,C放在第3列,并将前两列的水平合并:,1,213,425,63同时将第3列水平合并为二水平:1,2,314,5,62于是得设计表(表20)这是一个混合水平的设计表U6(3221),这个表有很好的均衡性。例如,A列和C列,B列和C列的二因素设计正好组成它们的全面试验方案,A列和B列的二因素设计中没有重复试验我们要安排一个二因素(A,B)五水平和一因素(C)二水平的试验这项试验若用正交设计,可用L50表,但试验次数太多若用均匀设计来安排,可用U10(5221)若选用U10(1010)的1,2,5三列,用同样的拟水平技术,便可获得表22列举的U10(5221)表它有较好的均衡性对1,5列采用水平合并1,21。 9,1051,2,3,4,516,7,8,9,102于是得表22的方案。经计算发现现表22结出的表具有偏差D0.39253,达到了最小,表-22 拟水平设计U10(5221),定义两列参数分别为因子数和水平数并选中,选择混合水平均匀设计命令,定义试验次数,定义试验次数,混合水平均匀设计表U12(121614132),