1、 均匀设计是一种试验设计方法。它可以用较少的试验次数,安排多因素、多水平的试验,是在均匀性的度量下最好的试验设计方法。这种完全从均匀性出发的试验设计,称为均匀设计均匀设计 。引子:黎元生留学加拿大随笔我于1996年受国家教委公派去加拿大滑铁卢大学化工系做访问学者,从事重油乳液的现场制氢破乳加氢改质课题研究工作。加拿大有很多重油,开采过程中严重乳化;加拿大又有全世界最大的沥青砂开采工业,沥青砂在开采和水蒸气抽提过程中也产生大量的沥青乳液。这些乳状液不仅破乳困难,而且破乳脱水后还需再加氢处理才能作为合成原油出售。指导教授想在乳液中通入一氧化碳,在催化剂的作用下使一氧化碳和乳液中的水反应生成氢,氢再
2、与重油或沥青中的含杂原子化合物反应,起到一步过程既破乳脱水,又对重油或沥青加氢处理的作用。这无疑是个好想法。在我去之前的10年中,陆续已有好几个研究生、博士后和访问学者在这个实验室做过这个课题了。 他们的研究方法是用含硫模型化合物和溶剂与水混合,然后在高压反应釜中通一氧化碳反应,考察脱硫效果。由于重点放在考察脱硫上,他们并没有用真正意义上的乳状液做过试验。听说我研究过沥青乳液,教授给我的任务就是制备出稳定的含模型化合物的甲苯水乳液。我以前并没有研究过轻油的乳化,当时心里一点底也没有,但我仍信心十足地答应了下来。我一面订购乳化剂,一面把从国内带去的“均匀设计与统计调优软件包”安装在实验室的微机里
3、,当然在安装之前要经过系里的电脑管理员对我的软件进行查毒,并把试验方案设计好。由于心里没底,我计划从5种乳化剂中筛选乳化配方,加上油和水的比例,一共是6个自变量。同时我又设计出一种快速评价乳液稳定性的方法,将稳定性试验结果作为考察变量。订的乳化剂来了以后,我就开始了紧张的试验和评价工作。 第一轮试验安排做12个样,评价以后进行回归处理,从中剔除两个对乳化影响不大的乳化剂,再安排第二轮7次试验。在第二轮试验中就出现了稳定性较好的样品。第三轮试验下来,整个稳定区间就出来了。将乳化剂加入量少而又能得到稳定乳状液的配方算出,验证之,又存放两天观察,得到了看起来像雪花膏一样的雪白的含苯并噻吩的甲苯水乳化
4、液。又按对水含量变化的要求,制备出从10 25不同含水量的稳定乳液。做完这些以后,我又观察三天,确信乳液稳定后,将乳化条件、配方变化和稳定性变化关系图整理出来,然后向指导教授汇报。 指导教授看到我在两个星期内就拿出了雪白又细腻均匀的乳液样品,而且还有配方变化后的稳定区间图,简直不敢相信这是事实。当得知我的“秘密武器”后,又让我给详细介绍和解释软件的使用方法和功能以及均匀设计的数学依据。由于我不能用英语将均匀设计的数学原理讲明白,他又派题目组内一位曾在数学院修过三门研究生课程的数学功底很深的博士生专门去数学院的统计和优化系请教。尽管他们没能在数学院得到满意的解释,但由于亲眼见到均匀设计和统计调优
5、能快速解决问题,还是对它产生了极大的兴趣。接下来又让我用需要加氢脱硫的直馏柴油做成乳化液,由于不需要新订乳化剂,又有了甲苯的经验,一个星期我就拿出了稳定的乳液样品和配方数据。这样,到滑铁卢的第一个月,我就得到了同事风趣相送的“Double E”(Emulsion Expert)的外号。(本节资料来自互联网:黎元生 留学加拿大随笔 1997年6月) q每一个方法都有其局限性,正交试验也不例外,它只宜用于水平数不多的试验中。q若在一项试验中有s 个因素,每个因素各有q 水平,用正交试验安排试验,则至少要作个q2试验,当q较大时,将更大,使实验工作者望而生畏。例如,当 q=12 时, q2 =144
6、,对大多数实际问题,要求做144 次试验是太多了!中国科学家巧妙的将“数论方法”和“统计试验设计”相结合,发明了均匀设计法。均匀设计法诞生於年。由中国著名数学家方开泰方开泰教授和王元王元院士合作共同发明。华罗庚王元q均匀设计只考虑试验点在试验范围内充分“均匀散布”而不考虑“整齐可比”,因此它的试验布点的均匀性会比正交设计试验点的均匀性更好,使试验点具有更好的代表性。q由于这种方法不再考虑正交设计中为“整齐可比”而设置的实验点,因而大大减少了试验次数,这是它与正交试验设计法的最大不同之处。 均匀设计和正交设计相似,也是通过一套精心设计的表(均匀设计表)来进行试验设计的。 )(qntU均匀表符号均
7、匀表横行数(试验次数)字码数(水平数)均匀表列数(最多安排因素数) 每个因素的每个水平只做1次试验 均匀设计所采用的均匀设计表的任意两列组成的试验方案一般并不等价 ,每个均匀设计表都有一个附加的使用表,进行均匀设计时,要遵循使用表的规定,才能达到较好的试验效果。 1)均匀设计的最大特点是均匀设计的最大特点是试验次数等于试验次数等于因素的最大水平数,而不是平方的关系因素的最大水平数,而不是平方的关系。如当水平数从如当水平数从9水平增加到水平增加到10水平时,试水平时,试验数验数n 也从也从9增加到增加到10。而正交设计当水平。而正交设计当水平增加时,试验数按水平数的平方的比例在增加时,试验数按水
8、平数的平方的比例在增加;当水平数从增加;当水平数从9到到10时,试验数将从时,试验数将从81增加到增加到100。由于这个特点,使均匀设计更便于使用。由于这个特点,使均匀设计更便于使用。 2)每个因素的每个水平做一次且仅做一次)每个因素的每个水平做一次且仅做一次试验。试验。3)任两个因素的试验,画在平面的格子点)任两个因素的试验,画在平面的格子点上,每行每列有且仅有一个试验点。上,每行每列有且仅有一个试验点。特点特点2)和)和3)反映了试验安排的)反映了试验安排的“均衡均衡性性”,即对各因素,每个因素的每个水平一,即对各因素,每个因素的每个水平一视同仁。视同仁。4)把奇数表划去最后一行就得到比原
9、奇)把奇数表划去最后一行就得到比原奇数表少一个水平的偶数表,相应地,试数表少一个水平的偶数表,相应地,试验次数也少一,而使用表不变。验次数也少一,而使用表不变。例如,把例如,把U7(76)划去最后一行即得)划去最后一行即得U6(66)。)。5)均匀设计表任两列组成的试验方案一)均匀设计表任两列组成的试验方案一般并不等价。般并不等价。例如用例如用U6(66)的的1,3 和和1,6列分别画图,列分别画图,得图得图8(a)和图和图8(b)。我们看到,。我们看到,(a)的点散的点散布比较均匀,而布比较均匀,而(b)的点散布并不均匀。的点散布并不均匀。 均匀设计表的这一性质和正交表有很均匀设计表的这一性
10、质和正交表有很大的不同,因此,每个均匀设计表必大的不同,因此,每个均匀设计表必须有一个附加的须有一个附加的使用表使用表。6)由于均匀设计不再考虑正交试验的整由于均匀设计不再考虑正交试验的整齐可比性,因此其试验安排既不能考虑交齐可比性,因此其试验安排既不能考虑交互作用,也不能估计试验误差;互作用,也不能估计试验误差;试验结果的分析只能采用试验结果的分析只能采用直观分析法直观分析法和回和回归分析方法归分析方法,根据回归系数的绝对值大小,根据回归系数的绝对值大小,得出试验因素对指标影响的主次顺序;,得出试验因素对指标影响的主次顺序;根据方程极值点得出最佳工艺条件。根据方程极值点得出最佳工艺条件。 我
11、们通过制药工业中的一个实例, 来看均匀设计表的使用方法。 这就是说以阿魏酸的产量作为目标 Y。 阿魏酸是某些药品的主要成分,在制备过程中,我们想增加其产量。例例7.3-1 7.3-1 :阿魏酸的制备全面交叉试验要N=73=343次,太多了。建议使用均匀设计。有现成的均匀设计表,提供使用。参见: 经过分析研究,挑选出因素和试验区域,为原料配比:1.0-3.4吡啶总量:10-28反应时间:0.5-3.5确定了每个因素相应的水平数为7。如何安排试验呢?“方开泰,均匀设计与均匀设计表,科学出版社(1994).”之附表 1网络地址:http:/www.math.hkbu.edu.hk/UniformDe
12、sing也可以浏览如下网页因素x1原料配比x2吡碇总量(ml)x3反应时间(hr)1.0100.5水1.4131.01.8161.52.2192.0平2.6222.53.0253.03.4283.5第第1步步: 将试验因素的水平列成下表:表表 6.3.1:第第2步步: : 选择相应的均匀设计表.每个均匀设计表有一个记号,它有如下的含义:Un(tq)均匀设计试验次数水平数因素的最大数例如:)7(47UNo. 1 2 3 4 1 1 2 3 6 2 2 4 6 5 3 3 6 2 4 4 4 1 5 3 5 5 3 1 2 6 6 5 4 1 7 7 7 7 7 )9(49UNo.12341121
13、32254533987443695547166726771948863899852表表 6.3.2:表表 6.3.3:每个表还有一个使用表,将建议我们如何选择适当的列。其中偏差为均匀性的度量值,数值小的设计表示均匀性好。例如 U7 (74)的使用表为,因素数 列号 偏差 2 1, 3 0.2398 3 1, 2, 3 0.3721 4 1, 2, 3, 4 0.4760 No.123411236224653362444153553126654177777No.1231123224633624415553166547777)47(7U表表 6.3.4:表表6.3.2:第第3步步: 应用选择的 U
14、D-表, 做出试验安排。No.12311232246336244155531665477771. 将 x1, x2和 x3放入列1,和3.x1 x2 x3 2用x1的个水平替代第一列的1到 7.1.01.41.82.22.63.03.43. 对第二列,第三列做同样的替代.13 1.519 3.025 1.010 2.516 0.522 2.028 3.54. 完成该设计对应的试验,得到个结果,将其放入最后一列.y0.3300.3660.2940.4760.2090.4510.482表表 6.3.5:第第 4步步: 直观分析从表 6.3.5中试验数据可见,第7号试验的指标值最大,第7号试验对应的
15、条件即为较优的工艺条件,即:原料配比3.4,吡啶总量28,反应时间3.5。试验区域,为试验区域,为 原料配比原料配比:1.0-3.4:1.0-3.4吡啶总量吡啶总量:10-28:10-28反应时间反应时间:0.5-3.5:0.5-3.5第第 5步步: 确定实验条件(可进行回归分析进一步优化)原料配比3.4,吡啶总量28,反应时间3.5。试验区域,为试验区域,为 原料配比原料配比:1.0-3.4:1.0-3.4吡啶总量吡啶总量:10-28:10-28反应时间反应时间:0.5-3.5:0.5-3.5这些条件就是试验寻求的更佳工艺参数在啤酒生产的某项试验中,选定2个因素,都取9个水平,进行均匀试验。
16、因素水平如下表所示。试验指标为吸氨量(g),越大越好。 表表 啤酒生产因素水平表啤酒生产因素水平表例例7.3-2 7.3-2 :啤酒工艺试验因素 水平 1 2 3 4 5 6 7 8 9 X1(底水)/g 136.5 137.0 137.5 138.0 138.5 139.0 139.5 140.0 140.5 X2(吸氨时间)/min 170 180 190 200 210 220 230 240 250 试验方案设计试验方案设计。显然,选U9(96)表比较合适,由U9(96)的使用表可知:因素z1,z3应安排在1,3列,试验方案及试验结果见下表: 表表 啤酒生产试验方案及结果啤酒生产试验方
17、案及结果 试验号 x1 x2 试验指标 y/g 1 3 1 1 136.5 4 200 5.8 2 2 137.0 8 240 6.3 3 3 137.5 3 190 4.9 4 4 138.0 7 230 5.4 5 5 138.5 2 180 4.0 6 6 139.0 6 220 4.5 7 7 139.5 1 170 3.0 8 8 140.0 5 210 3.6 9 9 104.5 9 250 4.1 试验结果分析试验结果分析直观分析法:从试验数据表可见,第2号试验的指标值6.3为最大,第2号试验对应的条件即为较优的工艺条件,即底水为137.0(g),吸氨时间为240(min)。 这
18、个方法看起来粗糙,但大量实践证明,它是这个方法看起来粗糙,但大量实践证明,它是十分有效的方法。十分有效的方法。由于试验点充分均匀分布,试验点中的最优工艺条件,离在试验范围内通过全面试验寻找的最优工艺条件不会很远。回归分析法:用MINITAB进行回归分析,得到 y = 96.6 - 0.697 x1 + 0.0218 x2Predictor Coef SE Coef T PConstant 96.571 1.058 91.24 0.000 x1 -0.696970 0.007678 -90.78 0.000 x2 0.0218182 0.0003839 56.83 0.000S = 0.0295
19、9 R-Sq = 99.9% R-Sq(adj) = 99.9%最佳结果预测与验证最佳结果预测与验证从回归方程可以看出,指标值随因素X1的增加而减少,随因素X2的增加而增加,当X1取最小值136.5,X2取最大值250时,得到最佳预测值Y=6.9。安排两次重复试验进行验证。并在最佳参数附近进行下一步的试验设计。 试验设计过程必然离不开试验基础内容的构思(包括试验的评价指标;试验的因素、水平的选择和试验次数的拟定等)、试验结果数据分析等共性方面的问题。试验的因素和水平的选择关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计(当然也包括均匀设计)的人员应该是有益的:(1) 因素的含义
20、:在一个试验过程中,影响试验指标的因素通常是很多的,通常固定的试验因素在试验方案中并不称为因素,只有变化的因素才称为因素;(2) 关于因素数量:在一项试验中,因素不宜选得太多(如超过10个),那样可能会造成主次不分;相反地,因素也不宜选得太少(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目的;(3) 关于各因素的水平范围:试验水平范围应当尽可能大一点。如果试验在实验室进行,试验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。试验范围太小的缺点是不易获得比已有条件有显著改善的结果;(4) 关于因素的水平数:若试验水平范围允许大一些,则每一因素的水平个数最好适当多一些;(5) 关于因素的水平间隔:水平间隔的大小和生产控制精度是密切相关的。如不切实际地降低试验的水平间隔,在试验范围确定了的情况下必然会引起试验次数的增加;而因素水平间隔太大,其试验结果的中不确定性成分也必然增加;(6) 因素和水平的含意可以是广义的:例如五种棉花用于织同一种布,要比较不同棉花影响布的质量的效应,这时“棉花品种”可设定为一个因素,五种棉花就是该因素下的五个水平。