1、简易正交试验设计方法一、试验设计方法概述 试验设计是数理统计学的一个重要的分支。多数数理统计方法主要用于分析已经得到的数据,而试验设计却是用于决定数据收集的方法。试验设计方法主要讨论如何合理地安排试验以及试验所得的数据如何分析等。 例例1 1 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。 对此实例该如何进行试验方案的设计呢?水平 因素 温度 压力Pa 加碱量kg 符号 T p m 123 T1 (80 )T2(100)T3(120) p1(5.0) p2(6.0) p3(7.0) m1(2.0
2、)m2(2.5)m3(3.0) 表表1 因素水平因素水平 很容易想到的是全面搭配法方案(如图1所示):图1 全面搭配法方案 此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达3327次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36729次实验,显然难以做到。那么采用简单比较法方案又如何呢? 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图2(1)所示的三次实验,发现 mm2时的实验效果最好(好的用 表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。图
3、2 简单比较法方案 固定T1和m2,改变p的三次实验如图2(2)所示,发现pp时的实验效果最好,因此认为因素p应取p水平。 固定p和m2,改变T 的三次实验如图2(3)所示,发现因素T 宜取T2水平。 因此可以引出结论:为提高合格产品的产量,最适宜的操作条件为T2pm2。与全面搭配法方案相比,简单比较法方案的优点是实验的次数少,只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。需要寻找一种合适的试验设计方法。在改变m值(或p值,或T值)的三次实验中,说m2(或p或T2 )水平最好是有条件的。在T T,p p时,m2 水平不是最好的可能性是有的。在改变m的三次实验中,固定T T,p
4、 p 应该说也是可以的,是随意的,故在此方案中数据点的分布的均匀性是毫无保障的。用这种方法比较条件好坏时,只是对单个的试验数据进行数值上的简单比较,不能排除必然存在的试验数据误差的干扰。试验设计方法常用的术语定义如下:试验指标:试验指标:指作为试验研究过程的因变量,常为试验结果特征的量(如得率、纯度等)。例1的试验指标为合格产品的产量。因素:因素:指作试验研究过程的自变量,常常是造成试验指标按某种规律发生变化的那些原因。如例1的温度、压力、碱的用量。水平:水平:指试验中因素所处的具体状态或情况,又称为等级。如例1的温度有3个水平。温度用T表示,下标1、2、3表示因素的不同水平,分别记为T1、T
5、2、T3。 二、正交试验设计方法的优点和特点用正交表安排多因素试验的方法,称为正交试验设计法。其优点为: 完成试验要求所需的实验次数少。 数据点的分布很均匀。 可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。运用正交试验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀,结论的可靠性较好。正交试验设计方法是用正交表来安排试验的。对于例1适用的正交表是L9(34),其试验安排见表2。 表表2 2 试验安排表试验安排表试验号 列号 1234因素 温度 压力Pa 加碱量kg 符号 T p m 123456789 1(T1)1(T1)1(
6、T1)2(T2)2(T2)2(T2)3(T3)3(T3)3(T3) 1(p1)2(p2)3(p3)1(p1)2(p2)3(p3)1(p1)2(p2)3(p3) 1(m1)2(m2)3(m3)2(m2)3(m3)1(m1)3(m3)1(m1)2(m2) 123312231 所有的正交表与L9(34)正交表一样,都具有以下两个特点:(1)在每一列中,各个不同的数字出现的次数相同。在表L9(34)中,每一列有三个水平,水平1、2、3都是各出现3次。(2)表中任意两列并列在一起形成若干个数字对,不同数字对出现的次数也都相同。在表L9(34)中,任意两列并列在一起形成的数字对共有9个:(1,1),(1,
7、2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),每一个数字对各出现一次。这两个特点称为正交性。正是由于正交表具有上述特点,就保证了用正交表安排的试验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数愈多,运用正交试验设计方法,愈发能显示出它的优越性,如上述提到的6因素3水平试验,用全面搭配方案需729次,若用正交表L27(313)来安排,则只需做27次试验。 在化工生产中, 因素之间常有交互作用。 如果上述的因素T的数值和水平发生变化时,试验指标随因素p变化的规律也发生变化,或反过来,因素p的数值和水平发生变化时,试验指标随因素T变化的规律
8、也发生变化。这种情况称为因素T、p间有交互作用,记为Tp 。三、正交表使用正交设计方法进行试验方案的设计,就必须用到正交表。正交表可查阅有关参考书。(如数学手册) 1 1、各列水平数均相同的正交表、各列水平数均相同的正交表各列水平数均相同的正交表,也称单一水平正交表。这类正交表名称的写法举例如下: 各列水平数均为2的常用正交表有:L4(23),L8(27),L12(211),L16(215),L20(219),L32(231)。 各列水平数均为3的常用正交表有:L9(34),L27(313) 各列水平数均为4的常用正交表有:L16(45) 各列水平数均为5的常用正交表有:L25(56)L 9(
9、3 4)正交表的列数每一列的水平数实验的次数正交表的代号 2 2、混合水平正交表、混合水平正交表各列水平数不相同的正交表,叫混合水平正交表,下面就是一个混合水平正交表名称的写法: L 8(4124)常简写为L 8(424)。此混合水平正交表含有1 个4水平列,4个2水平列,共有145列。 L 8(4124)2水平列的列数为44水平列的列数为1实验的次数正交表的代号3 3、选择正交表的基本原则、选择正交表的基本原则一般都是先确定试验的因素、水平和交互作用,然后选择适用的L表。在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。 (1)先看水平数。若各因素全是2水平,就选用L
10、(2)表;若各因素全是3水平,就选L(3)表。若各因素的水平数不相同,就选择适用的混合水平表。 (2)每一个交互作用在正交表中应占一列或两列。要看所选的正交表是否足够大,能否容纳得下所考虑的因素和交互作用。为了对试验结果进行方差分析或回归分析,还必须至少留一个空白列,作为“误差”列,在极差分析中要作为“其他因素”列处理。 (3)要看试验精度的要求。若要求高,则宜取实验次数多的L表。 (4)若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的L表。 (5)按原来考虑的因素、水平和交互作用去选择正交表,若无正好适用的正交表可选,简便且可行的办法是适当修改原定的水平数
11、。 (6)对某因素或某交互作用的影响是否确实存在没有把握的情况下,选择L表时常为该选大表还是选小表而犹豫。若条件许可,应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列。某因素或某交互作用的影响是否真的存在,留到方差分析进行显著性检验时再做结论。这样既可以减少试验的工作量,又不致于漏掉重要的信息。 4 4、正交表的表头设计、正交表的表头设计所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。 (1)有交互作用时,表头设计必须严格地按规定办事。此处不讨论,可以查阅有关书籍。 (2)若试验不考虑交互作用,则表头设计可以是任意的。如在例1中,对L 9(3
12、4)表头设计,表3所列的各种方案都是可用的。但是正交表的构造是组合数学问题,必须满足(二、)中所述的特点。对试验之初不考虑交互作用而选用较大的正交表,空列较多时,最好仍与有交互作用时一样,按规定进行表头设计。只不过将有交互作用的列先视为空列,待试验结束后再加以判定。列号1234方案1234T空mPpT空mmpT空空mpT表表3 L 9(3 4)表头设计方案)表头设计方案 四、正交试验的操作方法四、正交试验的操作方法 (1)分区组。对于一批试验,如果要使用几台不同的机器,或要使用几种原料来进行,为了防止机器或原料的不同而带来误差,从而干扰试验的分析,可在开始做实验之前,用L表中未排因素和交互作用
13、的一个空白列来安排机器或原料。 与此类似,若试验指标的检验需要几个人(或几台机器)来做,为了消除不同人(或仪器)检验的水平不同给试验分析带来干扰,也可采用在L表中用一空白列来安排的办法。这样一种作法叫做分区组法。 (2)因素水平表排列顺序的随机化。如在例1中,每个因素的水平序号从小到大时,因素的数值总是按由小到大或由大到小的顺序排列。按正交表做试验时,所有的1水平要碰在一起,而这种极端的情况有时是不希望出现的,有时也没有实际意义。因此在排列因素水平表时,最好不要简单地按因素数值由小到大或由大到小的顺序排列。从理论上讲,最好能使用一种叫做随机化的方法。所谓随机化就是采用抽签或者查随机数值表的办法
14、,来决定排列的顺序。 (3)试验进行的次序没必要完全按照正交表上试验号码的顺序。为减少试验中由于先后实验操作熟练的程度不匀带来的误差干扰,理论上推荐用抽签的办法来决定试验的次序。 (4)在确定每一个实验的实验条件时,只需考虑所确定的几个因素和分区组该如何取值,而不要(其实也无法)考虑交互作用列和误差列怎么办的问题。交互作用列和误差列的取值问题由实验本身的客观规律来确定,它们对指标影响的大小在方差分析时给出。 (5)做实验时,要力求严格控制实验条件。这个问题在因素各水平下的数值差别不大时更为重要。例如,例1中的因素(加碱量)m的三个水平:m1=2.0,m2=2.5,m3=3.0,在以m=m2=2
15、.5为条件的某一个实验中,就必须严格认真地让m2=2.5。若因为粗心和不负责任,造成m2=2.2或造成m2=3.0,那就将使整个试验失去正交试验设计方法的特点,使极差和方差分析方法的应用丧失了必要的前提条件,因而得不到正确的试验结果。 五、正交试验结果分析方法五、正交试验结果分析方法 正交试验方法之所以能得到科技工作者的重视并在实践中得到广泛的应用,其原因不仅在于能使试验的次数减少,而且能够用相应的方法对试验结果进行分析并引出许多有价值的结论。因此,用正交试验法进行实验,如果不对试验结果进行认真的分析,并引出应该引出的结论,那就失去用正交试验法的意义和价值。1 1、极差分析方法、极差分析方法
16、下面以表4为例讨论L4(23)正交试验结果的极差分析方法。极差指的是各列中各水平对应的试验指标平均值的最大值与最小值之差。从表4的计算结果可知,用极差法分析正交试验结果可引出以下几个结论: (1)在试验范围内,各列对试验指标的影响从大到小的排队。某列的极差最大,表示该列的数值在试验范围内变化时,使试验指标数值的变化最大。所以各列对试验指标的影响从大到小的排队,就是各列极差D的数值从大到小的排队。 (2)试验指标随各因素的变化趋势。为了能更直观地看到变化趋势,常将计算结果绘制成图。 (3)使试验指标最好的适宜的操作条件(适宜的因素水平搭配)。 (4)可对所得结论和进一步的研究方向进行讨论 。 表
17、表4 L4 L4 4(2 23 3)正交试验计算)正交试验计算 注:注:j j 第第 j j 列列“1”1”水平所对应的试验指标的数值之和;水平所对应的试验指标的数值之和; j j 第第 j j 列列“2”2”水平所对应的试验指标的数值之和;水平所对应的试验指标的数值之和; k kj j 第第 j j 列同一水平出现的次数。等于试验的次数(列同一水平出现的次数。等于试验的次数(n n)除以第)除以第 j j 列的列的水平数。水平数。 j j / / k kj j 第第 j j 列列“1”1”水平所对应的试验指标的平均值;水平所对应的试验指标的平均值; j j / / k kj j 第第 j j
18、 列列“2”2”水平所对应的试验指标的平均值;水平所对应的试验指标的平均值; D Dj j 第第 j j 列的极差。等于第列的极差。等于第 j j 列各水平对应的试验指标平均值中的最大列各水平对应的试验指标平均值中的最大值减最值减最 小值,小值, 即即 D Dj jmaxmaxj j / / k kj j ,j j / / k kj j , -min -min j j / / k kj j ,j j / / k kj j , 列 号 123试验指标yi 试验号 123n4 1122 1212 1221 y1y2y3y4 jjkjj / kjj / kj极差(Dj) 1y1y21y3y4k121
19、/ k11/ k1max -min 2y1y32y2y4k222/ k22/ k2max -min 3y1y43y2y3k323/ k33/ k3max -min 2 2、方差分析方法、方差分析方法(1 1)计算公式和项目计算公式和项目 试验指标的加和值 ,试验指标的平均 值 ,以第j列为例: j “1”水平所对应的试验指标的数值之和 j “2”水平所对应的试验指标的数值之和 kj 同一水平出现的次数。等于试验的次数除以第j列的水平数 j / kj “1”水平所对应的试验指标的平均值 j / kj “2”水平所对应的试验指标的平均值 以上7项的计算方法同极差法(见表4)。 niiy1niiyn
20、y11 偏差平方和偏差平方和 f fj j 自由度。自由度。f fj j 第第j j 列的水平数列的水平数1 1。 V Vj j 方差。方差。V Vj j S Sj j f fj j 。 V Ve e 误差列的方差。误差列的方差。V Ve e S Se e f fe e 。式中,。式中,e e为正交表的误差列。为正交表的误差列。 F Fj j 方差之比方差之比 F Fj j V Vj j V Ve e 。 查查F F分布数值表(分布数值表(F F分布数值表请查阅有关参考书)做显著性检验。分布数值表请查阅有关参考书)做显著性检验。 总的偏差平方和总的偏差平方和 总的偏差平方和等于各列的偏差平方和
21、之和。即总的偏差平方和等于各列的偏差平方和之和。即 式中,式中,m m为正交表的列数。为正交表的列数。 若误差列由若误差列由5 5个单列组成,则误差列的偏差平方和个单列组成,则误差列的偏差平方和S Se e等于等于5 5个单个单列的偏差平方和之和,即:列的偏差平方和之和,即:S Se e S Se e1 1 S Se e2 2 S Se e3 3 S Se e4 4 S Se e5 5 ;也可;也可用用S Se e S S总总 S S 来计算,其中来计算,其中S S 为安排有因素或交互作用的各列为安排有因素或交互作用的各列的偏差平方和之和。的偏差平方和之和。 222IIIIIIykkykkyk
22、kSjjjjjjjjjjmjjSS1总niiyyS12总(2 2)可引出的结论)可引出的结论 与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。在数理统计上,这是一个很重要的问题。显著性检验强调试验在分析每列对指标影响中所起的作用。如果某列对指标影响不显著,那么,讨论试验指标随它的变化趋势是毫无意义的。因为在某列对指标的影响不显著时,即使从表中的数据可以看出该列水平变化时,对应的试验指标的数值与在以某种“规律”发生变化,但那很可能是由于实验误差所致,将它作为客观规律是不可靠的。有了各列的显著性检验之后,最后应将影响不显著的交互作用列与原来的“误差列”
23、合并起来。组成新的“误差列”,重新检验各列的显著性。六、正交试验方法在化工原理实验中的六、正交试验方法在化工原理实验中的 应用举例应用举例 例例2 2 为提高真空吸滤装置的生产能力,请用正交试验方法确定恒压过滤的最佳操作条件。 影响实验的主要因素和水平见表5(a)。表中p为过滤压强差;T为浆液温度;w为浆液质量分数;M为过滤介质(材质属多孔陶瓷)。 解:解:(1)试验指标的确定:恒压过滤常数K(m2/s) (2)选正交表:根据表5(a)的因素和水平,可选用L 8(424)表。 因素 压强差kPa 温度 质量分数 过滤介质 符号 p T w M 水平 1234 2.943.924.905.88
24、(室温)18(室温15)33 稀(约5%)浓(约10%) G2*G3* * G2 、G3为过滤漏斗的型号。过滤介质孔径:G2 为3050m、G3为1630m。 表表5(a) 过滤实验因素和水平过滤实验因素和水平 (3)制定实验方案:按选定的正交表,应完成8次实验。实验方案见表5(b)。 (4)实验结果:将所计算出的恒压过滤常数K(m2/s)列于表5(b)。 列号 j1 23456因素 p T w M e K(m2/s) 试验号 水 平 12345678 11223344 12121212 12122121 12211221 12212112 4.011042.931045.211045.551
25、044.831041.021035.111041.10103 表表5(b)正交试验的试验方案和实验结果)正交试验的试验方案和实验结果 (5)指标K的极差分析和方差分析: 分析结果见表5(c)。以第2列为例说明计算过程: 2 4.011045.211044.831045.11104 1.92103 2 2.931045.551041.021031.101032.97103 k24 2/ k21.92103 44.79104 2/ k22.9710347.42104 D27.42104 4.791042.63104 K4.88103 6.11104 S2k2(2/ k2 )2k2(2/ k2 )2
26、 4(4.791046.11104 )2 4(7.421046.11104 )2 1.38107 KKK f f2 2第二列的水平数第二列的水平数1 12 21 11 1 V V2 2S S2 2f f2 21.381.3810107 71 11.381.3810107 7 S Se eS S5 5k k5 5(5 5/ / k k5 5 )2 2k k5 5(5 5/ / k k5 5 )2 2 4 4(6.226.2210104 46.116.1110104 4 )2 2 4 4(5.995.9910104 46.116.1110104 4 )2 2 1.061.0610109 9 f f
27、e ef f5 51 1 V Ve eS Se ef fe e1.061.0610109 91 11.061.0610109 9 F F2 2 =V =V2 2V Ve e1.381.3810107 71.061.0610109 9130.2130.2 查查F F 分布数值表分布数值表可知:可知: F F(0.010.01,f f1 11 1,f f2 21 1)4052 4052 F F2 2 F F(0.050.05,f f1 11 1,f f2 21 1)161.4161.4 F F2 2 F F(0.100.10,f f1 11 1,f f2 21 1)39.9 39.9 F F2 2
28、 F F(0.250.25,f f1 11 1,f f2 21 1)5.83 5.83 F F2 2 (其中:(其中:f f1 1 为分子的自由度,为分子的自由度,f f2 2 分母的自由度)分母的自由度) 所以第二列对试验指标的影响在所以第二列对试验指标的影响在0.100.10水平上显著。水平上显著。 练习:对剩余列作级差和方差分析练习:对剩余列作级差和方差分析KK 表表5 5(c c) K K的极差分析和方差分析的极差分析和方差分析列号 j1 23456因素 p T w M e K(m2/s) 项目 jjjjkjj / kjj / kjj / kjj / kjDjSjfjVjFjF0.01
29、F0.05F0.10F0.25显著性 6.941041.081031.501031.6110323.471045.381047.521048.061034.591042.6510738.8410883.45403215.753.68.202*(0.10) 1.921032.9710344.791047.421042.631041.3810711.38107130.24052161.439.95.832*(0.10) 3.041031.8410347.611044.611043.001041.8010711.80107169.84052161.439.95.833*(0.05) 2.541032
30、.3510346.351045.861044.901054.8010914.801094.534052161.439.95.830*(0.25) 2.491032.4010346.221045.991042.301051.061091.061091.00 K4.88103(m2/s)6.11104(m2/s)K (6)由极差分析结果引出的结论。 (7)由方差分析结果引出的结论。 第1、2列上的因素 p、T 在0.10水平上显著;第3列上的因素w在0.05水平上显著;第4列上的因素M 在0.25水平上仍不显著。 各因素、水平对K的影响变化趋势见图3。图3是用表5(a)的水平、因素和表5(c)的j
31、 / kj 、j / kj 、j / kj 、j / kj值来标绘的。从图中可看出: A过滤压强差增大,K值增大; B过滤温度增大,K值增大 C 过 滤 浓 度 增 大 ,K值 减 小 ; D过滤介质由1水平变为2水平,多孔陶瓷微孔直径减小, K值减小。因为第4列对K值的影响在0.25水平上不显著,所以此变化趋势是不可信的。 图3 指标随因素的变化趋势 适宜操作条件的确定。由恒压过滤速率方程式可知,试验指标K值愈大愈好。为此,本例的适宜操作条件是各水平下K的平均值最大时的条件: 过滤压强差为4水平,5.88kPa 过滤温度为2水平,33 过滤浆液浓度为1水平,稀滤液 过滤介质为1水平或2水平(这是因为第4列对K值的影响在0.25水平上不显著。为此可优先选择价格便宜或容易得到者)。 上述条件恰好是正交表中第8个试验号。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。