1、正交试验设计正交试验设计1.正交试验设计正交试验设计1.1正交试验设计的基本概念正交试验设计的基本概念 正交试验设计基本概念正交试验设计基本概念 :就是安排就是安排多因素试验多因素试验、寻求、寻求 最优水平组合最优水平组合的一种高效率试验设计方法。的一种高效率试验设计方法。适用于适用于3 3个或个或3 3个以上的试验因素。个以上的试验因素。正交试验设计基本特点正交试验设计基本特点:用部分试验来代替全面试:用部分试验来代替全面试 验,通过对部分试验结果的分析了解全面试验。验,通过对部分试验结果的分析了解全面试验。1.2正交试验设计的基本原理正交试验设计的基本原理 eg1:eg1:考察考察增稠剂用
2、量增稠剂用量、pHpH值值和和杀菌温度杀菌温度对豆奶稳定对豆奶稳定性的影响。每个因素设置性的影响。每个因素设置3 3个水平进行试验。个水平进行试验。分析分析:A:A因素是增稠剂用量,设因素是增稠剂用量,设A A1 1、A A2 2、A A3 3 3 3水平;水平;B B因素是因素是pHpH值,设值,设B B1 1、B B2 2、B B3 3 3 3个水平;个水平;C C因素为杀菌温度,设因素为杀菌温度,设C C1 1、C C2 2、C C3 3 3 3个水平。个水平。在试验安排中在试验安排中,每个因素在研究的范围内选几,每个因素在研究的范围内选几个水平,就好比在选优区内打上网格个水平,就好比在
3、选优区内打上网格,如果网上的每,如果网上的每个点都做试验,就是全面试验。如上例中,个点都做试验,就是全面试验。如上例中,3个因素的个因素的选优区可以用一个立方体表示(图选优区可以用一个立方体表示(图1),),3个因素各取个因素各取 3个水平,把立方体划分成个水平,把立方体划分成27个格点,反映在个格点,反映在 图图1上上就是立方体内的就是立方体内的27个个“.”。若。若27个网格点都试验,就个网格点都试验,就是全面试验,其试验方案如表是全面试验,其试验方案如表1所示。所示。图图13因素因素3水平试验的均衡分散立体图水平试验的均衡分散立体图全面试验各因素的水平之间全部可能组合有全面试验各因素的水
4、平之间全部可能组合有27种。种。正交设计就是从全面试验水平组合中挑选出有代正交设计就是从全面试验水平组合中挑选出有代表性的部分试验水平组合来进行试验。图表性的部分试验水平组合来进行试验。图2 2中标有试验中标有试验号的九个号的九个“()”)”,就是利用正交表,就是利用正交表L L9 9(3(34 4)从从2727个试个试验点中挑选出来的验点中挑选出来的9 9个试验点。即:个试验点。即:(1)A(1)A1 1B B1 1C C1 1 (2)A (2)A2 2B B1 1C C2 2 (3)A (3)A3 3B B1 1C C3 3(4)A(4)A1 1B B2 2C C2 2 (5)A (5)A
5、2 2B B2 2C C3 3 (6)A (6)A3 3B B2 2C C1 1(7)A(7)A1 1B B3 3C C3 3 (8)A (8)A2 2B B3 3C C1 1 (9)A (9)A3 3B B3 3C C2 2 上述选择,保证了上述选择,保证了A A因素的每个水平与因素的每个水平与B B因素、因素、C C因素的各因素的各 个水平在试验中各搭配一次个水平在试验中各搭配一次 。对于。对于A A、B B、C 3C 3个因素来个因素来 说,是在说,是在2727个全面试验点中选择个全面试验点中选择9 9个试验点,仅是全面试个试验点,仅是全面试 验的三分之一。验的三分之一。从图从图1 1中
6、可以看到,中可以看到,9 9个试验点在选优区中分布是均衡的,个试验点在选优区中分布是均衡的,在立方体的每个平面上,都恰有在立方体的每个平面上,都恰有3 3个试验点;在立方体的个试验点;在立方体的 每条线上也恰有一个试验点。每条线上也恰有一个试验点。9 9个试验点均衡地分布于整个立方体内,有很强的代表性,个试验点均衡地分布于整个立方体内,有很强的代表性,能够比较全面地反映选优区内的基本情况。能够比较全面地反映选优区内的基本情况。1.3 1.3 正交表及其基本性质正交表及其基本性质1.3.1 1.3.1 正交表正交表 表表2 2是一张正交表,记号为是一张正交表,记号为L L8 8(2(27 7),
7、其中,其中“L L”代表正交表;代表正交表;L L右下角的数字右下角的数字“8”8”表示有表示有8 8行,用这张行,用这张正交表安排试验包含正交表安排试验包含8 8个处理个处理(水平组合水平组合);括号内的底;括号内的底数数“2”2”表示因素的水平数,括号内表示因素的水平数,括号内2 2的指数的指数“7”7”表表示有示有7 7列列 ,用这张正交表最多可以安排,用这张正交表最多可以安排7 7个个2 2水平因素。水平因素。常用的正交表已由数学工作者制定出来,供常用的正交表已由数学工作者制定出来,供进行正交设计时选用。进行正交设计时选用。2水平正交表除水平正交表除L8(27)外,外,还有还有L4(2
8、3)、L16(215)等;等;3水平正交表有水平正交表有L9(34)、L27(313)等(详见附表等(详见附表6,P208)1.3.2 正交表的基本性质正交表的基本性质 1.3.2.1 正交性正交性 (1)任一列中,各水平都出现,且出现的次数相等任一列中,各水平都出现,且出现的次数相等 例如例如L8(27)中不同数字只有中不同数字只有1和和2,它们各出现,它们各出现4次;次;L9(34)中不同数字有中不同数字有1、2和和3,它们各出现,它们各出现3次次。(2 2)任两列之间各种不同水平的所有可能组合都出现,且对出)任两列之间各种不同水平的所有可能组合都出现,且对出现的次数相等。现的次数相等。例
9、如例如 L L8 8(2(27 7)中中(1,1),(1,2),(2,1),(2,2)(1,1),(1,2),(2,1),(2,2)各出现两各出现两次;次;L L9 9(3(34 4)中中 (1,1),(1,2),(1,3),(2,1),(2,2),(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)(2,3),(3,1),(3,2),(3,3)各出现各出现1 1次。即每个因素的次。即每个因素的一个水平与另一因素的各个水平所有可能组合次数相等,表明一个水平与另一因素的各个水平所有可能组合次数相等,表明任意两列各个数字之间的搭配是均匀的。任意
10、两列各个数字之间的搭配是均匀的。根据以上特性,我们用正交表安排的试验,具根据以上特性,我们用正交表安排的试验,具有有均衡分散均衡分散和和整齐可比整齐可比的特点。的特点。所谓均衡分散,是指用正交表挑选出来的各因所谓均衡分散,是指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的素水平组合在全部水平组合中的分布是均匀的 。由图由图2 2可以看出,在立方体中可以看出,在立方体中 ,任一平面内都包含,任一平面内都包含 3 3 个个“()”)”,任一直线上都包含任一直线上都包含1 1个个“()”)”,因此因此 ,这些点代表性强,这些点代表性强 ,能够较好地反映全面试,能够较好地反映全面试验的
11、情况。验的情况。在这在这9个水平组合中,个水平组合中,A因素各水平下包括了因素各水平下包括了B、C因因素的素的3个水平,虽然搭配方式不同,但个水平,虽然搭配方式不同,但B、C皆处于同皆处于同等地位,当比较等地位,当比较A因素不同水平时,因素不同水平时,B因素不同水平的因素不同水平的效应相互抵消,效应相互抵消,C因素不同水平的效应也相互抵消。因素不同水平的效应也相互抵消。所以所以A因素因素3个水平间具有综合可比性。同样,个水平间具有综合可比性。同样,B、C因素因素3个水平间亦具有综合可比性。个水平间亦具有综合可比性。1.4 1.4 正交表的类别正交表的类别 1、等等水平正交表水平正交表 各列水平
12、数相同的正交表各列水平数相同的正交表称为等水平正交表。如称为等水平正交表。如L4(23)、L8(27)、L12(211)等等各列中的水平为各列中的水平为2,称为,称为2水平正交表;水平正交表;L9(34)、L27(313)等各列水平为等各列水平为3,称为,称为3水平正交表。水平正交表。2、混合水平正交表混合水平正交表 各列水平数不完全相同各列水平数不完全相同的正交表称为混合水平正交表。如的正交表称为混合水平正交表。如L8(424)表中有表中有一列的水平数为一列的水平数为4,有,有4列水平数为列水平数为2。也就是说该表。也就是说该表可以安排一个可以安排一个4水平因素和水平因素和4个个2水平因素。
13、再如水平因素。再如L16(4423),L16(4212)等都混合水平正交表。等都混合水平正交表。试验结果方差分析试验结果方差分析列方差分析表,列方差分析表,进行进行F F 检验检验计算各列偏差平方和、计算各列偏差平方和、自由度自由度分析检验结果,分析检验结果,写出结论写出结论et2:为提高山楂原料的利用率,研究酶法液化工艺:为提高山楂原料的利用率,研究酶法液化工艺 制造山楂原汁,拟通过正交试验来寻找酶法液制造山楂原汁,拟通过正交试验来寻找酶法液 化的最佳工艺条件。化的最佳工艺条件。选因素选因素:根据专业知识、以往的研究结论和经验,从影响试验指根据专业知识、以往的研究结论和经验,从影响试验指标的
14、诸多因素中,通过因果分析筛选出需要考察的试验因素。标的诸多因素中,通过因果分析筛选出需要考察的试验因素。一般确定试验因素时,应以对试验指标影响大的因素、尚未考一般确定试验因素时,应以对试验指标影响大的因素、尚未考察过的因素、尚未完全掌握其规律的因素为先。察过的因素、尚未完全掌握其规律的因素为先。定水平定水平:试验因素选定后,根据所掌握的信息资料和相关知识,试验因素选定后,根据所掌握的信息资料和相关知识,确定每个因素的水平,一般以确定每个因素的水平,一般以2-42-4个水平为宜。对主要考察的个水平为宜。对主要考察的试验因素,可以多取水平,但不宜过多(试验因素,可以多取水平,但不宜过多(66),否
15、则试验次),否则试验次数骤增。因素的水平间距,应根据专业知识和已有的资料,尽数骤增。因素的水平间距,应根据专业知识和已有的资料,尽可能把水平值取在理想区域。可能把水平值取在理想区域。(2)选因素、定水平,列因素水平表选因素、定水平,列因素水平表 水平试验因素加水量(mL/100g)A加酶量(mL/100g)B酶解温度()C酶解时间(h)D1101201.52504352.53907503.5 一般情况下,试验因素的水平数应等于正交表中的一般情况下,试验因素的水平数应等于正交表中的水平数;因素个数(包括交互作用)应不大于正交表的水平数;因素个数(包括交互作用)应不大于正交表的列数。列数。此例有此
16、例有4 4个个3 3水平因素,可以选用水平因素,可以选用L L9 9(3(34 4)或或L L2727(3(31313);因本试验仅考察四个因素对液化率的影;因本试验仅考察四个因素对液化率的影响效果,不考察因素间的交互作用,故宜选用响效果,不考察因素间的交互作用,故宜选用L L9 9(3 34 4)正交表。)正交表。列号1234因素ABCD 把正交表中安排各因素的列中的每个水把正交表中安排各因素的列中的每个水平数字换成该因素的实际水平值,便形成了正平数字换成该因素的实际水平值,便形成了正交试验方案(表交试验方案(表5 5)。)。试验号因 素ABCD11111212223133342123522
17、3162312731328321393321试验结果(液化率%)01724124728118422.2 2.2 试验结果分析试验结果分析-分清各因素及其交互作用的主次顺序,分清哪个是主要因素,分清各因素及其交互作用的主次顺序,分清哪个是主要因素,哪个是次要因素;哪个是次要因素;判断因素对试验指标影响的显著程度;判断因素对试验指标影响的显著程度;找出试验因素的优水平和试验范围内的最优组合,即试验因找出试验因素的优水平和试验范围内的最优组合,即试验因素各取什么水平时,试验指标最好;素各取什么水平时,试验指标最好;分析因素与试验指标之间的关系,即当因素变化时,试验指分析因素与试验指标之间的关系,即当
18、因素变化时,试验指标是如何变化的。找出指标随因素变化的规律和趋势,为进标是如何变化的。找出指标随因素变化的规律和趋势,为进一步试验指明方向;一步试验指明方向;了解各因素之间的交互作用情况;了解各因素之间的交互作用情况;估计试验误差的大小。估计试验误差的大小。Kjm为第为第j列因素列因素m水平所对应的试验指标和,水平所对应的试验指标和,kjm为为Kjm平均值。由平均值。由kjm大小可以判断第大小可以判断第j列因素优水平列因素优水平和优组合。和优组合。Rj为第为第j列因素的极差,反映了第列因素的极差,反映了第j列因素水平波动时,列因素水平波动时,试验指标的变动幅度。试验指标的变动幅度。Rj越大,说
19、明该因素对试越大,说明该因素对试验指标的影响越大。根据验指标的影响越大。根据Rj大小,可以判断因素大小,可以判断因素的主次顺序。的主次顺序。极差分析法简单明了,计算工作量少便于推广普极差分析法简单明了,计算工作量少便于推广普及,但不能区分因素各水平间对应的试验结果的差异及,但不能区分因素各水平间对应的试验结果的差异究竟是由于因素水平不同引起的,还是由于试验误差究竟是由于因素水平不同引起的,还是由于试验误差引起的,无法估计试验误差的大小。此外,各因素对引起的,无法估计试验误差的大小。此外,各因素对试验结果的影响大小无法给以精确的数量估计,不能试验结果的影响大小无法给以精确的数量估计,不能提出一个
20、标准来判断所考察因素作用是否显著。为了提出一个标准来判断所考察因素作用是否显著。为了弥补极差分析的缺陷,可采用弥补极差分析的缺陷,可采用方差分析方差分析。2.3 正交试验结果的方差分析正交试验结果的方差分析 方差分析:将数据的总变异分解成方差分析:将数据的总变异分解成因素引起的因素引起的变异变异和和误差引起的变异误差引起的变异两部分,构造两部分,构造F统计量统计量,作,作F检验,即可判断因素作用是否检验,即可判断因素作用是否显著显著。空列(误差)因素SSSSSST空列(误列(因素Tdfdfdf误差误差误差因素因素因素dfSSMSdfSSMS ,误差因素因素MSMSF误差因素因素MSMSF处理处
21、理号号 1 12 23 34 45 56 67 78 89 9第第1 1列(列(A A)1 11 11 12 22 22 23 33 33 3第第2 2列列 1 12 23 31 12 23 31 12 23 3第第3 3列列 1 12 23 32 23 31 13 31 12 2第第4 4列列 1 12 23 33 31 12 22 23 31 1试验结果试验结果yiyiy1y1y2y2y3y3y4y4y5y5y6y6y7y7y8y8y9y9因素因素A A1 1A A2 2A A3 3重复重复1 1y1y1y4y4y7y7重复重复2 2y2y2y5y5y8y8重复重复3 3y3y3y6y6y
22、9y9和y1+y2+y3y4+y5+y6y7+y8+y9K K1 1K K2 2K K3 3表头设计表头设计列号列号试验号试验号1 12 2n nK K1j1jK K2j2jK KmjmjK K1j1j2 2K K2j2j2 2K Kmjmj2 2SSSSj jA A1 11 11 1m mK K1111K K2121K Km1m1K K11112 2K K21212 2K Km1m12 2SSSS1 1B B2 2K K1212K K2222K Km2m2K K12122 2K K22222 2K Km2m22 2SSSS2 2k kK K1k1kK K2k2kK KmkmkK K1k1k2 2K K2k2k2 2K Kmkmk2 2SSSSk k试验数据试验数据x xi ix x1 1x x2 2x xn nx xi i2 2x x1 12 2x x2 22 2x xn n2 2CTQSSr1QCTQSSxQnT CTxTjjijTTniiT2niim12ij121K nxxSSn1i2in1i2iT)(),()(k.21j nxKr1SSn1i2im1i2ijj),()(k.21j K-K n1SS22j1jjn-1dfT为因素水平个数,m j1mdf