1、正交设计资料的方差分析,The orthogonal design ANOVA,正交设计与析因设计的区别,析因设计是全面的设计,g个处理组是各因素各水平的全面组合 正交设计是非全面试验,各处理组是各因素各水平的部分组合,或称析因试验的部分实施。,例如,A、B、C、D、E 5个因素,每个因素为2水平 按析因设计共有g=25=32个处理 用正交设计,可选1/2实施方案,只有1/2g=16次试验,或1/4g=8次试验 因此,正交设计可以成倍减少试验次数,但它是以牺牲分析各因素的部分或大部分交互作用为代价的。,正交表,正交设计各因素各水平的组合方式要查正交表。,正交试验设计是利用“正交表”进行科学地安
2、排与分析多因素试验的方法。其主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。,正交表是一种特别的表格,是正交设计的基本工具。,正交表的记号及含义,记号及含义,正交表的列数 (最多能安排的因素个数, 包括交互作用、误差等),各因素的水平数 (各因素的水平数相等),m,正交表的代号,如,表示,?,表示各因素的水平数为2, 做8次试验,最多考虑7个 因素(含交互作用)的正 交表。,如,表示,?,表示各因素的水平数为3, 做9次试验,最多考虑4个 因素的正交
3、表。,下一张,主 页,退 出,上一张,L8(27)正交表,L9(34)正交表,试验号 1 2 3 4 1 1 1 1 1 2 1 2 2 2 3 1 3 3 3 4 2 1 2 3 5 2 2 3 1 6 2 3 1 2 7 3 1 3 2 8 3 2 1 3 9 3 3 2 1,正交表的特性,1、任一列中,不同数字出现的次数相同 例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次 。,2、任两列中,同一横行所组成的数字对出现的次数相同 例如 L8(27)的任两列中(1, 1), (1, 2), (2, 1), (2, 2)各出现两次;L9
4、(34)任两列中 (1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)各出现1次。即每个因素的一个水平与另一因素的各个水平互碰次数相等,表明任意两列各个数字之间的搭配是均匀的。,下一张,主 页,退 出,上一张,用正交表安排的试验,具有均衡分散和整齐可比的特点。 均衡分散,是指用正交表挑选出来的各因素 水 平 组合在全部水平组合中的分布是均衡的 。 由 图11-1可以看出,在立方体中 ,任一平面内都包含 3 个试验点,任两平面的交线上都包含1个试验点。,下一张,主 页,退 出,上一张,整齐可比是指每一个因素的
5、各水平间具有可比性。 因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它因素的效应都彼此抵消。如在A、B、C 3个因素中,A因素的 3 个水平 A1、A2、A3 条件下各有 B、C 的 3 个不同水平,即:,下一张,主 页,退 出,上一张,在这9个水平组合中,A因素各水平下包括了B、C因素的3个水平,虽然搭配方式不同,但B、C皆处于同等地位,当比较A因素不同水平时,B因素不同水平的效应相互抵消,C因素不同水平的效应也相互抵消。所以A因素3个水平间具有可比性。同样,B、C因素3个水平间亦具有可比性。,下一张,主 页,退 出,上一张,正交设计方法,例 研
6、究雌螺产卵的最优条件,在20CM2的泥河里饲养同龄雌螺10只,试验条件有4个因素,每个因素2水平。试在考虑温度与含氧量对雌螺产卵有交互作用的情况下安排正交试验。,(一) 确定试验因素及其水平, 列出因素水平表,(二) 选用合适的正交表,根据因素、水平及需要考察的交互作用的多少来选择合适的正交表。 有4个因素和1个交互作用,每因素有2水平,可选择L8(27)正交表。 正交表的选择原则:一般情况下,试验因素的水平数应恰好等于正交表记号中括号内的底数;因素的个数(包括需要考查交互作用)应不大于正交表记号中括号内的指数;各因素及交互作用的自由度之和要小于所选正交表 的总自由度,以便估计试验误差。,(三
7、) 表头设计,表头设计就是把挑选出的因素和要考察的交互作用分别排入正交表的表头适当的列上。 在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按该正交表的交互作用列表安排各因素与交互作用。 本题要考虑的交互作用为温度(A因素)和含氧量(B因素),即AB。,L8(27) 表头设计,因此,A、B、C、D 因素分别安排在第1、2、4、7列, 交互作用 AB安排在第3列,第5、6列空出,作为误差列。,L8(27)二列间的交互作用表,列号,列号,表示位于第二、第四列的两因素的交互作用要放于第六列。,(四) 列出试验方案,把正交表中安排因素的各列(不包含欲考察的交互作用列)中的每个数字依次
8、换成该因素的实际水平,就得到一个正交试验方案。,正交试验方案,(五)试验结果,(六)试验结果分析,直接分析 单因素分析 TA1=86+95+91+94=366 TA2=91+96+83+88=358 说明温度在5度时比在25度更利于产卵。 以此类推:含氧量0.5%比5.0%产卵多 含水量30%比10%产卵多 PH值8.0比6.0产卵多 因此:温度5度、含氧量0.5%、含水量30%、PH8.0 产卵多,TA1TA2,直接分析 交互分析 TAB1=86+95+83+88=352 TAB2=91+94+91+96=372 说明存在交互作用 因此:温度25度、含氧量0.5%、含水量30%、PH8.0
9、产卵多,TAB2TAB1,a2b1最多,该试验的8个观测值总变异由A、B、C、D因素及误差变异5部分组成,因而进行方差分析时平方和与自由度的分解式为: SST = SSA + SSB + SSC+ SSD + SSAB +SSe dfT = dfA + dfB + dfC + dfD + dfAB +dfe,下一张,主 页,退 出,上一张,方差分析,1、计算各项平方和与自由度 矫正数 C = T2/n = 7242/8 = 65522 总平方和 SST =x2-C =(682+952+882)-65522 =146,下一张,主 页,退 出,上一张,A因素平方和 SSA=2TA2/N-C =1/
10、N(T1A-T2A)2 =(366-358)2/8 =8,B因素平方和 SSB = 2TB2/N-C= 1/N(T1B-T2B)2 =(368-356)2/8 =18,下一张,主 页,退 出,上一张,C因素平方和 SSC=T2C/kc-C= 1/N(T1C-T2C)2 =60.5 D因素平方和 SSD= 1/N(T1D-T2D)2 =4.5 AB交互因素平方和 SSAB= 1/N(T1AB-T2AB)2 =50 误差平方和 SSe=SST-SSA-SSB-SSC-SSD-SSAB =146-8-18-60.5-4.5-50 =5,下一张,主 页,退 出,上一张,总自由度 dfT =n-1=8-
11、1=7 A因素自由度 dfA =a-1=2-1=1 B因素自由度 dfB =b-1=2-1=1 C因素自由度 dfC =c-1=2-1=1 D因素自由度 dfD =c-1=2-1=1 AB因素自由度 dfAB =c-1=2-1=1 误差自由度 dfe = dfT-dfA-dfB-dfC-dfD -dfAB = 7-1-1-1-1-1 = 2,下一张,主 页,退 出,上一张,2、列出方差分析表,进行F检验,下一张,主 页,退 出,上一张,正交试验设计的基本步骤,确定目标、选定因素(包括交互作用)、确定水平;,2. 选用合适的正交表;,3. 按选定的正交表设计表头,确定试验方案;,4. 组织实施试
12、验;,5. 试验结果分析。,例:某研究者打算分析茵陈胆道汤中各种成分的利胆作用,该药共有8中成分: A: 金钱草 A1:不用 A2:用 B: 大 黄 B1:不用 B2:用 C: 木 香 C1:不用 C2:用 D: 黄 芩 D1:不用 D2:用 E: 茵 陈 E1:不用 E2:用 F: 枳 壳 F1:不用 F2:用 G: 栀 子 G1:不用 G2:用 H: 柴 胡 H1:不用 H2:用 试验中考虑交互作用AC、AD、BD和CD,8因素和4个交互作用,共要安排12个因子,2水平,因此,要选用L16(215)。,L16(215)表头设计,结果,茵陈胆道汤成分利胆作用的方差分析表,结论,单因素:A、B、E、G有统计学意义 交互作用:AC、BD、CD有统计学意义 综合: A、B、C、D、E、G有统计学意义 即金钱草、大黄、木香、黄芩、茵陈及栀子是必要成分,而枳壳和柴胡的作用值得怀疑。,谢谢,