1、一些新的2-3混合水平的近似正交设计陆璇 谢描清华大学数学科学系正交设计的优点 因子的主效应的估计之间是相互独立的。有效性(D-和Ds-等)达到最大。对于强度为t的正交设计,当投影到任一只包含t个因子的子模型时,构成完全试验的若干次重复。(保证任一包含t个因子的子模型可以完全分析。)数据分析(参数估计、假设检验等)简单易行。使用正交设计时遇到的问题 对试验次数的要求非常严格 某些正交设计是不饱和的 强度高于2的正交设计很少 混合水平的正交设计不多以上问题限制了正交设计的实用价值一个例子 考虑一个试验,要考察7个三水平因子,假定:1)所有的交互效应都不存在;2)受条件限制,最多只能作15次试验。
2、显然,正交设计的条件不满足。(最小的正交设计需要作18次试验。)近似正交设计的提出是由于实践的需要。近似正交设计的提出是由于实践的需要。近似正交设计的一些文献近似正交设计的一些文献 J.C.Wang&C.F.J Wu(1992),Nearly Orthogonal Arrays with Mixed Levels and Small Runs Nam-Ky Nguyen(1996),A Note on the Construction of Near-Orthogonal Arrays with Mixed Levels and Economic Run Size Chang-Xing Ma&
3、Kai-Tai Fang&Erkki Liski(2000),A New Approach in Construction Orthogonal and Nearly Orthogonal Arrays“Hong Quan Xu(2002),An Algorithom for Constructing Orthogonal and Nearly Orthogonal Arrays with Mixed Levels and Small Runs“Lu,Fang,Xu and Yin(2002),“Balance Pattern and BP-optimal Designs”(HKBU Tech
4、nical Report)近似正交设计应满足的性质近似正交设计应满足的性质 t-投影性质投影性质:对于强度为强度为t的的近似正交设计,当模型投影到任一个只包含t个因子的子模型时,包含一个完全试验。(保证任一个包含t个因子的子模型是可以完全分析的。)近似正交性质近似正交性质:对于强度为t的近似正交设计,任意t个因子之间在一个适当的度量下偏离正交性最少。高的有效性高的有效性:如D有效性。其它性质其它性质:如不正交列对的数目(用于存在不饱和正交设计的场合)。强度为强度为t 的的近似正交设计:NOA(n,2k3l,t)偏离正交性的度量偏离正交性的度量设计:D(n,2k3l)偏离强度t的正交性的度量B(
5、t):任意t个因子之间的各种水平组合出现的次数偏离平均值的平均平方和。B(t)越小越好。(一般性的定义见:Lu,Fang,Xu and Yin(2002),HKBU technical report)例:一个D(6,2231)的B(2)B12(2)=6(1-1)2=0 B13(2)=2(1-1)2+2(2-1)2 +2(0-1)2=4 B23(2)=2(1-6/4)2+2(2-6/4)2=1 B(2)=B12(2)+B13(2)+B23(2)/3=5/3123100020103101411152016210关于关于B(t)的一些理论结果的一些理论结果Lu,Fang,Xu and Yin得到了B
6、(t)的两个下界.其中一个与设计的行之间的Hamming距离有关,称为“基于行的下界”。当行之间的Hamming距离都相等时,对所有的t=1,2,B(t)达到此下界。达到此下界的因子设计对应着一个可分解的平衡不完全区组设计(RBIBD)。这类设计包括:饱和的正交设计,最优的超饱和设计。类似的结果:Lu,et al,(2003),JSPI,Fang,et al,(2000).(在超饱和设计的构造方面)关于关于B(t)的一些理论结果(续)的一些理论结果(续)另一个下界是:当任意t个因子之间的各种水平组合出现的次数最多只相差1时,B(t)的值。此下界称为“基于列的下界”。当此下界达到,同时设计满足t
7、-投影性质(任意t个因子之间的各种水平组合至少出现一次)时,设计最接近于强度为t的正交设计,从而具有最高的有效性。构造方法构造方法基本算法基本算法:最小化B(t),采用在设计构造中常用的“列-对”置换法。基本步骤如下:Step 1:产生一个初始设计D0,Step 2:选D0中一列,当它去掉后B(t)减小幅度最大,Step 3:对此列中的元素作随机置换,使B(t)达到最小,记设计为D1,Step 4:对D1重复Step 2,3,以上4步反复进行,直到无法改进,或迭代步达到指定值。产生多个初始设计,重复以上过程,从中选择一个最理想的设计(达到或接近两个下界之一)。构造方法(续)构造方法(续)保证所
8、构造的设计具有t-投影性质是非常重要的。一般t=2,3。当行数和列数(包括2水平因子数和3水平因子数)选择适当时,构造出的设计通常满足t-投影性质。当行数和列数选择不适当时,经过大量的计算也得不到t-投影性质。此时要减少因子数,再计算。还尝试了其它几种不同的算法。效果有好有坏。例1:NOA(15,37,2)(Table 14)任意两个因子处于最佳组合状态:所有水平组合各出现1或2次。B(2)=2(达到基于列的下界)当要考察7个三水平因子,而最多只能作15次试验时,可用此设计。例2:NOA(36,2533,3)(Table 27)任意三列(2-2-2,2-2,3,2-3-3,3-3-3)包含一个
9、完全试验。(具有3-投影性质)而一个强度为3的2533正交设计至少需要2333=216次试验。结论:要保证高维的投影性质,用近似正结论:要保证高维的投影性质,用近似正交设计可以大大节省试验成本交设计可以大大节省试验成本。一些一些NOA的列表的列表NOA(n,2k31,2):n=0(mod 6),n6.取n=12,k=9,8,7.(Table 1-6.其中k=9的有四个,具有不同的非正交对结构.)NOA(n,2k3l,2):l2.n=0(mod 6),n9.取n=12,(k,l)=(7,2),(6,2),(4,2),(4,3),(3,4),(1,5)(Table 7-12),n=18,(k,l)
10、=(1,8)(Table 16).NOA(n,3l,2):n=0(mod 3),n9.取n=12,l=6 (Table 13),n=15,l=8(Table 14),n=21,l=10(Table 19),n=24,l=11(Table 20).一些NOA的列表(续)NOA(n,2k31,3):n=0(mod 6),n12.当n=12,存在一个唯一的OA(12,2331,3),取n=18,k=9,(Table 17),n=24,k=10(Table 21),n=30,k=12(Table 23),n=36,k=16(Table 25).NOA(n,2k32,3):n=0(mod 6),n18.
11、取n=18,k=4(Table 18),n=24,k=7(Table 22),n=30,k=8(Table 24),n=36,k=9(Table 26).NOA(n,2k33,3):n=0(mod 6),n30.取n=30,k=4(Table 25),n=36,k=5(Table 27).NOA(12,2931,2)的比较 W-W用不正交列对的数量来衡量偏离正交性的程度。以下是一些结果的比较。设计设计DB(2)不正交列对不正交列对W-W type I0.874/511(2-2)W-W type II0.911/115(2-3)Nguyen0.9332/558(2-2)Our Table 20.
12、9324/554(2-2),2(2-3)Our Table 30.9028/556(2-2),1(2-3)Our Table 40.9332/558(2-2)NOA与与UD的关系的关系 UD强调的是试验点在试验区域内散布的均匀性。NOA强调的是因子水平组合出现的均衡性。二者之间有一定的联系。在UD中,有一类设计称为U-型设计,要求试验点只出现在格子点上。两个常用的均匀性度量:CD2和WD2.Fang,Lu and Winker(2003)证明了:对于2水平的U-型设计,CD22可以表示为B(1),B(k)的凸函数;对于2或3水平的U-型设计,WD22可以表示为B(1),B(k)的凸函数.NOA
13、与与UD的关系(续)的关系(续)根据上述关系,得到了:对于2水平的U-型设计,CD22的两个下界;对于2或3水平的U-型设计,WD22的两个下界。用上述的下界作为bench mark,最优化CD22或WD22,得到了一批具有均匀性的2或3水平的U-型设计。我们的NOA设计可以看成是具有均匀性的U-型设计,同时还具有指定的投影性质同时还具有指定的投影性质。NOA设计的分析设计的分析 我们构造的NOA绝大部分是饱和或接近饱和的,个别是轻微超饱和的(超1个自由度)。对于饱和或接近饱和的NOA的分析,可以由一阶模型出发,用基于最小二乘的方法进行分析。如果只有t个有效因子,且NOA具有强度t,则可以对此t个有效因子进一步作全面分析。如果NOA的强度t t,则可以对此t个有效因子作部分分析(例如,去掉可以忽略的交互效应或平方效应等)。Thank You!