1、2022-4-251第六章第六章 均匀设计均匀设计 (Uniform Design) 2022-4-252一个问题:正交设计的适用条件一个问题:正交设计的适用条件是什么?是什么?最少试验次数最少试验次数=水平数水平数2=q2故正交设计要求:因素数目多、水平少。故正交设计要求:因素数目多、水平少。遇到不适用的情况怎么办?遇到不适用的情况怎么办?均匀设计均匀设计回顾正交设计回顾正交设计2022-4-253第六章第六章 均匀设计均匀设计 6.1 6.1 均匀设计表均匀设计表6.2 6.2 均匀设计的使用表均匀设计的使用表6.3 6.3 均匀设计的数据分析均匀设计的数据分析6.4 6.4 均匀混料设计
2、(了解)均匀混料设计(了解)2022-4-254但仅均匀分散,不整齐可比,因此不能进行直观分析。但仅均匀分散,不整齐可比,因此不能进行直观分析。2022-4-255前言前言 均匀设计均匀设计(Uniform Design) )是由中国数学家是由中国数学家王王元和方开泰元和方开泰于于19781978年首次提出的年首次提出的, ,采用均匀设计采用均匀设计表来安排试验的方法,最初在我国导弹设计中应表来安排试验的方法,最初在我国导弹设计中应用,经过用,经过2020多年的发展和推广,均匀设计已在我多年的发展和推广,均匀设计已在我国有较广泛的普及,并在医药、生物、化工、航国有较广泛的普及,并在医药、生物、
3、化工、航天、电子、军事工程等诸多领域中使用,取得了天、电子、军事工程等诸多领域中使用,取得了显著的经济和社会效益。显著的经济和社会效益。 与均匀设计几乎同期出现在西方流行的与均匀设计几乎同期出现在西方流行的“拉丁拉丁超立方体抽样超立方体抽样”与均匀设计在本质上是一致的。与均匀设计在本质上是一致的。2022-4-256王元王元方开泰方开泰中国科学院数学研究所中国科学院数学研究所中国科学院院士中国科学院院士中国科学院应用数学研究所中国科学院应用数学研究所北京师范大学香港浸会大学联合国际学院北京师范大学香港浸会大学联合国际学院美国数理统计科学院终身院士美国数理统计科学院终身院士美国统计学会终身院士美
4、国统计学会终身院士2022-4-2576.1 6.1 均匀设计概述及均匀设计表均匀设计概述及均匀设计表 6.1.1 均匀设计概述均匀设计概述 例例6.16.1 为了研究环境污染对人体的危害,考察为了研究环境污染对人体的危害,考察六种重金属六种重金属CdCd、CuCu、ZnZn、NiNi、CrCr、PbPb对老鼠寿命的影响对老鼠寿命的影响,考察,考察老鼠体内某种细老鼠体内某种细胞的死亡率胞的死亡率。将每一种重金属看成一个因素,每一因素取将每一种重金属看成一个因素,每一因素取1717个个水平。试验如何设计?水平。试验如何设计?实验目标?实验目标?试验指标?因素与水平?试验指标?因素与水平?如果采用
5、正交设计,那么至少要进行如果采用正交设计,那么至少要进行172=289次试验。次试验。能否减少试验次数?均匀设计便是针对这种情况提出的一种设能否减少试验次数?均匀设计便是针对这种情况提出的一种设计方法。计方法。2022-4-258 均匀设计均匀设计是用是用均匀设计表均匀设计表安排试验,而用安排试验,而用回归分析回归分析进行数据分析的一种试验设计方法。进行数据分析的一种试验设计方法。 基本想法基本想法:使试验点在因素空间中具有:使试验点在因素空间中具有较好的均匀较好的均匀分散性。分散性。 均匀设计同正交设计一样,也是部分因素设计的重均匀设计同正交设计一样,也是部分因素设计的重要方法之一。要方法之
6、一。 适用范围:适用范围:试验因素多、因素取值范围大、因素水试验因素多、因素取值范围大、因素水平多(一般不少于平多(一般不少于5 5),而试验次数相对较少的情况。),而试验次数相对较少的情况。6.1 均匀设计概述及均匀设计表均匀设计概述及均匀设计表 6.1.1 均匀设计概述均匀设计概述2022-4-2596.1.2 均匀设计表均匀设计表Un(qm) 均匀设计表是均匀设计的基本工具,它是用均匀设计表是均匀设计的基本工具,它是用华罗华罗庚庚提出的提出的“数论数论”方法编制的。方法编制的。 1. 均匀设计表均匀设计表Un(qm) 均匀设计表用代号均匀设计表用代号Un(qm)表示,表示,U表示均匀设计
7、表示均匀设计表,它有表,它有n行,行,m列,每列的水平数为列,每列的水平数为q。 对照着正交设计表看均匀设计表对照着正交设计表看均匀设计表2022-4-2510Un(qm)均匀设计均匀设计试验次数、行数试验次数、行数水平数水平数因素的最大数因素的最大数均匀设计表均匀设计表2022-4-2511均匀设计表均匀设计表U7(76)7 , 6 , 5 , 4 , 3 , 2 , 1该表的每一列都是该表的每一列都是 的重新排列的重新排列. . 7 7行、行、7 7水平水平末行全是末行全是7。2022-4-2512 该表的特点是:该表的特点是: (1)对)对任意的任意的n都可以构造均匀设计表,并且都可以构
8、造均匀设计表,并且行数行数n与与水平数水平数q相同相同,因此试验次数少;,因此试验次数少; (2)列数可按下面规则给出:)列数可按下面规则给出: 当当n为为素数素数时时,列数,列数最多最多等于等于n-1; (如上面(如上面n=7,所以列数最多为,所以列数最多为n-1=6列);列); 当当n是是合数合数时时,设,设 ,其中,其中 为为素素数数, 为正整数,那么列数为为正整数,那么列数为 (如(如n=9,由于,由于9=32,所以列数为,所以列数为 列)。列)。 klkllpppn2121kppp,21klll,21kpppn11111121631192022-4-2513表的构造步骤表的构造步骤前
9、提:给定试验次数前提:给定试验次数n,如,如n=9;1.确定第一行:由确定第一行:由1n之间与之间与n互素(两者的最大公约数为互素(两者的最大公约数为1)的)的整数构成。整数构成。故本例中第一行是:故本例中第一行是:1,2,4,5,7,82.其余各行数据由第一行生成:其余各行数据由第一行生成:记记第一行数据为第一行数据为h1h1,hrhr,则表的第则表的第k k行行、j j列列的数字的数字=MOD=MOD(n n,h hj j* *k k)excelexcel取余数函数取余数函数; ;故本例中第故本例中第1列的数据就是列的数据就是1,2,9; 第第2列的数据就是列的数据就是2k/n的余数。的余
10、数。具体操作时有均匀设计软件帮助具体操作时有均匀设计软件帮助2022-4-2514 2.另一类均匀设计表另一类均匀设计表 对于对于n为合数的表,一般列数较少,不太适用。为合数的表,一般列数较少,不太适用。 譬如譬如n=6时,时,由于由于n=2131,经计算,经计算 ,所以列数只有,所以列数只有2列。列。 因为均匀设计表因为均匀设计表U7(76)最后一行全是最后一行全是“7”组成的,故划去这组成的,故划去这一行,相当于减少一个水平。所以建议用一行,相当于减少一个水平。所以建议用U7(76)划去最后一行划去最后一行的方法得到,为区别起见,记为的方法得到,为区别起见,记为23112116)(*mnq
11、U)6(6*6Un=?均匀设计表均匀设计表U7(76)*表示均匀设表示均匀设计表有更好计表有更好的均匀性,的均匀性,所布的点更所布的点更具代表性具代表性)6(6*6U)6(6*6U2022-4-25156.2 均匀设计的使用表均匀设计的使用表 6.2.1 均匀设计表的使用均匀设计表的使用 在用均匀设计表安排试验时,因为任意两列的均匀性是不在用均匀设计表安排试验时,因为任意两列的均匀性是不同的,用哪些列是有讲究的。同的,用哪些列是有讲究的。 譬如用譬如用 安排两个因子时,用安排两个因子时,用1,31,3列与用列与用1,61,6列的均匀列的均匀性是不同的,试验点在平面上的分布见图性是不同的,试验点
12、在平面上的分布见图6.2.16.2.1。可见前者分。可见前者分布比较均匀。布比较均匀。 )6(6*6U6.2.1均匀设计表任两列组成的试验方案一般不等价均匀设计表任两列组成的试验方案一般不等价1 2 3 4 5 66543212022-4-2516均匀设计有其独特的布(试验)点方式:均匀设计有其独特的布(试验)点方式:1.每个因素的每个水平做且每个因素的每个水平做且仅做一次试验仅做一次试验。2.任两个任两个因素的试验点点在平面的格子点上,因素的试验点点在平面的格子点上,每行每列有且仅有一个试验点。每行每列有且仅有一个试验点。 此二性质反映了均匀设计试验安排的此二性质反映了均匀设计试验安排的“均
13、衡均衡”,即对各因素,每个因素的每个水平一视同仁。即对各因素,每个因素的每个水平一视同仁。3.均匀设计表任两列组成的试验方案一般并均匀设计表任两列组成的试验方案一般并不等价。不等价。2022-4-25176.2.3 使用均匀设计表使用均匀设计表1.1.刻划均匀度用偏差刻划均匀度用偏差D D,越小,均匀度越好。,越小,均匀度越好。偏差偏差D可对任一均匀设计表可对任一均匀设计表 或或 中任意二列、任意中任意二列、任意三列、三列、进行计算,从中选出使进行计算,从中选出使D达到达到最小的列最小的列作为使用作为使用列,从而形成使用表。列,从而形成使用表。 如下表就是如下表就是均匀设计表均匀设计表 的使用
14、表的使用表,s表示因子数。表示因子数。若从中选出若从中选出5列使用,就会使偏差列使用,就会使偏差D过大,故建议不使用。过大,故建议不使用。把使用表中不出现的列剔去,并重新编号,可以得到把使用表中不出现的列剔去,并重新编号,可以得到 及其使用表。及其使用表。 nU*nU)7(47U)7(67U可见,均匀设计表只用部分可见,均匀设计表只用部分2022-4-2518均匀设计表均匀设计表 及其使用表及其使用表 )7(47U 使用表说明:当安排使用表说明:当安排2 2个因个因子时,第子时,第1 1、3 3列是最佳的选择,列是最佳的选择,若安排若安排4 4个因子,第个因子,第1 1、2 2、3 3、4 4
15、是最佳选择。是最佳选择。 说明:若实验次数说明:若实验次数n固定,当因素数目固定,当因素数目s增大增大时,均匀设计表的偏差时,均匀设计表的偏差D也将随之增大,所以也将随之增大,所以在实际使用时,因素数目在实际使用时,因素数目s一般等于试验次数一般等于试验次数n的一半,即的一半,即n=2s(或(或s=n/2)。)。2022-4-2519 均匀设计表均匀设计表U7(74)与与 的使用表的使用表 )7(4*7U由表上的由表上的D值可知,在表上加值可知,在表上加“* *”的比不加的比不加“* *”的均匀,的均匀,因此在实际中我们首先使用加因此在实际中我们首先使用加“* *”的均匀设计表的均匀设计表但此
16、但此种表可安排的因子较少。种表可安排的因子较少。对于各因子不等水平的均匀设计,可以直接采用混合水平对于各因子不等水平的均匀设计,可以直接采用混合水平均匀设计表,或者采用拟水平法设计。均匀设计表,或者采用拟水平法设计。来自于来自于U U8 8(8(84 4) )去掉一行去掉一行2022-4-2520说明:说明:新均匀设计表新均匀设计表 由于基于由于基于CDCD2 2偏差和偏差和WDWD2 2偏差的均匀设计表具有更好的均偏差的均匀设计表具有更好的均匀性,匀性,方开泰教授在方开泰教授在2000年左右研制了年左右研制了2580多张新的均匀多张新的均匀设计表设计表。 请参见请参见方开泰教授的方开泰教授的
17、“均匀设计网站均匀设计网站”:http:/www.math.hkbu.edu.hk/UniformDesign/查询。查询。2022-4-25212.利用均匀设计表来利用均匀设计表来安排试验安排试验的步骤:的步骤:(1)根据试验目的,选择合适的因素和相应的水平。)根据试验目的,选择合适的因素和相应的水平。(2)选择适合该试验的均匀设计表,然后根据该表)选择适合该试验的均匀设计表,然后根据该表的的使用表使用表从中选出列号,将因素分别安排到这些列从中选出列号,将因素分别安排到这些列号上,并将这些因素的水平按所在列的指示分别对号上,并将这些因素的水平按所在列的指示分别对号,试验就安排好了。号,试验就
18、安排好了。详见下例:详见下例:2022-4-2522 阿魏酸是生产用于治疗心脑血管疾病及白细胞减少等阿魏酸是生产用于治疗心脑血管疾病及白细胞减少等症药品的基本原料。在阿魏酸的合成工艺考察中,为症药品的基本原料。在阿魏酸的合成工艺考察中,为了提高产量,选取了原料配比了提高产量,选取了原料配比(A)(A)、催化剂量、催化剂量(B)(B)和反和反应时间应时间(C)(C)三个因素,它们各取了三个因素,它们各取了7 7个水平个水平, ,具体如下:具体如下:原料配比原料配比(A):1.0(A):1.0,1.41.4,1.81.8,2.22.2,2.62.6,3.03.0,3.43.4催化剂量催化剂量(B)
19、(ml)(B)(ml):1010,1313,1616,1919,2222,2525,2828反应时间反应时间(C)(h)(C)(h):0.5,1.0,1.5,2.0,2.5,3.0,3.50.5,1.0,1.5,2.0,2.5,3.0,3.5分析:分析: 7 7个水平,需要安排个水平,需要安排7 7次试验,根据因素和水平,我们次试验,根据因素和水平,我们可以选用可以选用7 7水平均匀设计表水平均匀设计表 完成该试验。完成该试验。 具体表的使用,应该根据偏差具体表的使用,应该根据偏差D D来确定,应使来确定,应使 ,实验方案列于下表。实验方案列于下表。)7(47U2022-4-25232022-
20、4-25246.3 6.3 均匀设计数据分析均匀设计数据分析均匀设计的试验数据的处理通常采用均匀设计的试验数据的处理通常采用回归分回归分析析的方法,回归分析模型可采用线性回归模的方法,回归分析模型可采用线性回归模型、二次回归模型或其它非线性回归模型,型、二次回归模型或其它非线性回归模型,可以通过逐步回归的方法筛选变量。可以通过逐步回归的方法筛选变量。2022-4-2525这个结果与人们的经验不符。这个结果与人们的经验不符。01 12233yxxx用用spssspss软件,使用回归分析中变量筛选的方法,比如软件,使用回归分析中变量筛选的方法,比如“向后法向后法”,得到推荐的模型为:,得到推荐的模
21、型为:30.21420.0792yx对阿魏酸一例进行数据分析:对阿魏酸一例进行数据分析:首先,考虑线性回归模型首先,考虑线性回归模型:6.3.1 6.3.1 用回归法拟合模型用回归法拟合模型2022-4-2526然后,我们尝试用二次回归模型来匹配这些数据:然后,我们尝试用二次回归模型来匹配这些数据:使用使用“向前向前”的变量选择法,我们发现适宜的模型:的变量选择法,我们发现适宜的模型:22201 1223311 1222333121213 132323yxxxxxxx xx xx x233130.062320.250.060.0235yxxx x来源来源dfSSMSFp回归30.062190
22、0.02073043.880.006误差30.014170 0.000472总和60.063608方差分析(方差分析(ANOVAANOVA) 表表2022-4-2527.88.4,64.5,41.6,02174.0,978.0 312332xxxxtttsR具有模型模型233130.062320.250.060.0235yxxx x中的三项,中的三项,在在 5%的水平下都是显著的。的水平下都是显著的。2022-4-2528因为因为x1x3的回归系数是正的,的回归系数是正的,而而x1* = 3.4,从而有:,从而有:233306.03309.006232.0), 4 .3(xxxY可通过求导数的
23、办法求得,在可通过求导数的办法求得,在x3* = 2.7575达到最大值达到最大值 。 所以:在所以:在x1* = 3.4和和 x3* = 2.7575处估计响应的最大值处估计响应的最大值为为51.85% 。它比个试验点的最好值。它比个试验点的最好值48.2%还大。还大。),(max),(31*3*1xxYxxY这里求取这里求取maxmax的区域为:的区域为:5 . 35 . 0, 4 . 3131xx2133313(,)0.062320.250.060.0235Y xxxxx x因为:6.3.2 6.3.2 寻找最佳的因素水平组合寻找最佳的因素水平组合2022-4-2529讨论讨论:因素因素
24、 x2 没有给响应没有给响应Y予显著的贡献,可以予显著的贡献,可以选选x2为为其其中点中点,即,即x2 = 19 ml. 求出的求出的x1* = 3.4 在边界上在边界上, 需扩大需扩大x1的试验上限的试验上限。故,在故,在x1 = 3.4和和 x3 = 2.7575的邻域的邻域, ,追加一些追加一些试验是必要的。试验是必要的。在最后一步,一些优化算法是很有用的。在最后一步,一些优化算法是很有用的。否则要用到求偏导数的办法得到否则要用到求偏导数的办法得到x1x1和和x3x3的最值。的最值。2022-4-2530 又例:又例: 为了研究环境污染对人体的危害,为了研究环境污染对人体的危害,考察六种
25、重金属考察六种重金属Cd、Cu、Zn、Ni、Cr、Pb对老鼠寿命的影响,为此考察老鼠体内对老鼠寿命的影响,为此考察老鼠体内某种细胞的死亡率,为了了解误差,每一某种细胞的死亡率,为了了解误差,每一水平组合重复三次。水平组合重复三次。2022-4-2531一、试验设计一、试验设计1明确试验目的:了解六种重金属明确试验目的:了解六种重金属Cd、Cu、Zn、Ni、Cr、Pb对老鼠寿命的影响。对老鼠寿命的影响。 2明确试验指标:老鼠体内某种细胞的死亡率。明确试验指标:老鼠体内某种细胞的死亡率。3确定因素与水平:因素都是定量的。水平可以是等间确定因素与水平:因素都是定量的。水平可以是等间隔的,也可以是不等
26、间隔的。隔的,也可以是不等间隔的。本例中有六种重金属可看作六个因素,每一因素取本例中有六种重金属可看作六个因素,每一因素取17个水个水平,其水平值均平,其水平值均依次依次为:(单位:为:(单位:ppm)0.01,0.05,0.1,0.2,0.4,0.8,1,2,4,5,8,10,12,14, 16,18,20 注意:注意:水平必须按大小顺序排列水平必须按大小顺序排列 4选择均匀设计表,利用使用表进行表头设计选择均匀设计表,利用使用表进行表头设计2022-4-2532由于这里考察六个因素,每一因素取由于这里考察六个因素,每一因素取17个水平个水平,可以用表,可以用表U17(176),六个因素按)
27、,六个因素按使用表使用表的规定分别置于的规定分别置于1,2,3,5,7,8列上,得到试验计划(见下页表),表中括号内列上,得到试验计划(见下页表),表中括号内的数据是水平编号,括号外的数据是水平取值。的数据是水平编号,括号外的数据是水平取值。二、二、进行试验,获得试验结果进行试验,获得试验结果 本例在每一水平组合下进行本例在每一水平组合下进行三次重复试验三次重复试验,试验结果列,试验结果列在表在表6.3.6的最后三列上。的最后三列上。 Un(qm)表示,表示,n行,行,m列,每列的水平数为列,每列的水平数为q,n=q2022-4-25336.3.62022-4-2534三、数据分析三、数据分析
28、 对均匀设计所得到的试验结果通常采用回归分析方法,对均匀设计所得到的试验结果通常采用回归分析方法,建立回归方程。建立回归方程。 设在一个试验中有设在一个试验中有p个因素个因素 。 若只考虑若只考虑 y 关于关于xixi们的线性关系,则可用多元线性回归们的线性关系,则可用多元线性回归方法建立回归方程,并对每一系数作显著性检验,然后逐方法建立回归方程,并对每一系数作显著性检验,然后逐个删去不显著的变量,直到所有系数显著为止。个删去不显著的变量,直到所有系数显著为止。 若考虑若考虑 y 关于关于xixi们的二次回归,除每一变量的线性项外,们的二次回归,除每一变量的线性项外,还要考虑变量间的二次项、乘
29、积项,那么回归系数就有还要考虑变量间的二次项、乘积项,那么回归系数就有在本例中在本例中p=6,回归系数有,回归系数有28个,超过试验次数个,超过试验次数n=17,这,这时只能用逐步回归方法从中选出显著的项建立回归方程。时只能用逐步回归方法从中选出显著的项建立回归方程。pxxx,212(1)(2)212ppppC 个个22201 1223 311 122233 312 1 213 1 32323+yxxxxxxx xx xx x一次项和平方项一次项和平方项交叉项交叉项常数项常数项2022-4-2535 在本例中,根据背景知识,认为死亡率与含量的对数在本例中,根据背景知识,认为死亡率与含量的对数有
30、关,因此先将含量进行变换(这里将六个自变量分别有关,因此先将含量进行变换(这里将六个自变量分别取对数),并考虑其的二次项、交叉乘积项等,用逐步取对数),并考虑其的二次项、交叉乘积项等,用逐步回归方法,在显著性水平回归方法,在显著性水平0.05上挑选变量,所建立的方上挑选变量,所建立的方程如下程如下 :22227.94.83ln5.27ln2.29ln0.670(ln) 0.367(ln)0.710(ln)0.576 lnln 0.393 lnln0.401 lnln 0.384 lnlnyCdCuNiCdCuNiCdZnZnNiZnCrZnPb2022-4-2536用用MATLAB对方程作对方
31、程作失拟检验失拟检验与显著性检验的方差分析表如下:与显著性检验的方差分析表如下:6.3.7 在在显著性水平显著性水平0.05下,下,Flf=1.24F0.95(10,40) =2.10,因而此回归方程是显著的。,因而此回归方程是显著的。失拟平方和:回归方程未能拟合的部分失拟平方和:回归方程未能拟合的部分, ,包括未考虑的其他因素包括未考虑的其他因素及各及各X Xj j的高次项等所引起的差异,的高次项等所引起的差异,失拟检验不显著失拟检验不显著时,说明所时,说明所建立的建立的回归方程拟合的很好回归方程拟合的很好. .SSlf =SSE- SSel 或或SSlf =SST-SSel - SSR S
32、SRSSelSSE21.54.6332022-4-2538 对每一项回归系数的检验在显著性水平对每一项回归系数的检验在显著性水平0.050.05下都是显下都是显著的。所以上面所得到的方程是可信的。著的。所以上面所得到的方程是可信的。 此方程对应的误差标准差的估计为此方程对应的误差标准差的估计为 ,决定系数是决定系数是0.948。 此方程反映了该种细胞的死亡率与六种重金属的关系。此方程反映了该种细胞的死亡率与六种重金属的关系。从方程可以看出从方程可以看出Cd、Cu、Ni的含量增加会增加该种细胞的含量增加会增加该种细胞的死亡率,的死亡率,Zn与与Cd、Ni、Cr、Pb的的结合结合对该种细胞的死对该
33、种细胞的死亡率有较大影响。亡率有较大影响。 若要寻找最优的工艺参数,可通过求极值的方法获得。若要寻找最优的工艺参数,可通过求极值的方法获得。21.54.633残差均方残差均方2022-4-25396.4 6.4 均匀设计的灵活运用均匀设计的灵活运用试验中各因素若有试验中各因素若有不同水平数不同水平数,比如,其,比如,其水平数分别为水平数分别为q q1 1,q qk k。1.混合水平的均匀设计:混合水平的均匀设计:2.含有定性因素的均匀设计:含有定性因素的均匀设计:与一般回归分析一样,需引入与一般回归分析一样,需引入哑变量哑变量。2022-4-2540Un(q1 qk )均匀设计均匀设计试验次数
34、试验次数各定量因素各定量因素之水平数之水平数定量因素定量因素的最大数的最大数1.1.试验中各因素试验中各因素水平数不同水平数不同的的混合水平均匀设计表混合水平均匀设计表2022-4-2541它的试验数为它的试验数为 12。可以安排水平数。可以安排水平数为、的因素各一个。为、的因素各一个。2022-4-2542123112321323251426453126331744484639511105241164312652 U12(62 4)它的试验数为它的试验数为 12。可以安排二个。可以安排二个6水平因素水平因素和一个和一个4水平因素的设计。水平因素的设计。2022-4-2543考虑考虑4 4个因
35、素:个因素: 1.1.平均施肥量平均施肥量X X,分为,分为1212个水平个水平:70,74,78,82,86,90,94,98,102,106,110,11470,74,78,82,86,90,94,98,102,106,110,114 2. 2.种子播种前浸种时间种子播种前浸种时间T T,分为,分为6 6个水平个水平:1,2,3,4,5,61,2,3,4,5,6 3. 3.土壤类型土壤类型B B,分,分4 4种种:B B1 1,B B2 2,B B3 3,B B4 4。 4.4.种子品种种子品种A A,分,分3 3个个:A A1 1,A A2 2,A A3 3。对某农作物产量的影响对某农作
36、物产量的影响, ,前两个为定量因素,后两个为定性因素。前两个为定量因素,后两个为定性因素。例:例:在农业试验中在农业试验中如何安排试验?如何安排试验?2022-4-2544称为:混合型因素混合型水平的均匀设计称为:混合型因素混合型水平的均匀设计一般情况下试验中既有一般情况下试验中既有定量型连续变化定量型连续变化因因素,又有素,又有定性型状态变化定性型状态变化因素。因素。假设假设有有k k个定量因素个定量因素X1,XkX1,Xk;这这k k个因素可化为个因素可化为k k个连续变量,个连续变量, 其水平数分别为其水平数分别为。又有又有t t个定性因素个定性因素G1,GtG1,Gt,这这t t个定性
37、因素分别有个定性因素分别有个状态。个状态。2.含有定性因素的均匀设计含有定性因素的均匀设计2022-4-2545Un(q1 qk d1 dt )均匀设计均匀设计试验次数试验次数各定各定性性因素因素之水平数之水平数定定性性因素因素的最大数的最大数各定各定量量因素因素之水平数之水平数定定量量因素因素的最大数的最大数混合因素混合水平均匀设计表混合因素混合水平均匀设计表2022-4-2546 U12(12643 2 ) 1 2 3 4 5 6 7 1 1 1 1 2 3 1 2 2 2 2 2 3 2 2 1 3 3 3 3 2 1 1 2 4 4 4 4 3 1 2 1 5 5 5 1 1 2 2
38、2 6 6 6 2 3 2 1 1 7 7 1 3 1 1 1 1 8 8 2 4 3 3 2 1 9 9 3 1 1 3 2 2 10 10 4 2 2 2 1 2 11 11 5 3 1 1 1 1 12 12 6 4 2 3 2 2 12次试验,次试验,可以安排可以安排个水平数为个水平数为12和和6的的定量定量因素因素,以及,以及总数为总数为5的一的一个水平为个水平为4、两个水平为两个水平为3和两个水平和两个水平为为2的的定性因定性因素素的设计。的设计。2022-4-2547 U12(12643 )472461212135111122410101139934288131773266611
39、555344442333332222211114321安排试验:安排试验:第一列安排平均施肥第一列安排平均施肥量量X X,共,共1212个水平,个水平,第二列安排种子播种第二列安排种子播种前浸种时间前浸种时间T T,分为,分为6 6个水平,个水平,第三列安排土壤类型第三列安排土壤类型B B,分,分4 4种种B1B1,B2B2,B3B3,B4B4。第四列安排种子品种第四列安排种子品种A A,分,分3 3个个A1A1,A2A2,A3A3。2022-4-25489746114106251101220410611873102106929810531941271690111158692748289937
40、8901274771170241322113413321134233221ABABABABABABABABABABABABABTX值试验的安排及结果试验的安排及结果2022-4-2549为了进行分析,对于定性变量我们引进为了进行分析,对于定性变量我们引进5 5个个哑变哑变量量。它们的记号和取值如下。它们的记号和取值如下:将它们和将它们和 、 一起进行回归分析。一起进行回归分析。B因素的因素的) 000100010001 (31z) 001000100010 (32z) 010001000100 (33z) 010101010000 (41z) 101000000101 (42zA因素的因素的回
41、归方程略回归方程略2022-4-25506.5 均匀混料设计均匀混料设计(Uniform Mixture Design)在生物化学反应试验中,缺少某些混料成分,化学反应可能在生物化学反应试验中,缺少某些混料成分,化学反应可能不会进行,或者生成了其它产物。为此,人们提出了均匀混不会进行,或者生成了其它产物。为此,人们提出了均匀混料设计。料设计。 所谓均匀混料设计,就是在均匀设计中使所有试验点在所谓均匀混料设计,就是在均匀设计中使所有试验点在试验区域内尽可能均匀地散布。试验区域内尽可能均匀地散布。2022-4-25516.4 均匀混料设计均匀混料设计(Uniform Mixture Design)
42、 均匀混料设计的主要步骤如下:均匀混料设计的主要步骤如下: (1)给定试验因子给定试验因子p和试验次数和试验次数n,选用合适的均匀设计表选用合适的均匀设计表Un(ns-1)或或Un(ns-1) ,用用ukj记表中第记表中第k行第行第j列的元素。列的元素。 (2)对于每个对于每个k和和j,计算,计算 (3)计算计算0.5kjkjucn1,2,s 1;1,2,jknpjkjkjgc1,2,s 1;1,2,jkn2022-4-25526.5 均匀混料设计均匀混料设计(Uniform Mixture Design) (4)计算计算 (5)计算计算 (6)计算计算12,1(1)kjkkk jkjxg g
43、gg2,3,1;1,2,jskn1,2,kn111kkxg 1,2,kn12,1kskkk sxg gg所得所得 就是对应就是对应n次试验,次试验,s种原料的配方均匀设计,用记号种原料的配方均匀设计,用记号UMn(ns)表示。)表示。ksx2022-4-25536.5 均匀混料设计均匀混料设计(Uniform Mixture Design) 例例1:对对s=3,n=11的均匀设计,写出生成均匀混料设计的均匀设计,写出生成均匀混料设计UM11(113) 的过程。的过程。 此时上述公式可以简化为:此时上述公式可以简化为:2122kjkjuc1,2;1,2,11jk111kkxc 212(1)kkk
44、xcc312kkkxc c2022-4-25546.5 均匀混料设计均匀混料设计(Uniform Mixture Design) 结果见下表结果见下表UM11(113) 试验试验u1u2c1c2x1x2x31141/227/220.7870.1450.0682293/2217/220.6310.0840.2853375/2213/220.5230.1950.2824417/221/220.4360.5390.02655119/2221/220.3600.0290.61166311/225/220.2930.5460.16177613/2211/220.2310.3840.38488815/22
45、15/220.1740.2630.56399217/223/220.1210.7590.12010101019/2219/220.0710.1270.8031111521/229/220.0230.5770.4002022-4-2555 例例2:在一个新金属材料研制中,含三种金属成分,拟:在一个新金属材料研制中,含三种金属成分,拟采用均匀混料设计采用均匀混料设计UM15(153) 。NOx1x2x3YNOx1x2x3Y10.81740.10350.07918.225690.24720.17570.577110.136220.68380.05270.26358.7794100.20420.769
46、30.02659.376030.59180.36740.04089.5115110.16330.25100.585710.277240.51700.17710.30599.5619120.12440.55450.32119.865250.45230.41990.12789.9145130.08710.09130.821610.102260.39450.02020.58539.5526140.05130.79060.15819.179270.34170.32910.32929.9481150.01680.42610.55719.956580.29290.49500.212110.12412022
47、-4-2556逐步回归分析(逐步回归分析(SAS)Data sasuser.fang147;Input x1-x3 Y;x12=x1*x2;x13=x1*x3;x23=x2*x3;Cards;Proc Reg data=sasuser.fang147;Model Y = x1-x3 x12 x13 x23 /noint selection=stepwise sls=0.1 sle=0.1;Run;2022-4-2557回归分析结果回归分析结果在本例中在本例中R2 = 0.9997回归模型:回归模型:F=7961.6,P0.0001各回归系数显著性各回归系数显著性Variable Paramet
48、er SS F Px1 7.3596 36.0756 822.86 .0001x2 8.5776 49.6510 1132.50 .0001x3 10.9838 161.7197 3688.71 .0001x12 7.9208 1.6938 38.63 .0001可得回归方程:可得回归方程: Y=7.3596*x1+8.5776*x2+10.9838*x3+7.9208*x1*x22022-4-2558混料设计中注意的问题混料设计中注意的问题1.1.如果试验方案处理数比较少时,容易接近于饱和设如果试验方案处理数比较少时,容易接近于饱和设计,以致误差项自由度过小,可适当设置重复。处理计,以致误差项自由度过小,可适当设置重复。处理数较多时,误差项自由度较大,可以少设或者不设置数较多时,误差项自由度较大,可以少设或者不设置重复。重复。2.2.因子水平数与试验处理数同步增加,如果水平数太因子水平数与试验处理数同步增加,如果水平数太多不便于实施或致使水平间效应差异过小,易于被误多不便于实施或致使水平间效应差异过小,易于被误差掩盖,可以适当减少水平数,可以采用拟水平法,差掩盖,可以适当减少水平数,可以采用拟水平法,或采用或采用U Un n(q(qs s) )均匀表。均匀表。2022-4-2559更多内容参见:更多内容参见:http:/