1、第二章 正交试验设计的方差分析2022-11-11第二章第二章 正交试验设计的方差分析正交试验设计的方差分析一、试验设计的基本原则一、试验设计的基本原则二、正交试验的方差分析二、正交试验的方差分析三、重复试验的方差分析三、重复试验的方差分析四、误差分析与试验水平四、误差分析与试验水平一、实验设计的基本原则1.随机化原则:每个处理以概率均等的原则,随机地选择实验单元。2.重复原则:独立重复实验、重复测量3.对照原则:空白、安慰剂、实验条件、标准、历史或中外对照。4.区组原则:人为划分的时间、空间、设备等实验条件称为区组(block)。(3,4合称为局部控制原则)n方差分析(方差分析(analys
2、is of variance,简称,简称ANOVA)检验试验中有关因素对试验结果影响的显著性检验试验中有关因素对试验结果影响的显著性n试验指标试验指标(experimental index)衡量或考核试验效果的参数衡量或考核试验效果的参数 n因素因素(experimental factor)影响试验指标的条件影响试验指标的条件 可控因素可控因素(controllable factor)n水平水平(level of factor)因素的不同状态或内容因素的不同状态或内容 方差分析的必要性方差分析的必要性n 极差分析极差分析不能估计试验中以及试验结果测定中不能估计试验中以及试验结果测定中必然存在的
3、误差大小。为了弥补这个缺点,可必然存在的误差大小。为了弥补这个缺点,可采用方差分析的方法。采用方差分析的方法。n 方差分析法方差分析法是将因素水平(或交互作用)的变是将因素水平(或交互作用)的变化所引起的试验结果间的差异与误差波动所引化所引起的试验结果间的差异与误差波动所引起的试验结果间的差异区分开来的一种数学方起的试验结果间的差异区分开来的一种数学方法。法。n 所谓所谓方差分析方差分析,就是给出离散度的各种因素将就是给出离散度的各种因素将总变差平方和进行分解,然后进行统计检验的总变差平方和进行分解,然后进行统计检验的一种数学方法。一种数学方法。方差分析法的基本思路:(1)由数据中的总偏差平方
4、和中分出组内偏差平方和、组间偏差平方和,并赋予它们的数量表示;(2)用组间偏差平方和与组内偏差平方和在一定意义下进行比较,如两者相差不大,说明因素水平的变化对指标影响不大;如两者相差较大,组间偏差平方和比组内偏差平方和大得多,说明因素水平的变化影响很大,不可忽视;(3)构造F统计量,作F检验,即可判断因素作用是否显著。空列(误差)因素SSSSSST空列(误列(因素Tdfdfdf误差误差误差因素因素因素dfSSMSdfSSMS ,误差因素因素MSMSF由于进行F检验时,要用误差偏差平方和SSe及其自由度dfe,因此,为进行方差分析,所选正交表应留出一定空列。当无空列时,应进行重复试验,以估计试验
5、误差。误差自由度一般不应小于2,dfe很小,F检验灵敏度很低,有时即使因素对试验指标有影响,用F检验也判断不出来。为了增大dfe,提高F检验的灵敏度,在进行显著性检验之前,先将各因素和交互作用的方差与误差方差比较,若MS因(MS交)2MSe,可将这些因素或交互作用的偏差平方和、自由度并入误差的偏差平方和、自由度,这样使误差的偏差平方和和自由度增大,提高了F检验的灵敏度。9T-KKK31 9y9.y2y1y9y8y7y6y5y4y3y2y131SS22322212222A)(修正项)()()()(2.1 单因素试验的方差分析单因素试验的方差分析(one-way analysis of varia
6、nce)2.1.1 单因素试验方差分析基本问题单因素试验方差分析基本问题(1)目的:检验一个因素对试验结果的影响是否显著性)目的:检验一个因素对试验结果的影响是否显著性(2)基本命题:)基本命题:n设某单因素设某单因素A有有r种水平:种水平:A1,A2,Ar,在每种水平,在每种水平下的试验结果服从正态分布下的试验结果服从正态分布n在各水平下分别做了在各水平下分别做了ni(i1,2,r)次试验)次试验n判断因素判断因素A对试验结果是否有显著影响对试验结果是否有显著影响 (3)单因素试验数据表单因素试验数据表 2.1.2 单因素试验方差分析基本步骤单因素试验方差分析基本步骤(1)计算平均值)计算平
7、均值n组内平均值组内平均值:111inrijijxxn11iniijjixxnn 总平均:(2)计算偏差平方和)计算偏差平方和总偏差平方和总偏差平方和SST(sum of squares for total)211()inrTijijSSxxn 表示了各试验值与总平均值的偏差的平方和n 反映了试验结果之间存在的总差异 组间偏差平方和 SSA(sum of square for factor A)22111()()inrriiAiijiSSxxn xxn 反映了各组内平均值之间的差异程度n 由于因素A不同水平的不同作用造成的 组内偏差平方和组内偏差平方和 SSe(sum of square fo
8、r error)n反映了在各水平内,各试验值之间的差异程度反映了在各水平内,各试验值之间的差异程度 n由于随机误差的作用产生由于随机误差的作用产生 211()inrieijijSSxx三种偏差平方和之间关系:TAeSSSSSS(3)计算自由度)计算自由度(degree of freedom)n总自由度总自由度:dfTn1n组间自由度组间自由度:dfA r1n组内自由度组内自由度:dfe nr 三者关系三者关系:dfT dfA dfe(4)计算平均平方)计算平均平方n均方偏差平方和除以对应的自由度均方偏差平方和除以对应的自由度/AAAMSSSdf/eeeMSSSdfMSA组间均方MSe组内均方/
9、误差的均方(5)F检验检验n服从自由度为(服从自由度为(dfA,dfe)的)的F分布(分布(F distribution)n对于给定的显著性水平对于给定的显著性水平,从,从F分布表查得临界值分布表查得临界值F(dfA,dfe)n如果如果FA F(dfA,dfe),则认为因素,则认为因素A对试验结果有对试验结果有显著影响否则认为因素显著影响否则认为因素A对试验结果没有显著影响对试验结果没有显著影响 AAeMSFMS组间均方组内均方(6)方差分析表)方差分析表 n若若 FA F0.01(dfA,dfe),称因素,称因素A对试验结果有对试验结果有非常显著非常显著的的影响,用影响,用“*”号表示;号表
10、示;n若若 F0.05(dfA,dfe)FA F0.01(dfA,dfe),则因素,则因素A对试验对试验结果有结果有显著显著的影响,用的影响,用“*”号表示;号表示;n若若 FA F0.05(dfA,dfe),则因素,则因素A对试验结果的影响对试验结果的影响不显著不显著单因素试验的方差分析表 2.1.3 Excel在单因素试验方差分析中的应用在单因素试验方差分析中的应用n利用利用Excel“分析工具库分析工具库”中的中的“单因素方差分析单因素方差分析”工具工具 小结:根据偏差平方和的加和性,总偏差平方和可以分解成为组间偏差平方和与组内偏差平方和,前者反映了因素对试验结果的影响,后者反映了误差对
11、试验结果的影响。根据数学原理对组间偏差平方和与组内偏差平方和进行合理的比较,就能分析出因素对试验结果的影响程度、性质。若 F0.05(dfA,dfe)FA F0.01(dfA,dfe),由于F0.05(dfA,dfe)FA出现的概率只有5,是一个小概率事件,当其出现时,说明试验条件的改变对试验结果有显著性影响。若 FA F0.01(dfA,dfe),由于若 FA F0.01(dfA,dfe)出现的概率只有1,是一个更小概率事件,当其出现时,当然更说明试验条件的改变对试验结果有高度显著性影响。2.2 双因素试验的方差分析双因素试验的方差分析n讨论两个因素对试验结果影响的显著性,又称讨论两个因素对
12、试验结果影响的显著性,又称“二二元方差分析元方差分析”2.2.1 双因素无重复试验的方差分析双因素无重复试验的方差分析(1)双因素无重复试验)双因素无重复试验(2)双因素无重复试验方差分析的基本步骤)双因素无重复试验方差分析的基本步骤 计算平均值计算平均值 n总平均总平均:111rsijijxxrs 11siijjxxs11rjijixxrn Ai水平时:n Bj水平时:计算偏差平方和计算偏差平方和 n总偏差平方和:总偏差平方和:n因素因素A引起偏差的平方和:引起偏差的平方和:n因素因素B引起偏差的平方和:引起偏差的平方和:n误差平方和:误差平方和:211rsTijABeijSSxxSSSSS
13、S22111()()srriiAjiiSSxxsxx22111()()rssjjBijjSSxxrxx211()rsijeijijSSxxxx计算自由度计算自由度 nSSA的自由度:的自由度:dfA r1nSSB的自由度:的自由度:dfBs1 nSSe的自由度:的自由度:dfe(r1)()(s1)nSST的自由度:的自由度:dfTn1rs1 ndfT dfA dfB dfe计算均方计算均方 1AAAASSSSMSdfr1BBBBSSSSMSdfs(1)(1)eeeeSSSSMSdfrsF检验检验 nFA服从自由度为(服从自由度为(dfA,dfe)的的F分布;分布;nFB服从自由度为(服从自由度
14、为(dfB,dfe)的的F分布;分布;n对于给定的显著性水平对于给定的显著性水平 ,查,查F分布表:分布表:F(dfA,dfe),F(dfB,dfe)n若若FAF (dfA,dfe),则因素,则因素A对试验结果有显著影响,否对试验结果有显著影响,否则无显著影响;则无显著影响;n若若FBF (dfB,dfe),则因素,则因素B对试验结果有显著影响,否对试验结果有显著影响,否则无显著影响;则无显著影响;BBeMSFMSAAeMSFMS无重复试验双因素方差分析表无重复试验双因素方差分析表 1AASSMSrAAeMSFMS1BBSSMSsBBeMSFMS(1)(1)rs(1)(1)eeSSMSrs无重
15、复试验双因素方差分析表2.2.2 双因素重复试验的方差分析双因素重复试验的方差分析(1)双因素重复试验方差分析试验表)双因素重复试验方差分析试验表 11111211,.,cxxx12112212,.,cxxx1 11 21,.,ssscxxx21121221,.,cxxx22122222,.,cxxx2 12 22,.,ssscxxx11121,.,rrr cxxx21222,.,rrr cxxx12,.,rsrsrscxxx双因素重复试验方差分析试验表(2)双因素重复试验方差分析的基本步骤)双因素重复试验方差分析的基本步骤计算平均值计算平均值n总平均总平均:n任一组合水平(任一组合水平(Ai
16、,Bj)上)上:nAi水平时水平时:nBj水平时水平时:1111rscijkijkxxrsc 11cijijkkxxc11siijkjxxsc11rjijkixxrc计算偏差平方和计算偏差平方和n总偏差平方和:总偏差平方和:n因素因素A引起偏差的平方和:引起偏差的平方和:n因素因素B引起偏差的平方和:引起偏差的平方和:n交互作用交互作用AB引起偏差的平方和:引起偏差的平方和:n误差平方和:误差平方和:2111()rscTijkABABeijkSSxxSSSSSSSS 21()riAiSSscxx21()sjBjSSrcxx 211()rsijijA BijSScxxxx 2111()rscij
17、eijkijkSSxx 计算自由度计算自由度nSSA的自由度:的自由度:dfA r1nSSB的自由度:的自由度:dfBs1 nSSAB的自由度:的自由度:dfAB(r1)(s1)nSSe的自由度:的自由度:dfers(c 1)nSST的自由度:的自由度:dfTn1rsc1 ndfT dfA dfB dfAB dfe计算均方计算均方1AASSMSr1BBSSMSs(1)(1)A BA BSSMSrs(1)eeSSMSrs cF检验检验对有重复试验的双因素试验结果用F检验法进行分析时,首先必须计算各个因素及两个因素之间的交互作用所对应的F值。须注意的是,在F值的计算中,不同的模型所对应的F值的计算
18、方法不一样。模型根据两个因素是随机因素还是固定因素决定。当两个因素都是固定因素时,模型是固定模型;当两个因素都是随机因素时,模型是随机模型;当两个因素中只有一个因素为随机因素时,模型为混合模型。固定因素的水平是完全可以控制的,如温度、压力、浓度等,这时候对试验结果所带来的影响也是固定的,故称为固定效应。随机因素是指其试验水平可由许多可能的水平中随机抽取。例如:某试验室有10人和10台同样型号的仪器,现需考察人员和仪器这两个因素对测试结果的影响,因此随机从10人中抽取3人,随机从10台仪器中抽取3台,构成了双因素三水平试验,很显然,这两个因素都是随机因素。固定因素所考察的因素水平,也是该因素的全
19、部水平,由试验所得到的结论只是针对所试验过的因素水平而言的,而不能由已有水平的试验结果从统计上去推断该因素未经试验的其他水平的效应。应该指出的是,不能根据已有的试验结果从统计上去进行推断,这并不妨碍人们从专业的角度去做某些推断。随机因素由于所考察的水平是随机抽取的,因而由试验结果所得到的绍论都是被抽样总体的结论,可以由已试验过的样本效应从统计上去推导未经试验的其他样本的效应。F检验检验n若若FAF (dfA,dfe),则认为因素,则认为因素A对试验结果有显著影响,对试验结果有显著影响,否则无显著影响;否则无显著影响;n若若FBF (dfB,dfe),则认为因素,则认为因素B对试验结果有显著影响
20、,对试验结果有显著影响,否则无显著影响;否则无显著影响;n若若FABF (dfAB,dfe),则认为交互作用,则认为交互作用AB对试验结对试验结果有显著影响,否则无显著影响果有显著影响,否则无显著影响。AAeMSFMSBBeMSFMSA BA BeMSFMS重复试验双因素方差分析表重复试验双因素方差分析表2.2.3 Excel在双因素方差分析中的应用在双因素方差分析中的应用(1)双因素无重复试验方差分析)双因素无重复试验方差分析n利用利用“分析工具库分析工具库”中的中的“无重复双因素方差分析无重复双因素方差分析”工具工具(2)双因素重复试验方差分析)双因素重复试验方差分析n利用利用“分析工具库
21、分析工具库”中的中的“重复双因素方差分析重复双因素方差分析”工具工具 2.3 正交试验设计结果的正交试验设计结果的方差分析法方差分析法 n能估计误差的大小能估计误差的大小 n能精确地估计各因素的试验结果影响的重能精确地估计各因素的试验结果影响的重要程度要程度2.3.1 方差分析的基本步骤与格式方差分析的基本步骤与格式 设:设:n用正交表用正交表Ln(rm)来安排试验来安排试验 n试验结果为试验结果为yi(i=1,2,n)(1)计算偏差平方和)计算偏差平方和 总偏差平方和总偏差平方和 2221111()()nnnTiiiiiiSSyyyyQPn1niiTy21niiQy2211()niiTPyn
22、n设:设:各因素引起的偏差平方和各因素引起的偏差平方和 n第第j列所引起的偏差平方和列所引起的偏差平方和:22211()()rrjiiiirTrSSKKPnnn1mTjjSSSS因此:因此:试验误差的偏差平方和试验误差的偏差平方和 n方差分析时,在进行表头设计时一般要求方差分析时,在进行表头设计时一般要求留留有空列有空列,即,即误差列误差列 n误差的偏差平方和为所有空列所对应偏差误差的偏差平方和为所有空列所对应偏差平方和之和平方和之和:eSSSS空列 交互作用的偏差平方和交互作用的偏差平方和 n若交互作用只占有一列,则其偏差平方和若交互作用只占有一列,则其偏差平方和就等于所在列的偏差平方和就等
23、于所在列的偏差平方和SSj n若交互作用占有多列,则其偏差平方和等若交互作用占有多列,则其偏差平方和等于所占多列偏差平方和之和,于所占多列偏差平方和之和,例:例:r=3时时 12A BA BA BSSSSSS()()(2)计算自由度)计算自由度总自由度总自由度:dfTn1任一列偏差平方和对应的自由度任一列偏差平方和对应的自由度:dfjr1交互作用的自由度交互作用的自由度:(以:(以AB为例)为例)ndfABdfA dfBndfAB(r1)dfj若若r 2,dfABdfj若若r 3,dfAB 2dfj=dfA dfB误差的自由度:误差的自由度:dfe空白列自由度之和空白列自由度之和(3)计算均方
24、)计算均方n以以A因素为例因素为例:AAASSMSdfA BA BA BSSMSdfeeeSSMSdfn以以AB为例为例:n误差的均方:误差的均方:注意:注意:n若某因素或交互作用的均方若某因素或交互作用的均方MSe,则应将它们归,则应将它们归入误差列入误差列n计算新的误差、均方计算新的误差、均方 例:若例:若MSA MSe 则:则:eeASSSSSSeeAdfdfdfeeeSSMSdf(4)计算)计算F值值n各均方除以误差的均方,例如:各均方除以误差的均方,例如:AAeMSFMSA BA BeMSFMS(5)显著性检验)显著性检验n例如:例如:若若 ,则因素,则因素A对试验结果对试验结果有显
25、著影响有显著影响 若若 ,则交互作用,则交互作用AB对试验结果有显著影响对试验结果有显著影响(,)AAeFFdfdf(,)A BA BeFF dfdf(6)列方差分析表)列方差分析表 2.3.2 二水平正交试验的方差分析二水平正交试验的方差分析 n正交表中任一列对应的偏差平方和:正交表中任一列对应的偏差平方和:2121()jSSKKnn 例例6-92.3.3 三水平正交试验的方差分析三水平正交试验的方差分析 nr=3,所以任一列的偏差平方和:,所以任一列的偏差平方和:3213()jiiSSKPnn 例例6-10注意:注意:交互作用的方差分析交互作用的方差分析 有交互作用时,优方案的确定有交互作
26、用时,优方案的确定2.3.4 混合水平正交试验的方差分析混合水平正交试验的方差分析(1)利用混合水平正交表利用混合水平正交表 n注意:不同列的有关计算会存在差别注意:不同列的有关计算会存在差别 n例例6-11(2)拟水平法拟水平法 n注意:注意:有拟水平的列平方和的计算有拟水平的列平方和的计算误差平方和的计算误差平方和的计算误差自由度的计算误差自由度的计算n例例6-12实验方法与数据处理的基本概念1试验指标n在试验设计和数据处理中,我们通常根据试验和数据处理的目的而选定用来考察或衡量其效果的特性值称为试验考察指标。试验考察指标可以是产品的质量、成本、效率和经济效益等。n试验考察指标分为定量指标
27、和定性指标两大类。定最化指际(如精度、粗糙度、强度、硬度、合格率、寿命和成本等)可以通过试验直接获得、它方便计算和数据处理。而定性指标(如颜色气味、光泽等)不是具体数值,一般要定量化后再进行计算和数据处理。试验考察指标可以是一个,也可以是几个,前者称为单考察指标试验,后者称为多考察指标试验设计。2试验因素 对试验考察指标产生影响的原因或要素称为试验因素。例如在合金钢40Cr的淬火试验中淬火硬度与淬火温度(如770、800、850)和冷却方式(如水冷、油冷、空冷)有关。其中淬火温度和冷却方式是试验因素而淬火硬度是试验考察指标。除上述的试验因素外,在试验过程中由于测量、仪器和环境条件等影响也会影响
28、到试验考察指标,称这类因素为误差因素。因素一般用大写字母A、B、C、来标记。3因素水平 试验因素在试验中所处的状态、条件的变化可能会引起试验指标的变化,我们把因素变化的各种状态和条件称为因素的水平。在试验中需要考虑某因素的几种状态时则称该因素为几水平因素。如上例40Cr的淬火试验中淬火温度为770、800、850三种状态则淬火温度这个试验因素为三水平因素。因素的水平应是能够直接被控制的并且水平的变化能直瓦接影响试验考察指标有不同程度的变化。水平通常用数字1、2、3表示。实验设计的基本原则1.随机化原则:每个处理以概率均等的原则,随机地选择实验单元。2.重复原则:独立重复实验、重复测量3.对照原
29、则:空白、安慰剂、实验条件、标准、历史或中外对照。4.区组原则:人为划分的时间、空间、设备等实验条件称为区组(block)。(3,4合称为局部控制原则)极差分析法简单明了,通俗易懂,计算工作量少便于推广极差分析法简单明了,通俗易懂,计算工作量少便于推广普及。但这种方法普及。但这种方法不能将试验中由于试验条件改变引起的数不能将试验中由于试验条件改变引起的数据波动同试验误差引起的数据波动区分开来,据波动同试验误差引起的数据波动区分开来,也就是说,不也就是说,不能区分因素各水平间对应的试验结果的差异究竟是由于因素能区分因素各水平间对应的试验结果的差异究竟是由于因素水平不同引起的,还是由于试验误差引起
30、的,水平不同引起的,还是由于试验误差引起的,无法估计试验无法估计试验误差的大小误差的大小。此外,各因素对试验结果的影响大小无法给以。此外,各因素对试验结果的影响大小无法给以精确的数量估计,不能提出一个标准来判断所考察因素作用精确的数量估计,不能提出一个标准来判断所考察因素作用是否显著。为了弥补极差分析的缺陷,可采用方差分析。是否显著。为了弥补极差分析的缺陷,可采用方差分析。标准误差标准误差(standard error)n当试验次数当试验次数n无穷大时,总体标准差:无穷大时,总体标准差:222111()()/nnniiiiiixxxxnnn22221111()()/111nnnniiiiiii
31、idxxxxnsnnnn 试验次数为有限次时,样本标准差:试验次数为有限次时,样本标准差:n表示试验值的精密度,标准差表示试验值的精密度,标准差,试验数据精密度,试验数据精密度F检验检验(F-test)(1)目的:)目的:对两组具有正态分布的试验数据之间的精密度进行比较对两组具有正态分布的试验数据之间的精密度进行比较(2)检验步骤检验步骤计算统计量计算统计量1(1)(1)(1)12,nxxx2(2)(2)(2)12,nxxx21s21s设有两组试验数据:设有两组试验数据:都服从正态分布,样本方差分别为都服从正态分布,样本方差分别为和和和和,则,则2122sFs111dfn221dfn第一自由度
32、为第一自由度为第二自由度为第二自由度为服从服从F分布,分布,查临界值查临界值给定的显著水平给定的显著水平111dfn221dfn查查F分布表分布表临界值临界值n 双侧(尾)检验双侧(尾)检验(two-sided/tailed test):检验检验 若若则判断两方差无显著差异,否则有显著差异则判断两方差无显著差异,否则有显著差异 1212(1)22(,)(,)Fdf dfFFdf dfn单侧(尾)检验单侧(尾)检验(one-sided/tailed test):n左侧(尾)检验左侧(尾)检验:则判断该判断方差则判断该判断方差1 1比方差比方差2 2无显著减小,否则有显著减小无显著减小,否则有显著减小 右侧(尾)检验右侧(尾)检验 则判断该方差则判断该方差1比方差比方差2无显著增大,否则有显著增大无显著增大,否则有显著增大 若若若若(1)12(,)FFdf df12(,)FF df df(3)Excel在在F检验中的应用检验中的应用