1、质量工程师考试第质量工程师考试第2章常用统计技章常用统计技术中级术中级1第一节第一节 方差分析方差分析 一、几个概念一、几个概念二、单因子方差分析二、单因子方差分析 2一、几个概念一、几个概念 在试验中改变状态的因素称为因子,常用大写英文字母在试验中改变状态的因素称为因子,常用大写英文字母A、B、C、等表示。等表示。因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为A1,A2,Ak。试验中所考察的指标(可以是质量特性也可以是产量特性或其它)用试验中所考察的指标(可以是质量特性也可以是产量特性或其它)用Y表
2、示。表示。Y是一个随机变量。是一个随机变量。单因子试验:单因子试验:若试验中所考察的因子只有一个。若试验中所考察的因子只有一个。3例例2.1-1 现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差异,现分现有甲、乙、丙三个工厂生产同一种零件,为了了解不同工厂的零件的强度有无明显的差异,现分别从每一个工厂随机抽取四个零件测定其强度,数据如表所示,试问三个工厂的零件的平均强度是否相同?别从每一个工厂随机抽取四个零件测定其强度,数据如表所示,试问三个工厂的零件的平均强度是否相同?工厂工厂 量件强度量件强度 甲甲 乙乙 丙丙 103 101 98 110 113 107 1
3、08 116 82 92 84 86三个工厂的零件强度三个工厂的零件强度 4在这一例子中,考察一个因子:在这一例子中,考察一个因子:因子因子A:工厂:工厂该因子有三个水平:甲、乙、丙该因子有三个水平:甲、乙、丙试验指标是:零件强度试验指标是:零件强度 这是一个单因子试验的问题。每一水平下的试验结果构成一个总体,现在需要比较三个总体均值是这是一个单因子试验的问题。每一水平下的试验结果构成一个总体,现在需要比较三个总体均值是否一致。如果每一个总体的分布都是正态分布,并且各个总体的方差相等,那么比较各个总体均值是否一否一致。如果每一个总体的分布都是正态分布,并且各个总体的方差相等,那么比较各个总体均
4、值是否一致的问题可以用方差分析方法来解决。致的问题可以用方差分析方法来解决。5二、单因子方差分析二、单因子方差分析 假定因子假定因子A有有r个水平,在个水平,在Ai水平下指标服从正态分布,其均值为水平下指标服从正态分布,其均值为 ,方差为,方差为 ,i=1,2,r。每一。每一水平下的指标全体便构成一个总体,共有水平下的指标全体便构成一个总体,共有r个总体,这时比较各个总体的问题就变成比较各个总体的均个总体,这时比较各个总体的问题就变成比较各个总体的均值是否相同的问题了,即要检验如下假设是否为真:值是否相同的问题了,即要检验如下假设是否为真:i26r:H 210 当当 不真时,表示不同水平下的指
5、标的均值有显著差异,此时称因子不真时,表示不同水平下的指标的均值有显著差异,此时称因子A是显著的,否则称因子是显著的,否则称因子A不显著。检验这一假设的分析方法便是方差分析。不显著。检验这一假设的分析方法便是方差分析。0H7 方差分析的三个基本假定方差分析的三个基本假定1.在水平在水平 下,指标服从正态分布下,指标服从正态分布 ;iA),(Ni2 2.在不同水平下,各方差相等;在不同水平下,各方差相等;3.各数据各数据 相互独立。相互独立。ijy8 设在一个试验中只考察一个因子设在一个试验中只考察一个因子A,它有,它有r个水平,在每一水平下进行个水平,在每一水平下进行m次重复试验,其结果用次重
6、复试验,其结果用 表示,表示,i=1,2,r。常常把数据列成如下表格形式:常常把数据列成如下表格形式:imiiy,y,y21单因子试验数据表单因子试验数据表水平水平试验数据试验数据和和均值均值A1myyy11211,T11yA2myyy22221,T22yArrmrryyy,21Trry9 记第记第i水平下的数据均值为水平下的数据均值为 ,总均值为,总均值为 。此时共有。此时共有n=rm个数据,这个数据,这n个数据不全相同,它们的波动(差个数据不全相同,它们的波动(差异)可以用总离差平方和异)可以用总离差平方和ST去表示去表示iyy rimjijT)yy(S112记第记第i 水平下的数据和为水
7、平下的数据和为Ti,;mjijiyT110引起数据波动(差异)的原因不外如下两个:引起数据波动(差异)的原因不外如下两个:一是由于因子一是由于因子A的水平不同,当假设的水平不同,当假设H0不真时,各个水平下指标的均值不同,这必然会使试验结果不真时,各个水平下指标的均值不同,这必然会使试验结果不同,我们可以用组间离差平方和来表示,也称因子不同,我们可以用组间离差平方和来表示,也称因子A的离差平方和:的离差平方和:riiAyymS12这里乘以这里乘以m是因为每一水平下进行了是因为每一水平下进行了m次试验。次试验。11 二是由于存在随机误差,即使在同一水平下获得的数据间也有差异,这是除了因子二是由于
8、存在随机误差,即使在同一水平下获得的数据间也有差异,这是除了因子A的水平外的一的水平外的一切原因引起的,我们将它们归结为随机误差,可以用组内离差平方和表示:切原因引起的,我们将它们归结为随机误差,可以用组内离差平方和表示:rimjiijeyyS112 Se:也称为误差的离差平方和:也称为误差的离差平方和12可以证明有如下平方和分解式:可以证明有如下平方和分解式:eATSSS ST、SA、Se 的自由度分别用的自由度分别用 、表示,它们也有分解式:表示,它们也有分解式:,其中:,其中:TfAfefeATfff 1 试试验验数数Tf1 水水平平数数AfATefff 因子或误差的离差平方和与相应的自
9、由度之比称为因子或误差的均方和,并分别记为:因子或误差的离差平方和与相应的自由度之比称为因子或误差的均方和,并分别记为:AAAfSMS eeefSMS 两者的比记为:两者的比记为:eAMSMSF 13 当当 时认为在显著性水平时认为在显著性水平 上因子上因子A是显著的。其中是显著的。其中 是自由度为是自由度为 的的F分布的分布的1-分位数。分位数。),(1eAffFF ),(1eAffF eAff,单因子方差分析表单因子方差分析表 来源来源偏差平方和偏差平方和自由度自由度均方和均方和F比比因子因子A误差误差eSASe1 rfArnfe AAAfSMS eeefSMS eAMSMSF 总计总计T
10、ST1 nfT14各个离差平方和的计算:各个离差平方和的计算:nTyyySrimjijrimjijT2112112 r1i22i2ir1iAnTmTyymSATeSSS 其中其中 是第是第i个水平下的数据和;个水平下的数据和;T表示所有表示所有n=rm个数据的总和。个数据的总和。iT15进行方差分析的步骤如下:进行方差分析的步骤如下:(1)计算因子)计算因子A的每一水平下数据的和的每一水平下数据的和T1,T2,Tr及总和及总和T;(2)计算各类数据的平方和)计算各类数据的平方和 ;222,TTyiij (3)依次计算)依次计算ST,SA,Se;(4)填写方差分析表;)填写方差分析表;(5)对于
11、给定的显著性水平)对于给定的显著性水平,将求得的,将求得的F值与值与F分布表中的临界值分布表中的临界值 比较,当比较,当 时认为因子时认为因子A是显著的,否则认为因子是显著的,否则认为因子A是不显著的。是不显著的。eAffF,1 eAffFF,1 16对上例的分析对上例的分析(1)计算各类和:)计算各类和:每一水平下的数据和为:每一水平下的数据和为:344,444,412321 TTT数据的总和为数据的总和为T=1200(2)计算各类平方和:)计算各类平方和:原始数据的平方和为:原始数据的平方和为:1214922ijy每一水平下数据和的平方和为每一水平下数据和的平方和为 4852162 iT1
12、7(3)计算各离差平方和:)计算各离差平方和:ST=121492-12002/12=1492,fT=34-1=11SA=485216/4-12002/12=1304,fA=3-1=2Se=1492-1304=188,fe=11-2=918(4)列方差分析表:)列方差分析表:例例2.1-1的方差分析表的方差分析表 来源来源偏差平方和偏差平方和自由度自由度均方和均方和F比比因子因子A1304AS2Af652 AMSF=31.21误差误差e188eS9ef920.MSe 总计总计T1492TS11Tf19(5)如果给定如果给定 =0.05,从,从F分布表查得分布表查得 26.4)9,2(95.0 F
13、 由于由于F4.26,所以在,所以在 =0.05水平上结论是因子水平上结论是因子A是显著的。这表明不同的工厂生产的零件强度有明显是显著的。这表明不同的工厂生产的零件强度有明显的差异。的差异。当因子当因子A是显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。在单因子是显著时,我们还可以给出每一水平下指标均值的估计,以便找出最好的水平。在单因子试验的场合,第试验的场合,第i个水平指标均值的估计为:个水平指标均值的估计为:iiy ,ri,2,1 20 在本例中,三个工厂生产的零件的平均强度的的估计分别为:在本例中,三个工厂生产的零件的平均强度的的估计分别为:86,111,10332
14、1 由此可见,乙厂生产的零件的强度的均值最大,如果我们需要强度大的零件,那么购买乙厂的为由此可见,乙厂生产的零件的强度的均值最大,如果我们需要强度大的零件,那么购买乙厂的为好;而从工厂来讲,甲厂与丙厂应该设法提高零件的强度。好;而从工厂来讲,甲厂与丙厂应该设法提高零件的强度。误差方差的估计:这里方差误差方差的估计:这里方差 的估计是的估计是MSe。在本例中:。在本例中:的估计是的估计是20.9。2 2 的估计是的估计是 57.49.20 例例2.1-2 略(见教材略(见教材P92)21三、重复数不等的情况三、重复数不等的情况 若在每一水平下重复试验次数不同,假定在若在每一水平下重复试验次数不同
15、,假定在Ai水平下进行水平下进行 次试验,那么进行方差分析的步骤次试验,那么进行方差分析的步骤仍然同上,只是在计算中有两个改动:仍然同上,只是在计算中有两个改动:im imnnTmTSriiiA212 22 例例2.1-3 某型号化油器原中小喉管的结构使油耗较大,为节约能源,设想了两种改进方案以降低油耗。某型号化油器原中小喉管的结构使油耗较大,为节约能源,设想了两种改进方案以降低油耗。油耗的多少用比油耗进行度量,现在对用各种结构的中小喉管制造的化油器分别测定其比油耗,数据如表油耗的多少用比油耗进行度量,现在对用各种结构的中小喉管制造的化油器分别测定其比油耗,数据如表所列,试问中小喉管的结构(记
16、为因子所列,试问中小喉管的结构(记为因子A)对平均比油油耗的影响是否显著。(这里假定每一种结构下的)对平均比油油耗的影响是否显著。(这里假定每一种结构下的油耗服从等方差的正态分布)油耗服从等方差的正态分布)23例例2.1-3的试验结果的试验结果 水平水平试验结果(比油耗试验结果(比油耗-220)A1:原结构:原结构11.0 12.8 7.6 8.3 4.7 5.5 9.3 10.3A2:改进方案:改进方案12.8 4.5 -1.5 0.2A3:改进方案:改进方案24.3 6.1 1.4 3.6 (为简化计算,这里一切数据均减去(为简化计算,这里一切数据均减去220,不影响,不影响F比的计算及最
17、后分析因子的显著性)比的计算及最后分析因子的显著性)24(1)各水平下的重复试验次数及数据和分别为:)各水平下的重复试验次数及数据和分别为:A1:m1=8,T1=69.5A2:m2=4,T2=6.0A3:m3=4,T3=15.4总的试验次数总的试验次数n=16,数据的总和为,数据的总和为T=90.9 25(2)计算各类平方和:)计算各类平方和:41.7572 ijy07.6722 iimT43.5162 nT(3)计算各离差平方和:)计算各离差平方和:ST=757.41-516.43=240.98,fT=16-1=15SA=672.07-516.43=155.64,fA=3-1=2Se=240
18、.98-155.64=85.34,fe=15-2=1326(4)列方差分析表:)列方差分析表:例例2.1-3方差分析表方差分析表 来源来源偏差平方和偏差平方和自由度自由度均方和均方和F 比比因子因子 A64.155 AS2 Af8277.MSA 86.11 F误差误差 e34.85 eS13 ef566.MSe 总计总计 T98.240 TS15 Tf27(5)如果给定如果给定 =0.05,从,从F分布表查得分布表查得 81.3)13,2(95.0 F 由于由于F3.81,所以在,所以在=0.05水平上我们的结论是因子水平上我们的结论是因子A是显著的。这表明不同的中小喉管结构是显著的。这表明不
19、同的中小喉管结构生产的化油器的平均比油耗有明显的差异。生产的化油器的平均比油耗有明显的差异。28 我们还可以给出不同结构生产的化油器的平均比油耗的估计:我们还可以给出不同结构生产的化油器的平均比油耗的估计:69.22822069.81 50.22122050.12 85.22322085.33 这里加上这里加上220是因为在原数据中减去了是因为在原数据中减去了220的缘故。的缘故。由此可见,从比油耗的角度看,两种改进结构都比原来的好,特别是改进结构由此可见,从比油耗的角度看,两种改进结构都比原来的好,特别是改进结构1。在本例中误差方差的估计为在本例中误差方差的估计为6.56,标准差的估计为,标
20、准差的估计为2.56。29第二节第二节 回归分析回归分析 例例2.2-1 合金的强度合金的强度y与合金中的碳含量与合金中的碳含量x有关。为了生产出强度满足顾客需要的合金,在冶炼时应有关。为了生产出强度满足顾客需要的合金,在冶炼时应该如何控制碳含量?如果在冶炼过程中通过化验得到了碳含量,能否预测合金的强度?该如何控制碳含量?如果在冶炼过程中通过化验得到了碳含量,能否预测合金的强度?这时需要研究两个变量间的关系。首先是收集数据这时需要研究两个变量间的关系。首先是收集数据(xi,yi),i=1,2,n。现从生产中收集到表。现从生产中收集到表2.2-1所所示的数据。示的数据。30表表2.2-1 数据表
21、数据表 序号序号xy10.1042.020.1143.530.1245.040.1345.550.1445.060.1547.570.1649.080.1753.090.1850.0100.2055.0110.2155.0120.2360.031一、散布图一、散布图 6050400.150.200.10 xy例例2.2-1的散布图的散布图 32二、相关系数二、相关系数 1相关系数的定义相关系数的定义 在散布图上在散布图上 n 个点在一条直线附近,但又不全在一条直线上,称为两个变量有线性相关关系,可个点在一条直线附近,但又不全在一条直线上,称为两个变量有线性相关关系,可以用相关系数以用相关系数
22、r 去描述它们线性关系的密切程度去描述它们线性关系的密切程度 yyxxxyLLLr 33其中其中 nTTyxyyxxLyxiiiixy)(nTxxxLxiixx222 nTyyyLyiiyy222 iyixyTxT,34性质:性质:1 r 表示表示n个点在一条直线上,这时两个变量间完全线性相关。个点在一条直线上,这时两个变量间完全线性相关。1r r0表示当表示当x增加时增加时y也增大,称为正相关也增大,称为正相关 r0.576,说明两个变量间有(正)线性相关关系。,说明两个变量间有(正)线性相关关系。576.0)10(975.0 r38四、一元线性回归方程四、一元线性回归方程 1.一元线性回归
23、方程的求法:一元线性回归方程的求法:一元线性回归方程的表达式为一元线性回归方程的表达式为 bxay 其中其中a与与b使下列离差平方和达到最小:使下列离差平方和达到最小:2)(),(iibxaybaQ通过微分学原理,可知通过微分学原理,可知 xxxyLLb ,xbya 称这种估计为最小二乘估计。称这种估计为最小二乘估计。b 称为回归系数;称为回归系数;a一般称为常数项。一般称为常数项。39 求一元线性回归方程的步骤如下:求一元线性回归方程的步骤如下:(1)计算变量)计算变量x与与y的数据和的数据和Tx,Ty;(2)计算各变量的平方和与乘积和;)计算各变量的平方和与乘积和;(3)计算)计算Lxx,
24、Lxy;(4)求出)求出b与与a;40利用前面的数据,可得:利用前面的数据,可得:b=2.4392/0.0186=130.6022 a=590.5/12-130.6022 1.90/12=28.5297(5)写出回归方程:)写出回归方程:xy6022.1305340.28 画出的回归直线一定通过(画出的回归直线一定通过(0,a)与与 两点两点),(yx上例:上例:bxay 或或 xxbyy 412.回归方程的显著性检验回归方程的显著性检验 有两种方法:有两种方法:一是用上述的相关系数;一是用上述的相关系数;二是用方差分析方法(为便于推广到多元线性回归的场合),将总的离差平方和分解成两个部分:二
25、是用方差分析方法(为便于推广到多元线性回归的场合),将总的离差平方和分解成两个部分:回归平方和与离差平方和。回归平方和与离差平方和。42总的离差平方和:总的离差平方和:2yySiT回归平方和:回归平方和:xyiRbLyyS 2离差平方和:离差平方和:RTiiESSyyS 2且有且有ST=SR+SE,其中,其中 iibxay 它们的自由度分别为:它们的自由度分别为:fT=n-1,fR=1,fE=n-2=fT-fR 43计算计算F比,比,EERRfSfSF/对给定的显著性水平对给定的显著性水平 ,当,当 时认为回归方程是显著的,即回归方程是有意义的。一时认为回归方程是显著的,即回归方程是有意义的。
26、一般也列成方差分析表。般也列成方差分析表。)2,1(1 nFF 44对上面的例子,作方差分析的步骤如下:对上面的例子,作方差分析的步骤如下:根据前面的计算根据前面的计算(1)计算各类平方和:)计算各类平方和:ST=Lyy=335.2292,fT=12-1=11SR=bLxy=130.60222.4292=317.2589,fR=1SE=335.2292-317.2589=17.9703,fE=11-1=10 45(2)列方差分析表:)列方差分析表:例例2.2-1的方差分析表的方差分析表 来源来源 偏差平方和偏差平方和自由度自由度均方和均方和F比比回归回归317.25891317.2589 17
27、6.55残差残差17.9703101.7970T335.22921146对给定的显著性水平对给定的显著性水平 =0.05,有,有 F0.95(1,10)=4.96 由于由于F4.96,所以在,所以在0.05水平上认为回归方程是显著的(有意义的)。水平上认为回归方程是显著的(有意义的)。473利用回归方程进行预测利用回归方程进行预测 对给定的对给定的 ,y的预测值为的预测值为 0 xx 00bxay 1概率为概率为 的的y的预测区间是的预测区间是 ),(00 yy其中其中 xxLxxnnt2021112 EEfS 当当n较大,较大,与与 相差不大,那么可给出近似的预测区间,此时相差不大,那么可给
28、出近似的预测区间,此时 0 xx21 u48进行预测的步骤如下:进行预测的步骤如下:(1)对给出的)对给出的x0求预测值求预测值 上例,设上例,设x0=0.16,则,则 43.4916.06022.1305364.280 y(2)求)求 的估计的估计 上例有上例有 34.1109703.17 49(3)求)求 上例上例n=12,如果求概率为,如果求概率为95%的预测区间,那么的预测区间,那么t0.975(10)=2.228,所以,所以 11.30186.0)1583.016.0(1211228.234.12 (4)写出预测区间)写出预测区间),(00 yy上例为上例为(49.43-3.11,4
29、9.43+3.11)=(46.32,52.54)50 由于由于u0.975=1.96,故概率为,故概率为0.95的近似的预测区间为:的近似的预测区间为:63.234.196.1 所求区间:所求区间:(49.43-2.63,49.43+2.63)=(46.80,52.06)相差较大的原因总相差较大的原因总n较小。较小。51四、可化为一元线性回归的曲线回归四、可化为一元线性回归的曲线回归 在两个重复的散布图上,在两个重复的散布图上,n个点的散布不一定都在一条直线附近波动,有时可能在某条曲线附近波个点的散布不一定都在一条直线附近波动,有时可能在某条曲线附近波动,这时以建立曲线回方程为好。动,这时以建
30、立曲线回方程为好。1.确定曲线回归方程形式确定曲线回归方程形式 2.曲线回归方程中参数的估计曲线回归方程中参数的估计 通过适当的变换,化为一元线性回归的形式,再利用一元线性回归中的最小二乘估计方法获得。通过适当的变换,化为一元线性回归的形式,再利用一元线性回归中的最小二乘估计方法获得。52回归曲线的形式:回归曲线的形式:(1),(,(a0,b0)xbay11 (2),(,(b0))lg(xbay (3),(,(b0)xbay (4),(,(b0)xbay/exp100 533.曲线回归方程的比较曲线回归方程的比较 常用的比较准则:常用的比较准则:(1)要求相关指数)要求相关指数R大,其平方也称
31、为决定系数,它被定义为:大,其平方也称为决定系数,它被定义为:222)(1yyyyRiii(2)要求剩余标准差)要求剩余标准差s小,它被定义为:小,它被定义为:2n)y y(s2ii 54第三节第三节 试验设计试验设计 一、试验设计的基本概念与正交表一、试验设计的基本概念与正交表(一)试验设计(一)试验设计 多因素试验遇到的最大困难是试验次数太多,若十个因素对产品质量有影响,每个因素取两个不同多因素试验遇到的最大困难是试验次数太多,若十个因素对产品质量有影响,每个因素取两个不同状态进行比较,有状态进行比较,有210=1024、如果每个因素取三个不同状态、如果每个因素取三个不同状态310=590
32、49个不同的试验条件个不同的试验条件 55 选择部分条件进行试验,再通过数据分析来寻找好的条件,这便是试验设计问题。通过少量的试选择部分条件进行试验,再通过数据分析来寻找好的条件,这便是试验设计问题。通过少量的试验获得较多的信息,达到试验的目的。验获得较多的信息,达到试验的目的。利用正交表进行试验设计的方法就是正交试验设计。利用正交表进行试验设计的方法就是正交试验设计。56(二)正交表(二)正交表 493L试验号列号试验号列号1 12 23 34 41 11 11 11 11 12 21 12 22 22 23 31 13 33 33 34 42 21 12 23 35 52 22 23 31
33、 16 62 23 31 12 27 73 31 13 32 28 83 32 21 13 39 93 33 32 21 157 “L”表示正交表,表示正交表,“9”是表的行数,在试验中表示试验的条件数,是表的行数,在试验中表示试验的条件数,“4”是列数,在试验中表示可以安是列数,在试验中表示可以安排的因子的最多个数,排的因子的最多个数,“3”是表的主体只有三个不同数字,在试验中表示每一因子可以取的水平数。是表的主体只有三个不同数字,在试验中表示每一因子可以取的水平数。58正交表具有正交性,这是指它有如下两个特点:正交表具有正交性,这是指它有如下两个特点:(1)每列中每个数字重复次数相同。)每
34、列中每个数字重复次数相同。在表在表L9(34)中,每列有中,每列有3个不同数字:个不同数字:1,2,3,每一个出现,每一个出现3次。次。(2)将任意两列的同行数字看成一个数对,那)将任意两列的同行数字看成一个数对,那 么一切可能数对重复次数相同。么一切可能数对重复次数相同。在表在表L9(34)中,任意两列有中,任意两列有9种可能的数对:种可能的数对:(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)每一对出现一次。每一对出现一次。59常用的正交表有两大类常用的正交表有两大类(1)一类正交表的行数一类正交表的行数n,列数,列数p,水平数,水
35、平数q 间有如下关系:间有如下关系:n=qk,k=2,3,4,p=(n-1)/(q-1)如:如:L4(23),L8(27),L16(215),L32(231)等,可以考察因子间的交互作用。等,可以考察因子间的交互作用。(2)另一类正交表的行数,列数,水平数之间)另一类正交表的行数,列数,水平数之间 不满足上述的两个关系不满足上述的两个关系 如:如:L12(211),L18(37),L20(219),L36(313)等等 这类正交表不能用来考察因子间的交互作用这类正交表不能用来考察因子间的交互作用 常用正交表见附录常用正交表见附录60二、无交互作用的正交设计与数据分析二、无交互作用的正交设计与数
36、据分析 试验设计一般有四个步骤:试验设计一般有四个步骤:1.试验设计试验设计 2.进行试验获得试验结果进行试验获得试验结果 3.数据分析数据分析 4.验证试验验证试验61 例例2.3-1 磁鼓电机是彩色录像机磁鼓组件的关键部件之一,按质量要求其输出力矩应大于磁鼓电机是彩色录像机磁鼓组件的关键部件之一,按质量要求其输出力矩应大于210g.cm。某生产厂过去这项指标的合格率较低,从而希望通过试验找出好的条件,以提高磁鼓电。某生产厂过去这项指标的合格率较低,从而希望通过试验找出好的条件,以提高磁鼓电机的输出力矩。机的输出力矩。62(一)试验的设计(一)试验的设计 在安排试验时,一般应考虑如下几步:在
37、安排试验时,一般应考虑如下几步:(1)明确试验目的)明确试验目的(2)明确试验指标)明确试验指标(3)确定因子与水平)确定因子与水平 (4)选用合适的正交表)选用合适的正交表,进行表头设计,列出试验计划进行表头设计,列出试验计划 63在本例中:在本例中:试验目的:提高磁鼓电机的输出力矩试验目的:提高磁鼓电机的输出力矩 试验指标:输出力矩试验指标:输出力矩 确定因子与水平:经分析影响输出力矩的可能因确定因子与水平:经分析影响输出力矩的可能因 子及水平见表子及水平见表2.3-2 表表2.3-2 因子水平表因子水平表 因子因子水平水平一一二二三三A A:充磁量:充磁量(1010-4-4特)特)900
38、9001100110013001300B B:定位角度:定位角度(度)(度)101011111212C C:定子线圈匝数:定子线圈匝数(匝)(匝)70708080909064选表:首先根据因子的水平数,找出一类正交表选表:首先根据因子的水平数,找出一类正交表 再根据因子的个数确定具体的表再根据因子的个数确定具体的表 把因子放到表的列上去,称为表头设计把放因子的列中的数字改为因子的真实水平,便成为一张试把因子放到表的列上去,称为表头设计把放因子的列中的数字改为因子的真实水平,便成为一张试验计划表,每一行便是一个试验条件。在正交设计中验计划表,每一行便是一个试验条件。在正交设计中n个试验条件是一起
39、给出的的,称为个试验条件是一起给出的的,称为“整体设计整体设计”,并,并且均匀分布在试验空间中。且均匀分布在试验空间中。表头设计表头设计 A B C列号列号 1 2 3 465试验计划与试验结果试验计划与试验结果 因子因子试验号试验号充磁量充磁量 定位角度定位角度 定子线圈匝数定子线圈匝数T410 rad)180(匝匝试验结果试验结果 y y输出力矩输出力矩(g.cmg.cm)1 1(1)(1)900900(1)(1)1010(1)(1)70701601602 2(1)(1)900900(2)(2)1111(2)(2)80802152153 3(1)(1)900900(3)(3)1212(3)
40、(3)90901801804 4(2)(2)11001100(1)(1)1010(2)(2)80801681685 5(2)(2)11001100(2)(2)1111(3)(3)90902362366 6(2)(2)11001100(3)(3)1212(1)(1)70701901907 7(3)(3)13001300(1)(1)1010(3)(3)90901571578 8(3)(3)13001300(2)(2)1111(1)(1)70702052059 9(3)(3)13001300(3)(3)1212(2)(2)8080140140669个试验点的分布个试验点的分布 3C3C2C1A115
41、798642A2A3B1B2B367(二)进行试验,并记录试验结果(二)进行试验,并记录试验结果 在进行试验时,要注意几点:在进行试验时,要注意几点:1.除了所考察的因子外的其它条件,尽可能保持相同除了所考察的因子外的其它条件,尽可能保持相同 2.试验次序最好要随机化试验次序最好要随机化 3.必要时可以设置区组因子必要时可以设置区组因子 68(三)数据分析(三)数据分析 1.数据的直观分析数据的直观分析(1)寻找最好的试验条件)寻找最好的试验条件 在在A1水平下进行了三次试验:水平下进行了三次试验:#1,#2,#3,而在这三次试验中因子,而在这三次试验中因子B的三个水平各进行了一次试验,的三个
42、水平各进行了一次试验,因子因子C的三个水平也各进行了一次试验。的三个水平也各进行了一次试验。在在A2水平下进行了三次试验:水平下进行了三次试验:#4,#5,#6,在这三次试验中因子,在这三次试验中因子B与与C的三个水平各进行了一次试验。的三个水平各进行了一次试验。在在A3水平下进行了三次试验:水平下进行了三次试验:#7,#8,#9,在这三次试验中因子,在这三次试验中因子B与与C的三个水平各进行了一次试验。的三个水平各进行了一次试验。69 将全部试验分成三个组,那么这三组数据间的差异就反映了因子将全部试验分成三个组,那么这三组数据间的差异就反映了因子A的三个水平的差异,为此计算各组的三个水平的差
43、异,为此计算各组数据的和与平均:数据的和与平均:T1=y1+y2+y3=160+215+180=555 =T1/3=185 1T T2=y4+y5+y6=168+236+190=594 =T2/3=198 2T T3=y7+y8+y9=157+205+140=502 =T3/3=167.3 3T同理同理 对因子对因子B与与C将数据分成三组分别比较将数据分成三组分别比较 70所有计算列在下面的计算表中所有计算列在下面的计算表中 例例2.3-1直观分析计算表直观分析计算表 表头设计表头设计A AB BC C试验号试验号列号列号1 12 23 34 4y y1 11 11 11 11 1160160
44、2 21 12 22 22 22152153 31 13 33 33 31801804 42 21 12 23 31681685 52 22 23 31 12362366 62 23 31 12 21901907 73 31 13 32 21571578 83 32 21 13 32052059 93 33 32 21 1140140T T1 1555555485485555555T T2 2594594656656523523T T3 35025025105105735731T185185161.7161.71851852T198198218.7218.7174.3174.33T167.31
45、67.3170170191191R R30.730.7575716.716.771 (2)各因子对指标影响程度大小的分析)各因子对指标影响程度大小的分析 极差的大小反映了因子水平改变时对试验结果的影响大小。这里因子的极差是指各水平平均值的最极差的大小反映了因子水平改变时对试验结果的影响大小。这里因子的极差是指各水平平均值的最大值与最小值之差,譬如对因子大值与最小值之差,譬如对因子A来讲:来讲:RA=198167.3=30.7 其它的结果也列在上表中。从三个因子的极差可知因子其它的结果也列在上表中。从三个因子的极差可知因子B的影响最大,其次是因子的影响最大,其次是因子A,而因子,而因子C的影响的
46、影响最小。最小。72(3)各因子不同水平对指标的影响图)各因子不同水平对指标的影响图 从图上可以明显地看出每一因子的最好水平从图上可以明显地看出每一因子的最好水平A2,B2,C3,也可以看出每个因子对指标影响的大,也可以看出每个因子对指标影响的大小小RBRARC。CBA220205190175160900 1100 1300 10 11 12 70 80 90 RARBRC图图2.3-2 因子各水平对输出力矩的影响因子各水平对输出力矩的影响 73 由于正交表的特点,使试验条件均匀分布在试验空间中,因此使数据间具有整齐可比性,上述的直由于正交表的特点,使试验条件均匀分布在试验空间中,因此使数据间
47、具有整齐可比性,上述的直观分析可以进行。但是极差大到什么程度可以认为水平的差异确实是有影响的呢?观分析可以进行。但是极差大到什么程度可以认为水平的差异确实是有影响的呢?2.数据的方差分析数据的方差分析 要把引起数据波动的原因进行分解,数据的波动可以用离差平方和来表示。要把引起数据波动的原因进行分解,数据的波动可以用离差平方和来表示。74正交表中第正交表中第j列的离差平方和的计算公式:列的离差平方和的计算公式:nTqnTSiijj22 其中其中Tij为第为第j列第列第i水平的数据和,水平的数据和,T为数据总和,为数据总和,n为正交表的行数,为正交表的行数,q为该列的水平数为该列的水平数 该列表头
48、是哪个因子,则该该列表头是哪个因子,则该Sj即为该因子的离差平方和,譬如即为该因子的离差平方和,譬如SA=S1 正交表总的离差平方和为:正交表总的离差平方和为:nTyyySiiiiT222)(在这里有:在这里有:jjTSS75 例例2.3-12.3-1的方差分析计算表的方差分析计算表表头设计表头设计A AB BC C列号列号试验号试验号1 12 23 34 4Y Y1 11 11 11 11 11601602 21 12 22 22 22152153 31 13 33 33 31801804 42 21 12 23 31681685 52 22 23 31 12362366 62 23 31
49、12 21901907 73 31 13 32 21571578 83 32 21 13 32052059 93 33 32 21 1140140T T1 1555555485485555555536536T=1651T=1651T T2 2594594656656523523562562=310519=310519T T3 3502502510510573573553553T T1421.61421.65686.95686.9427.6427.6116.2116.2S ST T=7652.2=7652.276 第第4列上没有放因子,称为空白列。列上没有放因子,称为空白列。S4仅反映由误差造成
50、的数据波动,称为误差平方和。仅反映由误差造成的数据波动,称为误差平方和。Se=S4 利用利用 可以验证平方和的计算是否正确。可以验证平方和的计算是否正确。jjTSS77 例例2.3-12.3-1的方差分析表的方差分析表来源来源平方和平方和 S S自由度自由度 f f均方和均方和 V VF F 比比因子因子 A A1421.61421.62 2710.8710.812.2312.23因子因子 B B5686.95686.92 22843.42843.448.9448.94因子因子 C C427.6427.62 2213.8213.83.683.68误差误差 e e116.2116.22 258.