1、2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组1第七章第七章方差分析与方差分析与正交试验设计初步正交试验设计初步2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组2本章重点与难点本章重点与难点n重点重点:n 是了解和掌握方差分析与正交试验设是了解和掌握方差分析与正交试验设计的思想和方法。计的思想和方法。n难点难点:n 方差分析与正交试验设计的方法。方差分析与正交试验设计的方法。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组3学习目标学习目标n 通过本章的学习,正确理解方差分通过本章的学习,正确理解方差分析与正交试验设计的思想和有关概念,析与正交
2、试验设计的思想和有关概念,了解各种方法的应用条件和范围,能够了解各种方法的应用条件和范围,能够应用软件进行有关的计算,能说明计算应用软件进行有关的计算,能说明计算结果的含义。结果的含义。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组4案案 例例 染整工艺对布的缩水率有影响吗染整工艺对布的缩水率有影响吗?n 某公司为考察染整工艺是否对布的缩水率某公司为考察染整工艺是否对布的缩水率有显著影响进行了试验。试验中采用三种染整有显著影响进行了试验。试验中采用三种染整工艺,分别对四种布样进行了处理,测得缩水工艺,分别对四种布样进行了处理,测得缩水率的百分比资料如率的百分比资料如7-1表所
3、示表所示:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组5问题:问题:n(1)如何判断染整工艺类型对缩水率是否有显著影响?如何判断染整工艺类型对缩水率是否有显著影响?若影响显著,应采用哪种工艺?若影响显著,应采用哪种工艺?n(2)如果还有一个因素如果还有一个因素B(试验配方,共三种)也对缩(试验配方,共三种)也对缩水率产生作用,应该如何选择最优方案?水率产生作用,应该如何选择最优方案?n(3)如果还有两个或者两个以上的因素也对缩水率产生如果还有两个或者两个以上的因素也对缩水率产生作用,应该如何选择最优方案?作用,应该如何选择最优方案?n 为了回答上述问题,本章将介绍单因素方差
4、分析、为了回答上述问题,本章将介绍单因素方差分析、双因素方差分析和正交试验设计法的有关概念、分析双因素方差分析和正交试验设计法的有关概念、分析思想、数学模型、方差分析表和正交试验设计的基本思想、数学模型、方差分析表和正交试验设计的基本方法等。方法等。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组6n第一节第一节 方差分析的基本思想方差分析的基本思想 n第二节第二节 单因素方差分析单因素方差分析 n第四节第四节 双因素方差分析双因素方差分析 n第四节第四节 正交试验设计初步正交试验设计初步 第七章第七章方差分析与正交试验设计初步方差分析与正交试验设计初步2022-8-9版权所有
5、版权所有 BY 统计学课程组统计学课程组7第一节第一节 方差分析的基本思想方差分析的基本思想 n一、方差分析的有关概念和基本思想一、方差分析的有关概念和基本思想 n二、显著性检验二、显著性检验2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组8一、方差分析的有关概念和基本思想一、方差分析的有关概念和基本思想 n(一)简单平均数(一)简单平均数n 方差分析(方差分析(Analysis of Variance,ANOVA)是一种检验多个总体均值是否相等的统计方法。是一种检验多个总体均值是否相等的统计方法。n 一般将方差分析研究的对象称为因素,而一般将方差分析研究的对象称为因素,而因素
6、中的内容称为水平。若方差分析同时针对因素中的内容称为水平。若方差分析同时针对两个因素进行,则称为双因素方差分析。两个因素进行,则称为双因素方差分析。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组9一、方差分析的有关概念和基本思想一、方差分析的有关概念和基本思想n 在本章案例中,缩水率就是试验指标,染整工艺在本章案例中,缩水率就是试验指标,染整工艺是所要检验的因素(又称因子),三种不同的工艺可是所要检验的因素(又称因子),三种不同的工艺可看成是该因素的三种水平,故这是一个单因素三水平看成是该因素的三种水平,故这是一个单因素三水平的试验。的试验。n 从表从表7.1可知,可知,12
7、个数据各不相同。一方面,同一个数据各不相同。一方面,同一种工艺对不同种布样的缩水率是不同的,其差异可以种工艺对不同种布样的缩水率是不同的,其差异可以看成是由于随机因素造成的;另一方面,不同工艺对看成是由于随机因素造成的;另一方面,不同工艺对各布样的缩水率也是不同的,这既可能是由于染整工各布样的缩水率也是不同的,这既可能是由于染整工艺类型不同造成的,也有可能是由于随机因素造成的。艺类型不同造成的,也有可能是由于随机因素造成的。n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组10一、方差分析的有关概念和基本思想一、方差分析的有关概念和基本思想n 要判断随机因素和工艺差别哪个是造
8、成缩水率不要判断随机因素和工艺差别哪个是造成缩水率不同的主要原因,可假设三种不同的工艺为三个不同的同的主要原因,可假设三种不同的工艺为三个不同的总体,将此问题归结为判断三个总体是否具有相同的总体,将此问题归结为判断三个总体是否具有相同的分布。又由于经常假定遇到的是正态总体,且在进行分布。又由于经常假定遇到的是正态总体,且在进行试验时,除了要检验的因素,其他条件是尽可能保持试验时,除了要检验的因素,其他条件是尽可能保持一致的,于是可以认为每个总体的方差是相同的。这一致的,于是可以认为每个总体的方差是相同的。这样一来,推断几个总体是否具有相同分布,就可以化样一来,推断几个总体是否具有相同分布,就可
9、以化为检验几个具有相同方差的正态总体均值是否相等的为检验几个具有相同方差的正态总体均值是否相等的问题。这里还要假定各水平观察值为来自正态总体的问题。这里还要假定各水平观察值为来自正态总体的随机样本,各总体相互独立且方差相同。这些假定在随机样本,各总体相互独立且方差相同。这些假定在实际中一般难以严格满足,但应对数据进行处理,使实际中一般难以严格满足,但应对数据进行处理,使其近似地满足正态分布。其近似地满足正态分布。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组11二、显著性检验n 设检验的因素有设检验的因素有m个水平,分别记为个水平,分别记为n ,在每个水平下做,在每个水平下做
10、k次试验,观察值次试验,观察值 n 表示第表示第i个水平下的第个水平下的第j个试验值。又设个试验值。又设 n 是是m个相互独立且方差相等的正态总个相互独立且方差相等的正态总体,体,的总体均值的总体均值 ,则方差分析,则方差分析实际上就是要检验假设:实际上就是要检验假设:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组12n令令n=mkn通常称通常称 为组平均数,称为组平均数,称 为总平均数。为总平均数。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组13平方和分解公式:平方和分解公式:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组14n 称为总
11、离差平方和,它是描述所有数值离散程称为总离差平方和,它是描述所有数值离散程度的数量指标。度的数量指标。n 称为组内平方和或误差平方和,是观察值与组称为组内平方和或误差平方和,是观察值与组内平均数之差的平方和,它反映了组内(即在同一水内平均数之差的平方和,它反映了组内(即在同一水平之下)样本的随机波动。平之下)样本的随机波动。n 的自由度的自由度 ,其组内方差为,其组内方差为 。n 称为组间平方和,是组内平均数与总平均数之差称为组间平方和,是组内平均数与总平均数之差的平方和,它反映了因素水平的不同及随机因素引起的平方和,它反映了因素水平的不同及随机因素引起的差异。的差异。的自由度的自由度 ,其组
12、间方差为,其组间方差为n 。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组15n 由平方和分解公式可知,由平方和分解公式可知,与与 的比值的比值反映两种差异的大小,比值越大,说明由于因反映两种差异的大小,比值越大,说明由于因素水平不同引起的差异越显著。根据统计推断素水平不同引起的差异越显著。根据统计推断的有关定理和推论,统计量的有关定理和推论,统计量n因此,因此,F作为检验作为检验 是否成立的检验统计量。是否成立的检验统计量。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组16n 对于给定的显著性水平对于给定的显著性水平,由,由F分布表可查分布表可查出相应自由
13、度的临界值出相应自由度的临界值 。如果,。如果,则则拒绝原假设拒绝原假设 ,此时说明因素,此时说明因素A对试验指标起对试验指标起显著影响;如果显著影响;如果 ,则接受原假设,则接受原假设 ,此,此时说明因素时说明因素A的不同水平对试验指标的影响不的不同水平对试验指标的影响不显著。显著。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组17第二节第二节 单因素方差分析单因素方差分析一、各水平试验次数相等的方差分析一、各水平试验次数相等的方差分析 试验次数相等的单因素方差分析的具体步试验次数相等的单因素方差分析的具体步骤:骤:1建立假设建立假设2022-8-9版权所有版权所有 BY
14、统计学课程组统计学课程组182计算有关均值及平方和计算有关均值及平方和2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组19在表在表7.1中增加若干计算栏,计算有关均值,如表中增加若干计算栏,计算有关均值,如表7.3所示。所示。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组202022-8-9版权所有版权所有 BY 统计学课程组统计学课程组213列方差分析表列方差分析表2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组22对于本章案例,方差分析表如表对于本章案例,方差分析表如表7.5所示:所示:2022-8-9版权所有版权所有 BY 统计学课程组统
15、计学课程组234统计决策统计决策n 对于显著性水平对于显著性水平 ,检验,检验统计量统计量 ,说明不同工艺方法的,说明不同工艺方法的差异显著。又由于差异显著。又由于 ,故第一种故第一种工艺方法(即工艺方法(即 )对布料缩水率的影响显著小)对布料缩水率的影响显著小于其他方法,应予采用。于其他方法,应予采用。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组24二、试验次数不等的方差分析n试验中,有时各水平下的试验次数不相等,如表试验中,有时各水平下的试验次数不相等,如表7.6所所示:示:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组25试验次数不等的单因素方差分析
16、的计算步骤与试试验次数不等的单因素方差分析的计算步骤与试验次数相等的完全一样,只是将验次数相等的完全一样,只是将K改为改为 即可。即可。n 例例7.1 为了对几个行业的服务质量进行评价,某市为了对几个行业的服务质量进行评价,某市消费者协会对该地的旅游业、居民服务业、公路客运消费者协会对该地的旅游业、居民服务业、公路客运业和保险业分别抽取了不同数量的企业。每个行业中业和保险业分别抽取了不同数量的企业。每个行业中的这些企业在服务内容、服务对象、企业规模等方面的这些企业在服务内容、服务对象、企业规模等方面基本相同。经统计,最近一年消费者对这基本相同。经统计,最近一年消费者对这23家企业投家企业投诉的
17、次数资料如表诉的次数资料如表7-7所示,消费者协会想知道所示,消费者协会想知道:这几个这几个行业之间的服务质量是否有显著差异?如果有,究竟行业之间的服务质量是否有显著差异?如果有,究竟是在哪些行业之间?如果能找出哪些行业的服务质量是在哪些行业之间?如果能找出哪些行业的服务质量最差,就可以建议对消费者权益保护法中该行业的某最差,就可以建议对消费者权益保护法中该行业的某些条款作出修正。些条款作出修正。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组262022-8-9版权所有版权所有 BY 统计学课程组统计学课程组27n解解(1)建立假设建立假设 n 不全相等不全相等 n(2)计算
18、有关均值及平方和计算有关均值及平方和n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组28n(3)列方差分析表列方差分析表(表表7-8)2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组29n(4)统计决策统计决策n对于显著性水平对于显著性水平 n由于检验统计量由于检验统计量 ,所以拒绝,所以拒绝原假设原假设 ,即有,即有95%的把握认为不同的行业的把握认为不同的行业之间投诉的差异显著。之间投诉的差异显著。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组30Excel中方差分析的计算步骤中方差分析的计算步骤n(1)点击点击“工具工具”栏中的数据分
19、析项;栏中的数据分析项;n(2)在分析工具框中连击在分析工具框中连击“单因素方差分析单因素方差分析”;n(3)在对话框的在对话框的“数据区域数据区域”框中键入框中键入A3:C6;n在在框中保持框中保持0.05不变(也可根据需要变为不变(也可根据需要变为0.01););n在在“输出选项输出选项”中键入中键入D3;n选择选择“确定确定”,输出结果如表,输出结果如表7-9所示:所示:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组31由于由于P=0.0207150.05,故拒绝原假设,即有,故拒绝原假设,即有95%的把握认为三种染整工艺缩水率的差异是显著的。的把握认为三种染整工艺缩水
20、率的差异是显著的。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组32三、方差分析中的多重比较n最小显著差异法最小显著差异法 的基本步骤为:的基本步骤为:n第一步:提出原假设:第一步:提出原假设:n第二步:计算各检验统计量的第二步:计算各检验统计量的 值;值;n第三步:计算第三步:计算LSD,其公式为:,其公式为:n第四步:根据显著性水平进行决策:如果第四步:根据显著性水平进行决策:如果n 的值,则拒绝的值,则拒绝 ;否则,则接受;否则,则接受 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组33对于例对于例7.1,对四个行业的均值进行多重比较,对四个行业的均值
21、进行多重比较(=0.05)n由题意及计算可知,由题意及计算可知,n第一步:提出假设第一步:提出假设2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组342022-8-9版权所有版权所有 BY 统计学课程组统计学课程组352022-8-9版权所有版权所有 BY 统计学课程组统计学课程组36第四步:进行决策第四步:进行决策2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组37第三节第三节 双因素方差分析双因素方差分析n一、无交互作用的双因素方差分析一、无交互作用的双因素方差分析n 若记一因素为因素A,另一因素为因素B,对A与B同时进行分析,就属于双因素方差分,即判断是否
22、有某一个或两个因素对试验指标有显著影响,两个因素结合后是否有新效应。在统计学中将各个因素的不同水平的搭配所产生的新的影响称为交互作用。我们先讨论无交互作用的双因素方差分析问题,对于有交互作用的双因素方差分析问题稍后再讨论。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组38n 假定因素假定因素A有有r个水平:个水平:;因素;因素B有有s个水平:个水平:。在。在A的的r个水平与个水平与B的的s个水个水平的每种组合下作一次试验,可得无交互作用平的每种组合下作一次试验,可得无交互作用的双因素方差分析的数据结构如表的双因素方差分析的数据结构如表7-10所示:所示:2022-8-9版权所
23、有版权所有 BY 统计学课程组统计学课程组39表表7-10 双因素方差分析的数据结构双因素方差分析的数据结构2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组40n在表在表7-10中:中:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组41n判断因素判断因素A的影响是否显著等价于检验假设:的影响是否显著等价于检验假设:n判断因素判断因素B的影响是否显著等价于检验假设:的影响是否显著等价于检验假设:n其中,其中,表示表示A的第的第i个水平所构成的总体均值,个水平所构成的总体均值,表示的表示的B第第j个水平所构成的总体均值。个水平所构成的总体均值。2022-8-9版权
24、所有版权所有 BY 统计学课程组统计学课程组42n 对离差总平方和进行分解。与单因素情况对离差总平方和进行分解。与单因素情况类似,能够证明下列公式成立:类似,能够证明下列公式成立:n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组43n由数理统计可以证明:当由数理统计可以证明:当 时时 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组442022-8-9版权所有版权所有 BY 统计学课程组统计学课程组452022-8-9版权所有版权所有 BY 统计学课程组统计学课程组46表表7-11 双因素(无交互作用)方差分析表双因素(无交互作用)方差分析表 2022-8-
25、9版权所有版权所有 BY 统计学课程组统计学课程组47n 例例7.2 为提高某种产品的合格率,考察原为提高某种产品的合格率,考察原料用量和来源地对其是否有影响。原料来源地料用量和来源地对其是否有影响。原料来源地有三个:甲、乙、丙;原料用量有三种:现有有三个:甲、乙、丙;原料用量有三种:现有量、增加量、增加5%、增加、增加8%。每个水平组合各作一。每个水平组合各作一次试验,得到的数据如表次试验,得到的数据如表7-12所示。试分析原所示。试分析原料用量和来源地对产品合格率的影响是否显著?料用量和来源地对产品合格率的影响是否显著?2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组48表
26、表7-12 产品合格率数据产品合格率数据2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组49n解解:(1)建立假设建立假设n(2)计算相应的均值和平方和:计算相应的均值和平方和:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组50(3)列方差分析表列方差分析表2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组51(4)统计决策统计决策n对于显著性水平对于显著性水平 =0.05,查表得临界值,查表得临界值n因为因为 n即根据现有数据,有即根据现有数据,有95%的把握可以推断原料来源地对的把握可以推断原料来源地对产品合格率的影响不大,而原料用量对合格率
27、有显著影产品合格率的影响不大,而原料用量对合格率有显著影响。响。n由于由于 为最优水平。既然原料来源地对产为最优水平。既然原料来源地对产品合格率的影响不显著,在保证质量的前提下,可以选品合格率的影响不显著,在保证质量的前提下,可以选择运费最省的地方作为原料来源地选择时的首选。如果择运费最省的地方作为原料来源地选择时的首选。如果丙地的运费最省,则最优方案为丙地的运费最省,则最优方案为 。n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组52Excel应用应用n以例以例7.2为例,设数据输入到为例,设数据输入到Excel工作表的区域为工作表的区域为A2:C4,再按以下步骤进行:,
28、再按以下步骤进行:n(1)点击点击“工具工具”栏中的数据分析项。栏中的数据分析项。n(2)分析工具框中连击分析工具框中连击“方差分析:无重复的双因素方方差分析:无重复的双因素方差分析差分析”。n(3)在对话框的在对话框的“数据区域数据区域”框中键入框中键入B3:D5;n在框中保持在框中保持0.05不变(也可根据需要变为不变(也可根据需要变为0.01););n在在“输出选项输出选项”中键入中键入E2;n选择选择“确定确定”,输出结果如表,输出结果如表7-14所示:所示:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组53表表7-14 无重复双因素分析方差分析结果无重复双因素分析方
29、差分析结果2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组54二、有交互作用的双因素方差分析2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组55表表7-15 有交互作用的双因素方差分析数据结构有交互作用的双因素方差分析数据结构2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组562022-8-9版权所有版权所有 BY 统计学课程组统计学课程组572022-8-9版权所有版权所有 BY 统计学课程组统计学课程组58n对这一模型可设如下三个假设:对这一模型可设如下三个假设:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组593方差分析方
30、差分析n与单因素方差分析的平方和分解类似,有与单因素方差分析的平方和分解类似,有 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组602022-8-9版权所有版权所有 BY 统计学课程组统计学课程组612022-8-9版权所有版权所有 BY 统计学课程组统计学课程组62表表7.16 双因素(有交互作用)方差分析表双因素(有交互作用)方差分析表2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组63n 例例7.3 某公司想将橡胶、塑料和软木的板某公司想将橡胶、塑料和软木的板材冲压成密封垫片出售。市场上有两种不同型材冲压成密封垫片出售。市场上有两种不同型号的冲压机可供选
31、择。为了能对冲压机每小时号的冲压机可供选择。为了能对冲压机每小时所生产的垫片数进行比较,并确定哪种机器使所生产的垫片数进行比较,并确定哪种机器使用何种材料生产垫片的能力更强,该公司使用用何种材料生产垫片的能力更强,该公司使用每台机器对每一种材料分别运行三段时间,得每台机器对每一种材料分别运行三段时间,得到的试验数据(每小时生产的垫片数)如表到的试验数据(每小时生产的垫片数)如表7-16所示,试运用方差分析确定最优方案。所示,试运用方差分析确定最优方案。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组642022-8-9版权所有版权所有 BY 统计学课程组统计学课程组65n解解n
32、(1)建立假设:建立假设:n(2)计算相应的均值和平方和:计算相应的均值和平方和:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组662022-8-9版权所有版权所有 BY 统计学课程组统计学课程组67(3)列方差分析表(列方差分析表(7-19)2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组68n(4)统计决策统计决策n由于由于 ,说明不仅冲压机说明不仅冲压机的型号和垫片材料对垫片数量有显著影响,而的型号和垫片材料对垫片数量有显著影响,而且其交互作用也是显著的。由结构均值表可知,且其交互作用也是显著的。由结构均值表可知,在冲压机中在冲压机中,第一种的均值较大;
33、垫片材料中第一种的均值较大;垫片材料中,木的均值较大,故最优方案是木的均值较大,故最优方案是 。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组69有交互作用的双因素方差分析中的有交互作用的双因素方差分析中的Excel应用应用 n以例以例7.3为例,将数据输入到为例,将数据输入到Excel工作表的区域为工作表的区域为B2:D7,冲压机的二个水平,冲压机的二个水平A1、A2在第一列,垫片材在第一列,垫片材料的水平料的水平B1、B2、B3在第一行。再按以下步骤进行:在第一行。再按以下步骤进行:n(1)点击点击“工具工具”栏中的数据分析项。栏中的数据分析项。n(2)分析工具框中连击分
34、析工具框中连击“方差分析:可重复双因素方差方差分析:可重复双因素方差分析分析”。n(3)在对话框的在对话框的“数据区域数据区域”框中键入框中键入A1:D7;在;在“每每一样本的行数一样本的行数”框中键入框中键入3。n在框中保持在框中保持0.05不变(也可根据需要变为不变(也可根据需要变为0.01););n在在“输出选项输出选项”中键入空白地方,如中键入空白地方,如F2;n选择选择“确定确定”,输出结果如表,输出结果如表7-20所示:所示:2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组702022-8-9版权所有版权所有 BY 统计学课程组统计学课程组712022-8-9版权所
35、有版权所有 BY 统计学课程组统计学课程组72第四节第四节 正交试验设计初步正交试验设计初步一、试验设计的概念和设计原则一、试验设计的概念和设计原则n试验设计有三个基本原则:重复性、随机化和区组化。试验设计有三个基本原则:重复性、随机化和区组化。n(1)重复性原则:重复性是指对一项试验要在相同的条重复性原则:重复性是指对一项试验要在相同的条件下重复进行若干次。只有进行多次的试验,才能掌件下重复进行若干次。只有进行多次的试验,才能掌握其规律性。握其规律性。n(2)随机化原则:随机化是指试验材料和试验地点都要随机化原则:随机化是指试验材料和试验地点都要随机地确定。这样进行试验得出的结论才具有客观性
36、随机地确定。这样进行试验得出的结论才具有客观性和普遍性,且每次进行的试验都可认为是相互独立的。和普遍性,且每次进行的试验都可认为是相互独立的。n(3)区组化原则:一组试验,试验者总希望在相同或近区组化原则:一组试验,试验者总希望在相同或近似相同的条件下进行,以便在相互比较中得出正确的似相同的条件下进行,以便在相互比较中得出正确的结论。结论。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组73在安排试验时需要注意三点:在安排试验时需要注意三点:n第一、尽量减少试验误差。在试验时,要尽可能使对第一、尽量减少试验误差。在试验时,要尽可能使对试验产生影响的其他因素达到理论中要求的精确程
37、度,试验产生影响的其他因素达到理论中要求的精确程度,这样我们在对目的指标进行测算时才能达到较为客观这样我们在对目的指标进行测算时才能达到较为客观的结果。在一项试验中误差是必然存在的,我们的目的结果。在一项试验中误差是必然存在的,我们的目的就是要尽量减少该误差。的就是要尽量减少该误差。n第二、尽量减少试验次数。试验的次数越多,进行试第二、尽量减少试验次数。试验的次数越多,进行试验所耗费的人力、物力也就会相应地增多,最佳的试验所耗费的人力、物力也就会相应地增多,最佳的试验就是用尽可能少的费用来获得最有效的试验结果。验就是用尽可能少的费用来获得最有效的试验结果。n第三、所设计的试验要便于对指标值进行
38、统计分析。第三、所设计的试验要便于对指标值进行统计分析。影响一个事件的指标是多样的,在进行设计时要选择影响一个事件的指标是多样的,在进行设计时要选择比较容易测算且对事件影响较大的指标进行计算。比较容易测算且对事件影响较大的指标进行计算。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组74n 在现实问题中,影响试验指标的因素通常有很多在现实问题中,影响试验指标的因素通常有很多个,要考察它们就涉及多因子的试验设计问题。多因个,要考察它们就涉及多因子的试验设计问题。多因子试验中一个很困难的问题就是因子数较多,而又需子试验中一个很困难的问题就是因子数较多,而又需要进行多次的试验。例如,
39、有要进行多次的试验。例如,有10个因子对某一指标有个因子对某一指标有显著影响,而每个因子取两个水平进行比较,那么就显著影响,而每个因子取两个水平进行比较,那么就有有210=1024个不同的水平组合,即每个水平组合作一个不同的水平组合,即每个水平组合作一次试验,就需要进行次试验,就需要进行1024次试验,耗费的人力、财力次试验,耗费的人力、财力可想而知,这在实际中是不可行的。因此,需要按照可想而知,这在实际中是不可行的。因此,需要按照一定的方法从中选择一部分进行试验。常用的试验设一定的方法从中选择一部分进行试验。常用的试验设计方法有正交试验设计法、参数设计法、回归设计法、计方法有正交试验设计法、
40、参数设计法、回归设计法、均匀设计法、混料设计法等。限于篇幅,这里仅介绍均匀设计法、混料设计法等。限于篇幅,这里仅介绍正交试验设计的基础知识,其他方法请读者自行阅读正交试验设计的基础知识,其他方法请读者自行阅读试验设计的有关书籍。试验设计的有关书籍。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组75二、多因子试验问题二、多因子试验问题n 在多因子试验中,各因子又有不同的水平在多因子试验中,各因子又有不同的水平数,我们的目的是要从这些因子不同的水平组数,我们的目的是要从这些因子不同的水平组合中,找出一组或几组组合使所要求的指标达合中,找出一组或几组组合使所要求的指标达到最优。下面
41、以一个二因子的例子来具体认识到最优。下面以一个二因子的例子来具体认识一下多因子试验问题。一下多因子试验问题。n例例7.4 为提高合金钢的强度,同时考虑碳为提高合金钢的强度,同时考虑碳(C)含含量量(因子因子)及钛及钛(Ti)与铝与铝(AL)的含量的含量(因子因子)对强度对强度Y的影响,希望找出最佳的含量组合,使强度的影响,希望找出最佳的含量组合,使强度Y达到最大(表达到最大(表7-21)。)。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组76表表7-21 合金钢的试验数据合金钢的试验数据2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组772022-8-9版权所
42、有版权所有 BY 统计学课程组统计学课程组78三、交互作用三、交互作用n 一个因子的水平好坏或好坏的程度受另一一个因子的水平好坏或好坏的程度受另一个因子水平制约的情况,称为因子个因子水平制约的情况,称为因子A和和B的交的交互作用,记作互作用,记作 或或AB。n 因子因子A和和B的交互作用可以用图形较为直的交互作用可以用图形较为直观地表示。观地表示。n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组792022-8-9版权所有版权所有 BY 统计学课程组统计学课程组80n 因子间的交互作用会随着因子个数的增加而增加。因子间的交互作用会随着因子个数的增加而增加。如四个因子如四个因
43、子A,B,C,D间的交互作用有以下几类:间的交互作用有以下几类:n(1)二级交互作用有二级交互作用有6个:个:AB,AC,AD,BC,BD,CD;n(2)三级交互作用有三级交互作用有4个:个:ABC,ABD,ACD,BCD;n(3)四级交互作用有四级交互作用有1个:个:ABCD。n 交互作用共有交互作用共有11个,比因子个数还多。实践经验表个,比因子个数还多。实践经验表明,多数交互作用是不存在或者很小以至可以忽略不明,多数交互作用是不存在或者很小以至可以忽略不计的,一般我们主要考虑部分二级交互作用,但具体计的,一般我们主要考虑部分二级交互作用,但具体考察哪些二级交互作用还要根据下面的方法来决定
44、。考察哪些二级交互作用还要根据下面的方法来决定。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组81四、正交表及其类型四、正交表及其类型n 正交试验设计法是利用正交表科学地挑选试验条正交试验设计法是利用正交表科学地挑选试验条件,合理安排试验的方法,是研究与处理多因素试验件,合理安排试验的方法,是研究与处理多因素试验的一种科学方法。的一种科学方法。n 正交设计有两个重要的特点:(正交设计有两个重要的特点:(1)任意一对因子)任意一对因子(也称因素)的任一水平组合必在试验中出现,且出(也称因素)的任一水平组合必在试验中出现,且出现的次数相同;(现的次数相同;(2)总试验次数比全面试
45、验(所有因)总试验次数比全面试验(所有因子的任一水平组合都进行搭配)要少许多次。例如,子的任一水平组合都进行搭配)要少许多次。例如,对对7个二水平因子进行全面试验要进行个二水平因子进行全面试验要进行27=128次,而用次,而用正交表安排试验只需要作正交表安排试验只需要作8次。用正交表合理地安排试次。用正交表合理地安排试验,可以做到省时、省力、省钱,还能得到令人满意验,可以做到省时、省力、省钱,还能得到令人满意的检验效果,因此这种方法在改进产品质量、研究采的检验效果,因此这种方法在改进产品质量、研究采用新工艺、试制新产品、了解设备工艺性能以及改进用新工艺、试制新产品、了解设备工艺性能以及改进技术
46、管理等方面都有广泛的应用。技术管理等方面都有广泛的应用。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组821正交表及其特性正交表及其特性n 正交表是正交设计的工具,是运用组合数正交表是正交设计的工具,是运用组合数学理论在正交拉丁方的基础上构造的一种规格学理论在正交拉丁方的基础上构造的一种规格化表格,符号为:化表格,符号为:n其中,其中,L为正交表符号;为正交表符号;n n为正交表的行数为正交表的行数(试验次数,试验方案数试验次数,试验方案数);n j为正交表中每一列因子的水平个数;为正交表中每一列因子的水平个数;n i为正交表的列数为正交表的列数(试验因子的个数试验因子的个数
47、)。n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组832022-8-9版权所有版权所有 BY 统计学课程组统计学课程组842022-8-9版权所有版权所有 BY 统计学课程组统计学课程组85n 正交表具有正交性,这是指它有如下两个正交表具有正交性,这是指它有如下两个特征:特征:n(1)每列中不同的数字重复的次数相同。在)每列中不同的数字重复的次数相同。在表表7.22中,每列有两个不同的数字:中,每列有两个不同的数字:1,2,每,每一个各出现一个各出现4次。次。n(2)将任意两列的同行数字看成一个数对,)将任意两列的同行数字看成一个数对,那么任意可能数对重复的次数相等。在那
48、么任意可能数对重复的次数相等。在 中,中,任意两列有任意两列有4种可能数对:种可能数对:(1,1),(1,2),(2,1),(2,2),每一对各出现,每一对各出现2次。次。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组862正交表的分类正交表的分类2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组87五、无交互作用情况下的设计五、无交互作用情况下的设计n正交表安排试验的步骤如下:正交表安排试验的步骤如下:n(1)明确试验目的,确定要考察的试验指标。明确试验目的,确定要考察的试验指标。n(2)确定要考察的因子和因子的水平。确定要考察的因子和因子的水平。n(3)选用
49、合格的正交表,进行表头设计。选用合格的正交表,进行表头设计。n(4)根据试验号的安排进行试验,并记录试验指标根据试验号的安排进行试验,并记录试验指标的具体数据。的具体数据。n(5)数据分析。对一个正交表形式的试验设计通常数据分析。对一个正交表形式的试验设计通常有三种分析方法:一是用极差分析各因子对指标影响有三种分析方法:一是用极差分析各因子对指标影响程度的大小,这是一种较为简单的直观分析方法;二程度的大小,这是一种较为简单的直观分析方法;二是用方差分析进行数据分析;三是贡献率分析法。是用方差分析进行数据分析;三是贡献率分析法。2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组88
50、n例例7.5 某化工厂生产的一种产品的收率较低,某化工厂生产的一种产品的收率较低,为此希望通过试验提高收率。在试验中考察如为此希望通过试验提高收率。在试验中考察如下三个因子三个水平(表下三个因子三个水平(表7-23):):n表表7-23 因子水平表因子水平表n 2022-8-9版权所有版权所有 BY 统计学课程组统计学课程组89n解解n 由于所考察的因子是三水平的,因此选用由于所考察的因子是三水平的,因此选用三水平正交表,又现在只考察三个因子,故选三水平正交表,又现在只考察三个因子,故选择择 安排试验。安排试验。n 选定了正交表后把因子放在正交表的列上选定了正交表后把因子放在正交表的列上去,称