1、1 在科学试验和生产实际中,影响一事物的因素在科学试验和生产实际中,影响一事物的因素往往很多往往很多. . 例如,在药品生产中,有原料成分、原料比例如,在药品生产中,有原料成分、原料比例、温度、时间、机器设备、操作人员水平等许多例、温度、时间、机器设备、操作人员水平等许多因素,每一个因素的改变都可能影响产品的质量和因素,每一个因素的改变都可能影响产品的质量和数量数量. .在众多影响因素中,有的影响较大,有的影在众多影响因素中,有的影响较大,有的影响较小响较小. . 因此,常常需要分析哪几种因素对产品质因此,常常需要分析哪几种因素对产品质量和产量有显著影响量和产量有显著影响. .为了解决这类问题
2、,一般需为了解决这类问题,一般需要做两步工作要做两步工作. .引引 言言2n第一步是设计一个试验,使得这个试验一方面能很好地反映我们所感兴趣的因素的作用,另一方面试验的次数要尽可能地少,尽可能地节约人力、物力和时间.n其次是如何充分地利用试验结果的信息,对我们所关心的事物(因素的影响)作出合理地推断. ;n前者通常称为试验设计,后者最常用的统计方法就是方差分析.化工产品的化工产品的数量和质量数量和质量反应温度反应温度压力压力原料成分原料成分原料剂量原料剂量溶液浓度溶液浓度操作水平操作水平反应时间反应时间机器设备机器设备1 1 单因素方差分析单因素方差分析4 方差分析按影响试验指标的因素个数进行
3、方差分析按影响试验指标的因素个数进行分类,可分为分类,可分为: : 单因素方差分析单因素方差分析 双因素方差分析双因素方差分析 多因素方差分析多因素方差分析 1 实例实例例例1 灯丝的配料方案选优灯丝的配料方案选优 某灯泡厂用四种不同配料方案制成的灯丝生产了四批灯泡某灯泡厂用四种不同配料方案制成的灯丝生产了四批灯泡,在每批灯泡中随机地抽取若干个测得其使用寿命(单,在每批灯泡中随机地抽取若干个测得其使用寿命(单位:小时),所得数据如表位:小时),所得数据如表81. 试问:这四批灯丝生产的灯泡,其使用寿命有无显著差异试问:这四批灯丝生产的灯泡,其使用寿命有无显著差异?.一一 数学模型数学模型表表8
4、1 灯泡使用寿命数据表灯泡使用寿命数据表 在这个例子里,灯泡使用寿命称为试验结果或试验指在这个例子里,灯泡使用寿命称为试验结果或试验指标,试验中,除灯丝外其它条件相同,灯丝的配料方案本标,试验中,除灯丝外其它条件相同,灯丝的配料方案本身称为因素,四种配料方案称为四个水平,因此本例称为身称为因素,四种配料方案称为四个水平,因此本例称为一个因素四个水平的试验一个因素四个水平的试验.2 基本概念基本概念方差分析方差分析根据试验的结果进行分析根据试验的结果进行分析,鉴别鉴别各个有关因素对试验结果的影响程度各个有关因素对试验结果的影响程度.试验指标试验指标试验中要考察的指标试验中要考察的指标.因素因素影
5、响试验指标的条件影响试验指标的条件.因素因素可可 控控 因因 素素 不可控因素不可控因素水平水平因素所处的状态因素所处的状态.单因素试验单因素试验在一项试验中只有一个因素改变在一项试验中只有一个因素改变.多因素试验多因素试验在一项试验中有多个因素在改变在一项试验中有多个因素在改变. 在每一个水平下进行独立试验在每一个水平下进行独立试验,结果是一个随结果是一个随机变量机变量,将数据看成是来自四个总体的样本值将数据看成是来自四个总体的样本值.例例1 问题分析问题分析.,4321设总体均值分别为 倘若使用寿命无显著差异,我们就可以从中倘若使用寿命无显著差异,我们就可以从中选一种既经济又方便的配料方案
6、;如果有显著差选一种既经济又方便的配料方案;如果有显著差异,则希望选一种较优的配料方案,以便提高灯异,则希望选一种较优的配料方案,以便提高灯泡的使用寿命泡的使用寿命.检验假设检验假设进一步假设各总体均为正态变量进一步假设各总体均为正态变量,且各总体的且各总体的方差相等方差相等,但参数均未知但参数均未知.问题问题检验同方差的多个正态总体均检验同方差的多个正态总体均值是否相等值是否相等.解决方法解决方法方差分析法方差分析法,一种统计方法一种统计方法. .,:,:4321143210不全相等HH例例2设有三台机器设有三台机器, ,用来生产规格相同的铝合金薄用来生产规格相同的铝合金薄板板.取样取样,测
7、量薄板的厚度精确至千分之一厘米测量薄板的厚度精确至千分之一厘米.得结得结果如下表所示果如下表所示.铝合金板的厚度铝合金板的厚度机器机器机器机器机器机器0.2360.2380.2480.2450.2430.2570.2530.2550.2540.2610.2580.2640.2590.2670.262试验指标试验指标: 薄板的厚度薄板的厚度因素因素: 机器机器水平水平: 不同的三台机器是因素的三个不同的水平不同的三台机器是因素的三个不同的水平假定除机器这一因素外假定除机器这一因素外, 其他条件相同其他条件相同, 属于属于单因素试验单因素试验.试验目的试验目的: 考察各台机器所生产的薄板的厚度考察
8、各台机器所生产的薄板的厚度有无显著的差异有无显著的差异. 即考察机器这一因素对厚度有无即考察机器这一因素对厚度有无显著的影响显著的影响. 例例3下表列出了随机选取的下表列出了随机选取的、用于计算器的四种用于计算器的四种类型的电路的响应时间类型的电路的响应时间(以毫秒计以毫秒计).表表 电路的响应时间电路的响应时间类型类型类型类型类型类型19 1522201820 4021332716 17151826类型类型182219试验指标试验指标:电路的响应时间电路的响应时间因素因素:电路类型电路类型水平水平: 四种电路类型为因素的四个不同的水平四种电路类型为因素的四个不同的水平单因素试验单因素试验试验
9、目的试验目的:考察电路类型这一因素对响应时间有无考察电路类型这一因素对响应时间有无 显著的影响显著的影响.例例4一火箭用四种燃料一火箭用四种燃料,三种推进器作射程试验三种推进器作射程试验.每种燃料与每种推进器的组合各发射火箭两次每种燃料与每种推进器的组合各发射火箭两次,得得射程如下射程如下(以海里计以海里计).表表火箭的射程火箭的射程推进器推进器(B)B1B2B3燃料燃料(A)A1A2A3A458.252.649.142.860.158.375.871.556.241.254.150.570.973.258.251.065.360.851.648.439.240.748.741.4试验指标试验
10、指标: 射程射程因素因素: 推进器和燃料推进器和燃料水平水平: 推进器有推进器有3个个,燃料有燃料有4个个双因素试验双因素试验试验目的试验目的: : 考察推进器和燃料两因素对射程有考察推进器和燃料两因素对射程有 无显著的影响无显著的影响.数学模型数学模型 jAAAAsAjs(,21在水平在水平个水平个水平有有设因素设因素得到如下表得到如下表次独立试验次独立试验进行进行下下,)2(,), 2 , 1 jjnns.的结果的结果表表 9.4观察结果观察结果水平水平样本总和样本总和样本均值样本均值总体均值总体均值1A2AsA11X21X11nX12X22X22nXsX1sX2snsX1 T2 TsT
11、1 X2 XsX 1 2 s 假设假设;),(), 2, 1(,), 2 , 1(. 1 22221均未知均未知与与的正态总体的正态总体均值分别为均值分别为来自具有相同方差来自具有相同方差下的样本下的样本各个水平各个水平 jjjjnjjjNsjXXXsjAj . 2下的样本之间相互独立下的样本之间相互独立不同水平不同水平jA),(2 jijNX 因为因为)., 0(2 NXjij所以所以 可写成可写成那么那么表示随机误差表示随机误差记记ijijjijXX, 均未知均未知与与独立独立各各., 2, 1, 2, 1 , ), 0( ,22 jjijijijjijsjniNX单因素试验方差分析的数学
12、模型单因素试验方差分析的数学模型需要解决的问题需要解决的问题.,:,:211210不全相等不全相等ssHH 1.检验假设检验假设.,. 2221 s估计未知参数估计未知参数数学模型的等价形式数学模型的等价形式.1,11 sjjjsjjnnnn 记记总平均总平均., 2 , 1,sjjj . 02211 ssnnn .,平均的差异平均的差异平均值与总平均值与总下的总体下的总体表示水平表示水平应应的效的效水平水平jjAA 独立独立各各 . 0, 2, 1, 2, 1 , ), 0( ,12sjjjjijijijjijnsjniNX 均未知均未知与与独立独立各各., 2, 1, 2, 1 , ),
13、0( ,22 jjijijijjijsjniNX原数学模型原数学模型改写为改写为.,:,:211210不全相等不全相等ssHH 检验假设检验假设等价于等价于检验假设检验假设.,:, 0:211210不全为零不全为零ssHH 二二 统计分析统计分析1 1 假设检验假设检验 下面我们来构造检验假设下面我们来构造检验假设 用的统计量用的统计量. . 首先分析一下各个首先分析一下各个 为什么不相等?即引起为什么不相等?即引起 波动(差异)的原因是什么?这里有两个原因:波动(差异)的原因是什么?这里有两个原因:0:210sH0:210sHijXijXn其一,当假设其一,当假设 成立时,有成立时,有 ,各
14、个各个 的波动完全由重复试验中的随机误差引的波动完全由重复试验中的随机误差引起起. .n其二,当假设其二,当假设 不成时不成时, ,各,各个个 的数学期望不同,当然取值也不会一致的数学期望不同,当然取值也不会一致. 因此,我们想用一个量来刻划各个因此,我们想用一个量来刻划各个 之间之间的波动程度,并且把引起波动的两个原因区分的波动程度,并且把引起波动的两个原因区分开来,这就是方差分析的总偏差平方和分解方开来,这就是方差分析的总偏差平方和分解方法,并由此构造检验用的统计量法,并由此构造检验用的统计量. .0H),(2jijNXijX),(2jijNX0HijXijX sjniijjXnX111数
15、据的总平均数据的总平均 sjniijTjXXS112)(总偏差平方和总偏差平方和(总变差总变差) jniijjjXnX11下的样本平均值下的样本平均值水平水平jA平方和的分解平方和的分解证明证明: :定理一定理一( (平方和分解定理)平方和分解定理)在单因素方差分析模型中,平方和有如下的恒等式,AETSSS注注: :定理一的意义是将试验中的总偏差平方和定理一的意义是将试验中的总偏差平方和分解为试验随机误差的平方和与因素分解为试验随机误差的平方和与因素A A的偏的偏差平方和差平方和. . sjniijTjXXS112)( sjnijjijjXXXX112)()( sjnijsjnijijjjXX
16、XX112112)()( sjnijjijjXXXX11)(20 sjnijsjnijijTjjXXXXS112112)()(AESS sjnijijEjXXS112)(误差平方和误差平方和 sjjjsjnijAXXnXXSj12112)()(212XnXnsjjj 效应平方和效应平方和定理二定理二 在单因素方差分析模型中,有n(1) ,n(2) ,此时 .sjjjAnsSE122) 1()()(22snSE)(22snSE2)()(snSEE注注: : 定理二定理二(2)(2)没有用到假设没有用到假设 ,因此不论,因此不论 成立与否,定理二成立与否,定理二(2)(2)都成立都成立. . 0H
17、0H证明证明: :)(212XnXnESEsjjjA 212) 1 (XnXnSsjjjA)()(212XnEXEnsjjj )(22122 nnnnsjjjj2122122)1( nnnnssjjjsjjj sjjjns122)1( 0 ,独立独立与与EASS,0为真时为真时H).1(/22 sSA sjnijijEjXXS112)(,)()(1212111 snisisniiXXXX,1),()(212倍倍的样本方差的的样本方差的是是 jjnijijnNXXj ).1()(2212 jnijijnXXj (2)分布的可加性知分布的可加性知所以由所以由独立独立又由于各又由于各2, ijX),
18、)1(122 sjjEnS .),( 122 sjjEnnsnS其中其中即即 分布的性质可以得到分布的性质可以得到根据根据2 ; snSE 的自由度为的自由度为.)()(2 snSEE 定理定理三三 在单因素方差分析模型中,当假设在单因素方差分析模型中,当假设成立时,则有成立时,则有n(1 1) n(2 2) 与与 相互独立,因而相互独立,因而, , .)(22snSE0H) 1(22sSAESAS)., 1()() 1(snsFsnSsSFEA 因此,根据定理三,当假设因此,根据定理三,当假设 成立成立时,单因素方差分析模型构造的检验统计时,单因素方差分析模型构造的检验统计量为量为 (1.1
19、5) 我们把上述统计分析过程,归纳为方差分我们把上述统计分析过程,归纳为方差分析表,如表析表,如表83,由试验数据计算得由试验数据计算得 的观的观察值察值.0H(1)(1,)()AESsFF snsSnsF表表8-3 8-3 单因素试验方差分析表单因素试验方差分析表方差来源方差来源因素因素A误差误差总和总和平方和平方和自由度自由度 均方均方F比比ASESTS1 ssn 1 n1 sSSAAsnSSEE EASSF , 1,111 sjniijniijjjjXTsjXT记记,2112nTXSsjniijTj .ATESSS ,212nTnTSsjjjA n若若 ,则拒绝则拒绝 ,即认为因素,即认
20、为因素A对对试验结果的影响显著;试验结果的影响显著;n若若 , 则接受则接受 ,即认为因素,即认为因素A对试验结果的影响不显著对试验结果的影响不显著.), 1(snsFF0H0H), 1(snsFF方差分析的科学依据是什么?方差来源方差来源因素因素A误差误差总和总和平方和平方和自由度自由度均方均方F比比44360.72.1514786.96879.632225151350.8195711.5n例例5 例例1归结为检验假设(归结为检验假设( ) 解解 计算方差分析表得如下计算方差分析表得如下05. 043210:H11234:,H 不全相等n对给定的对给定的 ,查表得查表得 , 因为因为 ,所以
21、接受,所以接受 ,即这,即这4种配料方案生产的灯泡寿命之间无显著差异种配料方案生产的灯泡寿命之间无显著差异.n换句话说,配料方案对灯泡的寿命没有显著的换句话说,配料方案对灯泡的寿命没有显著的影响影响.05. 005. 3)22, 3(05. 0F)22, 3(15. 205. 0FF0H注注: :n在这个问题中,四个总体均值的点估计分别是n如果不作方差分析,只根据四个样本均值不同会做出甲种灯泡使用寿命最长的结论,但经过方差分析,发现在使用寿命上4种灯丝制成的灯泡没有显著的差别.n因此.灯泡厂在选择灯丝材料时就可以从其它方面去考虑,例如在四种灯丝材料中选择能使灯泡成本较低的材料等等.168011
22、x166222x25.163633x3 .156844x例例6设有三台机器设有三台机器,用来生产规格相同的铝合金薄用来生产规格相同的铝合金薄板板.取样取样,测量薄板的厚度精确至千分之一厘米测量薄板的厚度精确至千分之一厘米.得结得结果如下表所示果如下表所示.表表铝合金板的厚度铝合金板的厚度机器机器机器机器机器机器0.2360.2380.2480.2450.2430.2570.2530.2550.2540.2610.2580.2640.2590.2670.262.,: ,: ,05. 032113210不全相等不全相等检验假设检验假设取取 HH 解解,15, 5, 3321 nnnns.19200
23、0. 0,33053001. 0,33245001. 0 EATSSS方差分析表方差分析表方差来源方差来源因素因素A误差误差总和总和平方和平方和自由度自由度均方均方F比比0.0010533332.920.000526670.000016212140.0001920.00124533.89. 3)12, 2(92.3205. 0 FF.05. 00H下拒绝下拒绝在水平在水平各机器生产的薄板厚度有显著差异各机器生产的薄板厚度有显著差异.2 参数估计参数估计(1) 的点估计的点估计 由定理二,不论由定理二,不论 成立与否,成立与否, ,此时,此时 ,所以所以 (1.16) 是是 的无偏估计的无偏估计
24、.20H)(22snSE2)(snSEEsnSE22(2) ( )的点估计)的点估计 因为 , ,故 (1.17) 分别是 无偏估计.j,sj,21)(XEjjniijjjXnXE1.1)(XjjXj,(3) 的区间估计的区间估计 当拒绝假设 时,常常要作出总体 和 , 的均值差 的区间估计.其做法:由于 , 由于 与 独立,于是据此得均值差 = 的置信水平为 的置信区间为 (1.18)kj0H),(2jN),(2kNkj kj kjkjkjXXE)()11()(2kjkjnnXXDkjXX)(2snSE)11()()(kjEkjkjnnSXX2()()() ()11jkjkEjkXXSnst
25、 nsnnkjkj1211()()jkEjkXXtnsSnn(4) 的点估计的点估计 若拒绝 ,这意味者效应 不全为零.由于 知 (1.19) 是 的无偏估计.j0Hs,21jjXXjjj(5) 的区间估计的区间估计因为 ,所以 . 所以的 区间估计与 的区间估计一样.kjjjkj)()(kjkjkjkj例例7.95. 0)3, 2, 1(,6 2的置信区间平为估计及均值差的置信水的点中的未知参数求例jjj解解,000016. 0)(2 snSE ,242. 011 x ,253. 0 x ,011. 011 xx ,003. 022 xx .009. 033 xx ,256. 022 x .
26、262. 033 x ,1788. 2)12()(025. 0025. 0 tsnt因为因为,006. 0)11()12(025. 0 kjEnnSt的置信区间为的置信区间为的置信水平为的置信水平为所以所以95. 021 ),014. 0,026. 0()006. 0262. 0242. 0( 的置信区间为的置信区间为的置信水平为的置信水平为95. 031 ),008. 0,020. 0()006. 0256. 0242. 0( 的置信区间为的置信区间为的置信水平为的置信水平为95. 032 ).0 ,012. 0()006. 0262. 0256. 0( 小结小结1. 随机试验随机试验: 单
27、因素试验单因素试验、多因素试验多因素试验2. 单因素试验方差分析步骤单因素试验方差分析步骤(1) 建立数学模型建立数学模型;(2) 分解平方和分解平方和;(3) 研究统计特性研究统计特性;(4) 进行假设检验进行假设检验;(5) 估计未知参数估计未知参数.练习练习1 下表列出了随机选取的下表列出了随机选取的、用于计算器的四种用于计算器的四种类型的电路的响应时间类型的电路的响应时间(以毫秒计以毫秒计).表表 电路的响应时间电路的响应时间类型类型类型类型类型类型19 1522201820 4021332716 17151826类型类型182219考察电路类型这一因素对响应时间有无显著考察电路类型这
28、一因素对响应时间有无显著的影响的影响.练习练习2 抽查某地区三所小学五年级学生的身高数据抽查某地区三所小学五年级学生的身高数据如下表如下表, 试判断这三所学校学生的平均身高是否有试判断这三所学校学生的平均身高是否有显著差异显著差异 (取显著性水平为取显著性水平为 0.05)?学校学校身高数据身高数据1128.1134.1133.1138.1140.8127.42150.3147.9136.8126.0150.7155.83140.6143.1144.5143.7148.5146.450其它示例:定义定义 设随机试验下样本空间定理定理 设 为随机事件,则有. 证明证明 可以由,A B性质性质1 1 .说明说明, ,注注等等思考思考练习练习
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。