1、第二章第二章 实验结果的实验结果的统计分析方法统计分析方法方差分析法方差分析法2022-11-26第四章第四章 方差分析方差分析方差分析方差分析所要解决的问题所要解决的问题:各影响因素对结果影响程度的相对大小;各影响因素对结果影响程度的相对大小;各影响因素间是否存在相互作用;各影响因素间是否存在相互作用;实验条件如何优化。实验条件如何优化。通常称多次实验结果之间的差异为通常称多次实验结果之间的差异为变差变差,变差一般用,变差一般用偏差平偏差平方和方和表示。各因素形成的偏差平方和恰好等于总偏差平方和,表示。各因素形成的偏差平方和恰好等于总偏差平方和,即偏差平方和具有即偏差平方和具有加和性加和性,
2、这是建立方差分析的基础。,这是建立方差分析的基础。2022-11-26第四章第四章 方差分析方差分析本章内容本章内容:2.1 概述概述2.2 单因素方差分析单因素方差分析2.3 无重复两因素方差分析无重复两因素方差分析2022-11-26第四章第四章 方差分析方差分析2.1 概述概述2.1.1 基本概念基本概念(1)因素因素:表示对结果产生影响的各种条件、方式、方法等,如温度、:表示对结果产生影响的各种条件、方式、方法等,如温度、时间、酸度等。时间、酸度等。(2)水平水平:一种因素的各种不同取值状态,如温度、压力等的不同取值。:一种因素的各种不同取值状态,如温度、压力等的不同取值。(3)指标指
3、标:结果的标志,可体现为收率、产量等。:结果的标志,可体现为收率、产量等。(4)偶然误差偶然误差:因未能控制的:因未能控制的“偶然因素偶然因素”所引起的误差叫所引起的误差叫“实验误实验误差差”,即随机误差。,即随机误差。(5)系统误差系统误差:由于实验因素的变异引起实验结果的数量差异,也称为:由于实验因素的变异引起实验结果的数量差异,也称为“条件误差条件误差”。2.1.2 方法方法 把全部数据关于总体平均值的方差分解成几个部分,每一部分表示方把全部数据关于总体平均值的方差分解成几个部分,每一部分表示方差的一种来源,将各种来源的方差进行比较,判断实验各有关因素对实验差的一种来源,将各种来源的方差
4、进行比较,判断实验各有关因素对实验结果的影响大小。结果的影响大小。2022-11-26第四章第四章 方差分析方差分析【例例21】考察催化剂对收率的影响,分别用考察催化剂对收率的影响,分别用5种催化剂独立进行实验,种催化剂独立进行实验,每种催化剂测试每种催化剂测试4次,得收率如下表:次,得收率如下表:因素因素:催化剂;:催化剂;水平水平:5种种指标指标:收率:收率偶然误差偶然误差:每种催化剂下所得结果的标准差:每种催化剂下所得结果的标准差s系统误差系统误差:各催化剂下所得平均值的差异:各催化剂下所得平均值的差异催化剂催化剂12345收率收率/0.860.800.830.760.960.890.8
5、30.900.810.950.910.880.940.840.930.900.840.850.820.94平均值平均值/0.89000.83750.88000.80750.94502022-11-26第四章第四章 方差分析方差分析2.2 单因素方差分析单因素方差分析 研究单一因素对试验结果的影响。此时,方差分析的目研究单一因素对试验结果的影响。此时,方差分析的目的是考察一个因素的的是考察一个因素的m个水平对实验结果是否存在显著影响。个水平对实验结果是否存在显著影响。数学模型数学模型:xij=+ai+rij式中,式中,:总体平均值;:总体平均值;ai:i水平(水平(i=1,2,ni,ni为水平重
6、复数)对结果的影响,为水平重复数)对结果的影响,即即i水平下的水平下的系统误差系统误差;rij:随即误差(:随即误差(j=1,2,m,m为水重复平数)。为水重复平数)。该数学模型表示:该数学模型表示:实验结果总体平均值因素作用随即误差实验结果总体平均值因素作用随即误差2022-11-26第四章第四章 方差分析方差分析2.2.1 单因素方差分析基本公式单因素方差分析基本公式 设有设有m 个相互独立的正态总体个相互独立的正态总体:各个总体的方差相等:各个总体的方差相等:现从总体中抽取容量为现从总体中抽取容量为ni的随机样本:的随机样本:设设 为从第为从第i个总体抽取的样本平均值(个总体抽取的样本平
7、均值(组平均值组平均值),),为为总平均值总平均值,n为从为从m个总体中抽取的样本总容量,则:个总体中抽取的样本总容量,则:),(,),(,),(),(22222211mmiiNNNN2222221mi),2,1;,2,1(,21iinijiinjmixxxxiixxinjijiixnx11imiiminjijxnnxnxi11111miinn12022-11-26第四章第四章 方差分析方差分析样本对照表样本对照表2022-11-26第四章第四章 方差分析方差分析2.2.2 偏差平方和偏差平方和 设设Q为偏差平方和,为偏差平方和,即所有样本测定值与总体平均值之差的即所有样本测定值与总体平均值之
8、差的平方和平方和,则:,则:式中最后一项为协方差,由于:式中最后一项为协方差,由于:所以所以)(2)()()()()(11211211211211xxxxxxxxxxxxxxQiiminjijminjiiminjijiiminjijminjijiiiii injijiixxn10)()()()(111111 iinjijmiinjijmiiiiminjijxnxxxxxxxxxxxiii2022-11-26第四章第四章 方差分析方差分析令:令:则:则:Q=Qe+U1211)(iminjijexxQi2111)(xxUminjii单因素方差分析的基本关系式,说明偏差平方和具有加和性,即总单因素方
9、差分析的基本关系式,说明偏差平方和具有加和性,即总偏差平方和可以分解为具有不同来源的若干项。偏差平方和可以分解为具有不同来源的若干项。Qe为组内偏差平方和为组内偏差平方和:表示各水平下多次实验结果间的差异:表示各水平下多次实验结果间的差异。由于因素影响完全相同,所以为随机波动所致,属于。由于因素影响完全相同,所以为随机波动所致,属于随机随机误差误差。U1为组间偏差平方和为组间偏差平方和:反映各样本平均值间的差异,即在因:反映各样本平均值间的差异,即在因素不同的水平下实验结果相互间的差异,它说明了素不同的水平下实验结果相互间的差异,它说明了因素的不因素的不同水平对结果的影响同水平对结果的影响。2
10、022-11-26第四章第四章 方差分析方差分析2.2.3 方差分析统计量方差分析统计量(1)自由度)自由度令令f、fe及及 f1分别为总自由度、组内(随即误差)自由度和组间分别为总自由度、组内(随即误差)自由度和组间自由度,则:自由度,则:111nnfmiimnnfmiie)1(111 mf1fffe表明自由度具有加和性表明自由度具有加和性2022-11-26第四章第四章 方差分析方差分析(2)方差)方差令令 分别为总方差、组内方差和组间方差,则有:分别为总方差、组内方差和组间方差,则有:(3)统计量)统计量为构造统计量,先求出为构造统计量,先求出Qe、U1的期望值:的期望值:2122sss
11、e和、12nQfQsmnQfQseeee2111121mUfUs221211211)()1()()()(mnnxxExxEQEmiiinjijmiiminjijeii2mnQEe22)(esE表明,不论各总体平均值表明,不论各总体平均值1,2,i,m是否相等,是否相等,为为2的无偏估计量的无偏估计量2es2022-11-26第四章第四章 方差分析方差分析令令则可以推得:则可以推得:imiiinn112122111)()1()()(imiiminjinmxxEUEi2121)(111imiinmmUE21221)(11)(imiinmsE可见,只有当可见,只有当1=2=i=m时,时,才是才是2的
12、无的无偏估计量,否则它的期望值将大于偏估计量,否则它的期望值将大于221s2022-11-26第四章第四章 方差分析方差分析21221)(11)(imiinmsE式中,第二项表达了因素不同水平的影响,为判断因素的式中,第二项表达了因素不同水平的影响,为判断因素的 m个水平对实验结果的影响是否存在显著性差异,只需判断该个水平对实验结果的影响是否存在显著性差异,只需判断该项是否存在即可。为此,可进行项是否存在即可。为此,可进行F-检验,用如下统计量:检验,用如下统计量:)/()1/(1221mnQmUssFee若因素的若因素的m个水平对实验结果的影响不存在显著性差异,则个水平对实验结果的影响不存在
13、显著性差异,则相当于各总体均值相等。则第二项为相当于各总体均值相等。则第二项为0,有相同的期望有相同的期望值,皆为值,皆为2。此时,统计量应趋于此时,统计量应趋于1。若因素的不同水平对结果存在显著性影响,则若因素的不同水平对结果存在显著性影响,则 的期望的期望值不等,值不等,此时,统计量将明显大于此时,统计量将明显大于1。因此,可以根据因此,可以根据F的大小(与临界值比较)判断有关因素的的大小(与临界值比较)判断有关因素的不同水平对实验结果是否存在显著性影响。不同水平对实验结果是否存在显著性影响。221ess 和221ess 和2022-11-26第四章第四章 方差分析方差分析单因素方差分析的
14、程序:单因素方差分析的程序:提出原假设和备择假设:提出原假设和备择假设:原假设为原假设为H H0 0:1=2=i=m备择假设备择假设H1:各总体均值不等:各总体均值不等设原假设的前提成立:设原假设的前提成立:由已知条件计算统计量:计算偏差平方和、自由度及由已知条件计算统计量:计算偏差平方和、自由度及F F值值根据显著性水平根据显著性水平,查出,查出 ,若,若 ,原假,原假设成立;若设成立;若 ,原假设不成立,而备择假设成立,原假设不成立,而备择假设成立最后,将计算结果及结论整理成方差分析表。最后,将计算结果及结论整理成方差分析表。22221m),(,1effF),(,1effFF),(,1ef
15、fFF2022-11-26第四章第四章 方差分析方差分析单因素方差分析表单因素方差分析表211)(iminjijexxQi2022-11-26第四章第四章 方差分析方差分析【例例22】考察催化剂对收率的影响,分别用考察催化剂对收率的影响,分别用5种催化剂独立进行实种催化剂独立进行实验,每种催化剂测试验,每种催化剂测试4次,得收率如下表:次,得收率如下表:请对实验结果进行方差分析。请对实验结果进行方差分析。解:解:n=20,m=5,ni=4催化剂催化剂12345收率收率/0.860.800.830.760.960.890.830.900.810.950.910.880.940.840.930.9
16、00.840.850.820.94平均值平均值/0.89000.83750.88000.80750.94502022-11-26第四章第四章 方差分析方差分析催化剂催化剂12345总和总和收率收率/0.860.800.830.760.960.890.830.900.810.950.910.880.940.840.930.900.840.850.820.94平均值平均值/0.89000.83750.88000.80750.94503.653.353.523.233.7817.443.16982.80893.10502.61173.572615.2680injijx1injijx122022-11
17、-26第四章第四章 方差分析方差分析(1 1)偏差平方和)偏差平方和016.0)(1211112iinjijmiiminjijexnxQ04427.0)(1)(12112111minjijnjijmiiiixnxnU所以:所以:Q=Qe+U1=0.06027(2 2)自由度:)自由度:f fe e=n-mn-m=20-5=15=20-5=15 f f1 1=m=m-1=5-1=4-1=5-1=4 f=n-f=n-1=20-1=191=20-1=19(3)方差)方差011.015016.02eeefQs001106.0404427.01121fUs2022-11-26第四章第四章 方差分析方差分
18、析(4)F-检验检验06.100011.001106.0221essF查查F-分布表得:分布表得:F0.05,(4,15)=3.06F(5)结论:催化剂间有差别,且对结果影响较大。)结论:催化剂间有差别,且对结果影响较大。(6)方差分析如下表所示)方差分析如下表所示误差来源误差来源偏差平方和偏差平方和自由度自由度均方差均方差F值值F临界值临界值结论结论*组间组间0.0442740.0110610.063.06*组内组内0.01605150.0011总和总和0.06032190.003175注:用注:用*表示有影响;表示有影响;*表示影响显著;表示影响显著;*表示影响高度显著;下同表示影响高度显
19、著;下同2022-11-26第四章第四章 方差分析方差分析【例例23】某某4个实验室用典法测定一种铜合金(个实验室用典法测定一种铜合金(HPb60-1)试样中铜的)试样中铜的含量,均测定含量,均测定5次,结果如下表所示:次,结果如下表所示:实验室实验室测定结果测定结果/Cu%A66.3760.8560.5660.9260.22B60.8660.9861.0460.5360.71C60.6360.4760.8260.3960.77D61.4461.2461.6761.0461.15试分析各实验室的测定结果之间是否存在显著性差异。试分析各实验室的测定结果之间是否存在显著性差异。2022-11-26
20、第四章第四章 方差分析方差分析2.3 无重复两因素方差分析无重复两因素方差分析 单因素方差分析只研究一种因素对实验结果的影响,当单因素方差分析只研究一种因素对实验结果的影响,当可能存在多个因素对结果产生影响时,虽然可以采用可能存在多个因素对结果产生影响时,虽然可以采用“固定固定其他因素,研究变化因素其他因素,研究变化因素”的方法,对所有影响因素分别研的方法,对所有影响因素分别研究,但这种方法不仅效率低,而且往往会遗漏最好的组合。究,但这种方法不仅效率低,而且往往会遗漏最好的组合。2.3.1 无重复两因素方差分析的数学模型无重复两因素方差分析的数学模型 设因素设因素A有有a个水平,即:个水平,即
21、:A1,A2,Ai,Aa 因素因素B有有b个水平,即:个水平,即:B1,B2,Bj,BbAi,Bj作用下的实验指标为作用下的实验指标为xijk,则有:,则有:xijk=+i+j+ij+rijk 式中,式中,k为重复测定次数;为重复测定次数;ij为为Ai、Bj的交互作用;的交互作用;rijk为随为随机误差。机误差。有重复两因素方差有重复两因素方差分析的数学模型分析的数学模型2022-11-26第四章第四章 方差分析方差分析对于无重复两因素方差分析,对于无重复两因素方差分析,ij、rijk无法分辨,可合为一项,无法分辨,可合为一项,用用rij表示,相当于随机误差,则:表示,相当于随机误差,则:xi
22、j=+i+j+rij在在A、B两因素的共同作用下,得到两因素的共同作用下,得到ab个实验结果,如下表:个实验结果,如下表:无重复两因素方差分无重复两因素方差分析的数学模型析的数学模型平均值平均值平均值平均值bjBBBB21ABixabajaaibijiibjbjxxxxxxxxxxxxxxxx2121222221111211aiAAAA21xjx.bjxxxx.21.21aixxxx2022-11-26第四章第四章 方差分析方差分析无重复两因素方差分析的简化计算公式为:无重复两因素方差分析的简化计算公式为:总偏差平方和:总偏差平方和:反映随机误差的反映随机误差的偏差平方和:偏差平方和:反映因素
23、反映因素A各水各水平之间的偏差:平之间的偏差:反映因素反映因素B 各水各水平间的偏差:平间的偏差:aibjijaibjijaibjijxabxxxQ11211211)(1)(aibjijaibjijaiixabxbxxbU112211211)(1)(1).(21UUQQe211211212)(1)(1).(aibjijbjaiijbjjxabxaxxaU2022-11-26第四章第四章 方差分析方差分析无重复两因素方差分析表无重复两因素方差分析表偏差来源偏差来源偏差平偏差平方和方和自由度自由度方差方差F值值F临界值临界值显显著著性性A的影响的影响U1B的影响的影响U2随机误差随机误差Qe总和总
24、和Q11 af12bf)1)(1(bafe1 abf1121aUs1222bUs)1)(1(2baQse12abQs221eAssF 222eBssF),(,1effF),(,2effF显著性判断准则显著性判断准则:如如FA大于临界值,大于临界值,HA不成立,即因素不成立,即因素A影响显著;影响显著;如如FB大于临界值,大于临界值,HB不成立,即因素不成立,即因素B影响显著;影响显著;2022-11-26第四章第四章 方差分析方差分析【例例24】为了研究酵解作用,分别从为了研究酵解作用,分别从8位健康人体中抽取血液制成血滤位健康人体中抽取血液制成血滤液,再将每个受试者的血滤液分成液,再将每个受
25、试者的血滤液分成4份,分别放置份,分别放置0 min、45 min、90 min、135 min,测定其中血糖浓度,得到下表的数据:,测定其中血糖浓度,得到下表的数据:受试者受试者放置时间放置时间t0 min45 min 90 min 135 min1151593215148432625710418171510522181786323221147252317881512100试问试问(1)不同受试者的血糖浓度是否存在显著性差异?)不同受试者的血糖浓度是否存在显著性差异?(2)放置不同时间的血糖浓度的差异是否明显?)放置不同时间的血糖浓度的差异是否明显?2022-11-26第四章第四章 方差分析
26、方差分析受试者受试者放置时间放置时间t0 min45 min 90 min 135 min115159342540215148441501326257106814504181715106093852218178651161632322114992685725231787315078151210037469bjijx1bjijx12解:将数据简化,经初步计算得下表:解:将数据简化,经初步计算得下表:2022-11-26第四章第四章 方差分析方差分析22.1900)(1)(11211211aibjijaibjijaibjijxabxxxQ47.747)(1)(1).(112211211 aibji
27、jaibjijaiixabxbxxbU34.977)(1)(1).(211211212 aibjijbjaiijbjjxabxaxxaU偏差来源偏差来源偏差平方和偏差平方和自由度自由度方差方差F值值F临界值临界值显著性显著性受试者受试者747.477106.7812.79F0.05,(7,21)=2.49F0.05,(3,21)=3.07*放置时间放置时间977.343325.7839.01*随机误差随机误差175.41218.35综合综合1900.223161.30结论:不同受试者血糖浓度得差异是显著的;放置时间对血糖浓度的影响更为显著。结论:不同受试者血糖浓度得差异是显著的;放置时间对血糖浓度的影响更为显著。2022-11-26