1、Analysis of Variance, ANOVAChapter 9方差分析方差分析【例例9-1】 为研究煤矿粉尘作业环境对为研究煤矿粉尘作业环境对尘肺的影响,将尘肺的影响,将24只只Wistar 大鼠随机分大鼠随机分到甲、乙、丙三个组,每组到甲、乙、丙三个组,每组8只,分别只,分别在地面办公楼、煤炭仓库和矿井下染尘,在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(周后测量大鼠全肺湿重(g)。)。案例分析案例分析甲组甲组4.23.33.74.34.13.33.54.1乙组乙组4.54.43.54.24.64.24.44.1丙组丙组5.63.64.55.14.94.74.84.
2、4表表9-1 三组大鼠的全肺湿重(三组大鼠的全肺湿重(g)请思考以下问题请思考以下问题该实验属何种设计方案?处理因该实验属何种设计方案?处理因素是什么?有几个水平?观察指素是什么?有几个水平?观察指标是什么标是什么?能否采用能否采用 t 检验比较不同作业环境检验比较不同作业环境中的大鼠全肺湿重是否有差异?中的大鼠全肺湿重是否有差异? n对于小样本多组均数的比较不能采用对于小样本多组均数的比较不能采用t检检验进行两两比较验进行两两比较n原因:原因: 割裂整体设计,只见树木,不见森林割裂整体设计,只见树木,不见森林 增大一型错误的概率增大一型错误的概率n可以采用方差分析的方法进行分析可以采用方差分
3、析的方法进行分析第一节第一节ANOVA基本思想和应用条件基本思想和应用条件 基本概念的复习基本概念的复习n方差:方差:n离均差平方和(离均差平方和(sum of square,SS):):n自由度:自由度:n均方(均方(mean square,MS):即方差):即方差1-2222nXXSNX,2XXSS1 nANOVA的概念的概念 ANOVA,变异数分析,最早由英国,变异数分析,最早由英国著名统计学家著名统计学家R.A.Fisher提出,又称提出,又称F检验,是推断两个或多个总体均数检验,是推断两个或多个总体均数是否相同的统计分析方法。是否相同的统计分析方法。ijxinixx2iS2S表表9-
4、2 三组大鼠的全肺湿重(三组大鼠的全肺湿重(g)甲组甲组乙组乙组丙组丙组合计合计观观察察值值4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.73.54.14.84.14.44.388824(N )3.81254.23754.68754.24580.16980.11700.34690.326024个观测值彼此不同总变异同一组内的观测值不同组内变异不同组间的各个观测值不同组间变异各组样本均数差异可能原因:各组样本均数差异可能原因:n随机误差随机误差:包括抽样误差、测量误差等包括抽样误差、测量误差等 即各样本来自同一总体,但由于随即各样本来自
5、同一总体,但由于随机误差使得样本均数各不相等。机误差使得样本均数各不相等。n处理因素处理因素 即不同的处理(本例为不同的作业即不同的处理(本例为不同的作业环境)引起不同的作用或效果,导致环境)引起不同的作用或效果,导致各处理组均数不同。各处理组均数不同。 1.根据实验设计类型将总变异分解;根据实验设计类型将总变异分解; 如完全随机设计:如完全随机设计:2.计算各部分的计算各部分的 和和 ;3.计算计算F值;值;4.作出统计推断。作出统计推断。 SSeTRMSMSF/间变异总变异组内变异组方差分析的基本思路 变异分解变异分解 构造检验统计量构造检验统计量 eBAT+=eBATSSSSSSSS+=
6、误差因素MSMSF = ANOVA变异的分解变异的分解n总变异(总变异(total variation) 1-N总以完全随机设计为例以完全随机设计为例/)( - /)(-)-(2211222NxCCxNxxxxSSijij总n组间变异(组间变异(variation between groups) 引起原因:引起原因:1.处理因素处理因素2.随机误差(个体差异和测量误差随机误差(个体差异和测量误差)2() 1 (9-2)iiiSSn xxk 组间组间n组内变异(组内变异(variation between groups) )-(112ijiijxxSS组内引起原因:引起原因:随机误差(个体差异和
7、测量误差随机误差(个体差异和测量误差)k-N组内三种变异及相应自由度的关系为三种变异及相应自由度的关系为 (9-4)SSSSSS总总组间组内组间组内 (9-4)SSSSSS总总组间组内组间组内构造检验统计量构造检验统计量F随机误差随机误差处理组间差异组内组间组内组内组间组间 /MSMSSSSSF1.组间无差异,理论上组间无差异,理论上F=12.若处理组间有差异,则若处理组间有差异,则F1。是否统计学。是否统计学 意义查方差分析界值表意义查方差分析界值表050PFF050PFFeTReTR.,.,),),则若则若 ( ( 统计量统计量F 服服从从 F 分布分布F 分布如果H0成立,F=MSTR/
8、MSe 1各观察值相互独立(独立性)各观察值相互独立(独立性)各样本来自正态分布总体(正态性)各样本来自正态分布总体(正态性) 各个样本的总体方差齐(方差齐性)各个样本的总体方差齐(方差齐性) ANOVA应用条件应用条件第二节第二节完全随机设计的完全随机设计的 ANOVA 完全随机设计(完全随机设计(completely random design) 又称成组设计,按随机化原则将受试又称成组设计,按随机化原则将受试对象随机分配到某一研究因素的多个水平对象随机分配到某一研究因素的多个水平中去,然后观察实验效应。其目的都是推中去,然后观察实验效应。其目的都是推断不同水平下各组均数之间的差别是否有断
9、不同水平下各组均数之间的差别是否有统计学意义。统计学意义。 2()iiin xx1kSS组间组内组间MSMS2) 1( iiiSnSSSS或组间总kNSS组内Nxx22)(表表9-3 完全随机设计方差分析计算公式完全随机设计方差分析计算公式变异来源变异来源SSMSF组间(处理)组间(处理)k-1组内(误差)组内(误差)N-k总变异总变异N-1 【检验步骤检验步骤】 1.建立检验假设,确定检验水准建立检验假设,确定检验水准 05. 0,:32113210HH不等或不全相等不等或不全相等 2.计算检验统计量计算检验统计量F值值 23124 498. 71)-(240 0.326 1)-(2总总NS
10、SS2222() 8(3.8125-4.2458)8(4.23754.2458)8(4.68754.2458) 3.063 3 12iiiSSn xx 组间组间7.4983.0634.435SSSSSS总组内组间24321组内表表9-4 方差分析结果方差分析结果变异来源SSMSFP组间3.06321.5327.2500.01组内4.435210.211总7.49823 3.确定确定P值,做出统计推断值,做出统计推断 查附表查附表7(F界值表)界值表), P0.01。按。按 水准,拒绝水准,拒绝H0,接受,接受H1,差异有,差异有统计学意义,可认为不同粉尘环境影响大统计学意义,可认为不同粉尘环境
11、影响大鼠的全肺湿重。鼠的全肺湿重。 05. 0第三节第三节随机区组设计的随机区组设计的 ANOVAjxinixx2iS2S表表9-6 39-6 3种营养素喂养小白鼠所增体重(种营养素喂养小白鼠所增体重(g g)方差分析计算表)方差分析计算表变异分解 SSSS总总 = = SSSS处理处理+SS+SS区组区组+ +SSSSe e检验统计量F 值 e区组处理总eeMSMSFMSMSF/=/=区组区组处理处理表表 9-7 随机区组设计方差分析的计算公式随机区组设计方差分析的计算公式 变异来源 SS MS F 处理组 2()iiin xx k-1 1kSS处理 误差处理MSMS 区组 2()jjjn
12、xx b-1 1bSS区组 误差区组MSMS 误差 区组处理总SSSSSS N-k-b+1 或(k-1) (b-1) 1误差N-k-bSS 总变异 Nxx22)( N-1 1NSS总 【检验步骤检验步骤】 1.建立检验假设,确定检验水准建立检验假设,确定检验水准 05. 0,:32113210HH3种营养素对小白鼠体重增加作用相同种营养素对小白鼠体重增加作用相同 不等或不全相等不等或不全相等 对于处理组:对于处理组: 【检验步骤检验步骤】 1.建立检验假设,确定检验水准建立检验假设,确定检验水准 05. 0:10HH十个区组的总体均数相等十个区组的总体均数相等 十个区组的总体均数不等或不全相等
13、十个区组的总体均数不等或不全相等 对于区组:对于区组: 【检验步骤检验步骤】 2.计算检验统计量计算检验统计量F值值 (1)计算各项离均差平方和与自由度)计算各项离均差平方和与自由度 29130 774.31431)-(30406.108 1)-(2总总NSSS2222() 10(53.400-56.293)10(55.26056.293)10(60.22056.293) 248.579 3 12iiiSSn xx 处理处理2jj222() 3(66.2767-56.293)3(55.133 56.293), 3(50.100 56.293) 2357.799 10 19jSSn xx 区组区
14、组186.537799.2357759.248744.3143区组处理总误差SSSSSSSS299218误差 【检验步骤检验步骤】 2.计算检验统计量计算检验统计量F值值 (2)计算均方与)计算均方与F值值 248.579/2124.290MS处理2357.799/9261.978MS区组537.186/1829.844MS误差124.2904.165MS29.844MSF 处理误差261.9788.778MS29.844MSF 区组误差 【检验步骤检验步骤】 2.计算检验统计量计算检验统计量F值值 (3)列方差分析表)列方差分析表 表表 9-8 例例 9-2 的方差分析表的方差分析表 变异来
15、源 SS MS F P 处理组 248.579 2 124.290 4.165 0.05 区组 2357.799 9 261.978 8.778 0.01 误差 537.186 18 总变异 3143.774 29 【检验步骤检验步骤】 3.确定确定P值,做出统计推断值,做出统计推断 查附表查附表7(F界值表)界值表), P0.05。按。按 水水准,拒绝准,拒绝H0,接受,接受H1,差异有统计学意义,可,差异有统计学意义,可认为认为3种营养素对小白鼠体重增加作用不同或不种营养素对小白鼠体重增加作用不同或不全相同。全相同。 05. 0(1)对处理组:)对处理组: 【检验步骤检验步骤】 3.确定确
16、定P值,做出统计推断值,做出统计推断 查附表查附表7(F界值表)界值表), P0.05),其余各两组间差异均),其余各两组间差异均有统计学意义(有统计学意义(P0.05 1与3 0.875 5.388 3 3.38 4.64 0.05 【检验步骤检验步骤】 3.确定确定P值,做出统计推断值,做出统计推断 q界值不但考虑自由度,而且考虑组数界值不但考虑自由度,而且考虑组数a ,即任,即任意两对比组包含的组数。意两对比组包含的组数。 05. 0 按按 水准,水准,甲组和丙组甲组和丙组的总体均数差异有的总体均数差异有统计学意义,而统计学意义,而甲组和乙组甲组和乙组、乙组和丙乙组和丙组的总体组的总体均
17、数之间差异均无统计学意义。均数之间差异均无统计学意义。 最小显著性差异(最小显著性差异(least significant difference)t 检验,用于某一对或某几对在专业上有特殊检验,用于某一对或某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组意义的均数间的比较,如多个处理组与对照组的比较,一般在设计阶段确定哪些均数需进行的比较,一般在设计阶段确定哪些均数需进行多重比较。统计量多重比较。统计量t值。值。 LSD-t检验检验 (9-11)11()ABABABxxABxxxxtSMSnn误差误差 【检验步骤检验步骤】 1.建立检验假设,确定检验水准建立检验假设,确定检验水准
18、H0:AB,即任两对比组的总体均数相等 H1:AB,即任两对比组的总体均数不等 0.05 【检验步骤检验步骤】 2.计算检验统计量计算检验统计量F值值 8BAnn0.211MS误差(1)计算差值的标准误:本例各组例数相等,故)计算差值的标准误:本例各组例数相等,故任意两组均数差值的标准误相等。任意两组均数差值的标准误相等。 (2)计算统计量)计算统计量LSD-t 值值 表表9-10 例例9-1的的LSD-t 检验计算表检验计算表 对比组 t界值 A与B ABxx t 值 (2)(3)0.2297 0.05 0.01 P (1) (2) (3) (4) (5) (6) 甲组与乙组 0.425 1.8502 2.080 2.831 0.05 甲组与丙组 0.875 3.809 2.080 2.831 0.05 【检验步骤检验步骤】 3.确定确定P值,做出统计推断值,做出统计推断 以以 =21查查 t 界值表,按界值表,按 水准,水准,除甲组和丙组的总体均数差异有统计学除甲组和丙组的总体均数差异有统计学意义外,甲组与乙组、乙组与丙组总体意义外,甲组与乙组、乙组与丙组总体均数之间差异均无统计学意义均数之间差异均无统计学意义 。 05. 0误差