1、1 因素也称为因素也称为处理处理,每,每一处理因素至少有两个一处理因素至少有两个水平水平(level)(也称(也称“处理组处理组”)。)。一个一个因素因素(水平水平间独立)间独立)单向方差分析单向方差分析 一个个体多个测量值一个个体多个测量值重复测量资料的方差分析重复测量资料的方差分析 目的:目的:用这类资料的样本信息来推断各处理组间用这类资料的样本信息来推断各处理组间多个总多个总体均数体均数的差别有无统计学意义。的差别有无统计学意义。2 方差分析的条件方差分析的条件 一、方差分析的假定条件一、方差分析的假定条件1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本
2、的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)二、方差齐性检验二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。3某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?45 ANOVA ANOVA 由英国统由英国统计学家计学家R.A.FisherR.A.Fisher首首创,为纪念创,为纪念FisherFisher,以以F F命名,故方差分析命名,故方差分析
3、又称又称 F F 检验检验 (F F testtest)。用于推断)。用于推断多多个总体均数个总体均数有无差异有无差异 6单向方差分析单向方差分析One-way analysis of variance方差分析的基本思想方差分析的基本思想 将所有测量值间的总变异总变异按照其变异的来源分解为多个部份分解为多个部份,然后进行比较,评价由某种因素某种因素所引起的变异是否具有统计学意义。7组间变异组间变异总变异总变异组内变异组内变异81.总变异总变异(Total variation):全部测量值):全部测量值Yij与与总均数总均数 间的差异间的差异 2.组间变异组间变异(between group v
4、ariation):各):各组的均数组的均数 与总均数与总均数 间的差异间的差异3.组内变异组内变异(within group variation):每组的:每组的每个测量值每个测量值Yij与该组均数与该组均数 的差异的差异下面用下面用离均差平方和离均差平方和(sum of squares of(sum of squares of deviations from meandeviations from mean,SSSS)反映变异的大小反映变异的大小 20.0Y YiYiY 1.1.总变异总变异:所有测量值之间总所有测量值之间总的变异程度,的变异程度,计算公式计算公式22111122,1)ii
5、nnaaijijijijNiji jSSYYYCYCNS 总(2211,()()inaNijijiji jYYCNN校正系数校正系数:1N总10表表4-3 44-3 4个处理组低密度脂蛋白测量值个处理组低密度脂蛋白测量值(mmol(mmol/L)/L)11/ingijijXXNdidj2212111,iinnggijijijNiji jijXCSSXXXC 总总变异总变异SSSS总总 2 2组间变异:组间变异:各组均数与总均数的各组均数与总均数的离均差平方和,离均差平方和,计算公式为计算公式为21211()()inijjaaiiiiiYSSn YYCn组间1a组间SS组间反映了各组均数 的变异
6、程度组间变异组间变异随机误差随机误差+处理因素效应处理因素效应 iY12表表4-3 44-3 4个处理组低密度脂蛋白测量值个处理组低密度脂蛋白测量值(mmol(mmol/L)/L)dj1/iniijijXXn11/ingijijXXN组间变异组间变异SSSS组间组间21211()()inijjggiiiiiXSSn XXCn组间存在组间变异的原因有:存在组间变异的原因有:随机误差随机误差(包括个体变异和测量误差包括个体变异和测量误差);处理的不同水平可能对试验结果的影响。处理的不同水平可能对试验结果的影响。21121()(1)inaijiijaiiiSSYYnS 组 内Na组内 3组内变异:在
7、同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为14表表4-3 44-3 4个处理组低密度脂蛋白测量值个处理组低密度脂蛋白测量值(mmol(mmol/L)/L)组内变异组内变异SSSS组内组内211()ingijiijSSXX 组内1/iniijijXXndjdj4.8X存在组内变异的原因有:存在组内变异的原因有:随机误差随机误差(包括个体变异和测量误差包括个体变异和测量误差);三种三种“变异变异”之间的关系之间的关系离均差平方和离均差平方和分解分解:1
8、6二、变异分解二、变异分解 11/ingijijXXN1/iniijijXXn处理效应+随机误差随机误差1处理效应+随机误差统计量处理效应随机误差0 0 均方差,均方均方差,均方(mean square,MS)二、二、F 值与值与F分布分布,19F 分布曲线分布曲线10,10215,1215,52122121122/22/12121121)(222)(FFFf20F 界值表界值表附表附表5 5 F F界值表(方差分析用,单侧界值)界值表(方差分析用,单侧界值)上行:上行:P P=0.05 =0.05 下行:下行:P P=0.01=0.01分母自由度分母自由度2 2分子的自由度,分子的自由度,1
9、 11 12 23 34 45 56 6 1 1161161200200216216225225230230234234 405240524999499954035403562556255764576458595859 2 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.33 98.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.33 25254.244.243.393.392.992.992.762.762.602.602.492.49 7.777.775.57
10、5.574.684.684.184.183.853.853.633.63 521F F 分布曲线下面积与概率分布曲线下面积与概率2223某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组,进行双盲试验。6周后测得低密度脂蛋白作为试验结果。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?24H0:即即4个试验组个试验组总体均数总体均数相等相等 H1:4个试验组个试验组总体均数总体均数不全相等不全相等 12340.052.计算检验统计量计算检验统计量:1.建立检验假设,确定检验水准建立检验假设,确定检验水准:2526表表4-5 完
11、全随机设计方差分析表完全随机设计方差分析表列方差分析表列方差分析表270.053.确定确定P值,作出推断结论:值,作出推断结论:按按 水准,拒绝水准,拒绝H0,接受,接受H1,认为,认为4个试验组个试验组ldl-c总体均数不相等,即不同剂量药总体均数不相等,即不同剂量药物对血脂中物对血脂中ldl-c降低影响有差别。降低影响有差别。28四、下结论四、下结论 注意:当组数为注意:当组数为2时,完全随机设计的方时,完全随机设计的方差分析结果与两样本均数比较的差分析结果与两样本均数比较的t检验结果等检验结果等价,对同一资料价,对同一资料,有:有:tF2930313222222111(1)ln(1)ln
12、(1)lngggciiciiiiiiSnnSnSS =g-1 式中合并方差 2211(1)(1)ggciiiiiSnSn 对于完全随机设计资料,有2cS MS组内。33按0.10水准,查2界值表得0.10(1)2g,若20.10。按0.10水准,不拒绝 H0;反之,若20.10(1)2g,则 P0.10。拒绝 H0,接受 H1。3435例4-2的方差齐性检验表 36=41=3,查 附 表 8 的2界 值 表,得0.1P分析终止。分析终止。拒绝拒绝H0,接受,接受H1,表示总体均数不全相等表示总体均数不全相等哪两两均数之间相等?哪两两均数之间相等?哪两两均数之间不等?哪两两均数之间不等?需要进一
13、步作多重比较。需要进一步作多重比较。41控制累积控制累积类错误概率增大的方法类错误概率增大的方法采用采用Bonferroni法、法、SNK法和法和Tukey法等方法法等方法42累积累积类错误的概率为类错误的概率为 当有当有k个均数需作两两比较时,比较的次数共有个均数需作两两比较时,比较的次数共有c=k!/(2!(k-2)!)=k(k-1)/2设每次检验所用设每次检验所用类错误的概率水准为类错误的概率水准为,累积,累积类错误的概率为类错误的概率为,则在对同一实验资料进行,则在对同一实验资料进行c次检次检验时,在样本彼此独立的条件下,根据概率乘法原理,验时,在样本彼此独立的条件下,根据概率乘法原理
14、,其累积其累积类错误概率类错误概率与与c有下列关系:有下列关系:1(1)c (8.6)例如,设例如,设0.05,c=3(即即k=3),其累积,其累积类错误类错误的概率为的概率为1(1-0.05)3=1-(0.95)3=0.1432k 4344LSD,ijijXXXXtS误差11ijXXijSMSnn误差式中 MSMS误差组内45L S D-t 检检 验验 公公 式式 与与 两两 样样 本本 均均数数 比比 较较 的的t 检检 验验 公公 式式 区区 别别 在在 于于 两两样样 本本 均均 数数 差差 值值 的的 标标 准准 误误ijXXS和和自自 由由 度度 的的 计计 算算 上上。注意:注意
15、:46在两样本均数比较的 t 检验公式里是用合并方差2cS来计算ijXXS,=n1+n22;LSD-t 检验是用方差分析表中的误差均方误差MS来计算ijXXS,=误差。474802.4g0:H12.4g0:H49根根 据据 例例4-2,2.4gX=2.72,0X=3.43,2.4gn=0n=30,误差MS=0.43,误误 差差=116。按按 公公 式式(4-13)和和公公式式(4-14)ijXXS=110.433030=0.17 LSD-t=2.723.430.17=4.18 以以=116,t=4.18 查查附附表表 2 的的 t 界界值值表表,得得P0.001。按按0.05水水准准,拒拒绝绝
16、 H0,接接受受 H1,有有统统计计学学意意义义。可可认认为为降降血血脂脂新新药药 2.4g 组组的的低低密密度度脂脂蛋蛋白白含含量量总总体体均均数数低低于于安安慰慰剂剂组组。500.055152式中 00iiXXXXtS0011,iXXiSMSnn误差误差iX,in为第i个实验组的样本均数和样本例数;0X,0n为对照组的样本均数和样本例数。Dunnett-误差,5354根根 据据 例例4-2,2.4gX=2.72,4.8gX=2.70,7.2gX=1.97,0X=3.43,in=0n=30,误差MS=0.43,误误 差差=116。按按公公式式(4-15)和和公公式式(4-16)2.4g2.7
17、2 3.43110.4330 30t=4.18 4.8g2.70 3.43110.4330 30t=4.29 7.2g1.97 3.43110.4330 30t=8.59 Dunnett-Dunnett-Dunnett-116误差5556四、四、BonferroniBonferroni法法方法:采用方法:采用/c作为下结论时所采用的作为下结论时所采用的检验水准。检验水准。c为两两比较次数,为两两比较次数,为累积为累积I类错误的概率。类错误的概率。12,11ihiheYYYYtNaSMSnn组内组内()57例例2 2 四个均值的四个均值的BonferroniBonferroni法比较法比较 设设
18、/c0.05/6=0.0083,由此由此t的临的临界值为界值为t(0.0083/2,20)=2.927118.528.0(:),244201122.3866(:C)0.072.9271,(:)1.3523.482.92713.402.92714.832.9.9271(:),(:),(:)1.432271.9271t A Bt At A Dt B Ct BtBDC D 同理只有有统计学意义,其他与其他各无统计组间差异学意义。58BonferroniBonferroni法的适用性法的适用性 当当比较次数不多时比较次数不多时,Bonferroni法的效法的效果较好。果较好。但当但当比较次数较多比较次
19、数较多(例如在例如在10次以上次以上)时,时,则由于其检验水准选择得过低,结论偏于保则由于其检验水准选择得过低,结论偏于保守。守。59 三、数据变换三、数据变换 改善数据的正态性或方差齐性。使之满足方差分析的假定条件。1.平方根反正弦变换适用于二项分布率(比例)数据。2.平方根变换适用于泊松分布的计数资料3.对数变换适用于对数正态分布资料XY11sinsin180XYXY或10log()XY606162H0:即即4个试验组总体均数相等个试验组总体均数相等 H1:4个试验组总体均数个试验组总体均数不全相等不全相等 检验水准检验水准 12340.05一、一、建立检验假设建立检验假设6364二、二、计算离均差平方、自由度、均方计算离均差平方、自由度、均方65三、计算三、计算F值值66