1、方差分析方差分析(续)第四节第四节 两因素资料的方差分析两因素资料的方差分析两因素资料的方差分析,又称为双向分组资料的方两因素资料的方差分析,又称为双向分组资料的方差分析差分析很多情况下,我们需要设计两种不同的因素同时作很多情况下,我们需要设计两种不同的因素同时作用于供试动物用于供试动物或在考虑某一因素对供试动物产生影响的同时,还或在考虑某一因素对供试动物产生影响的同时,还需要考虑不同的环境情况需要考虑不同的环境情况这样,当试验结束后,数据的分析就必须进行两因这样,当试验结束后,数据的分析就必须进行两因素(或称双向分类资料)的方差分析素(或称双向分类资料)的方差分析同时考虑的这两个因素,我们分
2、别称之为因素同时考虑的这两个因素,我们分别称之为因素 A 和和因素因素 B,他们各有,他们各有 a个水平和个水平和 b个水平个水平有时候,因素有时候,因素 A 和因素和因素 B 是同等重要的是同等重要的有时候,因素有时候,因素 B 是为了从总变异中分剖出环境因素是为了从总变异中分剖出环境因素而特意设置的而特意设置的在设计时,因素在设计时,因素 A 和因素和因素 B 相互交叉,形成相互交叉,形成 ab 个个组合组合即:即:A 因素的每一个水平包含了因素的每一个水平包含了 B因素的所有水平因素的所有水平B 因素的每一个水平也包含了因素的每一个水平也包含了 A 因素的所有水平因素的所有水平即:即:A
3、 因素的各个水平与因素的各个水平与 B 因素的各个水平相逢一因素的各个水平相逢一次,也只相逢一次次,也只相逢一次例如:例如:A 因素有因素有 5个水平,个水平,B 因素有因素有 4个水平,形个水平,形成成54=20个组合个组合根据每一个组合内是一个独立供试动物还是多个独根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向分类资料又可分为组合内无重立供试动物,双向分类资料又可分为组合内无重复观测值和组合内有重复观测值两种情况复观测值和组合内有重复观测值两种情况一、组合内无重复观测值的两向分类资料的方差分一、组合内无重复观测值的两向分类资料的方差分析析这种类型的资料结构是每一组合内仅一个独
4、立供试这种类型的资料结构是每一组合内仅一个独立供试动物(独立供试单位)动物(独立供试单位)其观测值的数学模型为:其观测值的数学模型为:ijijijx这一模型的含义是:每一个观测值这一模型的含义是:每一个观测值 包含了总体平包含了总体平均值均值 ,同时还受,同时还受 A因素第因素第 个水平的效应和个水平的效应和 B因因素第素第 个水平的效应,同时还具有一定的误差个水平的效应,同时还具有一定的误差 :这一模型相应的数据结构为:这一模型相应的数据结构为:因素因素 T :T T ijxijij20,ijN1B2BjBbB1A2AiAaA11x1jx1bx1 ixijxibx1axajxabx1.T.i
5、T.aT.1T.jT.bT上页的数据结构表中,上页的数据结构表中,T为求和,不同因素的和的为求和,不同因素的和的下标不同下标不同两因素无重复资料的方差分析应从两因素无重复资料的方差分析应从 A 和和 B 两个方向两个方向进行,我们可以将这种结构看成是两个单向资料进行,我们可以将这种结构看成是两个单向资料的重合的重合即:对即:对 A因素来说,有因素来说,有 a个组(个组(k=a),每一组有),每一组有 b个观测值(个观测值(n=b)对对 B因素来说,有因素来说,有 b个组(个组(k=b),每一个组有),每一个组有 a个观测值(个观测值(n=a)因此我们可以直接用方差分析表来表示这种分剖的因此我们
6、可以直接用方差分析表来表示这种分剖的结果结果这里,无效假设有两个:这里,无效假设有两个:A:设:设 不全相等不全相等B:设:设 不全相等不全相等方差分析表方差分析表course A因素因素B因素因素误误 差差 T012:.aHvs:AiH012:.bHvs:AjHdfSSMSF1a1b11ab1ab2.1iTCb2.1jTCaTABSSSSSS2ijxC2ijxCabAASSdfBBSSdfeeSSdfAAeMSFMSBBeMSFMS若若 显著,应对显著,应对 A因素各水平的平均值进行多重比因素各水平的平均值进行多重比较,其标准误为:较,其标准误为:若若 显著,应对显著,应对 B因素各水平的平
7、均值进行多重比因素各水平的平均值进行多重比较,其标准误为:较,其标准误为:下面我们以实例来说明具体分析的过程下面我们以实例来说明具体分析的过程试验试验 4种药物配伍(因素种药物配伍(因素 A)对仔猪白痢的治疗效)对仔猪白痢的治疗效果,试验在果,试验在 5个发病的猪场(因素个发病的猪场(因素B)进行,每个)进行,每个猪场随机抽取猪场随机抽取 4个猪舍小区,每个猪舍小区随机个猪舍小区,每个猪舍小区随机使用其中的一种药物配伍,得如下治愈率,试比使用其中的一种药物配伍,得如下治愈率,试比较这较这 4种药物配伍的治疗效果种药物配伍的治疗效果AFeAMSSEbBFeBMSSEa药物药物 猪猪 场场配伍配伍
8、 76 82 83 79 77 83 89 92 87 84 73 77 80 72 80 81 82 79 85 87由于数据是百分率,因此应作转换:由于数据是百分率,因此应作转换:转换后的数据见下面这张表(为了分析方便,所有转换后的数据见下面这张表(为了分析方便,所有数据转换后都扩大数据转换后都扩大 100倍):倍):1A2A3A4A1B2B3B4B5B1sinpp药物药物 猪猪 场场配伍配伍 106 113 115 109 107 115 123 128 120 116 102 107 111 101 111 112 113 109 117 1201A2A3A4A1B2B3B4B5B.i
9、T2ijxixis.jT2ijxjxjs得如下一级数据:得如下一级数据:药物药物 猪猪 场场配伍配伍 550 60560 110.0 3.87 602 72594 120.4 5.32 532 56696 106.4 4.77 571 65283 114.2 4.32 435 456 463 447 454 2255 255133 设设 不全相等不全相等设设 不全相等不全相等1A2A3A4A1B2B3B4B5B.iT2ijxixis.jT2ijxjxjs01234:Hvs:AiH0125:.Hvs:AjH2255133881.75TijSSxCC4 5 119Tdf 222.11550.571
10、542.555AiSSTCCb13Adfa 222.11435.454112.54BjSSTCCa14Bdfb 226.7eTABSSSSSSSS4 1 5 112edf 22255254251.254 5C 将上述数据填入方差分析表中:将上述数据填入方差分析表中:方差分析表方差分析表Course药物间药物间 3 542.55 180.85 9.57*3.49 5.95猪场间猪场间 4 112.50 28.125 1.49 3.26误误 差差 12 226.70 18.892 T 19 881.75对于对于 A因素,应否定无效假设,即不同的药物配伍因素,应否定无效假设,即不同的药物配伍其治疗仔
11、猪白痢的疗效差异极显著(其治疗仔猪白痢的疗效差异极显著(p0.05)dfSSMSF0.05F0.01F由于药物配伍间差异极显著(由于药物配伍间差异极显著(p1)个观测值,整)个观测值,整批资料共有批资料共有 abn个数据,这样的资料就是组合内个数据,这样的资料就是组合内有重复观测值的两因子资料有重复观测值的两因子资料这种类型资料的数学模型为:这种类型资料的数学模型为:数据结构见本书数据结构见本书 P83表表 5-22(请参看)(请参看)ijkijijkijx任一观测值任一观测值 包含了总体效应包含了总体效应 ,A因子第因子第 个水个水平的效应,平的效应,B因子第因子第 个水平的效应,个水平的效
12、应,A 因子和因子和 B因子第因子第 、个互作效应,及随机误差个互作效应,及随机误差 ,随,随机误差机误差这一类资料的方差分析表为:这一类资料的方差分析表为:ijkxijijk20,ijkNij方差分析表方差分析表变异变异 自由度自由度 平方和平方和 均方均方 F值值来源来源 A a-1 B b-1AB (a-1)(b-1)e ab(n-1)T abn-12.1iTCbn2.1jTCan2.1ijABTCSSSSnTABABSSSSSSSS2ijkxCAAASSMSdfBBBSSMSdfABABABSSMSdfeeeSSMSdfAAeMSFMSBBeMSFMSABABeMSFMS22ijkxT
13、Cabnabn在这种类型资料的方差分析中,人们的注意力和兴在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于互作的检验上,一般首先完成互作趣往往集中于互作的检验上,一般首先完成互作的的 F检验检验如果互作部分的如果互作部分的 F检验显著,可不再进行检验显著,可不再进行 A因子、因子、B因子的检验(当然习惯上我们还是同时完成因子的检验(当然习惯上我们还是同时完成 A因因子、子、B因子的检验),而对组合进行多重比较,因子的检验),而对组合进行多重比较,因为互作的重要性要远大于单个因子的重要性,因为互作的重要性要远大于单个因子的重要性,它所提供的信息量比单个因子要丰富得多它所提供的信息量比单个
14、因子要丰富得多因此,一般的试验应当同时考察两个因子,这样做,因此,一般的试验应当同时考察两个因子,这样做,一是可以节省时间和财力,二是可以考察因子之一是可以节省时间和财力,二是可以考察因子之间的关系,这种关系在单个因子的试验中是考察间的关系,这种关系在单个因子的试验中是考察不到的不到的当互作不显著,则分别检验当互作不显著,则分别检验 A因子和因子和 B因子是否显因子是否显著,哪个因子显著,就对哪个因子进行多重比较著,哪个因子显著,就对哪个因子进行多重比较两个因子都显著,两个因子都应当作多重比较两个因子都显著,两个因子都应当作多重比较考察两因子的试验中,什麽时候在组合内设置重复?考察两因子的试验
15、中,什麽时候在组合内设置重复?一是当我们确认试验所设置的一是当我们确认试验所设置的 A因子和因子和 B因子间的因子间的确存在互作,我们为了检验这种互作确存在互作,我们为了检验这种互作二是当我们无法肯定二是当我们无法肯定 A、B因子之间是否存在互作,因子之间是否存在互作,我们为了发现这种互作,必须设置重复我们为了发现这种互作,必须设置重复三是为了防止可能存在的互作混杂到误差项中去而三是为了防止可能存在的互作混杂到误差项中去而无谓地扩大误差,因此必须设置重复无谓地扩大误差,因此必须设置重复下面我们用实例来说明这一类型资料的方差分析下面我们用实例来说明这一类型资料的方差分析(本书(本书 PP8485
16、例例 5-7)试验目的:观察不同细菌经不同修饰后其细胞表面试验目的:观察不同细菌经不同修饰后其细胞表面凝集素的化学性质凝集素的化学性质A因子:对细菌的三种修饰方式(因子:对细菌的三种修饰方式(a=3):):高碘酸钠:高碘酸钠 :胰蛋白酶:胰蛋白酶 :蛋白酶:蛋白酶B因子:三种细菌(因子:三种细菌(b=3):):大肠杆菌:大肠杆菌 :乳酸菌:乳酸菌 :双歧杆菌:双歧杆菌每个组合内有每个组合内有 4个重复(个重复(n=4):):4头仔猪头仔猪观测指标:固化仔猪小肠黏液蛋白的相对附着量观测指标:固化仔猪小肠黏液蛋白的相对附着量1A2A3A1B2B3B试验所得数据结构见下表试验所得数据结构见下表(习惯
17、上,我们总是将细菌作为(习惯上,我们总是将细菌作为 A因素,修饰方式因素,修饰方式作为作为 B因素)因素)修饰修饰 细细 菌菌方式方式 62.70 60.50 5.02 7.81 102.31 110.20 65.30 59.78 3.24 3.65 108.45 103.84 692.80 =248.28 =19.72 =424.80 20.30 23.51 34.50 37.21 120.73 114.92 17.92 19.35 31.92 31.05 117.22 124.73 693.36 =81.08 =134.68 =477.60 62.61 59.43 17.82 21.20
18、103.25 110.23 65.70 62.38 16.02 14.56 105.73 110.39 749.32 =250.12 =69.60 =429.60 579.48 224.00 1332.00 =2135.48 1A2A3A1B2B3B11T12T13T21T22T23T31T32T33T.iT.jTABT2187064.7600ijkx这是一张二维的数据表这是一张二维的数据表在计算一级数据时,应从最小单位开始,即首先计在计算一级数据时,应从最小单位开始,即首先计算组合的和,然后计算算组合的和,然后计算 A和和 B因子各水平的和,因子各水平的和,最后计算总和最后计算总和在逐段计算
19、各类和的时候,不要忘记同时计算平方在逐段计算各类和的时候,不要忘记同时计算平方和、平均数和、平均数做好上述准备工作后,即进行校正值、各类平方和做好上述准备工作后,即进行校正值、各类平方和及自由度的计算:及自由度的计算:222135.48126674.30083 3 4TCabn 3a 3b 4n 3 3 436Nabn 各平方和、自由度:各平方和、自由度:2222222.2222.222.62.70.110.3960390.459211692.80693.36749.323 4175.731911579.48224.001332.003 453342.121711248.28.429.604T
20、ijkAiBjABijABSSxCCSSTCCbnSSTCCanSSTCSSSSn6623.2556ABCSSSS249.3500eTABABSSSSSSSSSS1351212114127TABABedfabndfadfbdfabdfab n 修饰方式修饰方式 A:设:设 不全相等不全相等细菌种类细菌种类 B:设:设 不全相等不全相等AB:设:设 不全相等不全相等方差分析表方差分析表course修饰(A)175.7319 2 87.8660 9.514*细菌(B)53352.1217 2 26671.0609 2887.979*AB 6623.2556 4 1655.8139 179.294*
21、误差 249.3500 27 9.2352 T 60390.4592 35三个无效假设均否定,接受三个备择假设,即修饰方式、细菌种类、三个无效假设均否定,接受三个备择假设,即修饰方式、细菌种类、细菌与修饰方式的互作其间的差异均达极显著水平细菌与修饰方式的互作其间的差异均达极显著水平这里,仅需对互作进行多重比较这里,仅需对互作进行多重比较 SSdfMSF0.05F0.01F0123:Hvs:AiH0123:Hvs:AiH0111233:.Hvs:AijH多重比较:多重比较:2 3 4 5 6 7 8 9 2.91 3.52 3.88 4.14 4.35 4.51 4.65 4.77 3.93 4
22、.51 4.87 5.12 5.32 5.49 5.63 5.75 4.42 5.35 5.90 6.29 6.61 6.85 7.07 7.25 5.97 6.85 7.40 7.78 8.08 8.34 8.55 8.74(同学们先自行完成这一多重比较)(同学们先自行完成这一多重比较)9.23521.51954eMSSEn0.050.01qq0.050.01LSRLSRR将各组合的平均值按从大到小的次序排列:将各组合的平均值按从大到小的次序排列:组合组合 0.05 0.01 119.40 a A 107.40 b B 106.20 b B 62.53 c C 62.07 c C 33.67
23、 d D 20.27 e E 17.40 e E 4.93 f F(请同学们自行完成平均数表或平均数图的设置)(请同学们自行完成平均数表或平均数图的设置)233313A BA BA B311122A BABA B213212A BA BA Bijx课堂练习:课堂练习:今有一个试验,其数据分析为今有一个试验,其数据分析为 F值极显著,请对资料的值极显著,请对资料的 6个个平均值进行多重比较:平均值进行多重比较:R 2 3 4 5 6LSR0.05 0.82 0.99 1.10 1.18 1.23LSR0.01 1.12 1.29 1.39 1.48 1.54平均值:平均值:1:6.48 2:6.
24、32 3:7.95 4:4.50 5:5.52 6:7.11这里我们介绍的是组合内的数据量是一样多的情况这里我们介绍的是组合内的数据量是一样多的情况当组合内数据量不一样多时,可采用以下两种方法当组合内数据量不一样多时,可采用以下两种方法进行方差分析:进行方差分析:1、将每一组合内的数据截取为一样多将每一组合内的数据截取为一样多例如,有的组合是例如,有的组合是 5个数据,有的为个数据,有的为 7个数据,最个数据,最少的为少的为 3个,则可将所有组合均截为个,则可将所有组合均截为3个数据(取个数据(取每一组合的平均值周围的数据)进行方差分析每一组合的平均值周围的数据)进行方差分析2、使用使用最小二
25、乘方差分析法最小二乘方差分析法进行进行目前使用的统计软件均为最小二乘方差分析法,这目前使用的统计软件均为最小二乘方差分析法,这一方法可不考虑组合内样本量的多少,甚至某一一方法可不考虑组合内样本量的多少,甚至某一组合内为组合内为 0都可以进行方差分析都可以进行方差分析附:(待改)第五节第五节 系统分组资料的方差分析系统分组资料的方差分析系统分组设计,又称为巢式设计、树状设计、多因系统分组设计,又称为巢式设计、树状设计、多因子嵌套设计子嵌套设计其英文名称为:其英文名称为:nested design假设有假设有 A、B 两个因子,这两个因子的搭配组成不两个因子,这两个因子的搭配组成不再是上一节的交叉
26、构成,而是再是上一节的交叉构成,而是 B 因子嵌套在因子嵌套在 A 因因子内,即子内,即 B 因子为次级因子:因子为次级因子:A 因子的某一个水平包含了因子的某一个水平包含了 B 因子部分水平因子部分水平A 因子的另一个水平包含了因子的另一个水平包含了 B 因子的另一部分水平因子的另一部分水平即:即:B 因子的水平仅从属于因子的水平仅从属于 A 因子的一个水平因子的一个水平而而 A 因子的水平并不包含因子的水平并不包含 B 因子的所有水平因子的所有水平如果有第三个因子如果有第三个因子 C,则,则 C 因子嵌套在因子嵌套在 B 因子内因子内如果有第四个因子如果有第四个因子 D,则,则 D 因子嵌
27、套在因子嵌套在 C 因子内因子内以此类推以此类推其数据结构呈现树状结构其数据结构呈现树状结构如行政区划,就是典型的系统结构:如行政区划,就是典型的系统结构:国家包含若干个省(国家包含若干个省(A)、一个省()、一个省(A)包含若干个市()包含若干个市(B)、)、一个市一个市(B)包含若干个县(包含若干个县(C)、一个县()、一个县(C)包含若干)包含若干个镇(个镇(D)、一个镇()、一个镇(D)包含若干个村()包含若干个村(E)再如:畜牧生产中:一头公畜(再如:畜牧生产中:一头公畜(A)交配若干头母畜、一头)交配若干头母畜、一头母畜(母畜(B)生产若干头仔畜、每头仔畜()生产若干头仔畜、每头仔
28、畜(C)有若干次生)有若干次生产成绩产成绩在这种数据结构中,在这种数据结构中,各 因子的重要性是不完全相等因子的重要性是不完全相等的,下一级因子的重要性往往低于上一级因子的,下一级因子的重要性往往低于上一级因子 A1 Ai AaB11 B12 B1b Bi1 Bi2 Bib Ba1 Ba2 Bab C111 C112 C11c Ca11 Ca12 Ca1c A 因子称为一级因子,因子称为一级因子,B 因子称为二级因子,因子称为二级因子,因子之间是一种从属关系,而非上一节因子之间是一种从属关系,而非上一节 A、B 因子因子的交叉构成中所讨论的那种平行关系的交叉构成中所讨论的那种平行关系 下面我们
29、写出两因子系统分组资料的数据结构:下面我们写出两因子系统分组资料的数据结构:A因子因子 B因子因子 观测值观测值 B因子和因子和 A因子和因子和 T A1 B11 x111 x112 x11.B12 x121 x122 x12.x1.A2 B21 x211 x212 x21.B22 x221 x222 x22.x2.Ai Bi1 xi11 xi12 xi1.Bi2 xi21 xi22 xi2.xi.Ap Bp1 xp11 xp12 xp1.Bp2 xp21 xp22 xp2.xp.x根据这一数据结构我们可以写出其数学模型:根据这一数据结构我们可以写出其数学模型:式中,式中,为总体平均为总体平均
30、i为为 A 因子第因子第 i 个水平的效应个水平的效应ijij为为 A 因子第因子第 i 个水平下的个水平下的 B 因子第因子第 j 个水平个水平的效应的效应ijkijk为随机误差,且为随机误差,且p为为 A 因子的水平数;因子的水平数;qi为第为第 i 个个 A 因子水平下因子水平下 B 因子的水平数;因子的水平数;nij为第为第 i 个个 A 水平中第水平中第 j 个个 B 水平中的观测值水平中的观测值1,2,.,;1,2,.;1,2,.,ijkiijijkiijxip jq kn20,ijkN下面我们先介绍两个概念:下面我们先介绍两个概念:固定因子固定因子(fixed factor):)
31、:如果一个试验中,某一因子的水平是我们有目的地如果一个试验中,某一因子的水平是我们有目的地挑选的,因而我们只是希望将挑选的,因而我们只是希望将这几个这几个水平进行比水平进行比较,也只是希望知道这几个水平的差异,并不将较,也只是希望知道这几个水平的差异,并不将分析结果引申到其他水平,这样的因子就是固定分析结果引申到其他水平,这样的因子就是固定因子,固定因子的水平所产生的效应就是因子,固定因子的水平所产生的效应就是固定效固定效应应(fixed effect)随机因子随机因子(random factor):):如果一个因子的各个水平是从这因子的所有水平中如果一个因子的各个水平是从这因子的所有水平中随
32、机挑选出来的,我们的试验目的是希望通过这随机挑选出来的,我们的试验目的是希望通过这几个水平的差异情况了解几个水平的差异情况了解整个整个因子的变异情况,因子的变异情况,即对这一因子的方差进行检验和估计,从而知道即对这一因子的方差进行检验和估计,从而知道这一因子的方差组分,这样的因子就是随机因子,这一因子的方差组分,这样的因子就是随机因子,随机因子的各个水平所产生的效应就是随机因子的各个水平所产生的效应就是随机效应随机效应(random effect)在数学模型在数学模型 中:中:如果如果 A、B 两个因子所产生的效应都是固定效应,两个因子所产生的效应都是固定效应,这样的数学模型就是固定效应模型(
33、简称这样的数学模型就是固定效应模型(简称固定模固定模型型 fixed model),我们的检验目的是希望比较这),我们的检验目的是希望比较这一因子各参与试验的水平之间的差异一因子各参与试验的水平之间的差异固定模型中,我们总假定:固定模型中,我们总假定:ijkiijijkx00jijj如果如果 A、B 两因子所产生的效应都是随机效应,这两因子所产生的效应都是随机效应,这样的数学模型就是样的数学模型就是随机模型随机模型(random model),),我们的检验目的是希望知道每个因子的不同水平我们的检验目的是希望知道每个因子的不同水平效应的方差效应的方差2 2 和和2 2 是否为是否为 0两因子各
34、个水平的效应之间相互独立两因子各个水平的效应之间相互独立A 因子和因子和 B 因子效应之间也相互独立因子效应之间也相互独立且且:220,0,iijNN如果两个因子,一个为固定因子(如如果两个因子,一个为固定因子(如 A 因子),另因子),另一个为随机因子(如一个为随机因子(如 B 因子),由这样的两个因因子),由这样的两个因子组成的数学模型即为子组成的数学模型即为混合模型混合模型(mixed model),我们的检验目的是:),我们的检验目的是:A 因子各水平之间是否存在差异因子各水平之间是否存在差异B 因子不同水平效应的方差因子不同水平效应的方差2 2是否为是否为 0 0这时:这时:且不同的
35、且不同的ijij彼此独立彼此独立200,iijN我们在上一节讨论的两因子(我们在上一节讨论的两因子(A、B因子)交叉分组因子)交叉分组资料也有固定模型、随机模型、混合模型之分,资料也有固定模型、随机模型、混合模型之分,但在一般情况下,这种分组资料更多的是固定模但在一般情况下,这种分组资料更多的是固定模型,因此其方差分析方法是固定效应的分析型,因此其方差分析方法是固定效应的分析而系统分组资料则三种模型都有而系统分组资料则三种模型都有系统分组资料常见于数量遗传学、动物育种学中系统分组资料常见于数量遗传学、动物育种学中此时我们往往希望通过方差组分的计算估计遗传参此时我们往往希望通过方差组分的计算估计
36、遗传参数,从而进行数量遗传学的研究数,从而进行数量遗传学的研究但系统分组资料进行固定效应的估计也是常见的但系统分组资料进行固定效应的估计也是常见的下面我们给出平方和与自由度的剖分公式:下面我们给出平方和与自由度的剖分公式:每一观测值的总离均差平方为:每一观测值的总离均差平方为:等式两边求和(各乘积项的和均为等式两边求和(各乘积项的和均为 0)上式中,右手第二项称为上式中,右手第二项称为 A因子内因子内 B因子水平间因子水平间 SS 22.222.ijkijkijijiiijkijijiixxxxxxxxxxxxxx各乘积项22.22.ijkijkijijkijkijijiiiijixxxxnx
37、xnxx TeAB ASSSSSSSS 为为 A 因子第因子第 i 个水平中的观测值个数个水平中的观测值个数上一页的仅为推导的理论公式上一页的仅为推导的理论公式在实际计算时,我们使用以下公式在实际计算时,我们使用以下公式(从理论公式如何到下面的实际计算公式,同学们(从理论公式如何到下面的实际计算公式,同学们应当很清楚了)应当很清楚了)校正值:校正值:总平方和:总平方和:A 因子平方和:因子平方和:B 因子平方和:因子平方和:.iijjnn2TCN2TijkSSxC2.1AiiSSxCn2.1BiijSSxCnA 因子内因子内 B 因子水平间平方和:因子水平间平方和:误差平方和:误差平方和:相应
38、的自由度:相应的自由度:相应的均方:相应的均方:22.11ijiBAB AijiSSxCxCSSSSnn eTATBB ASSSSSSSSSSSS 11TAiB AeidfNdfpdfqpdfNq AAAB AB AB AeeeSSMSdfSSMSdfSSMSdf根据试验的要求不同,次级及次级内观测值可分为根据试验的要求不同,次级及次级内观测值可分为重复数相等和不等两种情况重复数相等和不等两种情况下面我们以例题来说明具体的分析方法下面我们以例题来说明具体的分析方法一、次级样本含量相等的系统分组资料一、次级样本含量相等的系统分组资料例例1:对长白猪进行选育,考察:对长白猪进行选育,考察 4 头长
39、白种公猪头长白种公猪 S,每头种公猪交配每头种公猪交配 2 头母猪头母猪 D,每头母猪考察,每头母猪考察 3 窝窝平均后代增重平均后代增重xijk,得数据如下表(数据已经过了,得数据如下表(数据已经过了简化)简化)S D xijk D S D SS D S S 后代增重后代增重 后代后代 后代后代 和和 平均平均 和和 平均平均1 1 2.2 2.3 2.0 3 6.5 14.13 2.17 2 2.0 2.1 2.3 3 6 6.4 13.70 2.13 12.9 2.152 3 1.6 1.5 1.7 3 4.8 7.70 1.60 4 1.8 2.0 1.7 3 6 5.5 10.13
40、1.83 10.3 1.723 5 2.6 2.5 2.2 3 7.3 17.85 2.43 6 2.4 2.4 2.2 3 6 7.0 16.36 2.33 14.3 2.38 4 7 1.8 1.5 1.7 3 5.0 8.38 1.67 8 1.5 1.6 1.4 3 6 4.5 6.77 1.50 9.5 1.58 24 24 47.0 95.02 47 上表中上表中,p=4,q=2,n=3 N=24校正值校正值 C=92.0417SST=(2.22+2.32+.1.42)-C=95.02-C=2.9783SSS=(12.92+9.52)/6 -C=94.54-C=2.4983 (一级
41、样本间)(一级样本间)SSD(S)=(6.52+4.52)/3 -(12.92+9.52)/6=94.68-94.54=0.14 (二级样本间)(二级样本间)SSe=SST SSS-SSD(S)=2.9783-2.4983-0.14=0.34自由度:自由度:dfT=423 1=23dfS=4 1 =3dfD(S)=4(2-1)=4dfe=42(3-1)=16 将平方和及自由度填入方差分析表中,并计算各均将平方和及自由度填入方差分析表中,并计算各均方和方和 F 值:值:方差分析表:方差分析表:变异来源变异来源 SS df MS F F0.05 F0.01公猪间公猪间S 2.4983 3 0.83
42、28 23.79*6.59 16.69(公猪内公猪内)母猪间母猪间D 0.14 4 0.035 1.64 3.01误误 差差e 0.34 16 0.02125 T 2.9783 23 上述计算中,上述计算中,0.832823.790.0350.0351.640.02125SSDDDeMSFMSMSFMS即:两个不同级别的即:两个不同级别的 F 值均由下一级的值均由下一级的 MS 作为比作为比较标准,而不再是统一由误差项均方作为比较标较标准,而不再是统一由误差项均方作为比较标准准而查而查 F所用的自由度也应作相应的变动,即:所用的自由度也应作相应的变动,即:FS的自由度分别为的自由度分别为 df
43、1=3,df2=4FD的自由度分别为的自由度分别为 df1=4,df2=16由于不同公猪间的增重差异极显著,而母猪间差异由于不同公猪间的增重差异极显著,而母猪间差异不显著,因此,应对公猪(一级样本)作多重比不显著,因此,应对公猪(一级样本)作多重比较:较:0.0350.07642 3DMSSEqn R 2 3 4 公猪公猪 0.05 0.01 q0.05 3.93 5.00 5.76 3 2.38 a A q0.01 6.51 8.12 9.17 1 2.15 a ABLSR0.05 0.30 0.38 0.44 2 1.72 b BLSR0.01 0.50 0.62 0.70 4 1.58
44、b B如果母猪间差异亦显著,则应当对母猪进行多重比如果母猪间差异亦显著,则应当对母猪进行多重比较,比较时的标准误以误差项均方为分子,每头较,比较时的标准误以误差项均方为分子,每头母猪的样本量为分母进行计算母猪的样本量为分母进行计算查查 q 表时用误差项自由度表时用误差项自由度本例中,我们将公猪、母猪均作为固定因子处理,本例中,我们将公猪、母猪均作为固定因子处理,因此其模型为固定模型因此其模型为固定模型ix如果是估计遗传参数,则公猪、母猪均为随机因子,如果是估计遗传参数,则公猪、母猪均为随机因子,则模型为随机模型则模型为随机模型当然也可以将公猪作为随机因子,母猪作为固定因当然也可以将公猪作为随机
45、因子,母猪作为固定因子处理,则模型为混合模型子处理,则模型为混合模型处理实际数据资料时,样本量肯定要大得多,本例处理实际数据资料时,样本量肯定要大得多,本例仅是一个说明统计方法的例子而已仅是一个说明统计方法的例子而已二、次级样本含量不等的系统分组资料二、次级样本含量不等的系统分组资料我们还以例子来说明统计方法我们还以例子来说明统计方法调查调查 3 个县的牧业情况,各县抽取若干个乡镇,每个县的牧业情况,各县抽取若干个乡镇,每个乡镇抽取若干个调查样点(户),得畜牧业产个乡镇抽取若干个调查样点(户),得畜牧业产值(为了方便计算,数据已经过简化)如下,试值(为了方便计算,数据已经过简化)如下,试进行分
46、析进行分析县别县别 乡别乡别 各样点观测值各样点观测值 乡样乡样 县样县样 乡和乡和 平方和平方和 乡平均乡平均 县和县和 县平均县平均一级一级 二级二级 点数点数 点数点数 A B nij ni.Tij xij Ti xi 1 21 19 21 18 20 5 99 1967 19.8 1 2 16 18 18 3 52 904 17.3 3 18 19 20 18 4 12 75 1409 18.75 226 18.83 2 4 16 14 16 13 15 14 6 88 1298 14.7 5 17 16 15 17 4 10 65 1059 16.25 153 15.30 6 15
47、18 16 17 15 5 81 1319 16.2 3 7 16 14 17 15 15 13 6 90 1360 15 8 17 18 18 3 14 53 937 17.7 224 16.0 36 36 603 10253 603将原始数据整理成表,并计算右边的一级数据,与左将原始数据整理成表,并计算右边的一级数据,与左边连成一个表边连成一个表此例中:此例中:p=3 为一级样本数为一级样本数q1=3,q2=2,q3=3 为二级样本数为二级样本数n11=5,n12=3,n33=3 得得:n1=12,n2=10,n3=14 校正值校正值 C=10100.25 8iQq36ijiNnn 222
48、2152.7580.9832.039.77TijkiAiijiB AijieTAB ASSxCTSSCnTTSSnnSSSSSSSS 135121528TAiB AeTB AdfNdfpdfqdfdfdfadf 设立无效假设(此处略,该如何设立?)设立无效假设(此处略,该如何设立?)建立方差分析表建立方差分析表变异来源变异来源 SS df MS F F0.05 F0.01县别间县别间 A 80.98 2 40.49 6.33*5.79 13.27乡别间乡别间 B 32.00 5 6.40 4.51*2.56 3.76误误 差差 39.77 28 1.42 T 152.75 35其中:其中:40
49、.496.3276.406.404.511.42AABBBeMSFMSMSFMS由于县、乡两级分别为显著、极显著,因此应分别由于县、乡两级分别为显著、极显著,因此应分别作多重比较作多重比较首先对县进行多重比较,各县的样本量不等,因此首先对县进行多重比较,各县的样本量不等,因此先求先求k1:然后求然后求SE:R 2 3 q0.05 3.61 4.54 q0.01 5.70 6.97 LSR0.05 2.65 3.33 LSR0.01 4.18 5.11 22221121014363611.88912inNNkp16.400.73411.889BMSSEk县别县别 0.05 0.01 1 18.8
50、3 a A 3 16.0 b A 2 15.30 b A 对乡别进行多重比较:对乡别进行多重比较:首先求首先求k2:然后求然后求SE:ix 222222222253464563361210144.32713 12 13 1ijiinNnkq1.420.5734.327SE R 2 3 4 5 6 7 8 q0.05 2.90 3.49 3.86 4.13 4.32 4.48 4.62 q0.01 3.91 4.48 4.84 5.09 5.28 5.44 5.58LSR0.05 1.67 2.00 2.21 2.37 2.47 2.57 2.65 LSR0.01 2.24 2.57 2.77