1、方差分析方差分析(续)第四节第四节 两因素资料的方差分析两因素资料的方差分析两因素资料的方差分析,又称为双向分组资料的方两因素资料的方差分析,又称为双向分组资料的方差分析差分析很多情况下,我们需要设计两种不同的因素同时作很多情况下,我们需要设计两种不同的因素同时作用于供试动物用于供试动物或在考虑某一因素对供试动物产生影响的同时,还或在考虑某一因素对供试动物产生影响的同时,还需要考虑不同的环境情况需要考虑不同的环境情况这样,当试验结束后,数据的分析就必须进行两因这样,当试验结束后,数据的分析就必须进行两因素(或称双向分类资料)的方差分析素(或称双向分类资料)的方差分析同时考虑的这两个因素,我们分
2、别称之为因素同时考虑的这两个因素,我们分别称之为因素 A 和和因素因素 B,他们各有,他们各有 a 个水平和个水平和 b 个水平个水平有时候,因素有时候,因素 A 和因素和因素 B 是同等重要的是同等重要的有时候,因素有时候,因素 B 是为了从总变异中分剖出环境因素是为了从总变异中分剖出环境因素而特意设置的而特意设置的在设计时,因素在设计时,因素 A 和因素和因素 B 相互交叉,形成相互交叉,形成 ab 个个组合组合即:即:A 因素的每一个水平包含了因素的每一个水平包含了 B 因素的所有水平因素的所有水平B 因素的每一个水平也包含了因素的每一个水平也包含了 A 因素的所有水平因素的所有水平即:
3、即:A 因素的各个水平与因素的各个水平与 B 因素的各个水平相逢一因素的各个水平相逢一次,也只相逢一次次,也只相逢一次例如:例如:A 因素有因素有 5个个 水平,水平,B 因素有因素有 4 个水平,形个水平,形成成 54=20 个组合个组合根据每一个组合内是一个独立供试动物还是多个独根据每一个组合内是一个独立供试动物还是多个独立供试动物,双向分类资料又可分为组合内无重立供试动物,双向分类资料又可分为组合内无重复观测值和组合内有重复观测值两种情况复观测值和组合内有重复观测值两种情况一、组合内无重复观测值的两向分类资料的方差分一、组合内无重复观测值的两向分类资料的方差分析析这种类型的资料结构是每一
4、组合内仅一个独立供试这种类型的资料结构是每一组合内仅一个独立供试动物(独立供试单位)动物(独立供试单位)其观测值的数学模型为:其观测值的数学模型为:这一模型的含义是:每一个观测值这一模型的含义是:每一个观测值 包含了总体平包含了总体平均值均值 ,同时还受,同时还受 A 因素第因素第 个水平的效应和个水平的效应和 B因素第因素第 个水平的效应,同时还具有一定的误个水平的效应,同时还具有一定的误差差 :ijijijxijxijij20,ijN这一模型相应的数据结构为:这一模型相应的数据结构为:因素因素 T :T T 1B2BjBbB1A2AiAaA11x1jx1bx1 ixijxibx1axajx
5、abx1.T.iT.aT.1T.jT.bT上页的数据结构表中,上页的数据结构表中,T为求和,不同因素的和的为求和,不同因素的和的下标不同下标不同两因素无重复资料的方差分析应从两因素无重复资料的方差分析应从 A 和和 B 两个方向两个方向进行,我们可以将这种结构看成是两个单向资料进行,我们可以将这种结构看成是两个单向资料的重合的重合即:对即:对 A 因素来说,有因素来说,有 a 个组(个组(k=a),每一组),每一组有有b 个观测值(个观测值(n=b)对对 B 因素来说,有因素来说,有 b 个组(个组(k=b),每一个组有),每一个组有 a个观测值(个观测值(n=a)因此我们可以直接用方差分析表
6、来表示这种分剖的因此我们可以直接用方差分析表来表示这种分剖的结果结果这里,无效假设有两个:这里,无效假设有两个:A:设:设 不全相等不全相等B:设:设 不全相等不全相等方差分析表方差分析表变异来源变异来源 A因素因素B因素因素误误 差差 T012:.aHvs:AiH012:.bHvs:AjHdfSSMSF1a1b11ab1ab2.1iTCb2.1jTCaTABSSSSSS2ijxC2ijxCabAASSdfbbSSdfeeSSdfAAeMSFMSbBeMSFdf若若 显著,应对显著,应对 A 因素各水平的平均值进行多重比因素各水平的平均值进行多重比较,其标准误为:较,其标准误为:若若 显著,应
7、对显著,应对 B 因素各水平的平均值进行多重比因素各水平的平均值进行多重比较,其标准误为:较,其标准误为:下面我们以实例来说明具体分析的过程下面我们以实例来说明具体分析的过程试验试验 4 种药物配伍(因素种药物配伍(因素 A)对鲢鱼腐皮病的治疗)对鲢鱼腐皮病的治疗效果,试验在效果,试验在 5 个发病的渔场(因素个发病的渔场(因素 B)进行,)进行,每个渔场随机抽取每个渔场随机抽取 4 个鱼池,每个鱼池随机使用个鱼池,每个鱼池随机使用其中的一种药物配伍,得如下治愈率,试比较这其中的一种药物配伍,得如下治愈率,试比较这 4 种药物配伍的治疗效果种药物配伍的治疗效果AFeAMSSEbBFeBMSSE
8、a药物药物 渔渔 场场配伍配伍 76 82 83 79 77 83 89 92 87 84 73 77 80 72 80 81 82 79 85 87由于数据是百分率,因此应作转换:由于数据是百分率,因此应作转换:转换后的数据见下面这张表(为了分析方便,所有转换后的数据见下面这张表(为了分析方便,所有数据转换后都扩大数据转换后都扩大 100 倍):倍):1A2A3A4A1B2B3B4B5B1sinpp药物药物 鱼鱼 场场配伍配伍 106 113 115 109 107 115 123 128 120 116 102 107 111 101 111 112 113 109 117 1201A2A
9、3A4A1B2B3B4B5B.iT2ijxixis.jT2ijxjxjs得如下一级数据:得如下一级数据:药物药物 渔渔 场场配伍配伍 550 60560 110.0 3.87 602 72594 120.4 5.32 532 56696 106.4 4.77 571 65283 114.2 4.32 435 456 463 447 454 2255 255133 1A2A3A4A1B2B3B4B5B.iT2ijxixis.jT2ijxjxjs设设 不全相等不全相等设设 不全相等不全相等01234:Hvs:AiH0125:.Hvs:AjH22255254251.254 5C 2255133881
10、.75TijSSxCC4 5 119Tdf 222.11550.571542.555AiSSTCCb13Adfa 222.11435.454112.54BjSSTCCa14Bdfb 226.7eTABSSSSSSSS4 1 5 112edf 将上述数据填入方差分析表中:将上述数据填入方差分析表中:方差分析表方差分析表变异来源变异来源药物间药物间 3 542.55 180.85 9.57*3.49 5.95渔场间渔场间 4 112.50 28.125 1.49 3.26误误 差差 12 226.70 18.892 T 19 881.75对于对于 A因素,应否定无效假设,即不同的药物配伍因素,应否
11、定无效假设,即不同的药物配伍其治疗鲢鱼腐皮病的疗效差异极显著(其治疗鲢鱼腐皮病的疗效差异极显著(p0.05)dfSSMSF0.05F0.01F由于药物配伍间差异极显著(由于药物配伍间差异极显著(p1)个观测值,整)个观测值,整批资料共有批资料共有 abn 个数据个数据这种类型资料的数学模型为:这种类型资料的数学模型为:数据结构见本书数据结构见本书P104表表7.3(请参看)(请参看)任一观测值任一观测值 包含了总体效应包含了总体效应 ,A 因子第因子第 个水个水平的效应,平的效应,B 因子第因子第 个水平的效应,个水平的效应,A 因子和因子和B 因子第因子第 、个互作效应,及随机误差个互作效应
12、,及随机误差 ,随机,随机误差误差这一类资料的方差分析表为:这一类资料的方差分析表为:ijkijijkijxijkxijijk20,ijkNij方差分析表方差分析表变异变异 自由度自由度 平方和平方和 均方均方 F值值来源来源 A a-1 B b-1AB (a-1)(b-1)e ab(n-1)T abn-12.1iTCbn2.1jTCan2.1ijABTCSSSSnTABABSSSSSSSS2ijkxCAAASSMSdfBBBSSMSdfABABABSSMSdfeeeSSMSdfAAeMSFMSBBeMSFMSABABeMSFMS22ijkxTCabnabn在这种类型资料的方差分析中,人们的注
13、意力和兴在这种类型资料的方差分析中,人们的注意力和兴趣往往集中于趣往往集中于互作互作的检验上的检验上一般首先完成互作的一般首先完成互作的 F 检验,如果互作部分的检验,如果互作部分的 F 检检验显著,可不再进行验显著,可不再进行 A 因子、因子、B 因子的检验(当因子的检验(当然习惯上我们还是同时完成然习惯上我们还是同时完成 A 因子、因子、B 因子的检因子的检验),而对组合进行多重比较验),而对组合进行多重比较因为互作的重要性要远大于单个因子的重要性,它因为互作的重要性要远大于单个因子的重要性,它所提供的信息量比单个因子要丰富得多所提供的信息量比单个因子要丰富得多因此,一般的试验应当同时考察
14、两个因子因此,一般的试验应当同时考察两个因子一个试验同时考察两个因子,一是可以节省时间和一个试验同时考察两个因子,一是可以节省时间和财力,二是可以考察因子之间的关系,这种关系财力,二是可以考察因子之间的关系,这种关系在单个因子的试验中是考察不到的在单个因子的试验中是考察不到的当互作不显著,则分别检验当互作不显著,则分别检验 A 因子和因子和 B 因子是否显因子是否显著,哪个因子显著,就对哪个因子进行多重比较著,哪个因子显著,就对哪个因子进行多重比较两个因子都显著,两个因子都应当作多重比较两个因子都显著,两个因子都应当作多重比较考察两个因子的试验中,什麽时候在组合内设置重考察两个因子的试验中,什
15、麽时候在组合内设置重复?复?一是当我们确认试验所设置的一是当我们确认试验所设置的 A 因子和因子和 B 因子间的因子间的确存在互作,我们为了检验这种互作确存在互作,我们为了检验这种互作二是当我们无法肯定二是当我们无法肯定 A、B 因子之间是否存在互作,因子之间是否存在互作,我们为了发现这种互作,必须设置重复我们为了发现这种互作,必须设置重复三是为了防止可能存在的互作混杂到误差项中去而三是为了防止可能存在的互作混杂到误差项中去而无谓地扩大误差,因此必须设置重复无谓地扩大误差,因此必须设置重复下面我们用实例来说明这一类型资料的方差分析下面我们用实例来说明这一类型资料的方差分析试验目的:作饲料增重试
16、验,同时考察蛋白质(因试验目的:作饲料增重试验,同时考察蛋白质(因子子 A)和磷(因子)和磷(因子 B)的影响)的影响A 因子:高、中、低三种水平(因子:高、中、低三种水平(a=3):):高含量:高含量 :中含量:中含量 :低含量:低含量B 因子:二种形态(因子:二种形态(b=2):):有机磷:有机磷 :无机磷:无机磷每个组合内有每个组合内有 4 个重复(个重复(n=4):4水箱一龄青鱼水箱一龄青鱼(每箱青鱼的尾数相等)(每箱青鱼的尾数相等)观测指标:试验期内的增重量观测指标:试验期内的增重量试验所得数据结构见下表试验所得数据结构见下表1A2A3A1B2B磷磷 蛋蛋 白白 质质形态形态 9.6
17、2 8.68 6.15 7.86 4.93 5.59 9.31 9.97 7.38 7.05 6.10 5.46 =37.58 =28.44 =22.08 88.10 7.74 6.85 6.30 5.81 3.33 2.85 6.34 6.09 6.54 6.63 3.60 3.19 =27.02 =25.28 =12.97 65.27 64.60 53.72 35.05 =153.37 1A2A3A1B2B11T21T31T12T22T32T.iT.jTABT21066.9333ijkx这是一张二维的数据表这是一张二维的数据表在计算一级数据时,应从最小单位开始,即首先计在计算一级数据时,应
18、从最小单位开始,即首先计算组合的和,然后计算算组合的和,然后计算 A 和和 B 因子各水平的和,因子各水平的和,最后计算总和最后计算总和在逐段计算各类和的时候,不要忘记同时计算平方在逐段计算各类和的时候,不要忘记同时计算平方和、平均数和、平均数做好上述准备工作后,即进行校正值、各类平方和做好上述准备工作后,即进行校正值、各类平方和及自由度的计算:及自由度的计算:22153.37980.09823 2 4TCabn 3a 2b 4n 3 2 424Nabn 各平方和:各平方和:2222.2222.222.229.62.3.1986.83511164.6053.7235.0555.83942411
19、88.1065.2721.7170341137.58.12.973.84444TijkAiBjABijABABeTSSxCCSSTCbnCSSTCanCSSTCSSSSnCSSSSSSSSS5.4343ABABSSSSS各自由度:各自由度:1231211112118TABABedfabndfadfbdfabdfab n 蛋白质蛋白质A:设:设 不全相等不全相等磷形态磷形态B:设:设 AB:设设 不全相等不全相等方差分析表方差分析表变异来源变异来源蛋白质(蛋白质(A)55.8394 2 27.9197 92.48*磷形态(磷形态(B)21.7170 1 21.7170 71.93*AB 3.84
20、44 2 1.9222 6.38*误差误差 5.4343 18 0.3019 T 86.8351 23SSdfMSF0.05F0.01F0123:Hvs:AiH012:Hvs12:AH0111232:.Hvs:AijH三个无效假设均否定,接受三个备择假设,即蛋白三个无效假设均否定,接受三个备择假设,即蛋白质的量、磷形态、蛋白质量与磷形态间的互作,质的量、磷形态、蛋白质量与磷形态间的互作,差异均达极显著水平差异均达极显著水平这里,仅需对互作进行多重比较即可这里,仅需对互作进行多重比较即可多重比较:多重比较:2 3 4 5 6 2.97 3.61 4.00 4.28 4.49 4.07 4.70
21、5.05 5.38 5.60 0.82 0.99 1.10 1.18 1.23 1.12 1.29 1.39 1.48 1.54(同学们先自行完成这一多重比较同学们先自行完成这一多重比较)0.30190.27474eMSSEn0.050.01qq0.050.01LSRLSRR将各组合的平均值按从大到小的次序排列:将各组合的平均值按从大到小的次序排列:组合组合 0.05 0.01 9.40 a A 7.11 b B 6.76 b BC 6.32 bc BC 5.52 c C 3.24 d D (请同学们自行完成平均数表的设置)(请同学们自行完成平均数表的设置)112112A BA BA B223
22、132A BA BA Bijx课堂练习:课堂练习:今有一个试验,其数据分析为今有一个试验,其数据分析为 F 值极显著,请对资值极显著,请对资料的料的 6 个平均值进行多重比较:个平均值进行多重比较:R 2 3 4 5 6LSR0.05 0.82 0.99 1.10 1.18 1.23LSR0.01 1.12 1.29 1.39 1.48 1.54平均值:平均值:1:6.48 2:6.32 3:7.95 4:4.50 5:5.52 6:7.11这里我们介绍的是组合内的数据量是一样多的情况这里我们介绍的是组合内的数据量是一样多的情况当组合内数据量不一样多时,可采用以下两种方法当组合内数据量不一样多
23、时,可采用以下两种方法进行方差分析:进行方差分析:1、将每一组合内的数据截取为一样多、将每一组合内的数据截取为一样多例如,有的组合是例如,有的组合是 5 个数据,有的为个数据,有的为 7 个数据,最个数据,最少的为少的为 3 个,则可将所有组合均截为个,则可将所有组合均截为 3个数据个数据(取每一组合的平均值周围的数据)进行方差分(取每一组合的平均值周围的数据)进行方差分析析2、使用、使用最小二乘方差分析法最小二乘方差分析法进行进行目前使用的统计软件均为最小二乘方差分析法,这目前使用的统计软件均为最小二乘方差分析法,这一方法可不考虑组合内样本量的多少,甚至某一一方法可不考虑组合内样本量的多少,
24、甚至某一组合内为组合内为 0 都可以进行方差分析都可以进行方差分析第五节第五节 系统分组资料的方差分析系统分组资料的方差分析系统分组设计,又称为巢式设计、树状设计、多因系统分组设计,又称为巢式设计、树状设计、多因子嵌套设计子嵌套设计其英文名称为:其英文名称为:nested design假设有假设有 A、B 两个因子,这两个因子的搭配组成不两个因子,这两个因子的搭配组成不再是上一节的交叉构成,而是再是上一节的交叉构成,而是 B 因子嵌套在因子嵌套在 A 因因子内,即子内,即 B 因子为次级因子:因子为次级因子:A 因子的某一个水平包含了因子的某一个水平包含了 B 因子部分水平因子部分水平A 因子
25、的另一个水平包含了因子的另一个水平包含了 B 因子的另一部分水平因子的另一部分水平即:即:B 因子的水平仅从属于因子的水平仅从属于 A 因子的一个水平因子的一个水平而而 A 因子的水平并不包含因子的水平并不包含 B 因子的所有水平因子的所有水平如果有第三个因子如果有第三个因子 C,则,则 C 因子嵌套在因子嵌套在 B 因子内因子内如果有第四个因子如果有第四个因子 D,则,则 D 因子嵌套在因子嵌套在 C 因子内因子内以此类推以此类推其数据结构呈现树状结构其数据结构呈现树状结构如行政区划,就是典型的系统结构:如行政区划,就是典型的系统结构:国家包含若干个省(国家包含若干个省(A)、一个省()、一
26、个省(A)包含若干个市()包含若干个市(B)、)、一个市一个市(B)包含若干个县(包含若干个县(C)、一个县()、一个县(C)包含若干)包含若干个镇(个镇(D)、一个镇()、一个镇(D)包含若干个村()包含若干个村(E)再如:畜牧生产中:一头公畜(再如:畜牧生产中:一头公畜(A)交配若干头母畜、一头)交配若干头母畜、一头母畜(母畜(B)生产若干头仔畜、每头仔畜()生产若干头仔畜、每头仔畜(C)有若干次生)有若干次生产成绩产成绩在这种数据结构中,在这种数据结构中,各 因子的重要性是不完全相等因子的重要性是不完全相等的,下一级因子的重要性往往低于上一级因子的,下一级因子的重要性往往低于上一级因子
27、A1 Ai AaB11 B12 B1b Bi1 Bi2 Bib Ba1 Ba2 Bab C111 C112 C11c Ca11 Ca12 Ca1c A 因子称为一级因子,因子称为一级因子,B 因子称为二级因子,因子称为二级因子,因子之间是一种从属关系,而非上一节因子之间是一种从属关系,而非上一节 A、B 因子因子的交叉构成中所讨论的那种平行关系的交叉构成中所讨论的那种平行关系 下面我们写出两因子系统分组资料的数据结构:下面我们写出两因子系统分组资料的数据结构:A因子因子 B因子因子 观测值观测值 B因子和因子和 A因子和因子和 T A1 B11 x111 x112 x11.B12 x121 x
28、122 x12.x1.A2 B21 x211 x212 x21.B22 x221 x222 x22.x2.Ai Bi1 xi11 xi12 xi1.Bi2 xi21 xi22 xi2.xi.Ap Bp1 xp11 xp12 xp1.Bp2 xp21 xp22 xp2.xp.x根据这一数据结构我们可以写出其数学模型:根据这一数据结构我们可以写出其数学模型:式中,式中,为总体平均为总体平均i为为 A 因子第因子第 i 个水平的效应个水平的效应ijij为为 A 因子第因子第 i 个水平下的个水平下的 B 因子第因子第 j 个水平个水平的效应的效应ijkijk为随机误差,且为随机误差,且p为为 A 因
29、子的水平数;因子的水平数;qi为第为第 i 个个 A 因子水平下因子水平下 B 因子的水平数;因子的水平数;nij为第为第 i 个个 A 水平中第水平中第 j 个个 B 水平中的观测值水平中的观测值1,2,.,;1,2,.;1,2,.,ijkiijijkiijxip jq kn20,ijkN下面我们先介绍两个概念:下面我们先介绍两个概念:固定因子固定因子(fixed factor):):如果一个试验中,某一因子的水平是我们有目的地如果一个试验中,某一因子的水平是我们有目的地挑选的,因而我们只是希望将这几个水平进行比挑选的,因而我们只是希望将这几个水平进行比较,也只是希望知道这几个水平的差异,并
30、不将较,也只是希望知道这几个水平的差异,并不将分析结果引申到其他水平,这样的因子就是固定分析结果引申到其他水平,这样的因子就是固定因子,固定因子的水平所产生的效应就是因子,固定因子的水平所产生的效应就是固定效固定效应应(fixed effect)随机因子随机因子(random factor):):如果一个因子的各个水平是从这因子的所有水平中如果一个因子的各个水平是从这因子的所有水平中随机挑选出来的,我们的试验目的是希望通过这随机挑选出来的,我们的试验目的是希望通过这几个水平的差异情况了解整个因子的变异情况,几个水平的差异情况了解整个因子的变异情况,即对这一因子的方差进行检验和估计,从而知道即对
31、这一因子的方差进行检验和估计,从而知道这一因子的方差组分,这样的因子就是随机因子,这一因子的方差组分,这样的因子就是随机因子,随机因子的各个水平所产生的效应就是随机因子的各个水平所产生的效应就是随机效应随机效应(random effect)在数学模型在数学模型 中:中:如果如果 A、B 两个因子所产生的效应都是固定效应,两个因子所产生的效应都是固定效应,这样的数学模型就是固定效应模型(简称这样的数学模型就是固定效应模型(简称固定模固定模型型 fixed model),我们的检验目的是希望比较这),我们的检验目的是希望比较这一因子各参与试验的水平之间的差异一因子各参与试验的水平之间的差异固定模型
32、中,我们总假定:固定模型中,我们总假定:ijkiijijkx00jijj如果如果 A、B 两因子所产生的效应都是随机效应,这两因子所产生的效应都是随机效应,这样的数学模型就是样的数学模型就是随机模型随机模型(random model),),我们的检验目的是希望知道每个因子的不同水平我们的检验目的是希望知道每个因子的不同水平效应的方差效应的方差2 2 和和2 2 是否为是否为 0两因子各个水平的效应之间相互独立两因子各个水平的效应之间相互独立A 因子和因子和 B 因子效应之间也相互独立因子效应之间也相互独立且且:220,0,iijNN如果两个因子,一个为固定因子(如如果两个因子,一个为固定因子(
33、如 A 因子),另因子),另一个为随机因子(如一个为随机因子(如 B 因子),由这样的两个因因子),由这样的两个因子组成的数学模型即为子组成的数学模型即为混合模型混合模型(mixed model),我们的检验目的是:),我们的检验目的是:A 因子各水平之间是否存在差异因子各水平之间是否存在差异B 因子不同水平效应的方差因子不同水平效应的方差2 2是否为是否为 0 0这时:这时:且不同的且不同的ijij彼此独立彼此独立200,iijN我们在上一节讨论的两因子(我们在上一节讨论的两因子(A、B因子)交叉分组因子)交叉分组资料也有固定模型、随机模型、混合模型之分,资料也有固定模型、随机模型、混合模型
34、之分,但在一般情况下,这种分组资料更多的是固定模但在一般情况下,这种分组资料更多的是固定模型,因此其方差分析方法是固定效应的分析型,因此其方差分析方法是固定效应的分析而系统分组资料则三种模型都有而系统分组资料则三种模型都有系统分组资料常见于数量遗传学、动物育种学中系统分组资料常见于数量遗传学、动物育种学中此时我们往往希望通过方差组分的计算估计遗传参此时我们往往希望通过方差组分的计算估计遗传参数,从而进行数量遗传学的研究数,从而进行数量遗传学的研究但系统分组资料进行固定效应的估计也是常见的但系统分组资料进行固定效应的估计也是常见的下面我们给出平方和与自由度的剖分公式:下面我们给出平方和与自由度的
35、剖分公式:每一观测值的总离均差平方为:每一观测值的总离均差平方为:等式两边求和(各乘积项的和均为等式两边求和(各乘积项的和均为 0)上式中,右手第二项称为上式中,右手第二项称为 A因子内因子内 B因子水平间因子水平间 SS 22.222.ijkijkijijiiijkijijiixxxxxxxxxxxxxx各乘积项22.22.ijkijkijijkijkijijiiiijixxxxnxxnxx TeAB ASSSSSSSS 为为 A 因子第因子第 i 个水平中的观测值个数个水平中的观测值个数上一页的仅为推导的理论公式上一页的仅为推导的理论公式在实际计算时,我们使用以下公式在实际计算时,我们使用
36、以下公式(从理论公式如何到下面的实际计算公式,同学们(从理论公式如何到下面的实际计算公式,同学们应当很清楚了)应当很清楚了)校正值:校正值:总平方和:总平方和:A因子平方和:因子平方和:B因子平方和:因子平方和:.iijjnn2TCN2TijkSSxC2.1AiiSSxCn2.1BiijSSxCnA 因子内因子内 B 因子水平间平方和:因子水平间平方和:误差平方和:误差平方和:相应的自由度:相应的自由度:相应的均方:相应的均方:22.11ijiBAB AijiSSxCxCSSSSnn eTATBB ASSSSSSSSSSSS 11TAiB AeidfNdfpdfqpdfNq AAAB AB A
37、B AeeeSSMSdfSSMSdfSSMSdf根据试验的要求不同,次级及次级内观测值可分为根据试验的要求不同,次级及次级内观测值可分为重复数相等和不等两种情况重复数相等和不等两种情况下面我们以例题来说明具体的分析方法下面我们以例题来说明具体的分析方法一、次级样本含量相等的系统分组资料一、次级样本含量相等的系统分组资料例例1:对鲤鱼进行选育,考察:对鲤鱼进行选育,考察 4 个鲤鱼品种个鲤鱼品种 B,每,每个品种选择个品种选择 2 个家系个家系 F,每个家系考察,每个家系考察 3 尾雌性尾雌性亲鱼的平均后代增重亲鱼的平均后代增重xijk,得数据如下表(数据已,得数据如下表(数据已经过了简化)经过
38、了简化)B F xijk F B F SS F B B 后代增重 后代 后代 和 平均 和 平均1 1 2.2 2.3 2.0 3 6.5 14.13 2.17 2 2.0 2.1 2.3 3 6 6.4 13.70 2.13 12.9 2.152 3 1.6 1.5 1.7 3 4.8 7.70 1.60 4 1.8 2.0 1.7 3 6 5.5 10.13 1.83 10.3 1.723 5 2.6 2.5 2.2 3 7.3 17.85 2.43 6 2.4 2.4 2.2 3 6 7.0 16.36 2.33 14.3 2.38 4 7 1.8 1.5 1.7 3 5.0 8.38
39、1.67 8 1.5 1.6 1.4 3 6 4.5 6.77 1.50 9.5 1.58 24 24 47.0 95.02 47 上表中上表中,p=4,q=2,n=3 N=24校正值校正值 C=92.0417SST=(2.22+2.32+.1.42)-C=95.02-C=2.9783SSB=(12.92+9.52)/6 -C=94.54-C=2.4983 (一级样本间)(一级样本间)SSF(B)=(6.52+4.52)/3 -(12.92+9.52)/6=94.68-94.54=0.14 (二级样本间)(二级样本间)SSe=SST SSS-SSD(S)=2.9783-2.4983-0.14=
40、0.34自由度:自由度:dfT=423 1=23dfB=4 1 =3dfF(B)=4(2-1)=4dfe=42(3-1)=16 将平方和及自由度填入方差分析表中,并计算各均将平方和及自由度填入方差分析表中,并计算各均方和方和 F 值:值:方差分析表:方差分析表:变异来源变异来源 SS df MS F F0.05 F0.01品种间品种间B 2.4983 3 0.8328 23.79*6.59 16.69(公猪内公猪内)家系间家系间F 0.14 4 0.035 1.64 3.01误误 差差e 0.34 16 0.02125 T 2.9783 23 上述计算中,上述计算中,0.832823.790.
41、0350.0351.640.02125BBFFFeMSFMSMSFMS即:两个不同级别的即:两个不同级别的 F 值均由下一级的值均由下一级的 MS 作为比作为比较标准,而不再是统一由误差项均方作为比较标较标准,而不再是统一由误差项均方作为比较标准准而查而查 F所用的自由度也应作相应的变动,即:所用的自由度也应作相应的变动,即:FB的自由度分别为的自由度分别为 df1=3,df2=4FF的自由度分别为的自由度分别为 df1=4,df2=16由于不同品种间的增重差异极显著,而家系间差异由于不同品种间的增重差异极显著,而家系间差异不显著,因此,应对品种(一级样本)作多重比不显著,因此,应对品种(一级
42、样本)作多重比较:较:0.0350.07642 3FMSSEqn R 2 3 4 品种品种 0.05 0.01 q0.05 3.93 5.00 5.76 3 2.38 a A q0.01 6.51 8.12 9.17 1 2.15 a ABLSR0.05 0.30 0.38 0.44 2 1.72 b BLSR0.01 0.50 0.62 0.70 4 1.58 b B如果家系间差异亦显著,则应当对家系进行多重比如果家系间差异亦显著,则应当对家系进行多重比较,比较时的标准误以误差项均方为分子,每个较,比较时的标准误以误差项均方为分子,每个家系的样本量为分母进行计算家系的样本量为分母进行计算查查
43、 q 表时用误差项自由度表时用误差项自由度本例中,我们将品种、家系均作为固定因子处理,本例中,我们将品种、家系均作为固定因子处理,因此其模型为固定模型因此其模型为固定模型ix如果是估计遗传参数,则品种、家系均为随机因子,如果是估计遗传参数,则品种、家系均为随机因子,则模型为随机模型则模型为随机模型当然也可以将品种作为随机因子,家系作为固定因当然也可以将品种作为随机因子,家系作为固定因子处理,则模型为混合模型子处理,则模型为混合模型处理实际数据资料时,样本量肯定要大得多,本例处理实际数据资料时,样本量肯定要大得多,本例仅是一个说明统计方法的例子而已仅是一个说明统计方法的例子而已二、次级样本含量不
44、等的系统分组资料二、次级样本含量不等的系统分组资料我们还以例子来说明统计方法我们还以例子来说明统计方法调查调查 3 个县的渔业情况,各县抽取若干个乡镇,每个县的渔业情况,各县抽取若干个乡镇,每个乡镇抽取若干个调查样点,得渔业产值(为了个乡镇抽取若干个调查样点,得渔业产值(为了方便计算,数据已经过简化)如下,试进行分析方便计算,数据已经过简化)如下,试进行分析县别县别 乡别乡别 各样点观测值各样点观测值 乡样乡样 县样县样 乡和乡和 平方和平方和 乡平均乡平均 县和县和 县平均县平均一级一级 二级二级 点数点数 点数点数 A B nij ni.Tij xij Ti xi 1 21 19 21 1
45、8 20 5 99 1967 19.8 1 2 16 18 18 3 52 904 17.3 3 18 19 20 18 4 12 75 1409 18.75 226 18.83 2 4 16 14 16 13 15 14 6 88 1298 14.7 5 17 16 15 17 4 10 65 1059 16.25 153 15.30 6 15 18 16 17 15 5 81 1319 16.2 3 7 16 14 17 15 15 13 6 90 1360 15 8 17 18 18 3 14 53 937 17.7 224 16.0 36 36 603 10253 603将原始数据整理
46、成表,并计算右边的一级数据,与左将原始数据整理成表,并计算右边的一级数据,与左边连成一个表边连成一个表此例中:此例中:p=3 为一级样本数为一级样本数q1=3,q2=2,q3=3 为二级样本数为二级样本数n11=5,n12=3,n33=3 得:n1=12,n2=10,n3=14 校正值校正值 C=10100.25 8iQq36ijiNnn 2222152.7580.9832.039.77TijkiAiijiB AijieTAB ASSxCTSSCnTTSSnnSSSSSSSS 135121528TAiB AeTB AdfNdfpdfqdfdfdfadf 设立无效假设(此处略,该如何设立?)设立
47、无效假设(此处略,该如何设立?)建立方差分析表建立方差分析表变异来源变异来源 SS df MS F F0.05 F0.01县别间县别间 A 80.98 2 40.49 6.33*5.79 13.27乡别间乡别间 B 32.00 5 6.40 4.51*2.56 3.76误误 差差 39.77 28 1.42 T 152.75 35其中:其中:40.496.3276.406.404.511.42AABBBeMSFMSMSFMS由于县、乡两级分别为显著、极显著,因此应分别由于县、乡两级分别为显著、极显著,因此应分别作多重比较作多重比较首先对县进行多重比较,各县的样本量不等,因此首先对县进行多重比较
48、,各县的样本量不等,因此先求先求k1:然后求然后求SE:R 2 3 q0.05 3.61 4.54 q0.01 5.70 6.97 LSR0.05 2.65 3.33 LSR0.01 4.18 5.11 22221121014363611.88912inNNkp16.400.73411.889BMSSEk县别县别 0.05 0.01 1 18.83 a A 3 16.0 b A 2 15.30 b A 对乡别进行多重比较:对乡别进行多重比较:首先求首先求k2:然后求然后求SE:ix 222222222253464563361210144.32713 12 13 1ijiinNnkq1.420.
49、5734.327SE R 2 3 4 5 6 7 8 q0.05 2.90 3.49 3.86 4.13 4.32 4.48 4.62 q0.01 3.91 4.48 4.84 5.09 5.28 5.44 5.58LSR0.05 1.67 2.00 2.21 2.37 2.47 2.57 2.65 LSR0.01 2.24 2.57 2.77 2.92 3.02 3.12 3.20多重比较表:多重比较表:乡别乡别 0.05 0.01 1 19.8 a A 3 18.75 ab AB 8 17.67 bc ABC 2 17.30 bc ABC 5 16.25 cd BC 6 16.20 cd
50、BC 7 15.00 d C 4 14.67 d C请同学们自行作两个平均值表或平均值图请同学们自行作两个平均值表或平均值图ijx可能大家都注意到了:可能大家都注意到了:在上面两个例子中我们并没有用到随机因子和固定在上面两个例子中我们并没有用到随机因子和固定因子这两个概念,这是因为我们这里仅仅进行了因子这两个概念,这是因为我们这里仅仅进行了普通的方差分析,而没有涉及到遗传参数的分析,普通的方差分析,而没有涉及到遗传参数的分析,因此这里的因子都是固定因子,其所涉及的数学因此这里的因子都是固定因子,其所涉及的数学模型就都是固定模型模型就都是固定模型在第一例中如果我们需要分析公猪和母猪在后代增在第一