1、第十章第十章试验设计及其统计分析试验设计及其统计分析生物学是一门实验性科学。生物学是一门实验性科学。收集资料,确定课题收集资料,确定课题制订方案,可行性分析制订方案,可行性分析进行实验,得出结论进行实验,得出结论 物质条件,技术方法物质条件,技术方法 仪器设备的精度要求仪器设备的精度要求 制订方案制订方案数据分析数据分析实验技术实验技术123学习目标学习目标 掌握:试验设计的基本原理;对比设计、掌握:试验设计的基本原理;对比设计、随机区组设计、裂区设计、正交设计随机区组设计、裂区设计、正交设计4种常用的试验设计及其统计方法。种常用的试验设计及其统计方法。 熟悉:不同试验设计的适用情况。熟悉:不
2、同试验设计的适用情况。第一节第一节第二节第二节第四节第四节试验设计的基本原理试验设计的基本原理裂区设计及其统计分析裂区设计及其统计分析试验设计及其统计分析第五节第五节统计设计及其统计分析统计设计及其统计分析对比设计及其统计分析对比设计及其统计分析第三节第三节随机区组设计及其统计分析随机区组设计及其统计分析第一节:试验设计的基本原理第一节:试验设计的基本原理一、试验设计的意义一、试验设计的意义二、生物学试验的基本要求二、生物学试验的基本要求三、试验设计的基本要素三、试验设计的基本要素四、试验误差及其控制途径四、试验误差及其控制途径五、试验设计的基本原则五、试验设计的基本原则一、试验设计的意义一、
3、试验设计的意义课题的名称课题的名称试验目的试验目的研究依据、内容研究依据、内容试验方案试验方案试验单位的选取试验单位的选取试验记录项目和要求试验记录项目和要求试验结果的分析方法试验结果的分析方法经济或社会效益分析经济或社会效益分析已备条件已备条件尚缺少的条件尚缺少的条件参加研究人员参加研究人员试验时间、地点试验时间、地点成果形式成果形式学术论文撰写学术论文撰写试验单位的重复数试验单位的重复数进度安排、经费预算进度安排、经费预算研究的预期效果研究的预期效果试验单位的分组试验单位的分组试验单位的选取试验单位的选取试验单位的重复数试验单位的重复数试验单位的分组试验单位的分组广 义狭 义节省人力、物力
4、、财力和时间节省人力、物力、财力和时间减少试验误差,提高试验的精确度,减少试验误差,提高试验的精确度,取得真实的试验资料,为统计分析得取得真实的试验资料,为统计分析得出正确的判断和结构打下基础。出正确的判断和结构打下基础。12二、生物学试验的基本要求二、生物学试验的基本要求试验目的明确试验目的明确试验条件有代表性试验条件有代表性试验结果可靠试验结果可靠试验结果能够重演试验结果能够重演严格要求试验的正确执行和试验条件的代表性;注意试验的环节,全面掌握试验的条件,详实的试验记载考虑季节变异的特点,克服年份、地点环境条件的差异在相同的条件下,再进行试验在相同的条件下,再进行试验或实践,应能重复获得与
5、原试或实践,应能重复获得与原试验结果相类似的结果。验结果相类似的结果。123试验结果重演基本要素处理因素处理因素受试对象受试对象处理效应处理效应三、试验设计的基本要素三、试验设计的基本要素处理(因素)处理(因素)概念概念 对受试对象给予的对受试对象给予的某种外部干预(或措施)某种外部干预(或措施)特点特点 人为设置人为设置单因素处理单因素处理多因素处理多因素处理处处理理因因素素实验中注意主要因素实验中注意主要因素控制非处理因素控制非处理因素处理因素标准化处理因素标准化123受试对象受试对象处理因素的客体,即根据研处理因素的客体,即根据研究目的而确定的观测总体。究目的而确定的观测总体。必须对其具
6、体条件做出严格必须对其具体条件做出严格规定,保证其规定,保证其同质性同质性。处理效应处理效应处理因素作用于受试对象处理因素作用于受试对象的反应的反应误差效应误差效应试验效应试验效应?研究结果的最终体现研究结果的最终体现12 试验误差的概念试验误差的概念来源来源控制途径控制途径表示方法表示方法四、试验误差及其控制途径四、试验误差及其控制途径处理的真实效应处理的真实效应不能完全一致的其他因素的偶然影响不能完全一致的其他因素的偶然影响处理效应处理效应误差效应误差效应试验效应试验效应观测值使观测值偏离试验处理使观测值偏离试验处理真值的偶然影响称为试真值的偶然影响称为试验误差或误差验误差或误差(erro
7、r)。试验材料固有的差异试验材料固有的差异试验条件不一致试验条件不一致操作技术不一致操作技术不一致偶然性因素的影响偶然性因素的影响疏忽大意造成疏忽大意造成(二)试验误差的来源(二)试验误差的来源绝对误差 观测值与真值之差相对误差 绝对误差与真值之比平均值标准差(三)试验误差的表示(三)试验误差的表示保证实验材料的均一性及实验环境的稳定性保证实验材料的均一性及实验环境的稳定性改进操作管理制度,使之标准化改进操作管理制度,使之标准化消除系统误差消除系统误差精心选择试验单位精心选择试验单位采用合理的试验设计采用合理的试验设计(四)试验误差的控制(四)试验误差的控制随随 机机重重 复复局部控制局部控制
8、无偏估计误差无偏估计误差降低误差降低误差估计误差估计误差统计推断统计推断提高精确性提高精确性三三原原则则作作用用五、试验设计的基本原则五、试验设计的基本原则第二节:对比设计第二节:对比设计对比法:对比法:适用于单因素试验。适用于单因素试验。简单对比设计简单对比设计邻比设计邻比设计只有一个只有一个CK每一个处理相邻都有一个每一个处理相邻都有一个CK动物试验中称为配对试验设计。动物试验中称为配对试验设计。把窝别、性别相同、年龄、体重相近的两个动物配把窝别、性别相同、年龄、体重相近的两个动物配成一对,然后用随机的方法将每对的两头动物分别成一对,然后用随机的方法将每对的两头动物分别安排到两组中。动物试
9、验中称为配对试验设计。安排到两组中。动物试验中称为配对试验设计。同一对动物之间差异要尽量小些,不同对之间的动同一对动物之间差异要尽量小些,不同对之间的动物可以有差异。物可以有差异。也可进行同一只动物前后两次进行不同的处理,对也可进行同一只动物前后两次进行不同的处理,对处理前后的结果进行比较。处理前后的结果进行比较。对比法试验,由于为顺序排列,不能正确估对比法试验,由于为顺序排列,不能正确估计出无偏的试验误差,因而试验结果不能采计出无偏的试验误差,因而试验结果不能采用方差分析的方法进行显著性检验。用方差分析的方法进行显著性检验。一般采用百分比法。一般采用百分比法。某处理总和数某处理总和数对邻近对
10、邻近CK的的邻近邻近CK总和数总和数第三节:随机区组设计第三节:随机区组设计(randomized block design)随机区组设计是根据局部控制和随机原理进行的,随机区组设计是根据局部控制和随机原理进行的,将试验单位按性质不同分成与重复数一样多的组,将试验单位按性质不同分成与重复数一样多的组,使区组内环境差异最小而区组间环境差异最大,使区组内环境差异最小而区组间环境差异最大,每个区组均包括各处理的一个小区。每个区组均包括各处理的一个小区。区组内各处理随机排列,各区组独立随机排列。区组内各处理随机排列,各区组独立随机排列。 随机区组设计的优点是每个区组内的随机区组设计的优点是每个区组内的
11、受试对象有较好的同质性,因此组间受试对象有较好的同质性,因此组间均衡性也较好。比完全随机设计减少均衡性也较好。比完全随机设计减少了误差,因而更容易察觉处理组间的了误差,因而更容易察觉处理组间的差别,提高了实验效率。差别,提高了实验效率。 单因素随机区组试验设计的统计分析是将区组单因素随机区组试验设计的统计分析是将区组看成一个试验因素,与试验因素一起作方差分看成一个试验因素,与试验因素一起作方差分析,方法与双因素无重复观测值的方差分析相析,方法与双因素无重复观测值的方差分析相似,主要做区组间、处理间和试验误差三方面似,主要做区组间、处理间和试验误差三方面的方差分析。的方差分析。 双因素随机区组试
12、验设计的统计分析相对较复双因素随机区组试验设计的统计分析相对较复杂,主要做区组间、杂,主要做区组间、A因素、因素、B因素、因素、AB交互交互作用和试验误差几方面的方差分析。作用和试验误差几方面的方差分析。第四节:裂区设计第四节:裂区设计裂区设计是裂区设计是多因素多因素试验的一种形式。试验的一种形式。裂区设计是先将每一区按第一因素的处理数裂区设计是先将每一区按第一因素的处理数划分为小区,称为主区(整区),在主区里划分为小区,称为主区(整区),在主区里随机安排主处理。随机安排主处理。在主区内引进第二个因素的各个处理(副处在主区内引进第二个因素的各个处理(副处理),就是主处理的小区内分设与副处理相理
13、),就是主处理的小区内分设与副处理相等的更小的小区,称为副区(裂区),在副等的更小的小区,称为副区(裂区),在副区里随机排列副处理。区里随机排列副处理。在一个因素的各处理比另一个因素的在一个因素的各处理比另一个因素的各处理需要更大区域时各处理需要更大区域时需要较大区域的因素作为主处理,设在主区需要较大区域的因素作为主处理,设在主区需要较小区域的因素作为副处理,设在副区需要较小区域的因素作为副处理,设在副区使用范围使用范围试验中某一因素的主效比另一因素的试验中某一因素的主效比另一因素的主效更为重要,而且要求的精度较高主效更为重要,而且要求的精度较高将要求精度较高的因素作为副处理,另一因素将要求精
14、度较高的因素作为副处理,另一因素作为主处理。作为主处理。根据以往的研究,知道某些因素的效根据以往的研究,知道某些因素的效应比另一些因素的效应更大时也适于应比另一些因素的效应更大时也适于采用裂区设计采用裂区设计将可能表现较大差异的因素作为主处理将可能表现较大差异的因素作为主处理试验设计需要临时改动再加入一个试验因素试验设计需要临时改动再加入一个试验因素可在原设计中的小区(主区)中再划分小区可在原设计中的小区(主区)中再划分小区(副区),增加一个试验因素,就成了裂区设(副区),增加一个试验因素,就成了裂区设计。计。 A1 A2 A3 AaB1 B2 B3 Bb B1 B2 B3 Bb B1 B2
15、B3 Bb B1 B2 B3 Bb A1 A2 A3 AaB1 B2 B3 Bb B1 B2 B3 Bb B1 B2 B3 Bb B1 B2 B3 Bb A因素因素a个水平个水平 B因素因素b个水平个水平 r个区组个区组rab 观测值主主区区部部分分副副区区部部分分区组区组A误差误差a总变异总变异BA B误差误差b总变异总变异r-1a-1(r-1)(a-1)ra-1b-1(a-1)(b-1)a(r-1)(b-1)rab-1变异来源变异来源自由度自由度第五节:正交设计第五节:正交设计正交试验的基本特点:用部分试验来代替正交试验的基本特点:用部分试验来代替全面试验,通过对部分试验结果的分析,全面试
16、验,通过对部分试验结果的分析,了解全面试验的情况。了解全面试验的情况。SNLq 正交表是一种特别的表格,是正交设计的基本工具。正交表是一种特别的表格,是正交设计的基本工具。我们只介绍它的记号、特点和使用方法。我们只介绍它的记号、特点和使用方法。 正交表的记号及含义正交表的记号及含义记号及含义记号及含义 正交表的列数正交表的列数(最多能安排的因素个数,(最多能安排的因素个数,包括交互作用、误差等)包括交互作用、误差等)S正交表的行数正交表的行数(需要做的试验次数)(需要做的试验次数)N各因素的水平数各因素的水平数(各因素的水平数相等)各因素的水平数相等)q正交表正交表的代号的代号L如如 782L
17、表示表示 782L表示各因素的表示各因素的水平数水平数为为2,做做8次试验次试验,最多考虑,最多考虑7个个因素因素(含交互作用)的(含交互作用)的正正交表交表。 正交表的特点正交表的特点1、正交表中任意一列中,不同的数字出现的次数相等;、正交表中任意一列中,不同的数字出现的次数相等;表示:在试验安排中,所挑选出来的水平组合是均匀表示:在试验安排中,所挑选出来的水平组合是均匀 分布的(每个因素的各水平出现的次数相同)分布的(每个因素的各水平出现的次数相同) 均衡分散性均衡分散性2、正交表中任意两列,把同行的两个数字看成有序数、正交表中任意两列,把同行的两个数字看成有序数 对时,所有可能的数对出现
18、的次数相同。对时,所有可能的数对出现的次数相同。表示:任意两因素的各种水平的搭配在所选试验中出现表示:任意两因素的各种水平的搭配在所选试验中出现 的次数相等的次数相等 整齐可比性整齐可比性这是设计正交试验表的基本准则这是设计正交试验表的基本准则 正交试验设计的基本步骤正交试验设计的基本步骤1. 确定目标、选定因素(包括交互作用)、确定水平;确定目标、选定因素(包括交互作用)、确定水平;2. 选用合适的正交表;选用合适的正交表;3. 按选定的正交表设计表头,确定试验方案;按选定的正交表设计表头,确定试验方案;4. 组织实施试验;组织实施试验;5. 试验结果分析。试验结果分析。例例1 为了解决花菜
19、留种问题,以进一步提高花菜种子为了解决花菜留种问题,以进一步提高花菜种子的产量和质量,科技人员考察了浇水、施肥、病害防的产量和质量,科技人员考察了浇水、施肥、病害防治和移入温室时间对花菜留种的影响,进行了四个因治和移入温室时间对花菜留种的影响,进行了四个因素各两个水平的正交试验,各因素及其水平如下表:素各两个水平的正交试验,各因素及其水平如下表:因素因素水平水平1水平水平2A:浇水次数:浇水次数 不干死为原则,整个不干死为原则,整个生长期只浇水生长期只浇水12次次根据生长需水量和自然根据生长需水量和自然条件浇水,但不过湿条件浇水,但不过湿B:喷药次数:喷药次数 发现病害即喷药发现病害即喷药每半
20、月喷一次每半月喷一次C:施肥次数:施肥次数 开花期施硫酸铵开花期施硫酸铵进室发根期、抽薹期、进室发根期、抽薹期、开花期和结果期各施肥开花期和结果期各施肥一次一次D:进室时间:进室时间 11月初月初11月月15日日解解 第一步:选择适当的正交表第一步:选择适当的正交表 这是一个四因素两水平的正交试验及分析问题,这是一个四因素两水平的正交试验及分析问题,因此要选择因此要选择2SNL型的表,且不考虑交互作用时,型的表,且不考虑交互作用时, 6S , 782L仍然是满足条件的最小的正交表,仍然是满足条件的最小的正交表,所以选用正交表所以选用正交表 782L注:也可由试验次数应满足的条件来选择正交表。注
21、:也可由试验次数应满足的条件来选择正交表。 若考虑若考虑A与与B、A与与C的交互作用,则的交互作用,则 4S ,而,而 782L是满足条件的最小的正交表,是满足条件的最小的正交表,所以还可选用正交表所以还可选用正交表 782L其中:其中:,Tii jEii jdfdfdfdfN由由 确定。确定。1TdfN是可求出的,而是可求出的,而 是未知的,是未知的,,ii jii jdfdfEdf当不考虑交互作用时:可取当不考虑交互作用时:可取11NS q故故 N 不是唯一的。不是唯一的。试验次数试验次数N的确定原则的确定原则 所以一般地,由所以一般地,由 ,1ii jii jNdfdf确定确定 N, 如
22、三因素四水平如三因素四水平 43 的正交试验至少应安排的正交试验至少应安排3 4 1110 次以上的试验。次以上的试验。 如三因素四水平如三因素四水平 43 并包括第一、二个因素的交互并包括第一、二个因素的交互作用作用的正交试验至少应安排的试验次数为的正交试验至少应安排的试验次数为 3 4 14 14 1119 若再加上包括第一、五个因素的交互作用的正交试若再加上包括第一、五个因素的交互作用的正交试验则至少应安排的试验次数为验则至少应安排的试验次数为 43 4 13 2 112 1161 3 4 13 2 1113 次以上的试验。次以上的试验。3342 又如安排又如安排 的混合水平的正交试验至
23、少应安排的混合水平的正交试验至少应安排所以一般地,有所以一般地,有 ,1ii jii jNdfdf花菜留种的表头设计花菜留种的表头设计列号列号 1 2 3 4 5 6 7因子因子A BABCDA C考虑交互作用考虑交互作用A B和和A C,则例,则例1的表头可设计为的表头可设计为 注:第注:第6列为空白列,当随机误差列;也可把第列为空白列,当随机误差列;也可把第7列列作空白列。一般要求至少有一个空白列。作空白列。一般要求至少有一个空白列。按正交表按正交表 得试验方案:得试验方案:782L 只需将各列中的数字只需将各列中的数字“1”、“2”分别理解为所填因素分别理解为所填因素在试验中的水平数,每
24、一行就是一个试验方案。在试验中的水平数,每一行就是一个试验方案。第二步第二步 表头设计表头设计第三步第三步 按所选定的正交试验方案组织试验,记录试验按所选定的正交试验方案组织试验,记录试验 结果;见结果;见P193 表表10-20、21 水水 列列平平 号号试验号试验号ABAXB CAXCD产量产量12345671111111135021112222325312211224254122221142552121212200621221212507221122127582212112375 第四步第四步 分析正交试验结果分析正交试验结果方法方法1 直观分析(极差分析)直观分析(极差分析) (1)计
25、算极差,确定因素的主次顺序)计算极差,确定因素的主次顺序 第第j列的极差列的极差 maxminjijijiiRTT maxminjijijiiRTT或或 极差越大,说明这个因素的水平改变对试验结果的极差越大,说明这个因素的水平改变对试验结果的影响越大,极差最大的那个因素,就是最主要的因素。影响越大,极差最大的那个因素,就是最主要的因素。对例对例1来说,各因素的主次顺序为来说,各因素的主次顺序为 ABA CCDAB(2)确定最优方案)确定最优方案 如果不考虑交互作用,则根据各因素在各水平下的总产量或如果不考虑交互作用,则根据各因素在各水平下的总产量或平均产量的高低确定最优方案;如果考虑交互作用,
26、则取各平均产量的高低确定最优方案;如果考虑交互作用,则取各种搭配下产量的平均数,按优化标准确定最优方案。种搭配下产量的平均数,按优化标准确定最优方案。本例中,不考虑交互作用,在方案本例中,不考虑交互作用,在方案A1B2C2D2最优,但交互最优,但交互作用作用A C是第三重要因素,所以需考虑是第三重要因素,所以需考虑A、C的搭配对实验的搭配对实验指标的影响,取指标的影响,取AiBj的各种搭配的平均数,结果是的各种搭配的平均数,结果是A1与与C1 搭配最好,故本问题的最优方案为搭配最好,故本问题的最优方案为A1B2C1D2。名词解释(名词解释(10个)个) 20分分选择(选择(20个)个) 20分分计算题(计算题(6个)个) 50分分填空(填空(10个)个) 10分分80%20分分100分