1、1主讲:梁主讲:梁 茹茹 冰冰联系方式:联系方式:liang_ru_liang_ru_2 科学研究是人类认识自然、改造自然、服务社会的原动力。 农业领域中所涉及的学科大多数属于实验科学,主要是。 农业科学试验及农业生产调查都会获得大量的数据,在千差万别的数字后面往往隐藏着事物的内在规律性。就是挖掘与利用这些规律。 相应的农业试验和调查数据分析软件。 3 农业是一巨型复杂的系统。 农业数据具有大量、多维、动态、不完整、不确定性(数据中的系统或随机噪声)、稀疏性(很少甚至没有有用的记录)、并且与时间相关等特点。 农业试验设计主要在介绍经典的农业设计方法的基础上还介绍、和等方法。4 农业数据分析的基
2、本方法是和。用来揭示农业过程中的机理关系,描述农业各因子之间的动态的定量关系,如农业产量与其他生态因子的关系。用来检验、归类和判别农业的最终结果,如在一定的置信度下判断农业因子对指标如作物产量是否有影响,比较不同的农业措施下农业产量是否有差别。首先生物统计模型是一类重要的数学模型;其次由于农业数据具有的不确定性,数学建模中时常要考虑随机误差的影响,因此在农业数据分析中,农业数学建模和生物统计这两种方法经常一起使用。 56 农业试验设计的基本原则 重复、随机化和区域控制 农业试验设计的方法 随机完全区组设计等 农业试验设计的数据处理方法 描述性统计、统计推断、回归分析、主成分分析等农业数学建模农
3、业数学建模生物统计生物统计78调时间(2004年9月前)Setup disksetup.exe 选择设置语言:英语 3)Install SAS Software 选择SAS Installation Data: sas9834961.txt next Select Licensed Software next 选择Disk1 68%时,选择Disk2 76%时,选择Secure windows 81%时,选择SAS Shared Components 进度条消失,选择Setup Disk Finish 将sashost.dll复制到安装目录下,即“C:Program FilesSASSAS S
4、ystem9.0”下,覆盖原文件调回时间 完成!9 SAS是美国SAS软件研究所于本上世纪70年代研制的一套大型集成应用软件系统,因其最初功能(Statistical Analysis System ) 而得名。经过二十多年的发展, 已成为综合软件系统, 其功能涉及数据访问、管理、分析和显示。作为管理信息系统(MIS)或决策支持系统(DSS)的开发平台, 1996 年评为建立数据仓库系统的首选产品。10 SAS软件为模块式结构, 用户可根据需要选择 譬如, 我们可以只选Base SAS (基本模块) , 用于数据管理、制表和描述性统计。 或再加上SAS/STAT (统计模块)和SAS/GRAP
5、H (图形模块), 组成一套具有数据管理、统计分析和图形表达功能的软件系统。 若在公司或工商企业工作, 再选两种模块,SAS/QC (质控) 和SAS/OR (运筹) , 就可使软件系统在质量管理、计划运筹、规划、决策等方面的功能大为增强。 而SAS/ETS 则是计量经济学、时序分析和预测的有力工具等等。1112 编辑窗口(PROGRAM EDITOR):编辑程序和数据文件。 日志窗口(LOG):记录运行情况,显示error信息。 输出窗口(OUTPUT):输出运行的结果。 图形窗口(GRAPH):输出图形。13 编辑窗口(PROGRAM EDITOR):编辑程式和数据文件。 日志窗口(LOG
6、):记录运行情况,显示error信息。 输出窗口(OUTPUT):输出运行的结果。 图形窗口(GRAPH):输出图形。 点击点击 Globals 菜单中菜单中的的 Program editor、Log、Output、Graph 命令可以进命令可以进入编辑、日志、输出入编辑、日志、输出及图形窗口。及图形窗口。 按功能键按功能键F5、F6、F7也可以进入编辑、也可以进入编辑、日志及输出窗口。日志及输出窗口。 14 在SAS中,对数据的处理可分为两大步: 将数据读入SAS建立的SAS数据集,称为数据步(DATA)。 调用SAS的模块处理和分析数据集中的数据,称为过程步(PROC)。 每一数据步都是以
7、DATA语句开始,以RUN语句结束; 而每一过程步则都是以PROC语句开始,以RUN语句结束。 每个语句的后面都要用符号“;”作为这个语句结束的标志。 下面看一个简单的例程。1516 SAS程序编好后, 不会自动出结果。必须经过发送(常用的方式是在命令行键入SUBMIT再按回车键) 所编程序才会被执行。或者通过菜单操作“run”-“submit”,也可执行SAS程序。该程序运行结果如图:171. 进入SAS的显示管理系统。2. 进入并扩大编辑窗口。3. 调出、编辑或修改SAS程式或数据文件。4. 将编辑窗口的SAS程式或数据文件存盘。5. 按功能键F8或点击“RUN”键运行SAS程式并注意观察
8、日志窗口中的信息,如有error出现,应将光标移到日志窗口,用PgUp或PgDn翻页,找到错误的所在。6. 将光标移到编辑窗口,按功能键F4或点击 Locals菜单中的 Recall text命令调出已经运行的SAS程式,改正错误后转入步骤(4),直到日志窗口中的信息没有error出现为止。7. 将光标移到输出窗口,用PgUp或PgDn翻页阅读输出的结果。 18 SAS不仅提供了灵活的程序模块来进行数据处理和分析,还提供了功能强大的菜单操作系统,借助SAS的菜单系统可以方便的进行数据的导入、导出、修改和统计分析、作图,并可以进行试验设计、时间序列预测。 下面的试验设计与数据分析学习全部是基于下
9、面的试验设计与数据分析学习全部是基于展开的。展开的。1920SAS在农业单因素试验中的应用举例: 有一水稻施肥试验,设有5个处理(TRT),分别为A(施氨水1),B(施氨水2),C(施碳氨),D(施尿素)和E(不施肥)。每个处理均种植4盆,随机排列,得稻谷产量如表2.3。试分析各处理平均数差异的显著性。处理试验结果A(施氨水1)24302826B(施氨水2)27242126C(施碳氨)31282530D(施尿素)32333328E(不施肥)2122162121SAS在农业单因素试验中的应用举例:(1)建立数据库文件 按图示录入数据表。22SAS在农业单因素试验中的应用举例:(2)进入方差分析,
10、选取方差分析类型与检验内容,StatisticsANOVAOneWay ANOVA(单因素方差分析),弹出单因素方差分析对话框,在该对话框中选择可控(自)变量independent与响应(因)变量dependent。操作如图所示: 23SAS在农业单因素试验中的应用举例:(2)进入方差分析,选取方差分析类型与检验内容,StatisticsANOVAOneWay ANOVA(单因素方差分析),弹出单因素方差分析对话框,在该对话框中选择可控(自)变量independent与响应(因)变量dependent。操作如图所示: 24(3)进行多重比较。点击单因素方差分析对话框中的Means项,并选择要进
11、行多重比较的主效应及相应的多重比较方法,点击Add添加。操作如图所示: 25(3)进行多重比较。点击单因素方差分析对话框中的Means项,并选择要进行多重比较的主效应及相应的多重比较方法,点击Add添加。操作如图所示: 26方差分析结果:P0.0002 F A4301.200075.300011.180.0002说明:说明:Source变异来源;变异来源;DF自由度;自由度;Type I SSSum of Squares (平方和平方和);Mean Square均方;均方;F ValueF值(值(F值接近值接近1,说明各组均数间的差异没有统计学意义,说明各组均数间的差异没有统计学意义,即没有差
12、异;即没有差异;F值远大于值远大于1,说明各组均数间的差异具有统计学意,说明各组均数间的差异具有统计学意义,即有差异。)义,即有差异。)PrF即即P值,如果该值小于值,如果该值小于0.05(显著性水平),则具有统计学(显著性水平),则具有统计学意义,反之没有统计学意义。意义,反之没有统计学意义。27Duncan GroupingMeanNAA31.504dBA28.504cBA27.004aBC24.504bC20.004e多重比较结果说明:为了便于理解,SAS将两两比较的结果直接用英文字母的形式标示出来。两两比较结果的最右侧是处理因素变量的取值,最左侧标以字母A、B、C等等,用以表示该处理组
13、和其它组有无差异。如果两组有相同的字母(如d、c、a三组),则两者之间无差异;而如果两组间只有不同的字母,则表示两组间的差异有统计学意义。28结果显示施尿素施尿素(d组组)稻田产量最高,但施尿素施尿素(d组组)的稻田产量与施氨水施氨水1(a组组)、施碳氨施碳氨(c组组)的稻田产量之间的差别并不具备统计学意义,施尿素施尿素(d组组)的稻田产量与施氨水施氨水2(b组组) 、不施肥不施肥(e组组)的稻田产量之间的差别具有统计学意义。Duncan GroupingMeanNAA31.504dBA28.504cBA27.004aBC24.504bC20.004e29 正交试验设计的直观分析正交试验设计的
14、直观分析 几因素几水平的正交试验 正交表采用L8(27) 通过观察SAS输出的结果,得出最优的策略 正交试验设计的方差分析正交试验设计的方差分析 方差分析 多重比较30 例题:为了解决花菜留种问题,以进一步提高花菜种子的产量和质量,科技人员考察了浇水浇水、施施肥肥、病害防治病害防治和移入温室时间移入温室时间对花菜留种的影响,进行了四个因素各两个水平的正交试验四个因素各两个水平的正交试验。 各因素及其水平见表2.6 A(浇水次数)(浇水次数)不干死为原则,整个不干死为原则,整个生长期只浇水生长期只浇水1-2次次根据生长需水量和自然条件根据生长需水量和自然条件浇水,但不过湿浇水,但不过湿B(喷药次
15、数)(喷药次数)发现病害即喷药发现病害即喷药每半月喷一次每半月喷一次C(施肥次数)(施肥次数)开花期施硫酸铵开花期施硫酸铵进室发根期、抽苔期、开花进室发根期、抽苔期、开花期和结实期各施肥一次期和结实期各施肥一次D(进室时间)(进室时间)11月初月初11月月15日日31 首先,选用L8(27)正交表: 8表示总共要做8次试验,2表示每个因子都有两个水平,7表示这个表最多可安排7个因子。试验结果如表2.732 第一步:SolutionsAnalysisAnalysts,出现分析员界,出现分析员界面后,输入表面后,输入表2.7的数据,其中的数据,其中 数据录入如图所示:33 第二步:Statisti
16、csDescriptiveSummary Statistics,出现分析员描述性统计对话框,出现分析员描述性统计对话框,在该对话框中,在该对话框中,Analysis按钮是按钮是选中要进行描述选中要进行描述性统计的变量,性统计的变量,我们选择产量我们选择产量y。Class按钮是选按钮是选中分组变量,我中分组变量,我们首先选择浇水们首先选择浇水次数次数A34 第三步:点击点击Statistics按钮,弹出对话框,在此对话框中你可以选择要按钮,弹出对话框,在此对话框中你可以选择要输出的描述性统计量,打输出的描述性统计量,打“”表示选中,我们选择均值表示选中,我们选择均值(Mean),最小值(),最小
17、值(Minimum)和最大值()和最大值(Maximum),极),极差(差(Range),和(),和(Sum)35 第四步:分别选择其他因素作为分组变量进行描述性统计。分别选择其他因素作为分组变量进行描述性统计。分析结果如下表所示分析结果如下表所示36 结果直观分析:结果直观分析: 根据各试验因子的总计数或平均数可以看出:根据各试验因子的总计数或平均数可以看出:A取取A1,B取取B2,C取取C2,D取取D2为好,即花椰菜留为好,即花椰菜留种最好的栽培管理方式为:种最好的栽培管理方式为: 37 第一步: 在在SAS分析员中,从分析员中,从StatisticsANOVAFactorial ANOV
18、A(多因素方差分析多因素方差分析),进入多因素方差分析的对话,进入多因素方差分析的对话框。框。 Dependent按钮按钮是选择因变量,是选择因变量,我们选择产量我们选择产量y, Independent 按按钮是选择进行方钮是选择进行方差分析的因素,差分析的因素,我们将我们将全部因素全部因素都选入。都选入。38 第二步: 在在SAS分析员方差分析对话框中,点击按钮分析员方差分析对话框中,点击按钮Model,会弹,会弹出效应选择对话框,这里我们只选择主效应出效应选择对话框,这里我们只选择主效应(main effects only)。 39 第三步: 多重比较:在方差分析对话框中,点击按钮多重比较
19、:在方差分析对话框中,点击按钮Means,在弹,在弹出对话框中,点击出对话框中,点击Add按钮可添加要进行多重比较的主效按钮可添加要进行多重比较的主效应(将应(将ABCD均均Add进来),多重比较的方法由进来),多重比较的方法由Comparison method中的下拉列表框中的选项决定(选中的下拉列表框中的选项决定(选择择Duncans multiple-range test) 40 最后一步:查看方差分析结果41Duncan GroupingMeanNAA381.2541B275.0042SourceDFType I SSMean Square F ValuePr F A122578.12
20、50022578.1250014.690.0313B117578.1250017578.1250011.440.0430C11953.125001953.125001.270.3416D178.1250078.125000.050.8361Duncan GroupingMeanNBA375.0042B281.254142 从方差分析表可以看出,浇水次数(A)和喷药次数(B)对产量的影响具有统计学意义; 对浇水次数(A)效应进行多重比较发现:在不干死为原则,整个生长期只浇水1-2次的浇水措施(水平1)下其花菜的产量明显高于根据生长需水量和自然条件浇水,但不过湿的浇水措施(水平2)花椰菜的产量。4
21、3 例例1 1为了研究杂交水稻的施氮量和密度与产量之间的为了研究杂交水稻的施氮量和密度与产量之间的关系,现做有关施氮量、水稻密度的试验,试求其回归关关系,现做有关施氮量、水稻密度的试验,试求其回归关系。因素编码水平表见系。因素编码水平表见2.132.13试验结果见表试验结果见表2.14 2.14 更改为:更改为:2.51.544 步骤(1):进入实验窗口45 步骤(1):进入两水平正交实验(Twolevel)窗口46 步骤(2):定义变量(Define Variables)47 步骤(2):定义变量48 步骤(2):定义变量49 步骤(3):选择实验设计50 步骤(3):选择实验设计51 步骤
22、(4):设置中心点数为252 步骤(4):设置中心点数为253 步骤(5):输入试验结果54 步骤(5):输入试验结果55 步骤(6):输出分析结果56 步骤(6):输出分析结果57 步骤(6):输出分析结果58 步骤(7):数值优化59 步骤(7):数值优化60 步骤(7):数值优化61 步骤(7):数值优化62 步骤(7):数值优化63 步骤(7): 数值优化64 例4我们以玉米 N 、P和 K 三因素三水平二次正交旋转组合设计试验为例,应用SAS探索玉米高产高效的施肥方案,试验因素及编码水平见表2.18,试验结果见表 2.19 。求出产量对N、P和 K三种肥料的回归模型三元二次方程进行方
23、差分析,回归系数检验在 1.682与1.682 的约束范围内模拟优化找出产量最高的方案。 65 步骤(1):选择试验设计(Response Surface响应面设计),定义变量66 步骤(1):选择试验设计,定义变量67 步骤(1):选择试验设计,定义变量68 步骤(1):选择试验设计,定义变量69 步骤(2):选择试验设计方案70 步骤(3):输入试验结果71 步骤(4):产量模型72 步骤(5):查看结果73 步骤(6):数值优化74 步骤(6):数值优化75 农业领域遇到的不少问题可用混料设计方法处理,如复合肥、饲料、农药等的配方问题。在总施肥量确定的前提下,作物不同生长时期应施肥的比例
24、问题也属于混料试验研究的问题。 常见的复合肥料由氮、磷、钾三种养分组成, 各养分所占的比例可以用混料试验的方法确定;下面是确定肥料的合理施用比例的应用实例。 76 步骤(1):选择试验设计,定义变量77 步骤(1):选择试验设计,定义变量78 步骤(1):选择试验设计,定义变量79 步骤(1):选择试验设计,定义变量80 步骤(1):选择试验设计,定义变量81 步骤(2):查看结果82 步骤(2):查看结果83作业内容:(1)43页第1题(2)44页第3题作业要求:报告中要详细地说明实验过程并附相关操作图,能够对实验结果进行分析,给出相关分析结论。提交作业截止时间:3月22日形式:发送电子稿到我的QQ邮箱或 liang_ru_ 注意:迟交或不交,成绩为零。