1、温孚江 山东农业大学 校长 教授农业大数据联盟理事长大数据走进农业生产l农业(广义)生产的产前、产中、产后提供全程跟踪服务。l 政府决策提供咨询、指导。l 企业生产、转型、市场营销提供咨询、指导。释义:利用大数据思维、方法及技术来解决涉农产业相关问题的农业大数据。特点:数据来之不易功能:关联、预测目的:掌控和改变事物的发生“必然”案例案例 1 1“神农物联”大数据云平台的建设神农物联网神农物联网-神农物联网神农物联网-神农物联网神农物联网-渤海粮仓农业大数据的获取信息感知功能(该系统已推广应用)数据分析服务功能“神农物联神农物联”农业农业大数据大数据云平台应用云平台应用大数据平台主要应用于:大
2、数据平台主要应用于:互联网互联网+农业农业物联网物联网农业农业大数据大数据智慧农业智慧农业渤海粮仓大数据平台研发-背景案 例 2 “渤海粮仓渤海粮仓”科技示范工程,是科技示范工程,是20132013年年4 4月科技部在山东、月科技部在山东、河北、天津、辽宁河北、天津、辽宁4 4省市正式启动实施的重大科技支撑项目。省市正式启动实施的重大科技支撑项目。主要针对三省一市主要针对三省一市环渤海低平原地区淡水资源匮乏、土壤瘠环渤海低平原地区淡水资源匮乏、土壤瘠薄及盐碱等问题,通过综合实施土、肥、水、种等关键技术,薄及盐碱等问题,通过综合实施土、肥、水、种等关键技术,达到达到粮食增产目的。粮食增产目的。计
3、划通过对环渤海地区计划通过对环渤海地区40004000多万亩多万亩中低产田和中低产田和10001000多万多万亩盐碱荒地的改造亩盐碱荒地的改造,实现到实现到20172017年增粮年增粮6060亿斤亿斤,到到20202020年增粮年增粮100100亿斤的目标亿斤的目标,将长期遭受旱、涝、碱灾害的环渤海地区建将长期遭受旱、涝、碱灾害的环渤海地区建成我国重要的成我国重要的“粮仓粮仓”。?环渤海盐碱地如何科学改造环渤海盐碱地如何科学改造?盐碱变化规律如何把握盐碱变化规律如何把握?盐碱地水盐变化规律如何盐碱地水盐变化规律如何?如何科学施肥如何科学施肥?如何科学灌溉如何科学灌溉?如何科学预防自然灾害如何科
4、学预防自然灾害?渤海粮仓工程的经济效益如何渤海粮仓工程的经济效益如何?渤海粮仓工程的社会效益如何渤海粮仓工程的社会效益如何?渤海粮仓工程的环境效益如何渤海粮仓工程的环境效益如何?上述各因子之间的关联关系如何?上述各因子之间的关联关系如何?2022-8-4渤海粮仓科技示范工程面临的难题案 例数据采集数据采集实时采取数据,并积累分析实时采取数据,并积累分析人工采集样品,分析得出数据人工采集样品,分析得出数据渤海粮仓科技示范工程大数据平台渤海粮仓科技示范工程大数据平台案 例 2案例 2渤海粮仓增产增效的大数据支撑研究大数据跟踪研究预测建议(1)土壤改良 18%的土样有机质含量低,这些地块应加大有机肥
5、的施用。东5功能区需要注意及时补施氮肥,以满足作物生长需要。42%的样品有效磷含量偏低,不能满足生产需要,应及时补充。另外,按照山东省滨海盐渍土分级标准,85%的土样属于脱盐 地,但76个样点(22800亩)含盐量高,特别是其中的2400 亩重度盐碱地,应采取控盐渍化措施。样点土壤已有27.50%出现干旱,需要灌溉。案例2渤海粮仓增产增效的大数据支撑研究大数据跟踪研究预测建议(2)春季麦田管理根据一类苗数占所有采集点8.2%(41个)、二类苗占12.4%(62个)、三类苗占79.8%(402个)及无病虫和冻害等数据信息,建议加强分类指导,因地因苗制宜,科学运筹肥水,抗旱保苗,促弱转壮,控盐保墒
6、,构建合理群体,加快转化升级,奠定丰收基础(最高产量1100多斤)。.案例3奶牛数字化精细养殖系统与大数据内容:数据采集、数据库构建、自动控制。目的:通过大数据研究,提高奶牛饲料营养、育种、繁殖、疾病防治等技术管理水平。案例3奶牛数字化精细养殖系统与大数据对奶牛产奶量、运动量、体重、乳汁电导率、牛舍温湿度等数据进行实时采集和贮存管理,通过对历史数据的分析建立模型,通过对实时数据的监控和模型分析,监控奶牛产奶量是否异常,对奶牛发情、乳房健康状况进行诊断,自动控制分群设备、补料设备及环境控制设备。案例3奶牛数字化精细养殖系统与大数据软件牛群管理模块可视化界面1案例3奶牛数字化精细养殖系统与大数据软
7、件牛群管理模块可视化界面2案例3奶牛数字化精细养殖系统与大数据用乳汁电导率历史数据和奶牛体细胞数测定建立的用于隐形乳房炎诊断的电导率与体细胞数关系模型案例3 实时数据采集和分析的结果利用通过产奶量、运动量、体重适时记录数据,系统分析给出奶牛个体营养需要量,在挤奶厅对每一头奶牛进行定量补饲,实现奶牛的精准营养管理。记录奶牛适时运动量,通过与由历史数据建立的发情诊断模型比对,发现发情牛只,检出率90%,误检率可259 种质资源 1,472 SSR标记 6,799,910 联合标记 3,559,291 SNP位点 20,602,973 选择性剪切 45,326,068案例3生物数据库的构建与应用生物
8、数据库应用l 基于这些专业数据库,已经定位和克隆了一些与高l 产、优质、高抗等主要农艺性状相关的基因;l 构建了快速鉴定田间病害的试剂盒;利用数据库中的分l 子标记,筛选了大量种质资源,为种质资源的调查、收l 集、分类、保存和育种利用提供了物质基础和技术支持。案例4大数据在农作物大数据在农作物虫害发生的预测虫害发生的预测Case 1基于基于SVRSVR的玉米田四代棉铃虫发的玉米田四代棉铃虫发生量的预测模型构建生量的预测模型构建研究背景研究背景近年来,随近年来,随BtBt棉大范围种植,棉大范围种植,第四代棉铃虫对玉米叶片和果第四代棉铃虫对玉米叶片和果穗,特别是果穗的危害逐渐加穗,特别是果穗的危害
9、逐渐加重重。而而棉铃虫的发生具有非线性、棉铃虫的发生具有非线性、不稳定、不稳定、相关相关变量多的特点变量多的特点。将支持向量机回将支持向量机回归归(SVR)用于棉用于棉铃虫发生量的建模和预测分析铃虫发生量的建模和预测分析,为防控服务。,为防控服务。支持向量回归支持向量回归(SVR)(SVR)支持向量机回归(SVR)模型按LIBSVM要求的数据格式准备数据集svmscale对数据规格化,选择核函数gridregression.py搜索最佳核函数参数svmtrain训练建模,svmpredic进行预测支持向量回归支持向量回归(supportvectorregression,SVR)是是Vapnik
10、等人提出的等人提出的一种新的机器学习算法。一种新的机器学习算法。数据采集与标准化数据采集与标准化气象变量气象变量“20-20时降水量时降水量”、“极大风速极大风速”、“极大风速的风向极大风速的风向”、“平均本站气压平均本站气压”等等16个气象变量个气象变量SVRSVR模型建立模型建立为例为例玉米田四代棉铃虫发生量玉米田四代棉铃虫发生量输入输入变量变量输出变量输出变量年份真实值拟合值绝对误差相对误差(%)199915.515.5998-0.09980.6420004948.89980.10020.2020011414.0998-0.09980.71200224.524.3999 0.10010.
11、4120035 5.1001-0.10012.0020041918.57490.42512.2420051616.1003-0.10030.63200639.337.69931.60074.07200742.542.39980.10020.2420084747.10030.10030.21200934.534.6003-0.10030.2920103838.0999-0.10.26 支持向量机回归拟合结果与实际值对比年份真实值预测值绝对误差相对误差(%)20115252.9923-0.99231.90201242.641.24321.35683.17201332.535.1017-2.6018
12、8.01 支持向量机回归预测结果与实际值对比输出结果与检验输出结果与检验0102030405060199920002001200220032004200520062007200820092010头头百株百株-1年份年份 训练集拟合训练集拟合结果(结果(12年的数据)年的数据)真实值拟合值0102030405060201120122013头头百株百株-1年份年份 样本的预测样本的预测结果(结果(3 3年的数据)年的数据)真实值预测值 通过回归模型得到的训练集样本的拟合值与实际值的相关系数为0.99,而测试集样本的预测值与实际值的相关系数为0.96。Case 2麦田主要瓢虫类天敌昆虫发麦田主要瓢虫
13、类天敌昆虫发生趋势分析生趋势分析七星瓢虫与异色瓢虫是小麦蚜虫的主要天敌昆虫七星瓢虫与异色瓢虫是小麦蚜虫的主要天敌昆虫 数据分析发现,数据分析发现,两种瓢虫的种群发生数量在近十几年内发生了反转。两种瓢虫的种群发生数量在近十几年内发生了反转。研究背景研究背景原因原因?七七星瓢虫与异色星瓢虫与异色瓢虫发生趋势分析瓢虫发生趋势分析麦田主要瓢虫类天敌昆虫发生趋势决策树分类模型分析决策树分类模型分析主要相关变量年代际变化主要相关变量年代际变化 2001-2014年年14年间小麦生长期日最低气温年代际变化呈上升趋年间小麦生长期日最低气温年代际变化呈上升趋势,其趋势线方程为:势,其趋势线方程为:y=0.552
14、8x+11.573 2001-2014年调查日期最低气温的变化趋势 2001-2014年调查日期日照时数的变化趋势 2001-2014年小麦生长期日照时数年代际变化呈上升趋势,年小麦生长期日照时数年代际变化呈上升趋势,其趋势线方程为:其趋势线方程为:y=0.1759x+75.987决策树分类模型决策树分类模型的的评估评估异色瓢虫决策树分类模型预测值与真实值拟合图 将预测误差小于将预测误差小于2%的数据视为预测准确,将预测准确数据个数占总数的数据视为预测准确,将预测准确数据个数占总数据个数的百分比作为预测的准确度,得到该决策树分类模型的置信度据个数的百分比作为预测的准确度,得到该决策树分类模型的
15、置信度为为90.62%。七星瓢虫决策树分类模型预测值与真实值拟合图 将预测误差小于将预测误差小于2%的数据视为预测准确,将预测准确数据个数占总的数据视为预测准确,将预测准确数据个数占总数据个数的百分比作为预测的准确度,得到该决策树分类模型的置信数据个数的百分比作为预测的准确度,得到该决策树分类模型的置信度为度为89.06%。日最低气温在调查期年际变化呈上升趋势,随日最低气温升高,日最低气温升高,七星瓢虫数量减少。日照时数在调查期年际变化呈上升趋势,随日照时数的增加,日照时数的增加,异色瓢虫的数量增加。Case 3决策树及决策树及SVRSVR机器学习算法在麦机器学习算法在麦蚜发生程度预测中的应用
16、蚜发生程度预测中的应用研究背景研究背景小麦蚜虫是影响我国小麦生产小麦蚜虫是影响我国小麦生产的最主要害虫,每年危害面积的最主要害虫,每年危害面积2.5亿亩,造成减产一般在亿亩,造成减产一般在15-30%。麦蚜发生缺少短期预测模型。麦蚜发生缺少短期预测模型。模型建立对指导政府主导的小模型建立对指导政府主导的小麦病虫害麦病虫害“统防统治统防统治”具有重具有重要意义。要意义。决策树树形图决策树树形图决策树分类模型评估决策树分类模型评估 经计算得样本中目标变量的正确值与错误值。以预测误差小于经计算得样本中目标变量的正确值与错误值。以预测误差小于2%作为准确作为准确值,得到该决策树分类模型的置信度为值,得
17、到该决策树分类模型的置信度为91.49%。且运算稳定。且运算稳定。2003-20102003-2010年的数据作为训练集,年的数据作为训练集,2011-20132011-2013年的数据作为测试集年的数据作为测试集进进行行训练,模型训练,模型真实值与预测值之间的回归系数为真实值与预测值之间的回归系数为0.93070.9307,预测值与真,预测值与真实值吻合程度高。实值吻合程度高。SVRSVR结果与检验结果与检验鲁中区,鲁中区,麦蚜发生量与日照时数相关程度最麦蚜发生量与日照时数相关程度最高高,当日照时数大于,当日照时数大于13h,小麦蚜虫发生程,小麦蚜虫发生程度为度为4级。级。在预测麦蚜发生程度
18、时,决策树在预测麦蚜发生程度时,决策树C5.0算法的算法的准确率略低于准确率略低于SVR。SVR算法可以弥补决策算法可以弥补决策树树C5.0算法在预测麦蚜发生为算法在预测麦蚜发生为4和和5级时误差级时误差较大的不足。较大的不足。二、应用情况案例 5、基于物联网的设施农业信息管理系统系统主界面系统主界面APP界面界面并研制了:并研制了:基于物联网的设施农业控制系统基于物联网的设施农业控制系统和温室信息显示、语音智能提示及和温室信息显示、语音智能提示及自动化控制系统。自动化控制系统。已推广应用已推广应用二、应用情况案例 6、蔬菜质量安全与溯源系统研发与应用 并研制了:并研制了:开发系统及应用设备,
19、蔬菜产业链物联网信息感知系统和蔬菜产业链物联网信息感知系统。已推广应用四、今后展望四、农业大数据产业化 2015年11月,由我校倡导并参与的“泰山神农智谷”农业大数据产业园区落户泰安国家高新技术产业开发区。总投资35亿元,将分三期建设完成预计引入500家企业,实现年产值100亿元。打造农业农村信息化技术创新和大数据产业孵化基地,以此推动农业农村信息化与农业现代化的快速融合与发展。农业大数据产业的“春天”来了 国家战略:国家战略:促进大数据发展行动纲要农业部:农业部:推动农业农村大数据发展的实施意见机遇:针对国家战略需求、实体经济的转型升级、第针对国家战略需求、实体经济的转型升级、第三产业的发展、民生的改善,我们将面临大数三产业的发展、民生的改善,我们将面临大数据驱动农业产业发展的良好机遇,在全国将形据驱动农业产业发展的良好机遇,在全国将形成立体的成立体的“农业大数据产业农业大数据产业”。AndThen,AREYOUREADY?WHATAREYOUWAITINGFOR?ACTION!五、展望