1、2023-2-312023-2-32这块地的土壤养分情况如何?不仅需要知道一个总体情况而是要知道每个地方的不同含量方便为那些含量低的地方施肥该怎么办呢?该怎么办呢?2023-2-33Step1:密集采样Step2:把土样运回实验室Step3:晒干,磨碎,.化学分析耗时,耗力,耗财得到的是点状数据得到的是点状数据面状连续分布呢?面状连续分布呢?未采样地的状况如何呢?未采样地的状况如何呢?2023-2-34算法分析2023-2-35(a)有机质(b)全氮(c)有效磷 2023-2-362023-2-372023-2-382023-2-392023-2-3102023-2-3112023-2-312
2、2023-2-3132023-2-3142023-2-3152023-2-316湖北咸宁据:罗勇,陈家宙,2008土壤容重空间变异土壤饱和导水率空间变异2023-2-317(a)有机质(b)全氮(c)有效磷 (d)速效钾 湖北沙洋据:杨勇,贺立源,20102023-2-318武汉市东湖高新技术开发区据:张贝,杨勇,2010 2023-2-3192023-2-3202023-2-3212023-2-3222023-2-323实例见表2-3 和 图2-22023-2-324NiizNz11NiizNz11mjQ/mjQ/2023-2-325minmaxzzRminmaxzzR213QQ zziNi
3、izN12)(121)(212nzzSnii:总体标准差S:样本标准差2023-2-326%100/zSCVsxxzii用于刻画数据与均值相对于标准差的偏离程度2023-2-327313)(1niikzznSSSk=0,对称分布;Sk0,正偏(右偏),较小的数据比较集中;Sk0,频数分布的曲线峰高于正态分布,称为尖顶峰度Ku0,频数分布的曲线较正态分布更为平坦,称为平顶峰度Ku=0,等于或接近于正态分布2023-2-3292023-2-3302023-2-331SzCA2SzCA32023-2-332(5.2932,7.941)SzCA2SzCA3(4.63125,8.60295)2023-2
4、-333ddNiizzNd1)(12023-2-3342023-2-3352023-2-3362023-2-3372023-2-338 Pn0.950.99 Pn0.950.9931.1351.155172.4752.78541.4631.492182.5042.82151.6721.749192.5322.85461.8221.944202.5572.88471.9382.097212.5802.91282.0322.231222.6032.93992.1102.323232.6242.963102.1762.410242.6442.987112.2342.485252.6633.00912
5、2.2852.550302.7453.103132.3312.607352.8113.178142.3712.659402.8663.240152.4092.705452.9143.292162.4432.747502.9563.3362023-2-3392023-2-340nnSXXtk12023-2-3412023-2-3422023-2-343直方图直方图(Histogram)(Histogram)又称又称柱状图柱状图、质量分质量分布图布图。是一种统计报告图,由一系列高度。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情不等的纵向条纹或线段表示数据分布的情况。况。一般用
6、横轴表示数据类型,纵轴表一般用横轴表示数据类型,纵轴表示分布情况。有各种形状:示分布情况。有各种形状:正常型正常型,孤孤岛型岛型,双峰型双峰型,折齿型折齿型,陡壁型陡壁型,偏态型偏态型,平顶型等。平顶型等。直方图只能初步判断数据是否符合正直方图只能初步判断数据是否符合正态分布。态分布。2023-2-3446.007.008.00PHPH 1020304050CountCount2023-2-3452023-2-3466.007.008.00PHPH 1020304050CountCount2023-2-3472023-2-348zz zz1sin2023-2-3492023-2-350bXaY
7、),(),(),(2211nnyxyxyxxbyanjjjnjjxxyyxxb121)()(2)(21nyySnjii2023-2-351njjTyyQ12)(21)(njjRyyQnjjeyyQ12)(2023-2-352TeTRQQQQR12221)2()2/()2/(RRnnQQQnQQFeeTeR)2,1(nFFa)2,1(nFFa)2,1(nFa2023-2-3531)(1)(1)()(12121nyynxxnyyxxrniiniiinii取值范围为-1,1,大于0为正相关,小于0为负相关,绝对值越接近1,相关性越大。2023-2-3542023-2-3552023-2-356202
8、3-2-3572023-2-3582023-2-3592023-2-360样品随机变量区域化变量随机函数随机函数模型的建立2023-2-361 现实世界实测采样定性信息运算处理描述性统计探索式数据分析探索式变异分析 概率模型概念工具随机变量区域化变量随机函数运算处理估值模拟随机函数假设分析变异函数模型结果应用于现实世界2023-2-3622023-2-363),()(XxxZxZii2023-2-3642023-2-365我的取值我做主2023-2-366h1h2x1x2x3h1=h2则|x1-x2|=|x2-x3|2023-2-367这里建房了,没有土壤,我没有值2023-2-368我们差不
9、多我们差很多2023-2-369h1h2x1x2x3虽然h1=h2但|x1-x2|x2-x3|2023-2-370)()(00zFzxZPx)()(00zFzxZPx1)(00zFx),1()(,)(,111znzFzxZzxZPxnxnn2023-2-371),(),(1,11,1nhxnhxnxnxzzFzzF2023-2-372mxZE)(Dx数学期望:反映随机变量取值的集中特征,是随机变量取得数字的代表数。该条件表示:在整个研究区内,区域化变量的数学期望对任意x存在,且等于常数2023-2-373)()()()()()()()()()(),(2hCmhxZxZEmhxZmxZExZEh
10、xZxZExZEhxZxZCov协方差:两个不同参数之间的方差就是协方差,用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。期望值分别为E(X)=与 E(Y)=的两个实数随机变量X与Y之间的协方差协方差定义为:COV(X,Y)=E(X-E(X)(Y-E(Y),若两个随机变量X和Y相互独立,则他们的协方差为0。2023-2-3740)()(hxZxZE)(2)()()()(2hrhxZxZEhxZxZVarr(h)称为半方差函数,也叫变异函数本征假设是地统计学中对随机函数的基本假设事实上,当作用于大区域时,本征假设的第一个条件很难满足,空间变异的漂移或趋势面可能
11、存在,由于这种漂移,第二个条件也不能满足,但地统计学理论的基础是本征假设,因此,有必要去认识一个随机过程是否是平稳性的在研究区域内,区域化变量Z(x)的增量的数学期望对任意x和h存在且等于0在研究区域内,区域化变量的增量Z(x)-Z(x+h)的方差对任意x和h存在且平稳2023-2-3752023-2-376)()0()(hCChr2023-2-377)0()(1)0()()(ChrChCh)()(),()(hrhrhChC2023-2-378基台值变程块金值2023-2-379孔穴效应:(a)有基台值,(b)无基台值2023-2-3802023-2-381N(h)是分隔距离为h时的样本对数总
12、数2023-2-3822023-2-383值分别是:4,3,4,5,7,9,7,8,7,7,则:2023-2-3842023-2-3852023-2-3862023-2-3872023-2-3882023-2-3892023-2-3902023-2-3912023-2-3922023-2-3932)()(21),(jijixzxzxxr表示两个实测值之间差的一半,称为半方差值,一般意义上,半方差值会随着两点间距离的加大而加大,这是因为距离相近的样品点的性质较为相似。2*)()(21)(iiijxzhxzhr)()(*ijhrhrij根据点对之间的空间滞后距离h将所有半方差值绘制成的散点图称为半
13、方差云图(如下图,红色圈内为特异值)0.0000 1.9600 3.9200 5.8800 7.84000.00 670.64 1341.28 2011.92VarianceSeparation Distance(h)Variance Cloud(Isotropic Lag Class 1)2023-2-394)(1*)()()(21)(hNiiikxzhxzhNrkhk表示滞后级别,更为常见的表示方法为:2023-2-395)(1)(1hNiiavgDIShNh)(1)(21)(*hNiiavgShNhr2023-2-3960.000 0.067 0.135 0.202 0.2700.00
14、223.55 447.09 670.64 894.19 1117.73 1341.28 1564.83 1788.37 2011.92 Standardized SemivarianceSeparation Distance(h)Isotropic Standarized2023-2-3972023-2-3982023-2-399当h超过某一个范围,例如变程a,变异函数r(h)不再增大,而是在一个极限值r()附件摆动,这种现象称为“跃迁现象”2023-2-3100当h=0时,变异函数r(h)不等于0,而是等于1个常数C0,这种现象称为“块金效应”2023-2-31012023-2-3102异常
15、值对变异函数的影响2023-2-31032023-2-31042023-2-31052023-2-31062023-2-31072023-2-3108C0:块金常数C0+C:基台值C:拱高a:变程应用最广的模型2023-2-3109C0:块金常数C0+C:基台值C:拱高3a:变程当C0=0,C=1时,称为标准指数函数模型2023-2-3110C0:块金常数C0+C:基台值C:拱高 :变程当C0=0,C=1时,称为标准高斯函数模型a32023-2-31112023-2-3112C0:块金常数C0+C:基台值C:拱高A:常数,表示直线斜率当C0=0,C=1时,称为标准指数函数模型2023-2-31
16、132023-2-31142023-2-31152023-2-31162023-2-31172023-2-31182023-2-3119niinhrhrhrhrhr010)()()()()(ri(h)可以是相同的或不同的理论模型2023-2-31202023-2-31212023-2-31222023-2-31232023-2-3124可以看出基台值在2.55左右对头两点作切线与纵坐标相交的交点就是块金值,大约在0.4左右0.4/2.55=0.156则大约16%的误差是随机现象造成的,而空间自相关现象造成的误差为84%2023-2-3125C0=0.4 C1=1.55a1=14 C2=0.6a
17、2=50从图中可看出,理论值与实际值差异较大,尤其是在15到40m之间,因此,需进行反复修改2023-2-3126C0=0.4 C1=1.15a1=12 C2=1a2=60从图中可看出,理论值与实际值差异拟合较好2023-2-31272023-2-31282023-2-31292023-2-31302023-2-3131通过得到的b0和b1,可以反算理论模型中的C0,C和a等参数值2023-2-31322023-2-3133其中:2023-2-31342023-2-31352023-2-31362023-2-31372023-2-31382023-2-31392023-2-31402023-2
18、-3141线性有基台值模型的残差最小,决定系数最大,其次是球状模型,基台值基本相同,但线性有基台值模型的变程最小,其次是高斯模型和球状模型。块金值是指数模型的最小,其次是球状模型和线性有基台值模型。对这5个参数,显然最重要的是考虑决定系数R2的大小,其次是考虑残差RSS的大小,然后再考虑变程和块金值的大小,根据这个原则,选择球状模型作为本实例的变异函数理论模型是比较合适的,这个理论模型除了具有较高的拟合精度外,对变程内的模拟可以得到满意的结果。2023-2-31422023-2-31432023-2-31442023-2-31452023-2-3146以这种编码方式随机产生T组染色体2023-
19、2-31472023-2-31482023-2-31492023-2-31502023-2-31512023-2-31522023-2-31532023-2-31542023-2-31552023-2-31562023-2-3157算法分析2023-2-3158Niiixzxz10*)()(如何分配权重是关键问题,多数空间插值方法只考虑到系统的或确定的变异,而没有考虑到其误差,地统计的克里格方法,不但能描述空间变异的分布特征,而且能够表达预测误差。2023-2-31592023-2-31602023-2-31612023-2-3162iiiiybxbbyxf210),(iiiiiiiiyxby
20、bxbybxbbyxf52423210),(2023-2-31632023-2-316422110)(pbpbbxzb0,b1,b2为回归系数,p1,p2为独立空间变量,z(x)为被预测属性2023-2-3165特性:(1)每个多边形内仅包含一个离散数据点。(2)在多边形内的任一点k(x,y)同Pi(xi,yi)之间距离总小于它同其它离散点Pj(xj,yj)之间距离。(3)泰森多边形的任意一个顶点必有三条边与它连接,这些边是相邻三个泰森多边形两两拼接的公共边。(4)泰森多边形的任意一个顶点周围存在三个离散点,将其连成三角形后其外接圆的圆心即为该顶点,该三角形称泰森三角形 2023-2-3166
21、2023-2-3167未测点只可能在三角形内或三角形边线上,利用线性插值即可求得缺点是每个预测值只是根据三个实测值得到,且有时会产生突变现象2023-2-3168niiixzxz10)()(*Nipipiidd100/2023-2-31692023-2-31702023-2-31712023-2-31722023-2-3173niiixzxz10)()(*0)()(*00 xZxZEmin)()(*var00 xZxZ2023-2-3174)()()()()()(*010100 xZExZExZxzExZxZEniiiniiimxZExZEi)()(00)1()()(1101niiniinii
22、immmxZExZEnii112023-2-31750)()(hxZxZE)(2)()()()(2hrhxZxZEhxZxZVarr(h)称为半方差函数,也叫变异函数本征假设是地统计学中对随机函数的基本假设在研究区域内,区域化变量Z(x)的增量的数学期望对任意x和h存在且等于0在研究区域内,区域化变量的增量Z(x)-Z(x+h)的方差对任意x和h存在且平稳2023-2-3176nininjjijiiiniiixxxxxZxzExZxZExZxZ011020120000),(),(2)()()()(*)()(*varnijjiiniixxxxx1001),()(),(1niiixxx1002),
23、()(2023-2-3177BA2023-2-31782023-2-31792023-2-31802023-2-31812023-2-31822023-2-31832023-2-31842023-2-31852023-2-31862023-2-31872023-2-31882023-2-31892023-2-31902023-2-31912023-2-3192x0 x01x02x03x042023-2-31932023-2-31942023-2-31952023-2-31962023-2-31972023-2-31982023-2-31992023-2-32002023-2-32012023-
24、2-32022023-2-3203样点位置、属性值及与待估点的距离2023-2-32042023-2-3205尺度变化后,屏蔽效应减弱,方差较小,精度提高2023-2-3206r1(h)r2(h)2023-2-32072023-2-32082023-2-3209)0()(0CCCr2023-2-32102023-2-3211块金值不变时块金值增大1倍2023-2-3212两种模型变异函数曲线(左)和协方差函数曲线(右)对比2023-2-3213与球状模型相比,线性有基台值模型的克里格估计结果汇总,内圈的权重系数减小,而外圈的权重系数增大,这与屏蔽效应一致2023-2-32142023-2-32
25、15领域内312个已知样本数量的克里格估计过程2023-2-3216不同样本点所产生的估计值(左)及其方差(右)可以看出,当领域内有效样本点的数量由4个增加到8个时,克里格估计方差基本保持不变,因此,在地统计学克里格估计中,一般多数采用4-8个领域内的有效数据,再扩大有效数据,会产生屏蔽效应,而且对克里格估计精度不起作用。2023-2-3217niiniiiskxzxZ110*)1()()(2023-2-3218),(),(01jnijiixxxxBA),(.),(),(.),(.),(),(),(.),(),(212221212111nnnnnnxxrxxrxxrxxrxxrxxrxxrxx
26、rxxrA),(.),(),(00201xxrxxrxxrBn),(.),(),(00201xxrxxrxxrBnn.21BA1niiiSKxxrx1002),()(2023-2-32192023-2-32202023-2-32212023-2-32222023-2-32232023-2-32242023-2-32252023-2-3226)(1)(1hNiiavgDIShNh)(1)(21)(*hNiiavgShNhr2023-2-32270.000 0.067 0.135 0.202 0.2700.00 223.55 447.09 670.64 894.19 1117.73 1341.28 1564.83 1788.37 2011.92 Standardized SemivarianceSeparation Distance(h)Isotropic Standarized2023-2-32282023-2-32292023-2-32302023-2-3231说明:asc文件包括文件头和文件正文两部分,文件头第一行表示列数,第二行表示行数,第三行表示区域内最小的x值,第四行表示区域内最小的y值,第五行表示格网大小,第六行表示当格网无值时的填充内容,文件正文存储各个格网的插值结果。