1、教学要求: 清楚灰色系统、生成数等基本概念; 掌握灰色关联度的计算; 掌握GM(1,1)的建模及预测; 了解GM(1,1)残差模型的作用及其实现; 了解其它灰色预测模型的用途;教学重点:关联度计算, GM(1,1)预测。教学难点:GM(1,1)残差模型。一.灰色系统理论概述 80年代,中国华中理工大学,邓聚龙教授创建的; 概率统计:要求大样本,事先需知道分布规律; 时间序列:数据的拟合; 灰色理论:少量数据(4个以上)发现规律; 是系统理论的新分支 系统理论工程与实践(一级刊物); The Journal of Grey System(SCI); 作为横断学科,广泛应用于社会经济系统,控制系
2、统等的预测、决策、控制; 1.灰色系统的概念部分信息已知、部分信息未知的系统,。相对于白色系统,其系统内部特征完全已知或系统信息是充足的。相对于黑色系统,其系统内部信息一无所知,只能从它与外部的联系来观测。举例:电力供求系统 计划体制下白色系统. 电价确定; 电量需求由用电计划指标决定; 市场条件下灰色系统. 电价不确定; 电量需求受生产经营状况等因素影响等;2.2.灰色预测的分类灰色预测的分类时间序列预测(重点介绍) 用等时距观测到的,反映对象特征的一系列数据,构造出灰色预测模型,并预测未来某一时刻的特征量,或者是达到某一特征量所需要的时间, 。畸变预测 通过灰色模型预测异常值出现的时刻,预
3、测异常值什么时候出现在特定的时区, 。波形预测(拓扑预测) 通过灰色模型,预测对于未来变动的轨迹,。系统预测 对系统行为特征指标,建立一组相互关联的灰色预测模型,在预测系统整体变化的同时,预测系统各个环节的变化,。 3.生成数特点: 不找概率分布; 不寻求统计特征;处理方法: 累加生成; 累减生成; 均值生成; 级比生成;与概率与数理统计中各随机变量不同。减少波动性。还原用。序列中空穴数的插值。序列两头空穴数的补齐。 计算过程: 原始序列 生成序列 其中:111112xx (), x ()x ( n )000012xx (), x ()x ( n )101kix (k )x (i)101x (
4、k)x (k )1AGO原始序列生成序列序号例题 例1:令 累加生成02 28 2 98 3 39 4 24 6 86 8 64 11 85 12 15 12 71x., ., ., ., ., .,.,.,.12 28 5 26 8 65 12 98 19 75 28 35 40 24 52 29 65 10 x., ., .,.,.,.,.,.,.100 x ()2.28+2.98=5.26x0与x1的变化曲线x0与x1的变化曲线0 01010202030304040505060607070 x0 x0 x1x1x0 x02.282.282.982.983.393.394.244.246.
5、866.868.648.6411.8511.8512.1512.1512.7112.71x1x12.282.285.265.268.658.6512.9812.9819.7519.7528.3928.3940.2440.2452.2952.2965.165.11 12 23 34 45 56 67 78 89 9 例2:令 累减生成(1IAGO)02 28 5 26 8 65 12 89 19 75 28 39 40 24 52 39 65 10 x., ., .,.,.,.,.,.,.12 28 2 98 3 39 4 24 6 84 8 64 11 85 12 15 12 71x., .,
6、 ., ., ., .,.,.,.100 x () 5.26-2.28=2.98二.灰色关联度的分析与计算 分析系统中各因素关联程度。分析系统中各因素关联程度。计算过程: step1:计算关联系数; 设 000012x ( k )x (), x ()x ( n )121iiiix ( k )x (),x ()x ( n ) ,i,m多个参考序列被比较序列则关联系数 0ix (k )x (k )0k其中,为第k点x 与x 的绝对差;0000iiikikiiiikminmin x (k )x (k )maxmax x (k )x (k )(k )x (k )x (k )maxmax x (k )x
7、 (k )0ikmin x (k )x (k )为第一级最小差,0ixx表示在 序列上,找各点与 的最小差;注意: 若单位不一,初值不同的序列,需事先进行初始化,即将序列中所有的数据分别除以第一个数据。0iikminmin x (k )x (k )为第二级最小差,表示在各序列找出最小差的基础上,寻求所有序列中的最小差。0iikmaxmax x (k )x (k )为二级最大差,其含义与二级最小差相似。0 5 . 称作分辨率,01,一般取。 Step2:计算关联度 表示被比较数列与参考数列间的关联度; 为各关联系数的平均值。 11niik( k)n,i = 1 , m灰色关联分析的主要优势另一类
8、量化分析方法数理统计类 (回归分析,方差分析,主成分分析)样本量大;样本具有较好的分布规律和确定的发展趋势;计算量大; 可能出现量化结果与定性分析结果不符的现象;灰色关联分析灰色关联分析 依据因素间发展态势的几何相似或相异程度, 来衡量因素间关联程度的。样本多少没有过多要求;不需要典型的分布规律;计算量少; 不会出现关联量化结果与定性分析不一致的情况;算例 已知: 参考序列 被比较数列 求:关联度。08 8 8 1 6 1 82 4 3 2Y,.,110 11 66 18 34 20 23 4 30Y,.,.,. ,25 5 625 5 375 6 875 8 125 8 75Y, ., .,
9、 ., ., .y0,y1,y2的变化曲线0,y1,y2的变化曲线0 05 5101015152020252530303535y0y0y1y1y2y2y0y08 88.88.81616181824243232y1y1101011.6611.6618.3418.34202023.423.43030y2y25 55.6255.6256.3756.3756.8756.8758.1258.1258.758.751 12 23 34 45 56 6yo解:Step 1:初始化01 1 1 2 2 2 5 3 4x, . ,.,11 1 166 1 834 2 2 34 3x, ., ., .,21 1
10、125 1 075 1 375 1 625 1 75x, ., ., ., ., .y0,y1,y2初始化后的变化曲线0,y1,y2初始化后的变化曲线0 00.50.51 11.51.52 22.52.53 33.53.54 44.54.5x0 x0 x1x1x2x2x0 x01 11.11.12 22.252.253 34 4x1x11 11.1661.1661.8341.8342 22.342.343 3x2x21 11.1251.1251.0751.0751.3751.3751.6251.6251.751.751 12 23 34 45 56 6xoStep2:求绝对差序列101x (k
11、 )x (k ) 202x (k )x (k ) 0 0 066 0 166 0 25 0 66 1, ., ., ., .,0 0 025 0 925 0 875 1 375 2 25, ., ., ., ., .111111123456min( ),(),( ),(),( ),()0 0 66 0 166 0 25 0 66 10min, ., ., ., .,2222221234560min( ),(),( ),(),( ),()0 00minmin,111111123456max( ),(),( ),(),( ),()0 0 066 0 166 0 25 0 66 11max, .,
12、., ., .,1 2 252 25maxmax, .222222123456max( ),(),( ),(),( ),()0 0 025 0 925 0 875 1 375 2 252 25max , ., ., ., ., .Step3 求关联系数0000iiikikiiiikminmin x (k )x (k )maxmax x (k )x (k )(k )x (k )x (k )maxmax x (k )x (k )120 9445().130 8714( ).140 8108().150 6303( ).160 5294().10100 5 2 250 5 2 2511110 5 2
13、 2500 5 2 25.( )x ( )x ( ).与k有关,k=16.Step4:求关联度 结论: y1和y0的关联程度大于y2和y0的关联程度。20 6449.12 21 0 978 0 5487 0 5625 0 45 0 333, ., ., ., ., .同 理 ,6111111 0 94450 87140 81080 63030 529466k(k ).0 7988.三.GM(1,1)模型及预测 GM(1,1)( Grey Model) 1阶1元微分方程;不是差分方程; 是一个线性动态模型,常用于时间序列。 1.理论依据把随机量当作是在一定范围内变化的灰色量;把随机过程当作是在一
14、定范围、一定时区内变化的灰色过程;灰色理论将无规律的历史数据,经累加生成后,使其变为具有指数增长规律的上升形状数列,由于一阶微分方程解的形式,即是指数增长形式,所以可对生成后的数列,建立微分方程模型。故灰色模型实际上是生成数列所建的模型;灰色理论通过灰数的不同生成方式,数据的不同取舍,不同级别的残差GM模型,来调整,修正,提高精度;对高阶系统建模,灰色理论是通过GM(1,n)模型群解决的。 GM(1,n)模型群也即一阶微分方程组组成的灰色模型;GM模型所得到的数据,必须经过逆生成,即累减生成还原后才能应用;2.GM(1,1)模型的建立 原始时间序列 累加生成序列 生成序列X1的微分方程为: 其
15、中,a发展灰数; u内生控制灰数; (灰色作用量)000012xx(), x()x( n )111112xx () , x ()x ( n )11d xa xud t待估参数-a反映了 的发展态势。 一般情况下,系统作用量应是外生的或前定的,而GM(1,1)是单序列建模,只用到系统行为序列(或称输出序列,背景值),而无外作用序列(或称输入序列,驱动值)。b为从背景值挖掘出来的数据,反映了数据变化的关系,其确切内涵是灰的。 灰色作用量是内涵外延化的具体体现,它的存在,是区别灰色建模于一般输入输出建模(黑箱建模)的分水岭。10 x ,x运用最小二乘法(推导参看牛东晓p172),估计参数其中: 1T
16、Tna aBBBYu0001123n( n)x ()x ( )Yx (n)121111112121112( n)( X ( )X ()B( X (n)X (n)生成序列的值原始序列的值原微分方程的解为:1011aiuuX (i)x ( )eaa变量GM(1,1)模型的预测方程。0,1, .inn原微分方程的还原解为: GM(1,1)模型的预测方程的还原解。0,1, .inn01111X (i)X (i)X (i)011aaiu(e) x ( )ea几点说明给定原始序列X0中的数据,不一定要全部用来建模,对原始序列的取舍不同,模型会不同,即a,u会不同。建模的数据取舍,应保证建模序列等时距、相连
17、的,不得有跳跃出现。 一般建模数据序列,应当由最新数据及其相邻数 据构成。当出现新数据时,处理方法: 将新信息加入原始序列,重估参数。 去掉原始序列中最老的一个数据,再加工最新数据 (等维信息),所形成序列和原序列维数相同,重估 参数。3.GM(1,1)模型的检验 残差检验 关联度检验 后验差检验 残差检验按预测模型,计算 ; 将 累减生成 ;计算原始序列 与 的绝对残差 及相对误差 11( ) x(i)0 x (i)0 x (i)000(i)x (i)x (i)00100( i )%X ( i )1(in) 11( ) x(i)0 x (i)关联度检验:按关联度计算方法,算出 与原始序列 的
18、关联 系数,再算出关联度。依经验,当 时,若关联度大于0.6,模型满意。 0 x (i)0 x (i)0 5.后验差检验计算原始序列的平均值计算原始序列的均方差计算残差 的均值 0011nixx (i)n0210111niS( x (i)x )n0(i)0011ni(i)n 计算残差的均方差计算方差比计算小误差概率p 若记 0022111niS(i)n21SCS00100 6745iP(i).SPeS 00ie(i) 010 6745S.S查表若相对误差、关联度、后验差检验均在允许范围内,则可用所建模型进行预测,否则应进行残差修正。 P C 模型评价 0.95 0.80 0.70 0.65 勉
19、强合格 0.70 0.65 不合格4.例题已知:试用GM(1,1)建模,并预测第8期的值。 02 67 3 13 3 25 3 36 3 56 3 72x (i )., ., ., ., ., .y0的时序变化曲线0的时序变化曲线0 00.50.51 11.51.52 22.52.53 33.53.54 4y0y0y0y02.672.673.133.133.253.253.363.363.563.563.723.721 12 23 34 45 56 6拐点解: 构造累加生成序列 12 67 5 80 9 05 12 4115 97 19 69x (i)., ., .,.,.,.y1的时序变化曲
20、线的时序变化曲线0 05 51010151520202525y1y1y1y12.672.675.85.89.059.0512.4112.4115.9715.9719.6919.691 12 23 34 45 56 6构造数据矩阵B和数据向量Yn 1267 5801214325 1580 905127425 11905 124111073 121419 111241 159711783 1211597 196912( .).( .).B( .).(.).(.) 0000023 1333 2543 263 5653 726nx ().x ( ).Yx ().x ( ).x ()计算 , 和 。即
21、TB B1T(B B)TnB Y707 4637554 4154 415T.B B.10 0086670 0943190 0943191 266382T.(B B).10 0438792 925663TTn.(B B) B Y.190 283617 02Tn.B Y.0 043879a. 2 925663u.预测模型 110 0438792 925663dX.X.dt1011aiuuX (i)( X ( )eaa0 0438869 345766 6757.i.e.指数函数形式Y1时序变化曲线及其预测曲线时序变化曲线及其预测曲线0 05 51010151520202525y1y1YI预测YI预测
22、y1y12.672.675.85.89.059.0512.4112.4115.9715.9719.6919.69YI预测YI预测2.672.675.785.789.039.0312.4312.4315.9715.9719.6819.681 12 23 34 45 56 6残差检验因为 10 04388 0169 345766 67572 67.X ( ).e.10 04388 1269 345766 67575 78.X ().e.10 04388 3369 345766 67579 03.X ( ).e.10 04388 4469 345766 675712 43.X ().e.10 043
23、88 4569 345766 675715 97.X ( ).e.10 04388 5669 345766 675719 68.X ().e.故01112 67X ( )X ( ).0112215 782 673 11X ()X ()X ( ).0113329 035 783 25X ( )X ( )X ().01144312 439 033 54X ()X ()X ( ).01155415 97 12 433 54X ( )X ( )X ().01166519 68 15 973 71X ()X ()X ( ).i1234562.673.133.253.263.563.722.675.809
24、.0512.4115.9719.692.675.789.0312.43015.9719.682.673.113.253.403.543.711X (i)1X (i)0X (i)0X (i)GM(1,1)模型计算一览表故绝对误差 相对误差0 0 02 0 0 04 0 02 0 01(, ., , ., ., .) 0 020 040 020 01010001001001003 133 363 563 72.( ,%, ,%,%,%).0 0 0440 1 190 560 27( , .%, , .%, .%, .%)小于4%关联度检验:计算 与 的绝对误差 。 注:由于只有2个序列,故不必寻求
25、二级最大或最小。0X (i)0X (i)(i)0 0 02 0 0 04 0 02 0 01( i ), ., , ., ., .0 0 02 0 0 04 0 02 0 010min(i)min, ., , ., ., .0 0 02 0 0 04 0 02 0 010 04max(i)max, ., , ., ., .关联系数为 故 关联度为 ,模型满足要求。min(i)max(i)(i)(i)max(i)0 6 .10 5(in).1 0 50 1 0 33 0 50 0 67(i ), ., , ., ., .110 67ni(i).n后验差检验X0的均值X0的均方差残差的均值残差的均
26、方差 012 673 133 253 363 563 753 856X( .).00210 36711( X (i)X )S.n100 0200 040 020 0160 0156(.)/. 220 02521(i)S.n计算方差比计算小概率 因为所有 都小于 ,故P=1210 0440 35SC.S00 6745 0 36710 2476S.0 15 0 005 0 015 0 025 0 0005 0 005ie(i)., ., ., ., ., . ie0S预测10 04388 7869 345766 6757.X ( ).e.10 04388 6769 345766 6757.X ()
27、.e.0118874 23X ( )X ( )X ().作业8-1.对以下数据进行GM(1,1)建模,并进行模型检验。 X0 =62.9,58.8,61.4,87.2,104.9,124.8,110.7,129.0,155.3,219.038-2.采用编制的GM(1,1)程序,探讨采用不同长度序列进行GM(1,1)建模的差异性。四.GM(1,1)残差模型1.问题的提出: 当用X0建立的GM(1,1)模型检验不合格时; 当用X0建立的GM(1,1)模型精度不理想时; 2.残差模型的建立 X0构建的GM(1,1)模型为 为预测序列; 为生成序列; 1X (i)1X (i)011e (i)X (i)
28、X (i)残差序列1011( )aiuuX(i)( X ( )eaa01i,n,n,.取部分残差,构成子序列000012e (i)e ( ),e ( ),e (n)对e1建立GM(1,1)模型101101ea ieeeeuu e (i)e ( )e,i,naa111112e (i)e ( ),e ( ),e (n)残差的生成序列为101101ea ieeeu e (i)a ) e ( )e,i,na的导数为:(表示 的偏差11 e (i)GM(1,1)修正模型的还原解为导数型残差修正1011aiuaX (i)X ( )eau注意:一般不使用全部残差建模。001eea ieeu(ii )( a
29、) e ( )ea00010,ii ;(ii ),ii ;01i(nn)修正前的值?参见例题4.算例已知:试:作下一期的预测。 043 45 47 05 52 75 57 14 62 64 68 52X (k ).,.,.,.,.,.x0的时序变化曲线x0的时序变化曲线0 010102020303040405050606070708080 x0 x0 x0 x043.4543.4547.0547.0552.7552.7557.1457.1462.6462.6468.5268.521 12 23 34 45 56 6解:step1: 普通GM(1,1)建模;043 45 47 05 52 75
30、57 14 62 64 68 52X (i).,.,.,.,.,.143 45 90 5 143 25 200 39 263 03 331 55X (i).,. ,.,.,.,.0 09a. 40 01u.10 091493 56450 11.iX (i).e.143 45 90 5 143 25 200 39 263 03 331 55X (k ).,. ,.,.,.,.序号i1043.4543.4543.4500.00%2147.0590.589.930.570.63%3252.75143.25140.792.461.72%4357.14200.39196.443.951.97%5462.
31、64263.03257.325.712.17%6568.52331.55323.957.62.29%0X1X1Xe1100e%X未修正前的建模计算偏差较大且有逐步增大的趋势;问:为什么与 X1 比较?step2: 基于残差的GM(1,1)建模;00 57 2 46 3 95 5 71 7 6e., ., ., ., .残差序列10 57 3 03 6 89 12 19 20 29e., ., .,.,.残差生成序列100 34116 395 840 4ea i.ieeeeuu e (i)e ( )e.e.i,aa残差模型,0 342 17.i.e残差模型的导数项为:0 341 98eeea.
32、au.残差模型的参数估计取n=5其中i=0时,残差项没有发生变化。step3: GM(1,1)残差修正模型;112X (i),i未修正前的数时0 342 172.i.e,i未修正前的值时残差未发生变化序号i1043.4543.4543.4500.00%2147.0590.589.930.570.63%3252.75143.25140.790.590.41%4357.14200.39196.440.330.17%5462.64263.03257.320.310.12%6568.52331.55323.950.850.26%0X1X1Xe1100e%X修正后的建模计算结论:偏差大大降低;step4
33、: 采用残差GM(1,1)模型预测;10 09 60 34 57493 56450 11 2 17408 72.X ().e.e.10 09 70 34 68493 56450 112 17493 29.X ( ).e.e.08493 29408 7284 57X ( ).注意: 本残差修正GM(1,1)模型,采用的是残差求导 方式; 残差修正是基于 预测模型之上进行的。 本残差修正模型,适用于偏差均为正的情况。11X (i)五.其它灰色预测模型 1.GM(1,N)预测模型 2.GM(2,1)预测模型 3.灰色系统预测模型1.GM(1,N)模型多个影响因素的建模问题000012inXX, X,
34、 X1i,n.系统有n个影响变量每个变量有m个数据,则有:0000111112XX ( ),X (),X (m)0000222212XX( ),X(),X(m)000012nnnnXX( ),X(),X(m)对每一个原始序列进行累加1111111112XX ( ),X (),X (m)1111222212XX ( ),X (),X (m)111112nnnnXX ( ),X (),X (m)110011niiiikXX (k)X (k )X (k )形成生成数列由这n个序列组成的系统,围绕着主要因素X1建立微分方程: 2Tna,b ,b其中,为待估参数。11111112233nndXaXb X
35、b Xb Xdt一阶n个变量的微分方程。 由最小二乘法知:1TTnB BB Y111111211111121111112112222123332112nnnX ( )X ()X ()X ()X ()X ( )X ( )X ( )BX (m)X (m)X (m)X (m)(m-1)n0001111123Tn( m)YX ()X ( )X (m)GM(1,N)的模型为10111122111111mmakiiiiiiX (k)X ( )b X (k) eb X (k)aa1011( )()iiX( )X( ).1in 0 11k, ,n,n.注:例:对以下两组数据建立GM(1,2)模型,且 进行预测
36、。i123456X102.2782.0373.2613.6793.851X207.047.6458.0758.538.7749.54解: step1:累加生成新序列。i12345X112.2784.9158.17611.85515.706X217.0414.68522.7631.2940.06400.20.40.60.811.21.41.61.812345系列1系列2step2:计算B和Yn阵。3.595614.6856.545522.7610.015531.2913.780440.0641111121111121111121111121(1)(2)(2)21(2)(3)(3)21(3)(4)
37、(4)21(4)(5)(5)2XXXXXXBXXXXXX00001111(2)(3)(4)(5)TnYXXXX2.0373.2613.6793.854Tstep3:计算a和b2。10 910 36TTn.B BB Y.20 910 36a.,b.0 4 .2bastep4:写微分方程且写出解的形式。1111120.910.36dXXXdt1111122dXaXb Xdt110.911122(1)2.2780.4(1)0.4(1)kXkXkeXkstep5:模型的检验。当k=0时,110.91 01122(1)2.2780.4(1)0.4(1)XXeX0.91 02.2780.4 7.040.4
38、 7.042.278e11111111(2)4.43(3)8.0(4)11.848(5)15.665XXXX GM(1,2)检验一览表i12345X12.2782.0373.2613.6793.851X1预测2.2782.1523.573.8483.871绝对偏差00.4830.3090.170.034相对偏差(%)018.399.484.620.88step5:模型的预测0211022210.91 51011111(6)6.54,(6)(5)(6)40.0646.54=49.604X (6)2.2780.4 49.6040.4 49.60419.656X (6)X (6)X (5)19.65
39、6 15.6653.991XXXXe当有2.GM(2,1)预测模型问题的提出 GM(1.1):适用于具有较强指数规律的序列,只能描述 单调的变化过程。 GM(2.1):解决非单调的摆动发展序列或有饱和的S性序 列问题。推导例题x0的时序变化曲线x0的时序变化曲线0 00.50.51 11.51.52 22.52.53 33.53.54 4x0 x0 x0 x02.8742.8743.2783.2783.3373.3373.393.393.6793.6791 12 23 34 45 5b/a2证明(略)3.灰色系统预测模型对于含有多个相互关联的因素与多个自主控制变量 的复杂系统,当任何单个模型都
40、不能反映系统的发展 变化时。求出系统发展的数值解;弄清楚各影响因素的制约关系与程度;协同关系预测;灰色系统预测模型的建模步骤:Step1:确定系统的主导因素和关联因素;Step2:建立GM模型群,一般情况下,对主导因素建立 GM(1,1)模型,对影响因素建立GM(1, h)模型;Step3:根据GM模型群,将灰参数列成系统状态方程的矩 阵;Step4:用龙格-库塔法,求解状态方程;Step5:对状态方程的解作累减还原,击球的系统各因素的 拟合值和预测值;常微分方程的数值求解方法例题:农村电力需求预测90年补充:龙格-库塔法作业8-2.阅读文献,清楚灰色预测理论在电力负荷预测中的实际应用。小 结1.掌握灰色系统的基本概念。2.掌握灰色关联度计算,GM(1,1)预测模型。3.清楚GM(1,1)残差预测模型及GM(1,N)预测模型。3.了解GM(2,1)和灰色系统预测模型。