1、灰色系统及在建模中的应用灰色系统及在建模中的应用一、灰色系统介绍一、灰色系统介绍 华中科技大学的邓聚龙教授80年代初创立的灰色系统是新兴的横断学科。在短短的二十年里已得到了长足的发展。目前,已经成为社会、经济、科教、技术等很多领域进行预测、决策、评估、规划、控制、系统分析和建模的重要方法之一。特别是它对时间序列短、统计数据少、信息不完全系统的建模与分析,具有独特的功效。灰色系统理论灰色系统理论是研究灰色系统分析、建模、预测、决策和控制的理论。它把一般系统论、信息论及控制论的观点和方法延伸到社会、经济和生态等抽象系统,并结合数学方法,发展出一套解决信息不完全系统(灰色系统)的理论和方法。1.1
2、几种不确定性方法的比较几种不确定性方法的比较 模糊数学模糊数学着重研究“认知不确定”问题,其研究对象具有“内涵明确,外延不明确内涵明确,外延不明确”的特点。主要凭借经验凭借经验,借助于隶属函数进行处借助于隶属函数进行处理理。概率统计概率统计研究的是“随机不确定随机不确定”现象的历史统计规律,考察具有多种可能发生的结果之“随机不确定”现象中每一种结果发生的可能性的大小。其出发点是,大样本,且对象服从某种大样本,且对象服从某种典型分布典型分布。灰色系统灰色系统研究的是“部分信息明确,部分信部分信息明确,部分信息未知息未知”的“小样本,贫信息小样本,贫信息”不确定性问题,并依据信息覆盖,通过序列算子
3、的作用探索事物运动的现实规律。其特点是“少数据建模少数据建模”,着重研究“外延明确,内涵不明确外延明确,内涵不明确”的对象。2050年中国人口控制在年中国人口控制在15亿到亿到16亿之间亿之间树高在树高在20米至米至30米米项目项目灰色系统灰色系统概率统计概率统计模糊数学模糊数学研究对象研究对象贫信息不确定随机不确定认知不确定基础集合基础集合灰色朦胧集康托集模糊集方法依据方法依据信息覆盖映射映射途径手段途径手段灰序列生成频率分布截集数据要求数据要求任意分布典型分布隶属度可知侧侧 重重内涵内涵外延目目 标标现实规律历史统计规律认知表达 特特 色色小样本大样本凭借经验表表1.1 1.1 三种不确定
4、性方法的比较三种不确定性方法的比较1.2 灰色系统的基本原理灰色系统的基本原理公理公理1、差异信息原理。、差异信息原理。“差异”是信息,凡信息必有差异。公理公理2、解的非唯一性原理、解的非唯一性原理。信息不完全、不确定的解是非唯一的。该原理是灰色系统理论解决实际问题所遵循的基本法则。公理公理3、最少信息原理、最少信息原理 灰色系统理论的特点是充分开发利用已占有的“最少信息”。公理公理4、认知根据原理。、认知根据原理。信息是认知的根据。公理公理5、新信息优先原理。、新信息优先原理。新信息对认知的作用大于老信息。公理公理6、灰性不灭原理、灰性不灭原理 “信息不完全”是绝对的。1.3 灰数及其运算灰
5、数及其运算灰数灰数:只知道大概范围而不知道其确切值的数,通常记为:“”。例如:1.头发的多少才算是秃子。应该是个区间范围。模糊 2.多少层的楼房算高楼,中高楼,低楼。3.多么大的苹果算大苹果,小苹果。灰数的种类:灰数的种类:a、仅有下界的灰数。、仅有下界的灰数。有下界无上界的灰数记为:有下界无上界的灰数记为:a,b、仅有上界的灰数。、仅有上界的灰数。有上界无下界的灰数记为:有上界无下界的灰数记为:-,b c、区间灰数、区间灰数 既有上界又有下界的灰数:既有上界又有下界的灰数:a,b d、连续灰数与离散灰数、连续灰数与离散灰数 在某一区间内取有限个值的灰数称为离散灰在某一区间内取有限个值的灰数称
6、为离散灰数,取值连续地充满某一区间的灰数称为连续数,取值连续地充满某一区间的灰数称为连续灰数。灰数。二、灰色系统模型二、灰色系统模型 通过少量的、不完全的信息,建立灰色微分通过少量的、不完全的信息,建立灰色微分预测预测模型模型,对事物发展规律作出模糊性的长期描,对事物发展规律作出模糊性的长期描述,是模糊预测领域中理论、方法较为完善的预述,是模糊预测领域中理论、方法较为完善的预测学分支之一。测学分支之一。灰色系统理论认为任何随机过程都是在一定灰色系统理论认为任何随机过程都是在一定幅值范围和一定时区内变化的灰色量,并把随机幅值范围和一定时区内变化的灰色量,并把随机过程看成灰色过程。过程看成灰色过程
7、。(一)(一)不需要大量的样本。不需要大量的样本。(二)(二)样本不需要有规律性分布。样本不需要有规律性分布。(三)(三)计算工作量小。计算工作量小。(四)(四)定量分析结果与定性分析结果不会不一致。定量分析结果与定性分析结果不会不一致。(五)(五)可用于近期、短期,和中长期预测。可用于近期、短期,和中长期预测。(六)(六)灰色预测精准度高。灰色预测精准度高。灰色模型的优点灰色模型的优点:2.1 灰生成技术灰生成技术灰色序列生成灰色序列生成:是一种通过对原始数据的挖掘、整理来寻求数据变化的现实规律的途径途径,简称灰生成。灰生成特点灰生成特点:在保持原序列形式的前提下,改变序列中数据的值与性质。
8、一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。灰生成的作用(意义)灰生成的作用(意义)1.统一序列的目标性质,为灰决策提供基础。2.将摆动序列转换为单调增长序列,以利于灰建模。3.揭示潜藏在序列中的递增势态,变不可比为可比序列。常见的几种灰生成类型:常见的几种灰生成类型:1.累加生成算子(累加生成算子(AGO)2.逆逆累加生成算子(累加生成算子(IAGO)3.均值生成算子(均值生成算子(MEAN)4.级比生成算子级比生成算子1.累加生成算子累加生成算子(AGO)定义 它是对原序列中的数据依次累加以得到生成序列。令 为原序列(0)x (0)(0)(0)(0)1,2,Xxxxn我们说 是
9、 的AGO序列,并记为(1)X(0)X(1)(0)XAGO X当且仅当 (1)(1)(1)(1)1,2,Xxxxn并满足(1)(0)1()()kmxkxm(1,2,)kn例1 摆动序列为:(0)1,2,1.5,3X通过AGO可以加工成单调增序列:(0)(1)(1,3,4.5,7.5)AGO XX00.511.522.533.544.5501234567891000.511.522.533.544.55012345678910(0)X(1)X2.逆逆累加生成算子累加生成算子(IAGO)定义 它是对AGO生成序列中相邻数据依次累减,又称累减生成。令 为原序列(0)X (0)(0)(0)(0)1,2
10、,Xxxxn称 是 的IAGO序列,并记为Y(0)X(0)YIAGO X当且仅当(1),(2),()Yyyy n并 满足()y kY(0)(0)()()(1)y kxkxk例2令原始序列 为(0)X (0)(0)(0)(0)(0)(0)1,2,3,4,5Xxxxxx(1,1,1,1,1)(0)(1)(1,2,3,4,5)AGO XX(1)1,2 1,32,43,54IAGO X(1,1,1,1,1)这表明(1)(0)(0)()IAGO XIAGO AGO XX3.均值生成算子(均值生成算子(MEAN)(1)(1)(1)(1)1,2,Xxxxn定义 它是将AGO序列中前后相邻两数取平均数,以获得
11、生成序列。令 为 的AGO序列称 为 的MEAN序列,并记为(1)Z(0)X(1)X(1)X(1)(1)ZMEAN X当且仅当 (1)(1)(1)(1)1,2,Zzzzn并且每个 满足下述关系(1)(1)()zkZ(1)(1)(1)1()(1)2zkxkxk例3 对于 ,有 (1)(1,2,3,4,5)X(1)(1)(1)(1)(1)(1),(2),(3),(4)MEAN Zzzzz0.5(12),0.5(23),0.5(34),0.5(45)1.5,2.5,3.5,4.54.级比生成算子级比生成算子定义 设序列 ,则称 (0)(0)(0)(0)1,2,Xxxxn(0)(0)(1)(),()x
12、kkxk2,3,.kn为序列 的级比。(1)X检验准则检验准则 设序列 的级比满足 (0)(0)(0)(0)1,2,Xxxxn2211()(,)nnkee时,序列 可做GM(1,1)建模。(1)X2.2 GM(1,1)模型模型 灰色理论灰色理论认为系统的行为现象尽管是朦胧的,数据是复杂的,但它毕竟是有序的,是有整体功能的。灰数的生成,就是从杂乱中寻找出规律。同时,灰色理论建立的是生成数据模型,不是原始数据模型。因此,灰色预测的数据是通过生成数据的GM(1,1)模型所得到的预测值的逆处理结果。GM(1,1)的的符号符号含义含义:G M (1,1)Grey灰色Model模型1阶方程1个变量定义1
13、设 ,和 (0)(0)(0)(0)1,2,Xxxxn (1)(1)(1)(1)1,2,Xxxxn,则称(0)(1)()()xkaxkb为GM(1,1)模型的原始形式。定义2 设 ,其中 ,则称 (1)(1)(1)(1)1,2,Zzzzn(1)(1)(1)0.5()0.5(1)zkxkxk(0)(1)()()xkazkb为GM(1,1)模型的基本形式。注意:原始序列 (0)(0)(0)(0)1,2,Xxxxn必是非负非负的,其中 ,。(0)()0 xk 1,2,kn若原始序列 不是非负的,则需要对 中的元素做平移变换平移变换,即令 其中 ,。(0)X(0)X(0)(0)()()xkxk+1,2,
14、kn0 显然,由此得到的累加生成序列 和均值生成序列 都是非负非负的。(1)X(1)Z 关于GM(1,1)模型 的参数a和b如何确定?(0)(1)()()xkazkb若 为参数列,且(,)TPa b(0)(0)(0)(2)(3)()xxYxn(1)(1)(1)(2)1(3)1()1zzBzn则其最小二乘估计参数列满足1,TTTPa bBBB Y问题1 关于GM(1,1)模型 的解如何确定?(0)(1)()()xkazkb问题2(白化方程)解得其时间响应函数为:(1)(1)d xa xbd t(1)(0)()(1)akbbxtxeaa 通过对一般微分方程的深刻剖析定义了系列的灰导数,从而使我们能
15、够利用离散数据序列建立近似的微分方程模型:1.解得时间响应序列为:(1)(0)(1)(1)akbbxkxeaa(0)(1)(1)(0)(1)(1)()1(1)aakbxkxkxkexea 2.原始数据序列 的预测值:(2,3,)kn(0)X注意:(0)()xk1.(1,2,)kn是原始数据序列(0)()xk(1,2,)kn的拟合值。2.(0)()xk()kn是原始数据序列预测值。如何检验GM(1,1)模型的精度?问题3残差:残差:(0)(0)()()()q kxkxk平均相对误差:平均相对误差:相对误差:相对误差:精度:精度:(0)(0)(0)(0)()()()()100%100%()()q
16、kxkxkkxkxk21()()1nkavgkn01()100%pavg 后验差检验 关联度检验 级比偏差检验此外,还有建立灰色预测模型的一般步骤建立灰色预测模型的一般步骤 第一步:级比检验,建模可行性分析。第二步:数据变换处理。第三步:用GM(1,1)建模。第四步:模型检验。灰建模实例:灰建模实例:北方某城市北方某城市1986-1992年交通噪声平均声级数据年交通噪声平均声级数据序号序号 年份年份 Leq序号序号 年份年份 Leq 1 1986 71.1 2 1987 72.4 3 1988 72.4 4 1989 72.1 5 1990 71.4 6 1991 72.0 7 1992 71
17、.6表:某城市近年来交通噪声数据表:某城市近年来交通噪声数据dB(A)第一步:级比检验,建模可行性分析。1.建立交通噪声平均声级数据时间序列:(0)(0)(0)(0)1,2,7Xxxx(71.1,72.4,72.4,72.1,71.4,72.0,71.6)2.求级比:(0)(0)(1)()()xkkxk(2),(3),(7)(0.9820,1.0000,1.0042,1.0098,0.9917,1.0059)3.级比判断:2211(),nnkee由于所有的 ,()0.778800783,1.284025417k(2,3,7)k,故可以用 作满意的GM(1,1)建模。(0)X 第二步:用GM(1
18、,1)建模。1.对原始数据 作一次累加:(0)X(1)(0)1()()kmxkxm(1,2,7)k (1)(1)(1)(1)1,2,7Xxxx得:(71.1,143.5,215.9,288,359.4,431.4,503)2.构造数据矩阵B及数据向量Y:(1)(1)(1)12(1)(2)107.32zxx(1)(1)(1)13(2)(3)179.32zxx(1)(1)(1)17(6)(7)467.22zxx(1)(1)(1)15(4)(5)323.72zxx(1)(1)(1)14(3)(4)251.952zxx(1)(1)(1)16(5)(6)395.42zxx于是得到:(0)(0)(0)(0
19、)(0)(0)72.4(2)72.4(3)72.1(4),71.4(5)72.0(6)71.6(7)xxxYxxx(1)(1)(1)(1)(1)(1)107.3 1(2)1179.7 1(2)1251.95 1(2)1323.7 1(2)1359.4 1(2)1467.2 1(2)1zzzBzzz 3.最小二乘估计求参数列 :(,)TPa b0.0023437972.65726961,TTTPa bBBB Y于是得到 。0.00234379,72.6572696ab4.建立模型:(0)(1)()0.00234379()72.6572696xkzk解得时间响应序列为:(1)(0)(1)(1)ak
20、bbxkxeaa0.0023437930928.8525930999.95259ke()5.求生成数列值 及模型还原值 :(0)(1)xk(1)(1)xk 令 代入时间响应函数可算得 ,其中取 。1,2,6k(1)()xk(1)(0)(1)(1)(1)(1)71.1xxx由累减生成 ,得还原值:0)(0)(0)()()(1)xkxkxk (0)(0)(0)(0)1,2,7xxxx(71.1,72.4,72.2,72.1,71.9,71.7,71.6)第三步:模型检验。序号序号 年份年份 原始值原始值模型值 残差 相对误差 1 1986 71.1 2 1987 72.4 3 1988 72.4
21、4 1989 72.1 5 1990 71.4 6 1991 72.0 7 1992 71.6 71.1 0 0 72.4 0 0 72.2 0.2 0.28%72.1 0 0 71.9 -0.5 -0.7%71.7 0.3 0.42%71.6 0 0 表:表:GM(1,1)模型检验表模型检验表平均相对误差:平均相对误差:21()()0.0021nkavgkn01()100%99.8%pavg精度:精度:经验证,该模型的精度较高,可进行预报和预测。MCM2006年 A题艾滋病疗法的艾滋病疗法的评价及疗效的预测评价及疗效的预测 艾滋病(ADIS)是当前人类社会最严重的瘟疫之一,从1981年美国发
22、现首例艾滋病以来,它已经吞噬了近3000万人的生命。我国自1985年发现首例艾滋病到2003年底,我国有艾滋病感染者84万人,到2010年感染艾滋病病毒人数将达到1000万。艾滋病已对我国的经济发展造成威胁,并带来了一系列政治与社会问题。对艾滋病疗法的研究,意义重大。背背 景景 艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”,英文简称HIV.引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,H
23、IV将迅速增加,导致AIDS发作。艾滋病治疗的目的艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。问题一问题一 美国艾滋病医疗试验机构ACTG公布的数据,ACTG320(见附件1)是同时服用zidovudine(齐多夫定),lamivudine(拉美夫定)和indinavir(茚地那韦)3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量
24、)。利用附件1的数据预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。问题二问题二 美国艾滋病医疗试验机构ACTG公布的数据,193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。4种疗法的日用药分别为:1.600mg zidovudine或400mg didanosine(去羟基苷),这两种药按月轮换使用;2.600 mg zidovudine加2.25 mg zalcitabine(扎西他滨);3.600 m
25、g zidovudine加400 mg didanosine;4.600 mg zidovudine加400 mg didanosine,再加400 mg nevirapine(奈韦拉平)。利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。问题三问题三 艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mg zidovudine 1.60美元,400mg didanosine 0.85美元,2.25 mg zalcitabine 1.85美元,400 mg nevirapine 1.20美元。如果病人需要考虑4种疗法
26、的费用,对问题(2)中的评价和预测(或者提前终止)有什么改变。CD4和HIV存在着密切的关系。HIV的靶细胞主要是CD4细胞,CD4细胞在抵御HIV的入侵中起着重要的作用。HIV感染CD4后,会利用CD4中的物质翻译出各种病毒结构蛋白和酶,最后在胞浆中装配成新的病毒;CD4被HIV感染后,最终会因裂解而死亡。CD4的数量变化由两方面组成:1.CD4细胞的自身增长;2.CD4细胞因被HIV感染而裂解。HIV的数量也由两方面组成:1.HIV被服用的药物杀死;2.HIV通过感染CD4细胞而增殖。问问题题分分析析自身未被自身未被 感染细胞感染细胞的增殖的增殖被被HIV感感染而裂解染而裂解 感染感染CD4而增而增HIV被药被药 物杀死物杀死HIV的的数量数量CD4的的 数量数量加入加入 退出退出加入加入 退出退出CD4和和HIV的数量变化图的数量变化图 词词 汇汇1.艾滋病治疗的目的2.CD4和HIV的关系3.测试病人CD4和HIV浓度的数据4.治疗效果5.最佳治疗中止时间6.疗法的优劣