1、xxxp12,yyym12,2121mpyyyxxxyjmnj,1212 系统x1x2xpy1y2ym为简化问题,不妨设该系统为单目标系统,且由函数关为简化问题,不妨设该系统为单目标系统,且由函数关系系 ,可以设:,可以设:(1.2)可得如下线性模型可得如下线性模型 (1.3)为测量误差,相互独立,为测量误差,相互独立,。令令yf xxxp(,)12yxxpp011nnppnnnppppxxxyxxxyxxxy22110222222211021112211101 12,niN(,)0YyyyXxxxxxxxxxnppnnnppn121112121222120112111YXniippiixxy
2、Q12110QQminpiQi,2,1,0001,pAX XpT设()1X YX XATTAXYT1yyn1,ynyyyn112()SyySyySyynnn总剩回()()()212121SxpSxnpFSpSnpF p np回剩回剩2222111()()/(,)Hp0120:H1:FFp npH(,),10时 拒绝当时,接受FFp npH(,)10H0 xxxp12,Hjj00:Hjj10:jp 1 2,jjjjjjjjjcNFcSnpFnp剩(,),()/(,)0 11112tSnpt npcAX XjjjjjT/()()剩是1111FFnpttnpjj(,)()1112或ji 0yxxpp
3、011yxxpop00101yyNb(,)00bnCxxxxijoiiojjjpip21111()()y ybNSx n py ySn pt n p (,),(),/()022001111剩剩y01)1(12020pnSpntyypnSty剩剩 得得 的预测区间:的预测区间:i0 x xxp12,1 mp;,2,1,nxyma11110mmnxxxxi12,nSxxSxxmmmmnn总回(),()2211Sxxxmmnm剩(),21 xbb xb xbxmmm0112211b bbm011,0121,mzxxjmijjjj12,jjjnxx()21zzzznnmm,01221111 2RNXX
4、AT00YXBT)1()1(mmijrRjinjjiiijxxxxr1)(1.14)可得数学模型为:可得数学模型为:(1.15)经推导可得:经推导可得:,BrrrRrrrrrrrrrmmmmmmmmmm01211 11 2112 12 2211 11 211,Zd zd zdznmm1 12211yxxd xd xdxnnmmmmmm()111222111111222111mmmmmmxdxdxdRbdjmjmjj1 21,bxb xmjjjm011dj112总总SSm回回SSm21剩剩SSm21VQjmj12VjxjZjZjjQVrrjjmjj()/12Rrrrrrrrrrrrrrrrrmm
5、mmmmmmmmmmm mm m(),0111211121222121 11 2111121VVVm112111()()(),)1()1(max1jjkVVZk1FVSfVrVnFnkkmmk111111111212()()()()()/()(,)剩剩FFn112(,)jm1 21,Vrrjjmjj()/12)1(11)1(1max,1jmjkVVkZk1FVrVnkmmk111112()()()FFn112(,)zjzjVjkVjj()()max212RRrtsj()()()012drrrjkjjmjjmjj()()()()/()22111)1()2()2(/1jjjjjjjrrcVdcrr
6、jjjjjmjj()()()()/222121zjkj()1zk2jk1zjVj()2Vj()2Vk22()zk2FVrVnFnkmmk121222313()()()()(,)zk2zk2zk1()()zdzdzmkkkk112222Vdcrrkkk kk mk k111 111 1222222()()()()()/SrVrrrrmmkmmk mk kmm剩()()()()()()()/212112122222fnn剩()2213zk1FVSfVrnFnkkmm22222211313()()()()()/()(,)剩剩zk1FVrnFnkmm2222313()()(,)zd zd zd znk
7、kkkkkll11221kz一、数学模型一、数学模型二、主成份分析二、主成份分析三、主成份的贡献率三、主成份的贡献率pp(,)12ppyyykpk12,()pXx xxpT(,)12pXx xxpT(,)12pE()D XV()12pijp pD XCOV xxV()(,)xxxp12,y yyk12,ya xa xa xa XppT11122aa aaXx xxTpTp(,),(,)1212D yD a XaDX aa VaTTT()()()1y1Dy1Lagrange1aaDy1max11DyaaTa Vaa aTT()1aVaaa aT22011aaaVaTTaaaVaaTTVaayDT
8、)(10)(aIV0IV12,pVpmax1,max21paVa11d1111aaTp1a11Tya XV120p12mmaaa,21XayT11Tay22XayTmmmmaaa,21y yym12,x xxp12,V,xxxnp121 2VnS11Sxxxxijppijiijjn()()1iixiijijx x是,Vnxxxxxxppppp11111,1 2,n,xxxnp121 2xij Rrijp pxijyyym12,x xxp12,COV XXVijpp()()1112,ppx xxp12,1122pptrVV()方阵 之迹12ptrVD yimiii()(),01 2 ktrVii
9、iiim1ikikkkm12kdiyyykdii1211,()一、数学模型一、数学模型二、关于计算中应注意的问题二、关于计算中应注意的问题三、关于误判率及多个总体的判别三、关于误判率及多个总体的判别 根据所研究的个体的观察指标来推断个体所属于何种根据所研究的个体的观察指标来推断个体所属于何种类型的一种统计分析方法,称为判别分析。类型的一种统计分析方法,称为判别分析。例如某精神病院有精神病患者例如某精神病院有精神病患者256名,诊断结果将名,诊断结果将它们分成六类它们分成六类 (相当于相当于6个总体个总体)设设 服服从三维联合正态分布从三维联合正态分布 i=1,2,6,其中,其中,为协方差矩阵,
10、一般这六种类型可分为为协方差矩阵,一般这六种类型可分为焦虑状、癔病、精神病、强迫观念型、变态人格、正焦虑状、癔病、精神病、强迫观念型、变态人格、正常,若有如下子样:常,若有如下子样:子样子样 子样子样 子样子样G GG126,GiNVi3(,)iiii(,)123),(111VN111211,n),(222VN222221,n),(666VN666261,nxij注意到每个子样注意到每个子样 都是三维向量。现有一个新的都是三维向量。现有一个新的精神病患者前来就医,测得三个指标:精神病患者前来就医,测得三个指标:1232.01.01.01xxx试判断该患者病情属于哪一类。试判断该患者病情属于哪一
11、类。(一一)两两点的距离点的距离n设设 维空间中有两点维空间中有两点 ,则其欧氏距离为则其欧氏距离为:Xx xxTn(,)12Yy yyTn(,)121221()niiidxy欧(3.1)由于数据的量纲不同,不采用欧氏距离由于数据的量纲不同,不采用欧氏距离,用马用马氏距离有:氏距离有:定义定义1 1:设:设X,YX,Y是从总体是从总体G G中抽取的样品中抽取的样品,G,G服从服从P P维维正态分布,正态分布,,定定义义X,Y两两点点间间的距离的距离为马为马氏距氏距离:离:NVp(,)1(,)()()Td X YXYVXY(3.2)定义定义2:X与总体与总体G的距离为的距离为D(X,G)为为 1
12、12(,)()()()(,)TTpD X GXVXE X(3.3)(二二)距离判别法距离判别法 设有两个协方差相同的正态总体设有两个协方差相同的正态总体 ,且,且G G12,1122(,)(,)PpGNVGNV对于一个新的样品,要判定它来自哪一个总体,对于一个新的样品,要判定它来自哪一个总体,有一个很直观的方法:有一个很直观的方法:计算计算 12(,),(,)D X GD X G221212(,)(,),DX GDX GXGXG则否则若若(三三)线线性判性判别别函函数数 由由 2212122(,)(,)()()TD X GD X GXVX11121112()()2()()2TTXVXXV令令
13、121()2记记 112()()()TW XXV则有:当则有:当 时,时,否则否则()0W X 1XG2XG 12,V当当 为已知时,令为已知时,令 112()aV,可得:可得:()()()TTW XXaaX(3.4)W X()称称 为线性判别函数,为线性判别函数,a a为判别系数为判别系数,因为因为 112()aV,即,即 12Va,解解线线性方程性方程组组可得解可得解12(,)Tpaa aa此时的判别规则为:此时的判别规则为:12()0()0TTaXXGaXXGX是新的一是新的一个个点点,将将其代入即可判其代入即可判别别。(3.5)实际上实际上,均未知均未知,要用样本值的估计公式来计算出要
14、用样本值的估计公式来计算出与。其方法如下。其方法如下:设子样设子样x xxn121,来自总体来自总体G1,子样子样yyyn122,来自来自G2,可由可由XnxYnykkknkn11121121,SXXXXxxxxkkTkikjjknknp pi11111()()()()ppnknkjkjikiTkkyyyyYYYYS22112)()(在本在本节节的的开头开头的例子中的例子中P=3)得到得到 VnnSS121212()(21YX(3.6)(3.7)判别函数为判别函数为)()()(1YXVXXW(3.8)判别系数为判别系数为)(1YXva这里提及一个回报的误判率问题。在构造判别函数这里提及一个回报
15、的误判率问题。在构造判别函数W(X)时时,是依据样本是依据样本 XXXn121,现现在已知在已知 XXXn121,均属于均属于 G1,从从道理上道理上来说来说,Xi经过判别公式经过判别公式(3.8),可得出可得出 XG ini1112,但也可能出但也可能出来来某几某几个个不不属属于于 G1,这这0n便是误判。若有便是误判。若有 存在存在,使得使得 0)(0nXW,说说明明 20GXn这这就就产产生了一生了一个误个误判。所判。所谓误谓误判率判率,即是出即是出现误现误判的判的百分百分数数,我我们应该们应该有所控制。有所控制。当两个总体的协方差不相等时当两个总体的协方差不相等时,可用如下方法可用如下
16、方法:DX GXVXT211111(,)()()DX GXVXT222212(,)()()(3.9)(3.10)当当 DX GDX GXGXG212212(,)(,),时否则当当 1212,未知时未知时,用下列估计代替用下列估计代替:222111211111SnVSnVYX在在m个总体个总体G GGm12,时,均值为时,均值为12,m协方差阵为协方差阵为V VVm12,(p维维)设设 iiV,都已知时都已知时,X为样品为样品 Xxxxp001020(,)计算计算 DXGimi201 2(,),选择一个选择一个最小的值例如最小的值例如),(min),(02102imikGXDGXD则则 XGk0
17、设设iiV,未知未知,但独立,可以分别以估计值来计算。但独立,可以分别以估计值来计算。iiV,当上述当上述 未知未知,但但VVVm12亦可以用上述类似方法。亦可以用上述类似方法。上述解决方法中,可以扩展到非正态分布。上述解决方法中,可以扩展到非正态分布。时,时,物以类聚,人以群分,社会发展和科技的进物以类聚,人以群分,社会发展和科技的进步都要求对于某些物体进行分类。由于早期的定步都要求对于某些物体进行分类。由于早期的定性分类已不能满足需要,于是数值分类学便应运性分类已不能满足需要,于是数值分类学便应运而生。而生。一、数学模型一、数学模型二、应用类例二、应用类例某种物品有某种物品有n个:个:XX
18、Xn12,指标,如何将其分成若干类,基本的思路是把距离指标,如何将其分成若干类,基本的思路是把距离较近的点归成一类。这里的距离可分为如下三类:较近的点归成一类。这里的距离可分为如下三类:它有它有m个数值量化个数值量化1.距离距离 Xxxxiiiim(,)12in 1 2,XXij,的距离的距离,dD XXijij(,)本文中的距离常用欧氏或马氏距离,公式在前几节本文中的距离常用欧氏或马氏距离,公式在前几节中已述,还有一种用绝对距离:中已述,还有一种用绝对距离:jkikmkijxxd1max)(应该提及马氏距离应该提及马氏距离dMij()可以克服数据相关性的困难可以克服数据相关性的困难。2.数数
19、据正据正规规化化处处理理 当当Xi的分量中的分量中m大大,要经过正规化标准化处理,要经过正规化标准化处理,令令 个指标量纲不一致时,相差很个指标量纲不一致时,相差很(min)(max)(min)iiiijijxxxxx(4.1)其中其中 xxxxiiiim(min)min(,)12xxxxiiiim(max)max(,)12(4.2)(4.3)将经过将经过(1)(1)式处理的数据式处理的数据ijx重新视作重新视作xij(为记号上的为记号上的方便方便)3.相似系相似系数数法法 XXij,的相关系数的相关系数rxxxxxxxxijikijkjkmikijkjkmkm()()()()1221112(
20、4.4)可以将相关愈密切的归成一类。可以将相关愈密切的归成一类。先将先将n个样本各自为一类,计算它们之间的距个样本各自为一类,计算它们之间的距离,选择距离小的二个样本归为一个新类,再计算离,选择距离小的二个样本归为一个新类,再计算这个新类与其它样本的距离,选择距离小的二个样这个新类与其它样本的距离,选择距离小的二个样本本(或二个新类或二个新类)归为一个新类,每次合并缩小一个归为一个新类,每次合并缩小一个以上的类,直到所有样本都划为一个类为止。以上的类,直到所有样本都划为一个类为止。这里规定两点间距离为:这里规定两点间距离为:dD XXijij(,)两类间的距离,即两类间的距离,即 GGpq与的
21、距离为:的距离为:ijGXGXpqdDqjpi,min步骤如下:步骤如下:1.数据正规化处理数据正规化处理 要视各指标的量纲是否一致,相差是否太大,要视各指标的量纲是否一致,相差是否太大,并选择一种距离计算法,为了方便计,一般都选并选择一种距离计算法,为了方便计,一般都选择欧氏距离法。择欧氏距离法。2.计算各样本间的两两距离计算各样本间的两两距离,并记在分类距离对并记在分类距离对称表中称表中,并记为并记为D(0),第第0步分类步分类,此时此时 Ddpqpq(每一每一个样个样本点本点为为一一个类个类)3.选择选择表表D(0)中的最短距离中的最短距离,设为设为 Dpq,则将则将 GGpq,合并成一
22、个新类合并成一个新类,记为记为 GrGGGrpq,(4.5)4.4.计算新类计算新类Gr与其它类之间的距离与其它类之间的距离,定义定义 ijGXGXrkdDkjri,minijGXGXijGXGXddkjqikjpi,min,minmin min,DDpkqk(4.6)表示新类表示新类Gr与类与类Gk之间的距离。之间的距离。5.作作D(1)表表,将将D(0)中的第中的第p,q行和行和p,q列列删删去去,加加上第上第r行行,第第r列。第列。第r行行,第第r列列与与其其它类它类的距离按的距离按(4.6)式判式判断断后后记记上上,这样这样得到一得到一个个新的分新的分类类距离距离对称对称表表,并并 记
23、为记为D(1),D(1)表示表示经过经过一次聚一次聚类类后的距离表后的距离表,要要注意的是注意的是Dr类类是由是由哪两类哪两类聚聚类类得到得到应应在在D(1)表下表下给给以以说说明。明。6.对对D(1)按按3,4,5重复类似重复类似D(0)的聚类工作的聚类工作,得得D(2)。7.一直重复一直重复,直到最后只剩下两类为止直到最后只剩下两类为止,并作聚并作聚类图。类图。现有现有8个样品个样品,每个样品有每个样品有2个指标个指标(m=2,2维变维变量量),它们的量纲相同它们的量纲相同,(否则要经过正规化处理否则要经过正规化处理)x1x2编号编号 1 12 23 34 45 56 67 78 82 2
24、2 24 44 4-4-4-2-2-3-3-1-15 53 34 43 33 32 22 2-3-3试用系统聚类方法对这试用系统聚类方法对这8个样品进行聚类。个样品进行聚类。解解:采用欧氏距离采用欧氏距离 (1)最短距离法最短距离法,首先用表格形式列出首先用表格形式列出D(0)D(0)D(0)G1G1G2G2G3G3G4G4G5G5G6G6G7G7G8G8G1G10 0G2G22.02.00 0G3G32.22.22.22.20 0G4G42.32.32.02.01.01.00 0G5G56.36.36.06.08.18.18.08.00 0G6G65.05.04.14.16.36.36.16
25、.12.22.20 0G7G75.85.85.15.17.27.27.17.11.41.41.01.00 0G8G88.58.56.76.78.68.67.87.86.76.75.15.15.45.40 0表示第表示第i个样品个样品,i=1,2,8 Gi在在D(0)D(0)中中,最小值是最小值是1.0,1.0,相应的距离是相应的距离是D(3.4),D(3.4),与与D(6,7)D(6,7)。则。则G G34,合并为新类合并为新类G9,把把GG67,合并成合并成G10。(2)把把D(0)中去掉中去掉 G G G GG G G G34673467,行及列并计算得下表并计算得下表,后两行重算后两行重
26、算,其余照其余照D(0)照抄。照抄。D(1)D(1)G1G1G2G2G5G5G8G8G9G9G11G11G1G10 0G2G22.02.00 0G5G56.36.36.06.00 0G8G88.58.56.76.76.76.70 0G9G92.22.22.02.08.08.07.87.80 0G10G105.05.04.14.11.41.45.15.18.18.10 0DDD(,)min(,),(,),934 21258DDD(,)min(,),(,),10671258DDDDD(,)min(,),(,),(,),(,)9 1036374 64 7视视D(1)D(1)中中,最小值为最小值为1.
27、4,1.4,相应的是相应的是D(5,10)D(5,10)将将G G510,合并成新类合并成新类G11。3)同法同法构构造造D(2)表表D(2)D(2)G1G1G2G2G8G8G9G9G10G10G1G10 0G2G22.02.00 0G8G88.58.56.76.70 0G9G92.22.22.02.07.87.80 0G11G115.05.04.14.15.15.16.16.10 0其中其中(11,)min(5,),(10,)1,2,8,9DDD最小值最小值D(1,2)=D(2,9)=2.0D(1,2)=D(2,9)=2.0,则把,则把G GGG12912,合并成新类,在,在D(2)中中,D
28、(3)D(3)G8G8G11G11G12G12G8G80 0G11G115.15.10 0G12G126.76.74.14.10 0 其中其中DDDD(,)min(,),(,),(,),12129811D(3)D(3)中中,最小值最小值D(11,12)=4.1D(11,12)=4.1,因此把因此把GGG111213,合并成,在,在D(4)D(4)G8G8G13G13G8G80 0G13G135.15.10 0DDDDDDDD(,)min(,),(,),(,),(,),(,),(,),(,).138182 8384 8586 87 851(见见D(0)第第8行行)3.3.把上述聚类过程用聚类图表
29、示把上述聚类过程用聚类图表示:0 1 1.4 2 T 3 4 5 G1G2G3G4G5G8G12G9G11G10G13G14G7G8 说明:聚类到一定程度即可结束说明:聚类到一定程度即可结束一般可以选取一个阈值一般可以选取一个阈值T,到,到D(K)中的所有非零元素中的所有非零元素都大于都大于T,即结束,即结束(表中的值表中的值T值值)设设T=2.5:则:则到到D(3)时结束,此时的共聚为三类:时结束,此时的共聚为三类:GGGGGGGGGGG1234125671188,如下图:如下图:85761 32 4二、数学模型二、数学模型一、问题的提出一、问题的提出三、一个实例三、一个实例客观事物分成确定
30、性和不确定性两类客观事物分成确定性和不确定性两类,处理不确定性的处理不确定性的方法为随机数学方法。在进行随机现象的研究时方法为随机数学方法。在进行随机现象的研究时,所表所表现的现象是不确定的现的现象是不确定的,但对象事物本身是确定的。例如但对象事物本身是确定的。例如投一个分币投一个分币,出现哪一面是随机的出现哪一面是随机的,但分币本身是确定的。但分币本身是确定的。如果所研究的事物本身是不确定的如果所研究的事物本身是不确定的,这就是模糊数学所这就是模糊数学所研究的范畴。研究的范畴。例如例如,一个人年龄大了一个人年龄大了,称年老称年老,年小年小,或年青或年青,但到底什但到底什么算年老么算年老,什么
31、算年青呢什么算年青呢?又如儿子象父亲又如儿子象父亲,什么是象什么是象?象多少象多少?再说儿子象父亲再说儿子象父亲,儿子又象母亲儿子又象母亲(部分象部分象),难道父亲象难道父亲象母亲母亲?1965年由年由I.A.Zadeh提出模糊数学提出模糊数学,它可以广泛地应于它可以广泛地应于图象识别图象识别,聚类分析聚类分析,计算机应用和社会科学。计算机应用和社会科学。fEEE()1001fA()fA()AfA()fEX()fA()(),(max)(BABAffffffABAB()min(),()ffAA()()1Aiiiim(,)12in 12,Yyyyiiiim(,)12ni,2,1Yi 0 21211
32、)()()(mkjjkmkiikjjkmkiikijYYYYYYYYr Rrijn n()|rij1rrrijijij050201.则 Rrijn n 第三步第三步:建立模糊等价矩阵建立模糊等价矩阵 由于上述模糊矩阵不具有传递性由于上述模糊矩阵不具有传递性:即即要通过褶积将模糊矩阵改造成模糊等价矩阵要通过褶积将模糊矩阵改造成模糊等价矩阵:矩阵的褶积与矩阵乘法类似矩阵的褶积与矩阵乘法类似,只是将数的加只是将数的加.乘运算改成并乘运算改成并 和交和交 :则则褶积为褶积为:RRRR242,ABabcijnijnijn()()()Ca ba ba bijijijinnj1 122Cabababijij
33、ijinnj()()(1122 于是有于是有:于是有于是有:一直到一直到 为止为止此时此时 即满足模糊等价矩阵即满足模糊等价矩阵,具有传递性具有传递性 此时记它为此时记它为:CR:CR第四步第四步:进行聚类进行聚类:将矩阵将矩阵CRCR的元素的元素 依大小次序排列依大小次序排列,从从1 1开始开始,沿沿着着 自大到小依次取自大到小依次取 值值,定义定义:可以得到若干个可以得到若干个0,10,1元素构成的元素构成的CR CR 矩阵矩阵,其中之其中之1 1的的表示这二个样本划为一类表示这二个样本划为一类RR R RRRRRR2422844,RRhh2RhCrijCrijCrCrCrijijij10
34、三、一个实例三、一个实例 =-上海上海4 4月平均气温月平均气温;-;-北京北京3 3月雨量月雨量 -5-5月地磁指数月地磁指数;-5;-5月月500500毫巴毫巴W W型环流型环流型日数型日数 予报对象予报对象:华北五站华北五站(北京、天津、营口、太原、石家庄北京、天津、营口、太原、石家庄)7-8)7-8月降水月降水量量,仅用仅用61-6761-67年年 7 7年的资料年的资料(略略)第一步第一步:计算相似系数计算相似系数 经过标准化计算相似系数矩阵经过标准化计算相似系数矩阵R RX(,)XXXX1234X1X2X3X4)(114.0149.019.0123.029.076.0126.056
35、.061.020.0160.019.099.076.057.0106.005.074.028.084.068.01 ijrR第二步第二步:建立模糊矩阵建立模糊矩阵 将相似系数压缩到将相似系数压缩到0,10,1之间之间 得得 第三步第三步:建立模糊等价矩阵建立模糊等价矩阵 按上式计算按上式计算:例如例如 rrijij0502.143.0120.040.0162.065.012.0163.022.020.060.0120.042.099.012.022.0153.048.013.060.092.016.01Rrrrrrrrrrrrrrrr121112122213321442155216621772
36、*()()()()()()()(.)(.)(.)(.)(.)(.)(.)(.10160161092022064012013099048042053020016016022012013042020042得到得到 ,发现发现 ,当当 取取0.920.92时时:将将 ,当当 取取0.650.65时有时有:RRR248,RR84CR0 921010000100100100001000100101.5252,XXXX合并成一类XXXX1313,亦合并成一类CR0 651010000100100100001010100101.又将又将 合并成一类合并成一类,当当 取取0.640.64时时,有有 此时将此时
37、将1,3,1,3,再与再与4,64,6并为一类并为一类,可分成三类可分成三类 再再 取取=0.63=0.63时时 这次再将这次再将 ,只有二类只有二类:,XX46,CR0 641011010100100110101010100101.6431,XXXX111001110111011001001110110163.0CRXXXXX71346并入,XXXXX13467,XX25,752,XXX 聚类图聚类图:说明说明:(1)(1)当当 =0.65=0.65时时,共分成四类共分成四类:(2)(2)当当 =0.64=0.64时时,共分成三类共分成三类:(3)(3)当当 =0.63=0.63时时,共分成
38、二类共分成二类:这是以按年份为基本类的分类图这是以按年份为基本类的分类图 XXXXXXX2513467,XXXXXXX2513467,XXXXXXX2513467,0.640.650.920.990.63X5X2X13XX4X6X7一、随机过程一、随机过程二、马尔可夫方程和二、马尔可夫方程和n步转移矩阵步转移矩阵三、遍历性与平稳分布三、遍历性与平稳分布四、马氏链的应用四、马氏链的应用一、随机过程一、随机过程 描述一种随机现象的变量描述一种随机现象的变量,一般称为随机变量一般称为随机变量,记为记为 ,而随着时间参数而随着时间参数t t或其它参数变化而变化的或其它参数变化而变化的随机变量随机变量,
39、称为随机过程。称为随机过程。定义定义1 1 在给定的概率空间在给定的概率空间(,F,P)(,F,P)及实数集及实数集T,T,其中其中 为样本空间为样本空间,F,F为分布函数为分布函数,P,P为概率为概率,对于对于每一个每一个 ,有定义在有定义在(,F,P)(,F,P)上的随机变量上的随机变量 与之对应与之对应,则称为则称为 随机过程随机过程,一一般简化为般简化为 。tT(,),t w w Ttwtwt););,()(t 定义定义2(2(马尔可夫过程马尔可夫过程)设随机过程设随机过程 ,如果在已知时如果在已知时间间t t系统处于状态系统处于状态x x的条件下的条件下,在时刻在时刻 (t)(t)系
40、统所处状态和系统所处状态和时刻时刻t t以前所处的状态无关以前所处的状态无关,则称则称 为马尔可夫过程。为马尔可夫过程。从定义从定义2 2可知马氏过程只与可知马氏过程只与t t时刻有关时刻有关,与与t t时刻以前无关。时刻以前无关。定义定义3(3(马尔可夫链马尔可夫链)设随机过程设随机过程 只能取只能取可列个值可列个值 把把 称为在时刻称为在时刻 系统处于系统处于状态状态 若在已知时刻若在已知时刻 系统处于系统处于 状态的条件下状态的条件下,在时刻在时刻 ()()系统所处的状态情况与系统所处的状态情况与t t时刻以前所处状态时刻以前所处状态无关无关,则称则称 为时间连续为时间连续,状态离散的马
41、氏过程。而状态状态离散的马氏过程。而状态的转移只能在的转移只能在 发生的马氏过程称为马尔可夫链发生的马氏过程称为马尔可夫链。从定义从定义3 3可知可知,马氏链是状态离散马氏链是状态离散,时间离散的马尔可夫过时间离散的马尔可夫过程。程。()t()t()t,21nrrrnrt)(tEnn(,)12 tEnt)(tttnn(,)12 定义定义4(4(转移概率转移概率)设系统的离散状态为设系统的离散状态为 设设 表示第表示第 次转移到状态次转移到状态 表示系统开始处于表示系统开始处于 状态。状态。则称则称 (6.1)(6.1)为系统在为系统在k-1k-1次转移到次转移到 状态状态,而第而第k k次转移
42、到次转移到 状态的转移状态的转移概率概率由定义可知由定义可知 (6.2)(6.2)定义定义5 5 若若(2)(2)式中式中 有有:(6.3)(6.3)则称为均匀马氏链则称为均匀马氏链 (与第几次转移无关与第几次转移无关)即即 EE12,Ajk()kEAjj()0iEPP AAijkjkik()()()(/)1jEEjPP AAP AAAAAijkjkinjkiki kkii()()()()()()()()(/)(/,)11221100Pi jk()PPkijkij(),12 PP EEP AAijjijkik(/)(/()()1 定义定义6 6 转移概率与转移矩阵转移概率与转移矩阵 令转移概率
43、令转移概率 为矩阵为矩阵 的第的第 行行,第第j j列元素则有列元素则有 (6.4)(6.4)称为马氏链的转移矩阵称为马氏链的转移矩阵,其中其中 Piji j(,)1212M1iMPPPPPPPPP1111213212223313233M1PPijijj011例例:一个分子在两个附着壁之间的随机游动一个分子在两个附着壁之间的随机游动,如图如图1 1所示所示 (1)(1)这个分子在这个分子在x x轴上轴上1,2,1,2,S,S的位置上任意一点的位置上任意一点,且只能在这且只能在这S S个位置上个位置上.(2)(2)当分子在当分子在1 1与与S S两端点时两端点时,分子被吸收分子被吸收,不再游动不
44、再游动(吸收壁吸收壁)(3)(3)分子每转移一次分子每转移一次,只移动一步只移动一步,且必须移动若时刻且必须移动若时刻时时,分子在分子在i i处处(),(),在一个单位时间后它转移到在一个单位时间后它转移到i+1i+1点处的概率为点处的概率为P(P(向右移动向右移动),),它转移到它转移到i-1i-1点处的概率点处的概率为为 向左移动向左移动)。问问:在初始位置于在初始位置于i i处处,经过经过5 5次转移它落在次转移它落在j j处的概率处的概率是多少是多少?1 2 3 i-1 i Sx轴满足以下条件满足以下条件:12si,1(pqq 分析分析:该系统的转移概率为该系统的转移概率为:这个均匀马
45、氏链系统的转移矩阵为这个均匀马氏链系统的转移矩阵为 PPss1111jijijsisisiqpPij其余的当当当111212120,Mqpqpqp11000000000000001 二、马尔可夫方程和二、马尔可夫方程和n n步转移矩阵步转移矩阵 设设 表示一个均匀马氏链经过表示一个均匀马氏链经过n n步转移由状态步转移由状态 转移到状态转移到状态 的转移概率的转移概率,当当 时时讨论讨论 (二步转移二步转移)令令 事件事件B=B=“系统经由二次转移系统经由二次转移,由由 转移到转移到 ”=“系统由系统由 转移到转移到 ,再由再由 转移到转移到 ”k=1,2,k=1,2,因此因此,两两互不相容事
46、件两两互不相容事件 (只与状态只与状态 时的时刻有关时的时刻有关)类似可证类似可证:(6.5)(6.5)(nPijEijE1nPRijij()1 2niEEjkBEikEkEEj1kkBBB B12,PP BPBP Bijkkkk()()()2111)/()/(kkjikEEPEEPEk)()()(1mnPmPnPkjikkij1mn(5)(5)式称切普曼一柯尔莫哥洛夫方程式称切普曼一柯尔莫哥洛夫方程由代数知识由代数知识:A=:A=可见可见 aaaaaaaaannnnnn111212122212)(2122221112112122221112112ijnnnnnnnnnnnnbBaaaaaaa
47、aaaaaaaaaaaAAAnknjinjijikjikijaaaaaaaab12211于是于是 (6.6)(6.6)类似可证得类似可证得 (6.7)(6.7)上例要求上例要求 :只要只要 例例 这个元素的值即可这个元素的值即可.)2(2ijPM1)2(kkjikijPPPMMMM21112MMnn1)5(ijP)5(515ijPMM)(4,2551ijdMMji求得2424)5(dP三、遍历性与平稳分布三、遍历性与平稳分布 定义定义7 7 设设 为均匀马氏链为均匀马氏链(与第与第n n次转移无关次转移无关),),对一切状态对一切状态i i及及j(j(或称或称 ,存在不依赖于存在不依赖于i i
48、的常数的常数,使得使得 (6.8)(6.8)则称均匀马氏链有遍历性则称均匀马氏链有遍历性遍历意义遍历意义:遍历性说明不论系统自那一个状态出发遍历性说明不论系统自那一个状态出发,当转移次数当转移次数n n充分大时充分大时,转移到转移到 状态的概率近似于状态的概率近似于某个常数某个常数 。nEEij,nijjP nlim()Ejj 定理定理1:1:对有限个状态的均匀马氏链对有限个状态的均匀马氏链 ,若存在一正整若存在一正整数数 ,使对一切使对一切 有有 (6.9)(6.9)则此马氏链是遍历的且则此马氏链是遍历的且(8)(8)中的中的 是如下方程组是如下方程组 (6.10)(6.10)在条件在条件
49、下的唯一解下的唯一解 证证 略略 nn0i js,12 P nij()00jjiijisPjs12,jjjs011,定义定义8(8(平稳性平稳性):设:设 为有限为有限s s个状态的均匀马氏链个状态的均匀马氏链,若初始概率若初始概率 满足全概率公式:满足全概率公式:则称则称 为平稳的为平稳的,称为称为 的一个平稳分布的一个平稳分布 表示第表示第k k次次 转移到状态的绝对概率转移到状态的绝对概率 为初始状态概率为初始状态概率 可以证明可以证明:结论结论:当马氏链是平稳时当马氏链是平稳时,初始概率等于绝对概率初始概率等于绝对概率 平稳均匀马氏链在任一时刻处于状态平稳均匀马氏链在任一时刻处于状态
50、的概率都相等的概率都相等,说明平稳。说明平稳。n),(jjEPP sj,2,1siijijsjPPP1,2,1,nPjsj(,)12 nP kj()Ej)2()1(jjjPPPP nj()Ej1 2 3 设设 二次转移矩阵为二次转移矩阵为 则则 对任意对任意 说明是遍历的。由定说明是遍历的。由定理理1 1可知可知:马氏链是平稳的马氏链是平稳的 即有即有:例例2:2:例例1 1一样一样:没有附着壁的随机游动其余没有附着壁的随机游动其余同例同例1 133311SPPqPMqPqPqPPPPPPPPPPPPPPPqPqPPPPP111121321222331323312311332213322230