1、气象统计方法气象统计方法主讲:温 娜南京信息工程大学大气科学学院2014年9月本课件主要参考南信大李丽平老师的课件重点掌握:重点掌握: 1)EOF方法原理方法原理 2)EOF方法在分析气象问题中的方法在分析气象问题中的 应用。应用。一、引一、引 言言 经验正交函数(经验正交函数(EOFEOF)方法最早由统计)方法最早由统计学家学家pearsonpearson在在19021902年提出,由年提出,由LorenzLorenz11(19561956)引入气象问题分析中。该方法以场)引入气象问题分析中。该方法以场的时间序列为分析对象,对计算条件要求甚的时间序列为分析对象,对计算条件要求甚高,故直到高,
2、故直到2020世纪世纪6060年代后期才在实际工作年代后期才在实际工作中得到广泛应用(中得到广泛应用(CraddockCraddock,1969196922;KutzbackKutzback,1970197033;KidsonKidson,1975197544)。)。 近近3030年来,出现了适合于各种分析目的的年来,出现了适合于各种分析目的的EOFEOF分析方法,如扩展分析方法,如扩展EOFEOF(EEOFEEOF)方法,旋转)方法,旋转EOFEOF(REOFREOF)方法,风场)方法,风场EOFEOF(EOFWEOFW)方法,复变量)方法,复变量EOFEOF(CEOFCEOF)方法。)方法
3、。 EOFEOF方法不但用于观测资料的分析,还用于方法不但用于观测资料的分析,还用于GCMGCM资料的分析和数值模式的设计。现在,资料的分析和数值模式的设计。现在,EOFEOF方方法已作为一种基本的分析手段频繁地出现在大气法已作为一种基本的分析手段频繁地出现在大气科学研究的文献中。科学研究的文献中。 主分量分析主分量分析是把随时间变化的气象要素是把随时间变化的气象要素场分解为场分解为空间函数空间函数部分和部分和时间函数时间函数部分。空部分。空间函数部分概况场的地域分布特点,这部分间函数部分概况场的地域分布特点,这部分不随时间变化;而时间函数部分则由空间点不随时间变化;而时间函数部分则由空间点的
4、线性组合构成,称为主分量,一般前几个的线性组合构成,称为主分量,一般前几个主分量可以解释原有空间场总方差的很大一主分量可以解释原有空间场总方差的很大一部分。部分。两个变量的主分量两个变量的主分量 如图所示我们所分析的气象要素场仅有两个空间点 y1y2x1x2通过一种线性变换,使得产生的新变量通过一种线性变换,使得产生的新变量y1的的变化代替原场两个变量的主要变化情况。变化代替原场两个变量的主要变化情况。主分量导出主分量导出 依据上例,我们希望以原变量依据上例,我们希望以原变量 组成一个新变量组成一个新变量 (7.1)使它具有极大方差,即使它具有极大方差,即 极大极大 (7.2)用(用(4.1)
5、式带入()式带入(4.2)有)有 =(4.2)模型的极大值问题转化为)模型的极大值问题转化为的极值问题。为了不同变量相互比较,对新的极值问题。为了不同变量相互比较,对新变量中的线性组合系数变量中的线性组合系数 通常还需加上通常还需加上约束条件约束条件 在上面条件下,在上面条件下, 问题转变成问题转变成求下面函数的极值问题求下面函数的极值问题根据微积分学求极值有根据微积分学求极值有 上面线性方程组等价于上面线性方程组等价于其中其中 S 为为x1和和x2的协方差阵,的协方差阵,I为单位阵,为单位阵,V为为(v1,v2)的组合向量。)的组合向量。 如果如果V有非零解,必须使有非零解,必须使 上式是矩
6、阵上式是矩阵S的特征多项式,因此问题就转化的特征多项式,因此问题就转化为求矩阵为求矩阵S的特征值及其对应特征向量的问题的特征值及其对应特征向量的问题。 因因S的秩有两个,故它有两个非零特征值的秩有两个,故它有两个非零特征值及其对应特征向量及其对应特征向量 :由此,可得到例中两个新变量由此,可得到例中两个新变量 : 1、主分量的方差与它所对应的特征值相等、主分量的方差与它所对应的特征值相等 以第一个主分量为例,说明这一性质以第一个主分量为例,说明这一性质 (7.4)上面第一式乘上面第一式乘 ,第二式乘,第二式乘 相加,整理得相加,整理得于是:于是: 2.不同主分量之间是无关的、相互独立的不同主分
7、量之间是无关的、相互独立的 证明这一性质,只需证明两个主分量的协方差为证明这一性质,只需证明两个主分量的协方差为零即可。零即可。 根据(根据(7.4)式,)式,y1和和y2的协方差可写为的协方差可写为由由 ,得证,得证主分量的几何意义主分量的几何意义 如果把如果把x1,x2变量第变量第i个样品看成个样品看成2维因子维因子空间中的一个点空间中的一个点 , 主分量中第主分量中第i个样品个样品也可以看成是新变量空间中的一个点也可以看成是新变量空间中的一个点 ,那么它们可以看成是由因子空间作线性变换,那么它们可以看成是由因子空间作线性变换的一个结果,即的一个结果,即其中其中 ,转化矩阵,转化矩阵 主分
8、量也可以看成由原变量组成的坐标主分量也可以看成由原变量组成的坐标系旋转变换的结果,新变量系旋转变换的结果,新变量y1,y2与原变量的与原变量的变换关系式可写为变换关系式可写为对例中坐标旋转角对例中坐标旋转角 。寻找主分量寻找主分量原则可以看成为寻找这样的坐标旋转角,使原则可以看成为寻找这样的坐标旋转角,使得样品点在新坐标系中对某一坐标轴上投影得样品点在新坐标系中对某一坐标轴上投影有极大方差。有极大方差。多个变量的主分量多个变量的主分量 如果我们要研究对象是某一气象要素场如果我们要研究对象是某一气象要素场,场中,场中 有有 个空间点,样本容量个空间点,样本容量 。由。由这这 变量线性组合成一个新
9、变量:变量线性组合成一个新变量:则(则(7.6)式)式 还可以写还可以写 (7.7)其中其中 (7.6) mnmmnnxxxxxxxxx212222111211X mmmmmmvvvvvvvvv212222111211V111212122212nnmmmnyyyyyyYyyy主分量导出主分量导出我们希望主分量有极大方差,即我们希望主分量有极大方差,即 (7.8)将新变量带入(将新变量带入(7.8)式,)式,其中其中 在条件在条件 下的极值问题,转化为下的极值问题,转化为求求 的极值问题,即有的极值问题,即有整理得整理得 。要使。要使V有非零解,必有非零解,必须须由于由于S为为mxm的协方差阵,
10、设它的秩为的协方差阵,设它的秩为m,则,则它有它有m个非零特征值个非零特征值及其对应的及其对应的m个特征向量个特征向量 主分量的性质主分量的性质1. 各主分量的方差分别与原各主分量的方差分别与原m个变量的协方个变量的协方差的特征值相对应。差的特征值相对应。原场m个变量方差和等于其对应协方差特征值之和第第K个主分量解释方差:个主分量解释方差:前前P个主分量累积解释方差:个主分量累积解释方差:2.主分量之间是正交的,彼此无关。主分量之间是正交的,彼此无关。将某气候变量场的观测资料以矩阵形将某气候变量场的观测资料以矩阵形式给出式给出m是空间点,是空间点,n是时间序列长度。是时间序列长度。 mnmmn
11、nxxxxxxxxx212222111211X 气象场的自然正交展开,是将气象场的自然正交展开,是将X X分解为时分解为时间函数间函数Z Z和空间函数和空间函数V V两部分两部分, ,即即或或 含义:场中第含义:场中第i个格点上的第个格点上的第t t次观测值,次观测值,可以看作是可以看作是m个空间函数个空间函数 和时间函数和时间函数 的的线性组合线性组合 。XVZmi,2, 1nt,2,111221mitikktititimmtkxv zv zv zv zikvkiz1, 2,km其中,其中, 是第是第j个典型场,只是空间的函数。个典型场,只是空间的函数。 mmmmmmvvvvvvvvv212
12、222111211V mnmmnnzzzzzzzzz212222111211ZTmjjjjvvvv),(21第第t t个空间场可表示为个空间场可表示为或者或者mtmtttzzzvvvx2211mtmmmmtmtmmtttzvvvzvvvzvvvxxx2122221211211121 上式表明,第上式表明,第t个场可以表示为个场可以表示为m个空间个空间典型场,按照不同的权重线性叠加而成。典型场,按照不同的权重线性叠加而成。V的每一列表示一个空间典型场,由于这个场的每一列表示一个空间典型场,由于这个场由实际资料确定,故又叫经验正交函数。由实际资料确定,故又叫经验正交函数。 上述分解要求满足下列两个
13、条件:上述分解要求满足下列两个条件:jijizzintjtit01TjiZZmji,21101mjki kjkijv vijTiv v性性质质 A A为实对称矩阵,根据实对称矩阵分解原为实对称矩阵,根据实对称矩阵分解原理,一定有理,一定有 或者或者TTVVZZXXTTXXA AVVTTVVA V的列就是的列就是A的特征向量,的特征向量, 是是A的的特征值组成的对角矩阵。特征值组成的对角矩阵。即即 Z就是时间系数矩阵,就是时间系数矩阵, 第第i个特征个特征向量对应的时间系数序列的第向量对应的时间系数序列的第t 个值。个值。XVZTmkktkiitxvz1itz主分量分析主分量分析/经验正交函数经
14、验正交函数经验正交函数:经验正交函数:主分量分析:主分量分析:TXXA x TVAV1TSnXX1xsn TV SV 其中其中 是拟合场是拟合场. 可以证明误差可以证明误差nppmZ.VXXX21111()pmnmititiiitiiQxx第第i个特征向量对个特征向量对X场的贡献率场的贡献率 (解释方差)(解释方差)前前p个特征向量对个特征向量对X场的贡献率场的贡献率 (累积解释方差)(累积解释方差)1miiiiR11pmpiiiiiG 当当 时,先求出时,先求出 的特征值,的特征值,然后求然后求 的特征向量,这种方法叫时空转换。的特征向量,这种方法叫时空转换。 令令 的特征值为的特征值为 ,
15、其特征向量为,其特征向量为 , 的特征值也为的特征值也为 ,其特征向量为,其特征向量为 nm XXTTXXXXTiiuTXXiiv转换关系:转换关系:iiiXuvmvvvV,21XVZT1)根据分析目的,确定)根据分析目的,确定X的具体形态的具体形态(距平距平或者标准化距平或者标准化距平);2)由)由X求协方差矩阵求协方差矩阵 ;3)求)求A的全部特征值的全部特征值 、特征向量、特征向量 ,h=1H(通常使用(通常使用Jacobi法);法);TAXXhVh 4)将特征值作降序排列,并对特征向)将特征值作降序排列,并对特征向量序数作相应变动;量序数作相应变动; 5)根据)根据 , ,h=1H和和
16、X总方差,求出全总方差,求出全部部 、 , , h=1H; 6 6)由)由X及主要及主要 求其时间系数求其时间系数 、h h=1=1H,主要的数量由分析目的及分析对象,主要的数量由分析目的及分析对象定;定; 7 7)输出主要计算结果。)输出主要计算结果。 hRhVhZhhG H是非是非0特征值总个数,对实际问题特征值总个数,对实际问题 需要强调的是,第需要强调的是,第1)步很重要。在大多)步很重要。在大多数情况下,数情况下,EOF分析对原观测场时间序列、距分析对原观测场时间序列、距平场时间序列和标准化距平场时间序列进行。平场时间序列和标准化距平场时间序列进行。选择何种形态作分析取决于分析目的和
17、分析对选择何种形态作分析取决于分析目的和分析对象。象。min( , )min-m nH(m,n 1) 为非中心化序列为中心化序列XX第一特征向量(第一空间典型场)是与第一特征向量(第一空间典型场)是与n张张X图平图平均最相似的,或者说具有与所要展开的资料矩阵均最相似的,或者说具有与所要展开的资料矩阵的的n n个样本最相似的特征。比如:若原始资料矩阵个样本最相似的特征。比如:若原始资料矩阵是是7 7月份月份5050年实测降水场(非距平场),则第一特年实测降水场(非距平场),则第一特征向量就可以解释为这征向量就可以解释为这5050年的平均场,其相应的年的平均场,其相应的时间系数基本对应我国大尺度旱
18、涝年。但当降水时间系数基本对应我国大尺度旱涝年。但当降水场由距平组成,第一特征向量就解释为与场由距平组成,第一特征向量就解释为与5050年夏年夏季距平场最相似的特征场,它指出了我国夏季经季距平场最相似的特征场,它指出了我国夏季经常出现的大尺度涝区和旱区。常出现的大尺度涝区和旱区。EOFEOF分析实例分析实例例例1 1:现有北京:现有北京1951-19761951-1976年年1212月月22月气温资料月气温资料,变量个数,变量个数m=3, m=3, 容量容量=26=26。对以上资料进行主。对以上资料进行主分量分析。分量分析。1.计算变量的协方差阵计算变量的协方差阵2. 求解实对称阵特征值及特征向量求解实对称阵特征值及特征向量3.计算三个距平主分量计算三个距平主分量4.计算头几个主分量的累积方差贡献率计算头几个主分量的累积方差贡献率5.要素场拟合要素场拟合2 2.mnXXVZ用前两个主分量进行拟合用前两个主分量进行拟合中国中国160气象标准站气象标准站夏季降水异常夏季降水异常EOFEOF分分解的第一模态,解解的第一模态,解释方差释方差15.5%15.5%夏季降水异常的第二、第三模态(夏季降水异常的第二、第三模态(13.5%,6.8%)例3 分析热带太平洋海温的主要变化特征。