1、气象统计方法气象统计方法主讲:温主讲:温 娜娜南京信息工程大学大气科学学院2014年9月本课件主要参考南信大李丽平老师的课件第三章第三章 选择最大信息的预报因子选择最大信息的预报因子1. 概率、条件概率及预报指标概率、条件概率及预报指标2. 定量数据的指标定量数据的指标3. 高自相关变量间的相关系数及其检验高自相关变量间的相关系数及其检验第一节第一节 概率和条件概率以及预报指标概率和条件概率以及预报指标一、概率一、概率1.1.事件:自然界中的一切现象。事件:自然界中的一切现象。 2.2.频率:衡量事件出现可能性大小的数量频率:衡量事件出现可能性大小的数量 指标。指标。n n次观测次数中,事件次
2、观测次数中,事件A A出现出现m m次,次, 则事件则事件A A的频率为的频率为nmAP)(3.3.概率:概率: 观测次数观测次数n n足够大,足够大,P(A)P(A)稳定接近某个常稳定接近某个常数,这就是概率。数,这就是概率。 概率是事件的总体特征,频率是事件的样概率是事件的总体特征,频率是事件的样本值。本值。二、条件概率和天气预报指标二、条件概率和天气预报指标1.1.概念概念 在事件在事件B B已经发生的条件下计算事件已经发生的条件下计算事件A A的概率,称为事件的概率,称为事件A A在事件在事件B B已出现条件下已出现条件下的条件概率,记为的条件概率,记为P(A/B)P(A/B)。若事件
3、若事件A A、B B同时出现的概率为同时出现的概率为P(AB),P(AB),则有则有 )()()/(BPABPBAP 条件概率是统计预报的基础。条件概率是统计预报的基础。 统计天气预报中,往往将统计天气预报中,往往将A取为所要预报的取为所要预报的具体内容,而将具体内容,而将B取为事件取为事件A 以前以前 时刻的时刻的某个前期气象条件。某个前期气象条件。举例:举例: 用事件用事件A表示长江中下游五站当年表示长江中下游五站当年 6月平均降月平均降水小于水小于250mm的情况,事件的情况,事件B代表长江中下游五代表长江中下游五站当年站当年1月平均降水小于月平均降水小于22mm的情况。的情况。 若已知
4、若已知18851980年共年共96年资料统计得:年资料统计得: P(A)69/960.72 P(A/B)13/140.93 则当则当1月份观测五站平均降水小于月份观测五站平均降水小于22mm时,时,可预报可预报6月降水小于月降水小于250mm2.条件概率条件概率作为天气预报指标必须满足两个经作为天气预报指标必须满足两个经 验性的条件验性的条件(1)P(A/B)P(A)或者或者P(A/B)0,表明两变量呈正相关,越接近,表明两变量呈正相关,越接近1.0,正正相关越显著;当相关越显著;当rt1)的自相关系数;的自相关系数;s(j):自协方差;:自协方差;落后相关系数:落后相关系数:j j为正数时;
5、(后一个为正数时;(后一个x比前一个比前一个 落后落后j j)超前相关系数:超前相关系数: j j为负数时。(相对概念)为负数时。(相对概念)tx其中,其中, 、s为样本(容量为样本(容量n)的平均值和)的平均值和标准差。标准差。jntjttxxxxjnjs1)(1)(2)()(sjsjrx(3)u u检验检验-自相关系数自相关系数(wei附表附表1b) 遵循遵循N(0,1)N(0,1)的正态分布(的正态分布(weiwei书中有表)。当书中有表)。当样本容量足够大时样本容量足够大时, ,用用u u检验。对于小样本量,检验。对于小样本量,可用可用t t检验。通过检验可以判断气候变量是否检验。通过
6、检验可以判断气候变量是否具有持续性。具有持续性。)()(jr jnju2月1月12月计算步骤:计算步骤:计算计算12月、月、1月、月、2月气温各自落后自相关系数月气温各自落后自相关系数12月三、落后交叉协方差和相关系数三、落后交叉协方差和相关系数1.1.概念概念 衡量两个变量不同时刻之间的相关衡量两个变量不同时刻之间的相关密切程度的量,常用落后交叉协方差和密切程度的量,常用落后交叉协方差和落后交叉相关系数表示。落后交叉相关系数表示。2.表达式表达式 设设 和和 (t=1,2,n),分别为两个时),分别为两个时间序列,则对时间间隔间序列,则对时间间隔 j 的落后交叉协方差为:的落后交叉协方差为:
7、相应的落后交叉相关系数为相应的落后交叉相关系数为交叉协方差的分母也可以为交叉协方差的分母也可以为n。jntjttxyyyxxjnjs1)(1)(yxxyxyssjsjr)()(txty1212月的气温与落后月的气温与落后1 1年的年的1 1月气温交叉相关系数月气温交叉相关系数11212月 1月 2月冬季(冬季(NDJNDJ)El NinoEl Nino指数指数冬季冬季El NinoEl Nino与次年夏季与次年夏季我国降水的相关关系(我国降水的相关关系(1958-20061958-2006)Red shaded: 90% significance Monte Carlo check:V=0.2
8、28 四、四、 偏相关系数偏相关系数1.1.概念概念 当存在三个以上变量互相影响时(如当存在三个以上变量互相影响时(如考虑考虑y y和和x1、x2 之间的关系),需要考虑之间的关系),需要考虑消除了消除了x1(x2)影响后,影响后,x2(x1)与与y 的相关关的相关关系,这时候的相关系数称为偏相关系数,系,这时候的相关系数称为偏相关系数,记为记为一般的表达为:一般的表达为:)(1.22.1yyrr)(.134.2.234.1mymyrr R为为m个预报因子和预报对象的单相关系个预报因子和预报对象的单相关系数组成的矩阵,对角线元素为数组成的矩阵,对角线元素为1 1。yyyymymmymmrrrr
9、rrrrrR21211121111 根据根据m个预报因子与个预报因子与y的相关矩的相关矩阵,则偏相关系数表示为:阵,则偏相关系数表示为: 2122111221221222212121*yy*111211 11 2m1m1mii,.2 , 1,rrrrrrrrrrrrRRmiRRRryyyyyyyyiiiiyyyimiiyi时,特别地,当列后的代数余子式;行、第是相关矩阵中去掉第列后的代数余子式;行、第是相关矩阵中去掉第相关矩阵去掉第相关矩阵去掉第m+1m+1行、第行、第i i列后的代数列后的代数余子式余子式例: 第三节第三节 高自相关变量间的相关系数高自相关变量间的相关系数 及其统计检验及其统
10、计检验(1 1)两个变量无持续性(非高自相关)两个变量无持续性(非高自相关) -t-t检验检验 (2 2)两变量本身有强持续性或高自相关,)两变量本身有强持续性或高自相关,t t检验的自由度不能用,需要计算有效自由检验的自由度不能用,需要计算有效自由度度 ,其中,其中 TnjyyxxjRjRT)()(其中,其中,分别是变量分别是变量x、y的自相关系数,的自相关系数,j j为滞后时间,为滞后时间,j j通常取到通常取到n的一半,的一半,* *表示标准化。表示标准化。海表温度和南方涛动指数都具有很强的持续海表温度和南方涛动指数都具有很强的持续性,计算相关时需要调整自由度。性,计算相关时需要调整自由
11、度。jntjttxxxxjnjR1*1)(jntjttyyyyjnjR1*1)(T=3.43T=3.43,有,有效自由度效自由度 n/T=33n/T=33课堂实践用超前滞后相关方法分析降水和海温自身变化特征。再分别用相关和合成方法,分析江苏省夏季降水与赤道太平洋Nino3区冬季海温异常之间的联系江苏省夏季降水资料(1978-2007)热带太平洋冬季Nino3.4区标准化海温异常(1977-2006)人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。