1、第二章时间序列的预处理1本章结构n平稳性检验n 纯随机性检验22.1平稳性检验 n特征统计量n平稳时间序列的定义n平稳时间序列的统计性质n平稳时间序列的意义n平稳性的检验 3概率分布n概率分布的意义n随机变量族的统计特性完全由它们的联合分布函数或联合密度函数决定 n时间序列概率分布族的定义n实际应用的局限性TtttmmxxxFmmtttm,),2,1(),(2121,214特征统计量n均值 n方差n自协方差n自相关系数)(xxdFEXttt)()()(22xdFxXEDXttttt)(),(ssttXXEststDXDXstst),(),(5平稳时间序列的定义n严平稳n严平稳是一种条件比较苛刻
2、的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才能被认为平稳。n宽平稳n宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。6平稳时间序列的统计定义 n满足如下条件的序列称为严平稳序列n满足如下条件的序列称为宽平稳序列),(),(21,21,2121mtttmtttxxxFxxxFmm有,正整数,正整数Ttttmm,21TtskksttskkstTtEXTtEXtt且,为常数,,),(),()3,)2,)127严平稳与宽平稳的关系n一般关系n严平稳条件
3、比宽平稳条件苛刻,通常情况下,严平稳(低阶矩存在)能推出宽平稳成立,而宽平稳序列不能反推严平稳成立n特例n不存在低阶矩的严平稳序列不满足宽平稳条件,例如服从柯西分布的严平稳序列就不是宽平稳序列n当序列服从多元正态分布时,宽平稳可以推出严平稳8平稳时间序列的统计性质 n常数均值 n自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关 n延迟k自协方差函数 n延迟k自相关系数)0()(kk为整数kkttk),()(9自相关系数的性质n规范性 n对称性 n非负定性 n非唯一性 10平稳时间序列的意义 n时间序列数据结构的特殊性n可列多个随机变量,而每个变量只有一个样本观察值n平稳性的重
4、大意义n极大地减少了随机变量的个数,并增加了待估变量的样本容量n极大地简化了时序分析的难度,同时也提高了对特征统计量的估计精度11平稳性的检验(图检验方法)n时序图检验 n根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征n自相关图检验 n平稳序列通常具有短期相关性。该性质用自相关系数来描述就是随着延迟期数的增加,平稳序列的自相关系数会很快地衰减向零12例题n例2.1n检验1964年1999年中国纱年产量序列的平稳性n例2.2n检验1962年1月1975年12月平均每头奶牛月产奶量序列的平稳性n例2.3
5、n检验1949年1998年北京市每年最高气温序列的平稳性13例2.1时序图14例2.1自相关图15例2.2时序图16例2.2 自相关图17例2.3时序图18例2.3自相关图192.2 纯随机性检验 n纯随机序列的定义n纯随机性的性质n纯随机性检验20纯随机序列的定义n纯随机序列也称为白噪声序列,它满足如下两条性质 TststststTtEXt,0,),()2(,)1(221标准正态白噪声序列时序图 22白噪声序列的性质 n纯随机性 n各序列值之间没有任何相关关系,即为“没有记忆”的序列 n方差齐性 n根据马尔可夫定理,只有方差齐性假定成立时,用最小二乘法得到的未知参数估计值才是准确的、有效的0
6、0k(k),)0(2tDX23纯随机性检验 n检验原理n假设条件n检验统计量 n判别原则24Barlett定理 n如果一个时间序列是纯随机的,得到一个观察期数为 的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布0,)1,0(knNkn25假设条件n原假设:延迟期数小于或等于 期的序列值之间相互独立n备择假设:延迟期数小于或等于 期的序列值之间有相关性 1,0210mHm:mkmHk,:至少存在某个1,01mm26检验统计量nQ统计量 nLB统计量)(212mnQmkk)()()2(212mknnnLBmkk27判别原则n拒绝原假设n当检验统
7、计量大于 分位点,或该统计量的P值小于 时,则可以以 的置信水平拒绝原假设,认为该序列为非白噪声序列n接受原假设n当检验统计量小于 分位点,或该统计量的P值大于 时,则认为在 的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定 21()m121()m128例2.4:标准正态白噪声序列纯随机性检验样本自相关图样本自相关图29检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平 ,所以该序列不能拒绝纯随机的原假设。30例2.5n对1950年1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验 31例2.5时序图32例2.5自相关图33例2.5白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.570.000134