1、保持幽默感要能处乱不惊第四章第四章 水文统计基础知识水文统计基础知识本章重点:本章重点:1 1、理解、理解随机变量随机变量及及概率分布概率分布的概念,掌握常用概率分布曲线;的概念,掌握常用概率分布曲线;2 2、理解、理解总体、样本与抽样误差总体、样本与抽样误差的概念及的概念及统计参数统计参数的估计;的估计;3 3、掌握现行频率计算的方法、掌握现行频率计算的方法适线法,理解频率计算中适线法,理解频率计算中 几个特殊问题的处理;几个特殊问题的处理;4 4、掌握掌握二元相关分析法二元相关分析法。本章学习思路本章学习思路:工程设计标准工程设计标准设计洪水频率设计洪水频率(洪水重现期)(洪水重现期)设计
2、洪水水位设计洪水水位设计洪水流量设计洪水流量表表5.15.3工程设计标准工程设计标准频率曲线(频率曲线( P- 型曲线型曲线)频率曲线频率曲线经验频率曲线经验频率曲线理论频率曲线理论频率曲线曲线选用(曲线选用(P- 曲线)曲线)统计参数(统计参数(x,Cv,Cs)()(P3740)适线方法适线方法求矩适线法求矩适线法三点适线法三点适线法公式公式4-18公式公式4-20QKQCQPvP) 1(问题启发问题启发 1 1、如何由工程设计标准(设计洪水频率或重、如何由工程设计标准(设计洪水频率或重现期)推求设计洪水流量(设计洪水水位)?现期)推求设计洪水流量(设计洪水水位)? 2 2、设计洪水频率和重
3、现期之间是什么关系?、设计洪水频率和重现期之间是什么关系? 3 3、理论频率曲线的形式是什么样的?、理论频率曲线的形式是什么样的? 4 4、如何求理论频率曲线的三个参数?、如何求理论频率曲线的三个参数? 5 5、求矩适线法中,如何选取水文资料?、求矩适线法中,如何选取水文资料?经验频率曲线经验频率曲线理论频率曲线理论频率曲线QKQCQPvP) 1(CS=2CVCS=2.5CVCS=3CVCS=3.5CVCS=4CV水文特征值的选取:年最大值法水文现象的特性水文现象的特性一、随机性一、随机性 水文现象是自然现象的一种,在其发生和演变过程水文现象是自然现象的一种,在其发生和演变过程中,包含着必然性
4、的一面,也包含着偶然性的一面。中,包含着必然性的一面,也包含着偶然性的一面。 必然现象是在一定条件下,必然出现或不出现的现必然现象是在一定条件下,必然出现或不出现的现象。偶然现象是在一定条件下,可能出现也可能不出现象。偶然现象是在一定条件下,可能出现也可能不出现的现象,也称随机现象。的现象,也称随机现象。二、确定性规律二、确定性规律1 1、周期性:年周期,多年周期。、周期性:年周期,多年周期。2 2、地区性:气候及下垫面相似地区的水文现象规律、地区性:气候及下垫面相似地区的水文现象规律相似。相似。3 3、相关性:水文现象之间存在一定的因果关系。、相关性:水文现象之间存在一定的因果关系。第一节第
5、一节 随机变量及其概率分布随机变量及其概率分布随机变量随机变量离散随机变量离散随机变量连续随机变量连续随机变量水文统计法水文统计法就是将流量、水位、降雨量等实测水文资料作就是将流量、水位、降雨量等实测水文资料作为随机变量,通过统计分析和计算,推求水文现象(随机事为随机变量,通过统计分析和计算,推求水文现象(随机事件)客观规律性的方法。件)客观规律性的方法。1 1、随机变量:随机试验取值随机的变量,分为离散型、连、随机变量:随机试验取值随机的变量,分为离散型、连续型随机变量。续型随机变量。2 2、概率、概率P P:随机变量出现某取值的可能性。:随机变量出现某取值的可能性。3 3、频率、频率P P
6、:随机变量某取值在试验中出现的比率。:随机变量某取值在试验中出现的比率。 nmP(A)掷币试验出现正面的频率表掷币试验出现正面的频率表试验者 掷币次数 出现正面次数 频率 蒲丰 . 皮尔逊 . 皮尔逊 . 在试验次数足够大的情况下,事件的频率和概在试验次数足够大的情况下,事件的频率和概率是十分接近的。率是十分接近的。二、随机变量的概率分布二、随机变量的概率分布概率分布概率分布例例 4-14-1X(日)(日)012345678910 P(%)2468101315171384100例例4-24-21 1)计算频率密度及累积频率)计算频率密度及累积频率年降水量组距年降水量组距D Dx(=200mm)
7、x(=200mm)发生在组距中发生在组距中的次数的次数D Dm m区间频率区间频率D Dp=p=D Dm/n(%)m/n(%)频率密度频率密度D Dp/p/D Dx(%)x(%)累积次累积次数数m m累积频率累积频率P=m/n(%)P=m/n(%)2300210111.60.00811.62100190123.20.01634.81900170134.80.02469.670050111.60.00862100合计合计621002 2)绘制频率直方图)绘制频率直方图3 3)绘制累积频率曲线)绘制累积频率曲线频率直方图频率直方图累积频率曲线累积频率曲线f(x)F(x)概率密度曲线概率分布曲线分布
8、曲线与密度曲线的关系分布曲线与密度曲线的关系PF(x)= f (x)dx(分布曲线) f (x)(密度曲线)xxPP(%)xxpdxxfxFxxPPxPP)()()(1)(dxxf三、随机变量的分布参数三、随机变量的分布参数x 水文计算中常用的统计参数有均值水文计算中常用的统计参数有均值 、变差系数、变差系数 和偏态系数和偏态系数 。 一个随机变量系列的频率密度曲线和频率分布曲线的形一个随机变量系列的频率密度曲线和频率分布曲线的形状和方程,都可以用几个数值特征值来反映,这些数值特征状和方程,都可以用几个数值特征值来反映,这些数值特征值称为值称为统计参数统计参数(特征参数,分布参数)(特征参数,
9、分布参数) 。vCsC1 1). .均值均值 均值反映了系列在数值上的大小(系列总体水平的高低),均值反映了系列在数值上的大小(系列总体水平的高低),可以作为系列之间数值大小(水平高低)的比较标准。可以作为系列之间数值大小(水平高低)的比较标准。系列中各个变量与均值的比值,称为系列中各个变量与均值的比值,称为模比系数模比系数(或变率),(或变率),以以K 表示。对任一变量表示。对任一变量 x,则有:,则有: 2 2). .中值中值 中值的大小能反映系列中间项和密度曲线的位置。中值的大小能反映系列中间项和密度曲线的位置。x niinxnnxxxx1211xxKiix1.1.位置特征参数位置特征参
10、数3 3). .众值众值 众值的大小能反映系列中最大几率项和密度曲线的位置。众值的大小能反映系列中最大几率项和密度曲线的位置。4 4). .均值、中值、众值的位置关系均值、中值、众值的位置关系xa)xxxox0yyb)xxx0 xc)xxxxya a)正偏态;)正偏态; b b)正态;)正态; c c)负偏态)负偏态 密度曲线图密度曲线图 水文现象为不对称分布,年洪峰流量频率分布多为水文现象为不对称分布,年洪峰流量频率分布多为正偏正偏。2 2、均方差、均方差 和变差系数和变差系数 均方差和变差系数都是反映随机变量系列对其均值离均方差和变差系数都是反映随机变量系列对其均值离散程度的参数。散程度的
11、参数。系列中各随机变量系列中各随机变量 对其均值对其均值 的差称为的差称为离差离差,用,用 表示,表示, 。方差方差是离差的平方和是离差的平方和 ,可以用来表示,可以用来表示系列总的离散程度。系列总的离散程度。均方差均方差 表达各随机变量对其均值的平均离散程度。表达各随机变量对其均值的平均离散程度。对于总体对于总体 对于样本对于样本 vCixxiDxxiiDDniiniixx1212)(nxxnii12)(1)(12nxxnii 比值比值 表示相对离散程度,称为表示相对离散程度,称为变差系数变差系数或或离差离差系数系数,用,用 表示。表示。在水文计算中,利用样本资料推算总体的变差系数可采在水文
12、计算中,利用样本资料推算总体的变差系数可采用下式:用下式:或或1) 1() 1(1212nnKnKxCniiniivxvC212) 1()(xnxxxCniiv 较小时,表示系列的离散程度较小,即变量间的变化较小时,表示系列的离散程度较小,即变量间的变化幅度较小,频率分布比较集中;反之,幅度较小,频率分布比较集中;反之, 较大时,系列的离较大时,系列的离散程度较大,频率分布比较分散。散程度较大,频率分布比较分散。vCvC3 3、偏态系数、偏态系数 偏态系数是反映随机变量系列中各随机变量对其均偏态系数是反映随机变量系列中各随机变量对其均值对称性的参数。值对称性的参数。对于总体对于总体 对于样本对
13、于样本 sC3313)(vniisCxnxxC3313) 3()(vniisCxnxxC 频率曲线的三个参数,其中均值(频率曲线的三个参数,其中均值( )一般直接采用矩)一般直接采用矩法计算值;变差系数(法计算值;变差系数(Cv)可先用矩法估算,并根据适线拟)可先用矩法估算,并根据适线拟合最优的准则进行调整;偏态系数(合最优的准则进行调整;偏态系数(Cs)一般不进行计算,)一般不进行计算,而直接采用倍比,我国绝大多数河流可采用而直接采用倍比,我国绝大多数河流可采用 Cs=(23)Cv。x ,其频率分布对称于均值,为正态分布;,其频率分布对称于均值,为正态分布; ,为正偏态,系列中大于均值的变量
14、比小于均值的变量出现的,为正偏态,系列中大于均值的变量比小于均值的变量出现的机会少,其均值对应的频率小于机会少,其均值对应的频率小于50%50%; ,为负偏态,表明系列中大于均值的变量比小于均值的变量出,为负偏态,表明系列中大于均值的变量比小于均值的变量出现的机会多,其均值对应的频率大于现的机会多,其均值对应的频率大于50%50%。0sC0sCCS30CS1=0 xsC0sC值变化情况值变化情况统计参数与密度曲线及频率曲线的关系统计参数与密度曲线及频率曲线的关系1 1统计参数统计参数 、 、 与密度曲线形与密度曲线形状的关系状的关系cv3cv2cv10ya)x1x2x2x1cv1=0 x0yc
15、s3b)xcv3x0cv2ycs2c)xcs3cs2cs1cs1=0 xxvCsC1 1)均值)均值 反映密度曲线的位置变化反映密度曲线的位置变化2 2)变差系数)变差系数 反映密度曲线的高矮情况反映密度曲线的高矮情况3 3)偏态系数)偏态系数 反映曲线的偏斜程度反映曲线的偏斜程度xvCsCx对频率曲线的影响对频率曲线的影响2 2统计参数统计参数 、 、 与频率曲线形状的关系与频率曲线形状的关系xvCsCvC对频率曲线的影响对频率曲线的影响sC对频率曲线的影响对频率曲线的影响 、 、 与频率曲线的关系与频率曲线的关系1 1)均值)均值 反映频率曲线的位置高度反映频率曲线的位置高度2 2)变差系
16、数)变差系数 反映频率曲线的陡坦程度反映频率曲线的陡坦程度3 3)偏态系数)偏态系数 反映频率曲线的曲率大小反映频率曲线的曲率大小vCCS1=0CS3CS2CS17599959075 502010510.1a)P(%)xx3x1x2x3x2x1501015200.195909950205110750.1P(%)b)c)xCV3CV1=0CV2CV3CV2CV1CS3CS2x9990 95P(%)xvCsCxsC四、几种常用的概率分布曲线四、几种常用的概率分布曲线2.2.皮尔逊皮尔逊 型曲线(型曲线(K. PearsonK. Pearson,英国生物,英国生物学家)学家))()(100)()()
17、(axeaxxfyP- P- 型曲线的方程式的密度函数为:型曲线的方程式的密度函数为:为为 函数函数1.1.正态分布正态分布曲线的三个参数曲线的三个参数 、 、 经过换算也可以用系列经过换算也可以用系列的三个统计参数的三个统计参数 、 和和 来表示,其关系式为来表示,其关系式为 0axvCsC24sCxCCsv2)21 (0svCCxaxvCsC因此,若已知三个统计参数因此,若已知三个统计参数 、 和和 ,则,则P-P-型曲线型曲线及其方程式就可以确定,也就是确定了密度曲线及密度函数。及其方程式就可以确定,也就是确定了密度曲线及密度函数。P- P- 型曲线的应用型曲线的应用将将P-P-型曲线的
18、方程式进行一定的积分演算,就可以得到频率曲型曲线的方程式进行一定的积分演算,就可以得到频率曲线纵坐标值线纵坐标值 的计算公式,即频率曲线的方程式(分布函数)为:的计算公式,即频率曲线的方程式(分布函数)为: 式中,式中, 频率为频率为 P 的随机变量;的随机变量; 离均系数,离均系数, ,这是频率这是频率 P 和偏差系数和偏差系数 Cs 的函数,为了便于实际应用,制成离均的函数,为了便于实际应用,制成离均系数系数 值表,可供查阅。值表,可供查阅。 模比系数,模比系数, ,可根据拟定的比值,可根据拟定的比值 制成模比系数制成模比系数 值表。值表。PxxKxCxPvP) 1(Px),(1sPvPv
19、PCPfxxxCxxCKPK1vPPCxxKvsCC /PK对于年最大流量系列,公式(对于年最大流量系列,公式(4-184-18)可写成)可写成 式中,式中, 频率为频率为 P 的洪峰流量(的洪峰流量(m m3 3/s/s););例例4-34-3QKQCQPvP) 1(PQ解题思路解题思路QKQCQPvP) 1(),(sCPf1 1、把历年的年最大流量资料按大小递减次序排列,然后进、把历年的年最大流量资料按大小递减次序排列,然后进行计算;行计算;2 2、计算、计算 、 、 ;vCsCQPQ3 3、计算、计算 。Cs=n*Cv五、重现期五、重现期在水文计算中,等于和大于某一数值的水文要素特征值在
20、水文计算中,等于和大于某一数值的水文要素特征值(流量、水位等)出现的次数与总次数的比值,为该特征值(流量、水位等)出现的次数与总次数的比值,为该特征值的的累积频率累积频率( (P P ) )。重现期重现期是指在很长时期内,平均若干年遇到一次大于或等是指在很长时期内,平均若干年遇到一次大于或等于(或小于或等于)某值的洪水(或枯水),以年为单位。于(或小于或等于)某值的洪水(或枯水),以年为单位。重现期重现期 T 与累积频率与累积频率 P 的关系为:的关系为:当当 P P50%50%时,对洪水而言时,对洪水而言 当当 P P50%50%时,对枯水而言时,对枯水而言PT1PT11宜昌水文站各种频率的
21、设计洪水流量宜昌水文站各种频率的设计洪水流量洪水频率洪水频率重现期重现期洪水流量洪水流量(m3/s)5%20年一遇年一遇723002%50年一遇年一遇790001%100年一遇年一遇837000.1%1000年一遇年一遇988000.01%10000年一遇年一遇113000第二节第二节 统计参数的估计统计参数的估计一、总体与样本一、总体与样本总体,总体的容量总体,总体的容量样本,样本容量样本,样本容量二、统计参数的估计二、统计参数的估计累积频率曲线的累积频率曲线的三个统计参数:三个统计参数:均值均值变差系数变差系数偏态系数偏态系数1.1.矩法简介矩法简介1 1)原点矩(均值为一阶原点矩)原点矩
22、(均值为一阶原点矩)2 2)中心矩(方差为二阶中心矩)中心矩(方差为二阶中心矩)2.2.矩法估计样本系列统计参数矩法估计样本系列统计参数1 1)样本的均值)样本的均值 估算估算xniixnx112 2)样本的变差系数)样本的变差系数 估算估算vCniiniivKnxxnC12121111xxKii3 3)样本的偏态系数)样本的偏态系数 估算估算sC3131vniisnCKC3.3.样本参数的无偏估计值样本参数的无偏估计值niivvKnCnnC12111131323121vniissCnKCnnnC三、抽样误差三、抽样误差统计参数的均方误公式:统计参数的均方误公式:422221652316243
23、2124312ssCsvsvvCsxCCnCCCCnCCnnsv尊重弱者保持高度的自信心第三节第三节 水文频率计算求矩适线法水文频率计算求矩适线法一、概述一、概述累积频率曲线累积频率曲线累积频率曲线累积频率曲线的绘制方法:的绘制方法:求矩适线法求矩适线法三点法三点法读点补矩法读点补矩法1.1.求矩适线法绘制累积频率曲线的基本要点求矩适线法绘制累积频率曲线的基本要点2.2.经验累积频率计算公式经验累积频率计算公式二、绘制累积频率曲线的求矩适线法二、绘制累积频率曲线的求矩适线法点绘点据点绘点据计算统计参数计算统计参数选线选线绘制曲线绘制曲线%1001nmP3.3.用适线法绘制累积频率曲线的具体步骤
24、用适线法绘制累积频率曲线的具体步骤1 1)绘制经验累积频率曲线)绘制经验累积频率曲线2 2)矩法求样本统计参数)矩法求样本统计参数3 3)选定线型)选定线型4 4)适线)适线例例 某工程拟建断面水文站有某工程拟建断面水文站有3535年实测流量资料,试求最大流量的年实测流量资料,试求最大流量的累积频率曲线及相应于设计标准累积频率曲线及相应于设计标准P=1%P=1%和校核标准和校核标准P=0.1%的最大流量值。的最大流量值。1 1)计算经验累积频率)计算经验累积频率序号序号m m最大流量最大流量Q Q模比系数模比系数KiKiKi-1Ki-1(Ki-1)(Ki-1)2 2经验累积经验累积频率频率P
25、P1 118500185002.092.091.091.091.18811.18812.82.82 217700177002.002.001.001.001.00001.00005.65.63 313900139001.571.570.570.570.32490.32498.38.34 413300133001.501.500.500.500.25000.250011.111.13333424042400.480.48-0.52-0.520.27040.270491.791.73434365036500.410.41-0.59-0.590.34810.348194.494.4353532203
26、2200.360.36-0.64-0.640.40960.409697.297.2总计总计31001031001035.0035.000.000.006.06166.0616最大流量的统计参数及经验累积频率计算表最大流量的统计参数及经验累积频率计算表2 2)矩法求样本统计参数)矩法求样本统计参数vCQ、smQnQnii/886031001035113142. 0340616. 6112nKCiv3 3)理论累积频率曲线计算与绘制)理论累积频率曲线计算与绘制Cs/CvP(%)0.010.119999.92P KPQP5.593.35297004.302.81249002.922.2319800-
27、1.710.282480-1.970.1715103P KPQP6.553.75332004.903.06271003.192.3420700-1.1410.413640-1.520.3631904P KPQP7.504.15368005.483.31293003.432.4421600-1.150.524600-1.180.5044304 4)适线情况分析)适线情况分析习题习题1 1、绘制经验频率曲线即可查得设计值,为什么一般还要、绘制经验频率曲线即可查得设计值,为什么一般还要求绘制理论频率曲线?求绘制理论频率曲线?2 2、某站年最大洪峰流量资料如下表,试求频率为、某站年最大洪峰流量资料如下
28、表,试求频率为1 1的设的设计洪峰流量。计洪峰流量。年份年份195919601961196219631964196519661967流量流量(m3/s)29202040303014903520392044020201230年份年份196819691970197119721973197419751976流量流量(m3/s)17101770154041443608919551750649三、频率计算中的几个特殊问题三、频率计算中的几个特殊问题1.1.基准面变化对参数的影响基准面变化对参数的影响axxavavCaxxC2.2.负偏态线型(负偏态线型(Cs0Cs100N100后,考证期对参数后,考证期
29、对参数 和和 影响很小,即影响很小,即 N 的的敏感性较差;敏感性较差;对于对于 N 值的考证,只要有一个比较可靠的范围即可,值的考证,只要有一个比较可靠的范围即可,而不必拘泥于十分确切的数值。而不必拘泥于十分确切的数值。NQNVC第四节第四节 相关分析相关分析 在数理统计法中,把这种变量之间近似的或平均的关在数理统计法中,把这种变量之间近似的或平均的关系就称为相关关系,把研究这种关系的方法称为系就称为相关关系,把研究这种关系的方法称为相关分析相关分析。完全相关完全相关零相关零相关统计相关(相关关系)统计相关(相关关系)变量之间变量之间的关系的关系变量变量的多少的多少简单相关简单相关复相关复相
30、关直线相关直线相关曲线相关曲线相关一、概述一、概述水文分析计算中进行相关分析的目的?水文分析计算中进行相关分析的目的?通过相关分析,把短系列资料延展为长期,提高系列通过相关分析,把短系列资料延展为长期,提高系列的的代表性代表性,增加计算结果的,增加计算结果的可靠性可靠性。水文现象中,变量之间的关系多属于水文现象中,变量之间的关系多属于统计相关统计相关。 水文统计法中,最常用的是简单相关中的水文统计法中,最常用的是简单相关中的直线相关直线相关。y0a(x,y)a)0 x(x ,y )iiyb)xa a)直线相关;)直线相关; b b)曲线相关)曲线相关 统计相关统计相关 二、相关分析法二、相关分
31、析法1.1.图解法图解法2.2.回归分析法回归分析法设直线方程为:设直线方程为:bxay若任一点坐标(若任一点坐标(xi,yi)与直线之间纵标离差为:)与直线之间纵标离差为:所有相关点纵坐标离差所有相关点纵坐标离差 的平方的平方之和为:之和为:iiiibxayyyyDiyDDniiiniiniibxayyyy121212使上式取得极小值,解得:使上式取得极小值,解得:直线方程式写成回归直线的形式:直线方程式写成回归直线的形式:xyniiniiibxxyyxxbxbya121xxRyxxbyyxyxy引入描述相关程度的特征值,相关系数引入描述相关程度的特征值,相关系数 2222yyxxyyxxi
32、iii22yyxxyyxxRRbbiiiiyxxyyxxy三、回归线的误差三、回归线的误差采用均方误采用均方误 衡量回归线与观测点之间的误差:衡量回归线与观测点之间的误差:yS22112nyynnnyySniiniiy均方误与均方差的关系:均方误与均方差的关系:21yyS四、相关系数显著水平四、相关系数显著水平错误判断的概率错误判断的概率 ,称为显著水平。,称为显著水平。用用 t 检验法得出相关系数检验表,列出样本容量检验法得出相关系数检验表,列出样本容量 n ,显著水平显著水平 为为0.01、0.02、0.05及及0.1时相关系数时相关系数达到显著的最小值,以达到显著的最小值,以 表示。表示。n1=4n2=40例例步骤:步骤:1,资料整理;,资料整理;2,绘制点据图;,绘制点据图;3,列表计算相关系数并进行检验;,列表计算相关系数并进行检验;4,建立回归方程;,建立回归方程;5,回归线误差计算均方误;,回归线误差计算均方误;6,根据回归方程插补延长,根据回归方程插补延长 y 系列。系列。五、曲线相关和复相关简述(自学)五、曲线相关和复相关简述(自学)具备胆识和勇气常和别人保持合作并从中获得乐趣