1、水文现象具有二重性:水文现象具有二重性:水文现象包含着水文现象包含着(Inevitability)水文现象也包含着水文现象也包含着(Contingency),对水文的偶然现象(或称随机现象)所遵循的对水文的偶然现象(或称随机现象)所遵循的规律一般称做统计规律。规律一般称做统计规律。1.1.概述概述物理成因分析法物理成因分析法概率论和数理统计分析方法概率论和数理统计分析方法水文分析计算常用到数理统计的方法水文分析计算常用到数理统计的方法 预测流域内未来的河道来水量(径流量),预测流域内未来的河道来水量(径流量),以对流域或地区水资源开发利用进行合理规划;以对流域或地区水资源开发利用进行合理规划;
2、弄清未来时期河流中可能的洪水量及其过程,弄清未来时期河流中可能的洪水量及其过程,以确定工程的规模。以确定工程的规模。这种对未来长期的径流情势(属随机变量)这种对未来长期的径流情势(属随机变量)的估计,只能依据其统计规律,利用数理统计的的估计,只能依据其统计规律,利用数理统计的方法进行方法进行“概率预估概率预估”。所谓所谓“概率预估概率预估”,即分析水文变量出现大,即分析水文变量出现大过或小于某个数值的可能性为多少。过或小于某个数值的可能性为多少。1)1)(Probability)为了比较某随机事件出现(或不出现为了比较某随机事件出现(或不出现)的可能的可能性大小,必然赋予一种量化的(以数量表示
3、性大小,必然赋予一种量化的(以数量表示)指标,指标,这个数量指标就是事件的概率。这个数量指标就是事件的概率。2.2.水文随机变量及其分布参数水文随机变量及其分布参数 Random variables&distribution parameters nmAP)(式中式中,P(A):一定条件下随机事件:一定条件下随机事件A的概率;的概率;n :试验中所有可能的出现的结果数;:试验中所有可能的出现的结果数;m :出现随机事件:出现随机事件A的结果数。的结果数。简单简单(古典古典)的随机事件的概率定义用下式表示:的随机事件的概率定义用下式表示:以上公式适合于以上公式适合于古典概率事件,其特点是:古典概
4、率事件,其特点是:试验的所有可能结果是等可能的;试验的所有可能结果是等可能的;试验的所有可能结果总数是有限的随机事件试验的所有可能结果总数是有限的随机事件但水文事件不一定符合这种性质。但水文事件不一定符合这种性质。对于不是古典概型事件,只能通过多次重对于不是古典概型事件,只能通过多次重复试验来估计事件的概率。复试验来估计事件的概率。设事件设事件A在在n 次随机试验中出现了次随机试验中出现了m 次,则次,则定义:定义:nmAW)(2 2)频率)频率(Frequency)为事件为事件A 在在n 次试验中出现的频率。次试验中出现的频率。n 不是所有可能的结果总数,仅是不是所有可能的结果总数,仅是随机
5、试验的次数。随机试验的次数。丢币次数丢币次数 出现正面的次数出现正面的次数 频率频率 12000 6019 0.5016 24000 12014 0.5005当试验次数当试验次数 n 不大时,事件频率有明显的不不大时,事件频率有明显的不稳定性。当试验次数稳定性。当试验次数 n 增加到充分大时,事件增加到充分大时,事件频率显著地出现稳定的趋势,例如:频率显著地出现稳定的趋势,例如:频率是通过若干次试验后才能求得的经验值,频率是通过若干次试验后才能求得的经验值,事先不能确定,当试验次数事先不能确定,当试验次数n愈大,即当愈大,即当n趋于无趋于无穷大时,理论上,穷大时,理论上,n变成试验中所有可能的
6、结果总变成试验中所有可能的结果总数,则频率愈接近概率。数,则频率愈接近概率。在等可能条件下,表达事件客观上出现的可能在等可能条件下,表达事件客观上出现的可能性大小,是一个理论值。性大小,是一个理论值。因此,当事件不能归结为古典概率型时就可以因此,当事件不能归结为古典概率型时就可以通过多次试验,把事件的频率作为事件的概率近似通过多次试验,把事件的频率作为事件的概率近似值。一般将这样估计而得的概率称为值。一般将这样估计而得的概率称为统计概率统计概率/经经验概率验概率。因为各种水文要素其可能出现的总数是无限的,因为各种水文要素其可能出现的总数是无限的,可见水文现象的概率不能视为古典概率。可见水文现象
7、的概率不能视为古典概率。因此,通因此,通常将有限的实测水文数据当作多次重复试验结果,常将有限的实测水文数据当作多次重复试验结果,故可用公式(故可用公式(,式中,式中n为事件为事件A 随机随机试验次数)推求的频率作为概率的近似值。试验次数)推求的频率作为概率的近似值。nmAW)((Population/Totality)在统计数学中,把某种随机变量所取数值的在统计数学中,把某种随机变量所取数值的全体,称为总体。全体,称为总体。水文随机变量如年径流量的总体数是无穷的,水文随机变量如年径流量的总体数是无穷的,故无法取得总体。故无法取得总体。(Sample)从总体中不带主观成分任意抽取的一部分,从总体
8、中不带主观成分任意抽取的一部分,称为样本。样本所包含的项数,称为称为样本。样本所包含的项数,称为样本容量样本容量。如实测的水文数据是有限的,是一样本。如实测的水文数据是有限的,是一样本。它是指随机试验结果的一个数量。在水文它是指随机试验结果的一个数量。在水文学中,常用大写字母表示,记作学中,常用大写字母表示,记作X,而随机变而随机变量的可能取的值记作量的可能取的值记作x,即:即:X=x1,X=x2,X=xn 随机变量的集合称之为随机变量的集合称之为随机系列随机系列或或随机数随机数列列。Discrete random variable 随机变量仅取得区间内某些间断的离散值,随机变量仅取得区间内某
9、些间断的离散值,则称为离散型随机变量。如洪峰次数,只能取则称为离散型随机变量。如洪峰次数,只能取0,1,2,不能取相邻两数值之间的任何值。,不能取相邻两数值之间的任何值。Continuous random variable 随机变量可以取得一个有限区间内的任何数随机变量可以取得一个有限区间内的任何数值,则称为连续型随机变量。如某河流断面的流值,则称为连续型随机变量。如某河流断面的流量可以取量可以取0 极限值之间的任何实数值。极限值之间的任何实数值。随机变量的取某一可能值的机会有的大有的小,随机变量的取某一可能值的机会有的大有的小,即随机变量取值都有一定的概率与之相对应,可表即随机变量取值都有一
10、定的概率与之相对应,可表示为:示为:nn2211PxXPPxXPPxXP )()()(上式中上式中P1,P2,Pn 表示随机变量表示随机变量X 取值取值x1,x2,xn 所对应的概率。所对应的概率。x1 x2 x3 x4 xnXP 一般将这种对应关系称作随机变量的一般将这种对应关系称作随机变量的概率分布规概率分布规律律,简称为,简称为分布律分布律。可以用以下的分布图形表示。可以用以下的分布图形表示:由于它的所有可能取值有无限个,水文学上由于它的所有可能取值有无限个,水文学上习惯研究随机变量的取值等于或大于某个值的概习惯研究随机变量的取值等于或大于某个值的概率,表示为:率,表示为:它是它是x的函
11、数,称作随机变量的函数,称作随机变量X 的分布函数的分布函数(Distribution function),记作,记作F(x),即即 F(x)=P(X x)表示表示随机变量随机变量X大于或等于值大于或等于值x的概率,的概率,其几其几何曲线称作随机变量的概率分布曲线(水文学上何曲线称作随机变量的概率分布曲线(水文学上通常称通常称累计频率曲线,简称频率曲线累计频率曲线,简称频率曲线)。)。)(xXP 由图中可知,由图中可知,X=900,相应的,相应的P(X x)=0.15,说明大,说明大于等于于等于900mm降雨的可能性为降雨的可能性为15%;同理,大于等于;同理,大于等于500 mm 降雨的可能
12、性为降雨的可能性为60%0 0.2 0.4 0.6 0.8 1.0)xX(P)x(F 500900年降雨量年降雨量(mm)某站年雨量概率分布曲线某站年雨量概率分布曲线 P(X x)(8-9)xexfxx222)(21)(式中,式中,:平均数;:平均数;:标准差。:标准差。x 许多随机变量如水文测量误差、抽样误差许多随机变量如水文测量误差、抽样误差等一般服从正态分布。等一般服从正态分布。xxxf(x)a.单峰,只有一个众数;单峰,只有一个众数;b.对于平均数对称对于平均数对称,Cs=0;c.曲线二端趋于曲线二端趋于,并以并以x 轴为渐近线轴为渐近线;d.1)(dxxf正态分布的密度曲线正态分布的
13、密度曲线在在 处出现拐点,处出现拐点,而且:而且:x 33)()(0.997)33(0.683)(xx2xxxx2xxdxe21xXxPdxe21xXxP2222 xxxf(x)x3 x3 概率密度函数表达式:概率密度函数表达式:)(100)()()(axeaxxf 式中式中,()的伽玛函数的伽玛函数,a 0:三个参数,与三个统计参数:三个参数,与三个统计参数有一定的关系,其表达式为:有一定的关系,其表达式为:dxexx 01)(VSx CC,VSSVSCaxCCxC C02242(1)可见,当以上三个参数确定后,可见,当以上三个参数确定后,P-III型密度函型密度函数亦完全确定。数亦完全确定
14、。f(x)皮尔逊皮尔逊 型概率密度曲线型概率密度曲线 a0M0(x)Me(x)xP PxdxxfP)(xP-III型曲线的特点:型曲线的特点:一端有限另一端无限的不对称单峰正偏曲线,很一端有限另一端无限的不对称单峰正偏曲线,很多水文变量均符合多水文变量均符合P-III型分布。型分布。PxaxPdxeaxxXPP)(100)()()(在水文计算中,一般要求出指定概率在水文计算中,一般要求出指定概率 P 所相应所相应的随机变量的取值的随机变量的取值 xP,即求出的,即求出的 xP满足下列等式:满足下列等式:取标准变量取标准变量(离均系数离均系数),即即 代入上式,代入上式,,a0 以相应的以相应的
15、 和和 关系式表示,简化后得:关系式表示,简化后得:VCxxx)()1(VCxx VCx,SC dCfPPsP),()(0.031.302.473.384.160.20.021.292.403.233.940.10.001.282.333.093.720.0501010.10.01P(%)P CsP-III型曲线离均系数型曲线离均系数 P 值表值表 被积函数含有参数被积函数含有参数 ,Cs,而,而 包含在包含在 中,制成中,制成 对应关系表:对应关系表:,VxCPsPC VCxxx)(xCxVPP)1(可见,只要已知指定概率可见,只要已知指定概率 P 和三个统计和三个统计参数,则可求出相应于参
16、数,则可求出相应于P的随机变量的取值的随机变量的取值 xP 因此,由给定的因此,由给定的CS 及及P,从,从P-III型曲线型曲线离均系数离均系数 值表,查出值表,查出 P 值,再依据均值和值,再依据均值和离差系数,由下式可求出指定概率离差系数,由下式可求出指定概率 P 所相应所相应的随机变量的值的随机变量的值 xP已知已知:某地年平均降雨量某地年平均降雨量 =1000 mm,CV=0.5,CS=1.0,假定年降雨量符合假定年降雨量符合P-III型分布型分布试求:试求:P=1%的年降雨量。的年降雨量。x求解:求解:由由 CS=1.0及及P=1%,查附表,查附表1得得 P=3.02 1%(1)(
17、3.020.5 1)1000=2510PPVxx Cxmm +引入引入模比系数模比系数:x/xKPP 1 VPPCKxCxVPP1)(由由由此建立由此建立 的的 对应数值关系对应数值关系P-III型型曲线模比系数曲线模比系数 KP 值表值表PKCPV上例的解法:上例的解法:由由 CV=0.5,CS =1.0=2 CV,P=1%查附表查附表2得得:mmxKxKP1%P251010002.512.51 P-III型曲线模比系数型曲线模比系数 KP 值表(附表值表(附表2,P266)P(%)CV0.010.10.20.330.512510205075909599(一)(一)CS=CV0.051.19
18、1.161.151.141.131.121.111.091.071.041.000.970.940.920.891.5011.68.858.027.366.876.005.113.923.002.040.64-0.10-0.53-0.70-0.89(二)(二)CS=1.5CV0.05(三)(三)CS=2CV (三)(三)CS=6CV 随机变量统计参数在水文计算中起到十分重随机变量统计参数在水文计算中起到十分重要的作用,但由于水文随机变量的总体是无限的,要的作用,但由于水文随机变量的总体是无限的,这就需要在总体不知道的情况下,靠抽出的样本这就需要在总体不知道的情况下,靠抽出的样本(观测的系列观测
19、的系列)去估计总体参数。去估计总体参数。估算方法有:估算方法有:矩法;矩法;适线法;适线法;极大似然法;极大似然法;权函数法;权函数法;n1iixn1x 已知样本的随机系列:已知样本的随机系列:x1,x2,x3,xn,分别求样本的三个统计参数分别求样本的三个统计参数 。SVCCx,n1i2inxxS)(式中,式中,称作模比系数称作模比系数xxKii n1i2in1i2iV1Kn1n1xxxSC)()(以上三个公式求到的参数是根据样本求参以上三个公式求到的参数是根据样本求参得到,故与相应的总体的参数是不相等的。得到,故与相应的总体的参数是不相等的。3Vn1i3iSCn1KC )(n1i2in1i
20、2iV1Kn1n1xxxSC)()(式中,式中,根据统计学的证明可知:根据统计学的证明可知:由矩法求到的样本平均值由矩法求到的样本平均值 为总体平均数为总体平均数的无偏估计量,然而的无偏估计量,然而CV,CS 则不是总体相应参则不是总体相应参数的无偏估计量,称为有偏估计量。故需要对数的无偏估计量,称为有偏估计量。故需要对参数参数CV,CS 进行修正,使其变成无偏估计量。进行修正,使其变成无偏估计量。x 由统计学的定义,若由统计学的定义,若 是未知数是未知数 的估的估计量,而且计量,而且 ,则称,则称 为为 的无偏估的无偏估计量。计量。)(E 31323132)3()1()2)(1()1()2)
21、(1(VniiVniissCnKnnnCnKnnnCC (当当 n 较大时较大时)1)1(112 nKnnCCniivv求求 Cv,Cs 的不偏估计量的修正计算式:的不偏估计量的修正计算式:用上述的无偏估算公式计算的很多同容量的样本的用上述的无偏估算公式计算的很多同容量的样本的统计参值的均值,可望等于总体的同名参数。统计参值的均值,可望等于总体的同名参数。是以经验频率点据为基础,在一定的适是以经验频率点据为基础,在一定的适线准则下,求出与经验点据拟合最优的频率线准则下,求出与经验点据拟合最优的频率曲线参数,这是一种较好的参数估计方法,曲线参数,这是一种较好的参数估计方法,是我国估计某些水文变量
22、(如径流量、降雨是我国估计某些水文变量(如径流量、降雨量等)频率曲线统计参数的主要方法。量等)频率曲线统计参数的主要方法。【例】已知某地年降雨量的观测资料【例】已知某地年降雨量的观测资料(n=12),并由大,并由大 到小排列,按到小排列,按 计算频率。计算频率。式中,式中,P:大于或等于某一变量值:大于或等于某一变量值 x 的的经验频率经验频率;m:x 由大到小排列的序号,即在由大到小排列的序号,即在n 次观测资次观测资料中出现大于或等于某一值料中出现大于或等于某一值 x 的次数。的次数。nmP 经验频率计算表:经验频率计算表:n=12 其反映年降雨量其反映年降雨量(X x)的经验频率的经验频
23、率P(X x)和和x的关系。的关系。随着样本容量随着样本容量n的增加,频率的增加,频率P就非常接近于概率,而该就非常接近于概率,而该经验分布曲线就非常接近于总体的分布曲线。经验分布曲线就非常接近于总体的分布曲线。由此得到经验频率分布曲线由此得到经验频率分布曲线:0.02 0.04 0.06 0.08 0.01 0 0.0P(%)8 0 01 0 0 01 2 0 01 4 0 0年 降 雨 量 (m m)经经 验验 分分 布布 曲曲 线线P(X x)x%31.92112121 nmP样本的每一项的经验频率用公式样本的每一项的经验频率用公式P=m/n进进行计算,当行计算,当m=n时,时,P=10
24、0%,说明样本的最末项,说明样本的最末项为总体的最小值,这是不合理的。故必须进行修为总体的最小值,这是不合理的。故必须进行修正,中国常采用下面的公式进行计算:正,中国常采用下面的公式进行计算:经验频率的计算公式:经验频率的计算公式:这样,当这样,当m=n=12 时,时,该公式在水文计算中通常称为该公式在水文计算中通常称为期望公式期望公式1 nmP所谓的重现期是指某一随机事件在很长所谓的重现期是指某一随机事件在很长时期内时期内平均多长时间平均多长时间出现一次(水文学中常称出现一次(水文学中常称为为“多少年一遇多少年一遇”)。即在许多试验中,某一)。即在许多试验中,某一随机事件重复出现的时间间隔的
25、平均数,即平随机事件重复出现的时间间隔的平均数,即平均的重现间隔期。均的重现间隔期。在水文分析中,重现期可以等效地替代在水文分析中,重现期可以等效地替代频率。频率。2)2)重现期重现期 Recurrence interval/return perioda.a.当研究洪水或暴雨问题当研究洪水或暴雨问题 水文上关心的是大于等于某洪水或某暴雨量发水文上关心的是大于等于某洪水或某暴雨量发生的频率,因此,重现期指在很长时期生的频率,因此,重现期指在很长时期N年内,出年内,出现大于现大于等于等于某水文变量某水文变量XP 事件的平均重现的间隔事件的平均重现的间隔期期T:式中,式中,T:重现期,以年计;:重现
26、期,以年计;P:大于等于某水文变量:大于等于某水文变量 XP 事件的频率,事件的频率,1TP NNP NP为为N年内大于等于年内大于等于XP 事件出现的次数。事件出现的次数。表中表中12年中年降雨量大于等于年中年降雨量大于等于990mm的次的次数为数为6次,即等于次,即等于NP=12 50%=6,可知该事件的,可知该事件的重现期为:重现期为:T=12/6=2年年可按下式计算重现期:可按下式计算重现期:11=2()50%NTNPP 年年n=12 水文上关心的是小于水文上关心的是小于xP的事件出现的频率及的事件出现的频率及相应的重现期。相应的重现期。重现期指在很长的时期内重现期指在很长的时期内(N
27、年年)出现小于某水出现小于某水文变量文变量xP事件的平均重现间隔期。若水文变量大事件的平均重现间隔期。若水文变量大于等于于等于xP的频率为的频率为P,则小于,则小于xP事件的频率应为:事件的频率应为:,在在N年内小于年内小于xP事件出现的次数应为事件出现的次数应为N(1-P),因此其重现期为:因此其重现期为:b.b.当研究枯水问题当研究枯水问题1=(1-)1-NTNPP 表中年降雨量大于等于表中年降雨量大于等于850mm的次数为的次数为11次,即等次,即等于于 ,则小于,则小于850mm的降雨次数为的降雨次数为1次,即次,即等于等于 可知该事件的重现期为:可知该事件的重现期为:T=12/1=1
28、2(年年)亦可按下式计算:亦可按下式计算:11121112 NP112112)(1 PN1212111111)(1 PPNNT(年年)n=12 根据实测样本资料进行点绘根据实测样本资料进行点绘 纵坐标为随机变量纵坐标为随机变量X=x,横坐标为对应的经验频率横坐标为对应的经验频率P(X x),经验频经验频率计算公式为:率计算公式为:1mPn 假定一组参数假定一组参数 ,可选用矩法的估值作,可选用矩法的估值作为为 的初始值的初始值,一般不求一般不求CS,假定假定 ,K为比例系数,可选为比例系数,可选 K1.5,2,2.5,3.SVC,C,xVC,xVSKCC 已知:经验频率分布,已知:经验频率分布
29、,求:总体分布参数求:总体分布参数12根据选定的参数根据选定的参数 ,由由P-III型曲线离均型曲线离均系数系数 值表或值表或P-III型曲线模比系数型曲线模比系数KP 值表值表,求出求出 xP P 的理论频率曲线,将其绘在有经验点据的同的理论频率曲线,将其绘在有经验点据的同一张图上,看它们的配合好坏,若不理想,则修一张图上,看它们的配合好坏,若不理想,则修改有关的参数改有关的参数(主要调整主要调整CV 及及K=CS/CV),重复以,重复以上的步骤,重新配线;上的步骤,重新配线;SVC,C,x选定线型,对于水文的随机变量,一般选选定线型,对于水文的随机变量,一般选P-III型型;根据配合的情况
30、,选出一配合最佳的频率曲线作根据配合的情况,选出一配合最佳的频率曲线作为采用曲线,则相应的参数作为总体参数的估值。为采用曲线,则相应的参数作为总体参数的估值。PxP 适线法的实质是通过样本经验分布来推求总体适线法的实质是通过样本经验分布来推求总体分布,适线法的关键在于分布,适线法的关键在于“最佳配合最佳配合”的判别。的判别。经验点据经验点据 理论频率曲线理论频率曲线【水文学习题】11在水文频率计算中,我国一般选配皮尔逊在水文频率计算中,我国一般选配皮尔逊型曲线,型曲线,这是因为这是因为 A、已经从理论上证明它符合水文统计规律、已经从理论上证明它符合水文统计规律 B、已支撑该线型的、已支撑该线型
31、的 值表供查用,使用方便值表供查用,使用方便 C、已制成该线型的、已制成该线型的KP值表供查用,使用方便值表供查用,使用方便 D、经验表明该线型能与我国大多数地区水文变量的、经验表明该线型能与我国大多数地区水文变量的频率分布配合良好频率分布配合良好12甲乙两河,通过实测年径流量资料的分析计算,获甲乙两河,通过实测年径流量资料的分析计算,获得各自的年平均径流值得各自的年平均径流值 和离差系数如下:和离差系数如下:甲河:甲河:Q甲甲100 m3/s,CV甲甲0.42;乙河:乙河:Q乙乙500 m3/s,CV乙乙0.25,两者比较可知:两者比较可知:A、甲河水资源丰富,径流量年际变化大、甲河水资源丰
32、富,径流量年际变化大B、甲河水资源丰富,径流量年际变化小、甲河水资源丰富,径流量年际变化小C、乙河水资源丰富,径流量年际变化大、乙河水资源丰富,径流量年际变化大D、乙河水资源丰富,径流量年际变化小、乙河水资源丰富,径流量年际变化小13用配线法进行频率计算时,判断配线是否良用配线法进行频率计算时,判断配线是否良好所遵循的原则是好所遵循的原则是:A、抽样误差最小原则、抽样误差最小原则B、统计参数误差最小原则、统计参数误差最小原则C、理论频率曲线与经验频率点据配合最好、理论频率曲线与经验频率点据配合最好原则原则D、设计值偏于安全原则、设计值偏于安全原则C14P=5的丰水年,其重现期等于的丰水年,其重现期等于 年年 A、5 B、50 C、20 D、9515P=95%的枯水年,其重现期等于的枯水年,其重现期等于 年年 A、95 B、50 C、5 D、20D