1、(水文统计基本方法)第一节 概述 一、一、水文现象的随机性:二、二、概率论和数理统计学在水文分析中的应用:三、三、水文统计解决的问题:给定样本,求指定频率的设计值值 例:求指定频率的设计洪水。方法方法:确定频率曲线。资料插补展延 方法方法:建立变量间的相关关系 第二节 概率的基本概念 一、一、事件 指在一定条件组合下,随机试验的结果。分为:必然事件、不可能事件、随机事件。水文测验可看作随机试验。二、二、概率 反映随机事件出现的可能性大小的数量标准:三、三、频率 对于水文现象,用频率作为概率的近似值:nkAP)(nmAw)(第三节 随机变量及其概率分布 一、随机变量 随试验结果而发生变化的变量,
2、用 X 表示,取值用 表示。例:水文特征值:年径流、洪峰流量。离散型随机变量:连续型随机变量:水文特征值属连续型随机变量。ix 二、随机变量的概率分布 随机变量的取值与其概率的对应关系,称为随机变量的概率分布。用 表示。对于水文变量对于水文变量;常研究大于等于某一取值常研究大于等于某一取值 x 的概的概率率 ,即:)(xF)(xF 水文上通常称随机变量的水文上通常称随机变量的累积频率曲线,简称简称频率曲线。)(xF 三、概率分布函数与概率密度函数的关系 概率分布函数导数负值,称为概率密度函数概率分布函数导数负值,称为概率密度函数。四、随机变量的统计参数 总体统计参数、样本统计参数 均值、均方差
3、、变差系数、偏态系数 总体:随机变量所有取值的全体。样本:从总体中抽取的一部分。样本容量:样本包括的项数,样本大小。水文样本系列:统计参数是样本统计参数。均值():定义模比系数:xxxKii则:nKKKKnnnii21111 表示系列表示系列平均情况平均情况2.均方差():nxxnii12)(例4-1:5,10,15 x=10 =4.08 1,10,19 x=10 =7.35 反映系列中各变量值相对集中或离散的程度 3.变差系数(Cv):例4-2:5,10,15 x=10 =4.08 Cv=0.48 995,1000,1005 x=1000 =4.08 Cv=0.0048 反映系列中各变量值相
4、对集中或离散的程度nKCniiv12)1(4.偏态系数(Cs):313)1(vniisnCKC反映系列在均值两边的对称程度样本系列13002200318541655150例4-3:计算系列的统计参数均值、均方差、变差系数、偏态系数。ixnx1nKCniiv12)1(313)1(vniisnCKC样本系列统计参数计算样本系列(xi-x)2(xi-x)3KiKi-1(Ki-1)313001000010000001.50.50.1252200001003185225-33750.925-0.075-0.0004218741651225-428750.825-0.175-0.0053593851502
5、500-1250000.75-0.25-0.015625均值20027901657500.10359375均方差52.8 变差系数0.2641021.12 偏态系数1.12 第四节 水文频率计算 一、水文频率分布线型 1.正态曲线或正态分布:2.皮尔逊型分布曲线(P-)1.正态曲线或正态分布:密度函数:密度曲线:2.皮尔逊型分布曲线(P-)一端有限,一端无限的不对称单峰曲线)21(2402svsvSCCxaCCxC可以推证:形状、尺度、位置参数 水文计算中:一般需求出指定频率P所对应的随机变量 取值,即 。例如:求频率为1%(百年一遇)的设计洪峰流量 。这就需要对密度曲线进行积分,求出等于及大
6、于 的累积频率 P值,即:pxpxP?%1pxPxPPdxxfxXPxF)()()(px 即求出的 应满足:令:,是均值为零,标准差为1的 标准化变量(离均系数)则有:)1(vCxx px 取决于 四个参数。px0aP、该式包含CS、P与 p的关系,根据拟定CS值,可得不同 P 的 p 值,附录1。频率计算时,由估计的 和CV值,通过下式即可求出与各种P相应的 值,然后绘频率曲线。xpx)1(pvpCxxxKCxxppvp)1(P 频率曲线的绘制:根据统计参数 ,求不同频率 对应的值:xCCVs、然后在频率格纸上绘曲线,横坐标为频率,纵坐标为水文特征值。例4-4:某站年径流系列符合P-型分布,
7、如已知该系列的R=650mm,CV=0.25,CS=2Cv,试绘频率曲线。解:当CS=2Cv=0.5时,查附录1,得不同频率下的p,代入下式求Xp:)1(pvpCxxP0.010.10.20.330.512p4.833.813.483.253.042.682.31Xp144312741215.51176.51150.51085.51027P10205075909599p1.320.81-0.08-0.71-1.22-1.49-1.96Xp864.5780637533455409.5338 二、P型分布参数估计 用有限的样本观测资料估计总体分布线型中的参数,如PP型的 、CV、CS。1、矩法 用
8、样本矩估计总体矩,并通过矩与参数之间的关系,来估计频率曲线的参数。均值 的无偏估计:xx CV的无偏估计量:CS 的无偏估计量:1)1(12nKCniiv313)3()1(vniisCnKC 抽样误差:由随机抽样引起的误差,称为抽样误差。以均值为例;抽样误差定义为:),2,1(kixxxii总 样本均值是随机变量,抽样误差也为随机变量。抽样误差近似服从正态分布。可以证明,系列的均方差 可作为度量抽样误差的指标,称为均方误。各参数的均方误(抽样误差)各参数的均方误(抽样误差):x)165231(6243212431242222ssCsvsvvCsxCCnCCCCnCCnnsv),2,1(kixi
9、CV=2CS时样本参数的均方误(相当误差,%)cv 参数均值变差系数偏态系数1005025101005025101005025100.1112371014221261782523990.33469710152351721021620.557101681116254158821300.771014229121727405680126110142032101420324260851342、适线法 根据估计的频率分布曲线和样本经验点据配合最佳来优选参数的方法。经验频率曲线 由实测样本资料绘制的频率曲线。绘制:设某水文要素(如年径流量)的实测系列共 n 项,按由大到小的次序排列为x1、x2、.、x m
10、、.、x n。第m项的经验频率就是在系列中大于及等于样本 x m 的项数出现次数(m次)与样本容量(n)之比值,即 当m=n时,p=100%,即样本的末项 xn是总体中的最小值,显然不符合实际,因为随着观测年数的增多,总会出现更小的数值。对上式进行修正,有:数学期望公式:在频率格纸上以系列各项的频率为横坐标、各项的值为纵坐标点图,再通过点群中心目估绘光滑曲线即经验频率曲线。年份年最大洪峰流量序号由大到小排列经验频率(1)(2)(3)(4)(5)1961720126509.1 196210802206018.2 196310303144027.3 196412504142036.4 196514
11、405137045.5 196614206125054.5 196711207112063.6 196820608108072.7 196913709103081.8 197026501072090.9 例例45某枢纽年最大洪峰流量经验频率曲线某枢纽年最大洪峰流量经验频率曲线 频率与重现期的关系:水文上常用“重现期”来代替“频率”1.当研究暴雨或洪水时(一般P50%)2.当研究枯水或年径流时(一般 P50%)例如:当某一洪水的频率为P=1%时,则T=100年,称此洪水为百年一遇洪水,表示大于等于这样的洪水平均100100年会遇到一次。对于p=80%的枯水流量,则 T=5 年,称作以五年一遇枯水
12、流量作为设计来水的标准。表示小于等于这样的流量平均5 5年会遇到一次。说明具有80%的可靠程度。PT1PT11 适线法(配线法)适线法:是以经验频率点据为基础,在一定的适线准则下,求解与经验点据拟合最优的频率曲线参数,得到一条理论频率曲线。目估适线法、优化适线法。目估适线法步骤:1)将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据。2)选定水文频率分布线型(一般选用P-型)。3)初估一组参数 、CV、CS。为了使初估值大致接近实际,可用矩法或其它方法求出3个参数,作为3个参数第一次的假定值。当用矩法估计时,因CS的抽样误差太大,一般不计算CS,而是根据经验假定CS为CV的某
13、一倍数(如CS=2 CV)。x 4)根据假定的 、CV、CS,查附表计算xP值,以x P为纵坐标,p为横坐标,即可得到频率曲线。将此线画在绘有经验点据的图上,看与经验点据配合的情况,若不理想,则修改参数(主要调整CV、CS)再次进行计算。5)最后根据频率曲线与经验点据的配合情况,从中选择一条与经验点据配合较好的曲线作为采用曲线。相应于该曲线的参数便看作是总体参数的估值。x 统计参数对频率曲线的影响:1)均值 对频率曲线的影响x 1.均值大的位于小的之上。2.均值大的较小的陡。2)CV对频率曲线的影响 1.随着CV的增大,频率曲线越来越陡。3)CS对频率曲线的影响 1.CS越大,均值(K=1)对
14、应的频率越小,频率曲线中部越向左偏,且上段 越陡,下段越平缓。三、计算实例:某枢纽处最大洪峰流量频率计算某枢纽处年最大洪峰流量计算表年份洪峰流量序号排序模比系数(Ki)Ki-1(Ki-1)2频率(P)(1)(2)(3)(4)(5)(6)(7)(8)19451540127502.207 1.207 1.4562 4.5 1946980223901.918 0.918 0.8424 9.1 19471090318601.493 0.493 0.2426 13.6 19481050417401.396 0.396 0.1570 18.2 19491860515401.236 0.236 0.0556
15、 22.7 19501140615201.220 0.220 0.0483 27.3 1951790712701.019 0.019 0.0004 31.8 19522750812601.011 0.011 0.0001 36.4 1953762912100.971-0.029 0.0008 40.9 195423901012000.963-0.037 0.0014 45.5 195512101111400.915-0.085 0.0073 50.0 195612701210900.875-0.125 0.0157 54.5 195712001310500.843-0.157 0.0248 5
16、9.1 195817401410500.843-0.157 0.0248 63.6 1959883159800.786-0.214 0.0456 68.2 19601260168830.709-0.291 0.0849 72.7 1961408177940.637-0.363 0.1317 77.3 19621050187900.634-0.366 0.1340 81.8 19631520197620.611-0.389 0.1510 86.4 1964483204830.388-0.612 0.3751 90.9 1965794214080.327-0.673 0.4524 95.5 总计2
17、61702617021.00 0.000 4.252 均值1246 变差系数0.46 1、矩法估计参数洪峰频率曲线选配计算表频率 P(%)第一次配线第二次配线第三次配线Q=1246 CV=0.5 CS=2CV=1.0Q=1246 CV=0.6 CS=2CV=1.2Q=1246 CV=0.5 CS=2.5CV=1.5(1)(2)(3)(4)(5)(6)(7)12.513127 2.893601 33738 51.942417 2.152679 2.172704 101.672081 1.82243 1.82243 201.381719 1.441794 1.421769 500.921146 0
18、.891109 0.861072 750.64797 0.56698 0.56698 900.44548 0.35436 0.39486 950.34424 0.26324 0.32399 990.21262 0.13162 0.24299 第五节 相关分析 一、相关关系的概念 1、相关分析:研究两个或多个随机变量之间的联系。例如:降雨与径流之间、上下游洪水之间、水位与流量之间等。水文计算中的应用应用:资料的插补展延、水文预报等。2、注意的问题注意的问题:必须先分析变量在成因上是否有联系。3、两变量之间关系(简单相关)二、简单直线相关关系 方法:相关图解法 相关分析法 1、相关分析法 最小二乘
19、法确定参数最小二乘法确定参数a、b。设:两变量之间的相关关系为:设:两变量之间的相关关系为:原理:在所有观测点与配合的直线在纵轴方向的离差平方和最小的前提下求a、b:观测点与配合的直线在纵轴方向的离差离差为:为极小值。欲使上式取得极小值,可分别对a和b求一阶导数,并使其等于零,即令:得方程组解方程组,可得:r:相关系数。将a、b代入是回归线的斜率,一般称为y倚x的回归系数,记为:即:2、相关分析的误差 1.回归线的误差 常用均方误表示。y倚x的回归线的均方误:3.相关系数及其误差讨论(1)y与x完全相关;(2)y与x零相关或非直线相关(3)y与x存在相关关系。r 0,正相关;r 0负相关。12
20、r102 r02r 相关关系存在的判断:可用相关系数的机误(随机误差)来判断:nrEr216745.0rEr4同期观测资料不能太少,n12 相关分析时应注意的问题:1)必须先分析变量在成因上是否有联系,不能在两个毫不相关的变量之间硬凑出相关关系。2)同期观测资料不能太少,n12。3)统计判断是否存在相关关系。例4-6:已知某水文站断面以上流域年降雨量与年径流量资料如下表,利用相关关系将缺测的资料展延。年份年降雨量 x (mm)年径流量 y(mm)年份年降雨量 x (mm)年径流量 y (mm)193298219499221933108019501460193413201951119519358801952133019361159195399519371410195420141362193813601955121172819391010195617281369194087019571157695194111701958125772019429301959102953419431040196013067781944885196110293371945126519621310809194611651963135692919471070196412667961948136019651052383