1、3.1.2 事件与随机变量必然事件必然事件不可能事件不可能事件随机事件随机事件 随机变量(Random variables):随机变量随机变量(Random variablesRandom variables):随机事件的数量化表征随机事件的数量化表征离散型离散型随机变量的一个有限区间内可以取得任何数值随机变量的一个有限区间内可以取得任何数值3.1.3 总体与样本 总总 体体 有有 限限 无无 限限样样 本本 容量一定容量一定 容量无限容量无限 容容 量量 概率与频率 基本性质:基本性质:0P(A)1 0P(A)1(2)(2)频率:频率:在具体重复试验中,随机事件在具体重复试验中,随机事件A
2、A出现的次数出现的次数与试验总次数之比值与试验总次数之比值k()knP AnA:事件 在客观上可能出现结果的总数;:一切可能出现的结果的总数。():kW AnkAn事件 在 次试验中实际出现的次数概率和频率的关系(3)(3)概率与概率与频率频率关系:关系:0)()(limAPAWnn 频率是经验值,概率是经验值;频率是经验值,概率是经验值;n 可以通过实测样本的频率分析来推论事件总体概可以通过实测样本的频率分析来推论事件总体概率特性;率特性;n 样本容量越大,结果越准确;样本容量越大,结果越准确;n 对于水文现象,只能采用有限的多年实测水文资对于水文现象,只能采用有限的多年实测水文资料组成样本
3、系列,推求频率作为概率的近似值。料组成样本系列,推求频率作为概率的近似值。随机变量的概率分布iiPxXP)((3-3)对于连续性随机变量,实际工程更关注对于连续性随机变量,实际工程更关注:?)(ixXP水专业图-工程例 题的图将左式进行积分05101530013002300 x(mm)PX()10-4x(mm)23001300300200P()406080100频率密度直方图频率密度直方图f(x)频率密度曲线频率密度曲线P(Xxi)累积频率曲线累积频率曲线累积频率直方图累积频率直方图)(lim0 xxfdxdpxp(3-4)水文学中的概率分布ixiidxxfxFxXP)()()(f(x)xpf
4、(x)dxP(Xxp)=F(xp)f(x)x0 xp100F(xp)pF(x)xp0 xF(x)()概率密度函数概率密度函数 概率分布函数概率分布函数 )(21)(222)(xexfxx3.1.6 累积频率与重现期频率特性(1)(1)(%)(nmxXPi(3-6)有:有:累积频率特性:累积频率特性:)(1)(1)(1)()(11iinikkikkiixXPxXPffnxXPxXP累计频率分类:累计频率分类:重现期?表示方法PT1)(1)(iixXPxXT(3-8)设计频率标准50%重现期分类PT11)(11)(1)(iiixXPxXPxXT(3-8)设计频率标准路桥的总体思路Hydrologi
5、cal Statistics资料要求 3-2 统计参数与抽样误差特征参数1.2.3.无偏估计均值)(E)(E(1)(1)x均值图示3-11我国我国多年平均年降水量多年平均年降水量分布图(单位:分布图(单位:mm)Y图湖北省部分地区湖北省部分地区多年平均年径流深多年平均年径流深等值线图(等值线图(mm)众值(2 2)x x示意图均方差(1 1)变差系数1)(2nxxi样21niixxn总21v1niixxCnxx总21v11niixxCnxx样2211v1nniiiikknCnn2211v111nniiiikknCnniixKx变差系数图湖北省部分地区年径流量湖北省部分地区年径流量变差系数变差系
6、数CvCv等值线图等值线图Cv的曲线形状影响偏态系数xxSC3133131VniiniiSCnKnxxC(3-16)3333)3()1()3()(viisCnKnxxC(3-17)Cs影响形状图图总结复习:矩的概念矩矩 随机变量随机变量 x 对原点离差的对原点离差的 k 次幂的数学期望次幂的数学期望 E(xk),称为随机称为随机 变量变量 x 的的 k 阶原点矩。阶原点矩。随机变量随机变量 x 对中心分布对中心分布 E(x)离差的离差的 k 次幂的数学期望次幂的数学期望 E x E(x)k,则称为随机变量则称为随机变量 x 的的 k 阶中心矩。阶中心矩。统计参数:统计参数:均值均值 称为称为一
7、阶原点矩;一阶原点矩;变差系数变差系数 Cv 称为称为二阶中心矩;二阶中心矩;偏态系数偏态系数 Cs 称为称为三阶中心矩;三阶中心矩;各统计参数的计算公式亦称为各统计参数的计算公式亦称为矩法公式矩法公式。x3.2.2抽样误差公式误差分布图mxxmiix12)(总体(3-14)%3.68)(xxxxxP总总误差计算公式相对误差公式(3-18))165231(62432124222ssCsvsvvCxCCnCCCCnCnsvXp误差公式(3-19)%100)165231(61%1002432121%1004222sssCsvsvCvxCCnCCCCCnnCsvx 参数参数误误 差差 n CvCs
8、与 Cv 经验关系%1001)nmxXPi(%1004.03.0)xnmXPi(%1005.0)xnmXPi(P为大于等于为大于等于xi的经验频率;的经验频率;m为水文变量从大到小排列的序号;为水文变量从大到小排列的序号;n为样本的容量,即观测资料的总项数。为样本的容量,即观测资料的总项数。3.3.2 经验频率曲线),(),(),(2211nnxPxPxP曲线图),(),(),(2211nnxPxPxP例题表整理频率值计算表m经验频率计算延长 x1%=?x99%=?100%P363机率格纸理论线年径流量QP()CADB1000.010.111105090 959999.9(m /s)3EF20
9、306050408070P364图横坐标中间密,两边疏不均匀分横坐标中间密,两边疏不均匀分格,表示频率格,表示频率max)()(xxpppdxxfxFxXPEndpxpdxxfxXP)()(f(x)表达式特点:曲线单峰,只有一个众数、曲线是一条一端有限、特点:曲线单峰,只有一个众数、曲线是一条一端有限、另一端无限且以横轴为渐近线的不对称曲线。另一端无限且以横轴为渐近线的不对称曲线。:起点到坐标原点的距离起点到坐标原点的距离 dda11)(100)()(axeaxxf(3-18)皮尔逊III型曲线参数与统计参数的关系:psvxxpsvpxCCxFdxxCCxfxXPp,),()(max)21(2
10、402svsvsCCxaCCxC(3-19)2 理论曲线2.理论频率曲线推公式pxaxpdxeaxxXP)(100)()()(vCxxx(3-29)附录(3-30)deCCPpssCCssp2)2(21)2()()/2()()1(pvpCxx理论曲线纵横标Cs)1(pvpCxx绘制曲线步骤pxaxpdxeaxxXP)(100)()()()1(pvpCxx例题xpvppCxxK1smQ/10036.0VC4.24VSCC328m3/s 曲线计算表2)Q1%=?参数对曲线影响pCvpKp=1+CvpQp=KpExcell/反回上页反回上页QCs=2.4参数Cv参数Cs3-4 水文频率计算方法频率计
11、算推求频率计算推求 xp参数初估参数初估适线法适线法3.4.1.统计参数初估方法矩法svCCx,3321)3()1(1)1(1visivniiCnKCnKCxnx经验法三点法3321)3()1(1)1(1visivniiCnKCnKCxnx)1()1()1(332211vvvCxxCxxCxx(3-22)参数计算公式311331PPPPPPxxx 133131PPPPPPvxxxxC 132132131322PPPPPPPPPPxxxxx (3-34)(3-35)(3-33)),(PCfSsS 表附录附录C P-III曲线三点法曲线三点法 S 与与 Cs 关系表关系表P=5 50 95%求参步
12、骤 据据(3-35)(3-35)式左端计算得式左端计算得S S值,且已知值,且已知P P1,1,P P2,2,P P3,3,查查 附录附录C,C,求得参数求得参数Cs;据据Cs查附录查附录B,B,得得p p1 1、p p2 2,代入,代入(3-33)(3-33)、(3-34)(3-34)式式,求得求得 。适线法svCCx,1步骤 表格 实际计算水文频率时,通过制表完成上述的步骤实际计算水文频率时,通过制表完成上述的步骤。经验频率及统计参数计算表经验频率及统计参数计算表理论线 表xxKii模比系数xxxppp例题100%1mpn三点法配线矩法配线经验点年最大洪峰流量Q频率P()120000.18
13、0003(m /s)1600020000240002800015 1020 30 40 50 60 70 8090 95994000Q5%Q50%Q95%经验法经验法优化法变量或现象之间的关系可依照密切程度划分变量或现象之间的关系可依照密切程度划分完全相关完全相关零相关零相关相关关系相关关系相关分析:研究两个或两个以上随机变量之间的相关关系。相关分析:研究两个或两个以上随机变量之间的相关关系。复复 相相 关关简简 相相 关关 曲线相关曲线相关直线相关直线相关负负 相相 关关正正 相相 关关相关分析意义相关分析的任务是寻求随机变量之间的统计相关分析的任务是寻求随机变量之间的统计 关系,以延展和插
14、补实测水文系列,提高样本的代关系,以延展和插补实测水文系列,提高样本的代 表性和设计成果的可靠性。表性和设计成果的可靠性。例如:流量与例如:流量与降水量降水量 蒸发量与蒸发量与温度温度 2。线性简相关 图解法 相关分析法 图解法0 xy一元回归方程yx,(1)图解法图解法:y=a x+b当点据分布趋势明显,可采用目估作图的方法绘出一条相关直线,当点据分布趋势明显,可采用目估作图的方法绘出一条相关直线,让该条直线通过点群中间及(让该条直线通过点群中间及()点,在图上量得直线的斜率)点,在图上量得直线的斜率为为b,纵轴上的截距为,纵轴上的截距为ayx,0 xyiiyx,ix(x)iyyiy(2)相
15、关分析法相关分析法 1)直线回归方程)直线回归方程(Linear Regression Equation)a、b表达式yx,y=ax+b 最小二乘法最小二乘法若点据分布较分散,可采用若点据分布较分散,可采用先关分析法确定相关线的方先关分析法确定相关线的方程,即确定参数程,即确定参数a、b。若选择一条最佳配合线,其离差 平方和应最小,这种以利差平方和达到最小的条件来选择参数a、b的方法称为最小二乘法。iyxayb 2)()(xxyyxxaiii(3-29)推倒 a 与关系式xyiiiiiiiiiiiiiiinxxnyyyyxxyyxxnyynyyxxxxyyxxxxyyxxa1)(1)()()(
16、)(1)(1)()()()()()(22222_2_2_2_2_(3-30)a 回归系数回归系数(回归线的斜率(回归线的斜率)回归方程式)(xxryyxy(3-31)xryxyb=式中:式中:相相 关关 系系 数数 定量表示两种变量之间的密切程度。定量表示两种变量之间的密切程度。相关系数将公式(将公式(3-30)、()、(3-31)代入)代入 y=ax+b,有:,有:(3-32)0 xyiiyx,ix(x)iyyiy(3)回归方程的误差回归方程的误差 标准误差标准误差均方误均方误(Sy):):2)(12nyySniiy(3-33)图示回归方程误差21 rSyy(3-34)或:或:n-2n-2称
17、为自由度。回归线的误差一般服从正态分布。称为自由度。回归线的误差一般服从正态分布。xyy=ax+b+3Syy=ax+by=ax+b-3SySySy3Sy3Sy68.3%99.7%相关系数误差nrsr21(3-35)相关系数的误差相关系数的误差 标准误差标准误差均方误均方误(sr):注意要点 同期观测资料不能太少,一般要求同期观测资料不能太少,一般要求n n1212,以减少抽样,以减少抽样 误差和提高成果的可靠性;误差和提高成果的可靠性;要求相关系数要求相关系数 0.8,且且Sy(10%15%);回归分析中,长系列为自变量,短系列为倚变量,回归分析中,长系列为自变量,短系列为倚变量,;外延回归线
18、至无实测点控制部分时,要注意考证。外延回归线至无实测点控制部分时,要注意考证。(4)ry 分析论证变量之间在物理成因上确实存在联系;分析论证变量之间在物理成因上确实存在联系;例题【例题例题】某站年降雨量与年径流量相关计算某站年降雨量与年径流量相关计算n=22,相关分析内容,公式计算)(xxryyxy2222)1()1()1)(1()()()(yxyxiiiiKKKKyyxxyyxxr1)1(1)1(22nKynKxyyxx直线回归扩充1)幂函数)幂函数一般形式有:一般形式有:2)指数函数)指数函数一般形式有:一般形式有:y=aebx 线性复相关mmxaxaxaay22110 式中式中a0,a1
19、,a2,am 为为m+1个待定的系数。个待定的系数。设在设在 t 时刻,有:时刻,有:mtmtttxaxaxaay22110 t=1,2,n Y=XAmmnnmmnaaaAxxxxxxXyyyY10121211121111YXXXATT1)(依据最小二乘法原理,得:依据最小二乘法原理,得:若若(XTX)是非奇异矩阵,解向量是非奇异矩阵,解向量A就是唯一的。就是唯一的。矩阵:矩阵:Y=X A例题矛盾 /普通意义【例题例题】某地区径流量、降雨量和湿度饱和差资料某地区径流量、降雨量和湿度饱和差资料 设:设:tttxaxaay22110(t=1,2,13)Y=X A矩阵:矩阵:XTXYXXXATT1)(74.449-0.40075119.51=所求回归方程为:所求回归方程为:y=119.51+0.4x174.45x2 (XT X)=444.711677569.29167754337353745369.29745313 End即为非奇异矩阵即为非奇异矩阵