1、随机变量及其联合分布边际分布与随机变量的独立性随机变量函数的分布随机变量的特征数条件分布与条件期望3.3.1 多维随机变量 定义3.1.1 若X,Y是两个定义在同一个样本空间上的 随机变量,则称(X,Y)是两维随机变量.同理可定义 n 维随机变量(随机向量).定义3.1.2 F(x,y)=P(X x,Y y)为(X,Y)的联合分布函数.(以下仅讨论两维随机变量)任对实数 x 和 y,称注意:F(x,y)为(X,Y)落在点(x,y)的左下区域的概率.x1x2(x1,x2)(1)F(x,y)关于 x 和 y 分别单调增.(2)0 F(x,y)1,且F(,y)=F(x,)=0,F(+,+)=1.(3
2、)F(x,y)关于 x 和 y 分别右连续.(4)当ab,cd 时,有F(b,d)F(b,c)F(a,d)+F(a,c)0.注意:上式左边=P(aXb,cY d).(单调性)(有界性)(右连续性)(非负性)二维离散随机变量 3.1.3 联合分布列若(X,Y)的可能取值为有限对、或可列对,则称(X,Y)为二维离散随机变量.称pij=P(X=xi,Y=yj),i,j=1,2,.,为(X,Y)的联合分布列,其表格形式如下:Yy1 y2 yj x1x2xi p11 p12 p1j p21 p22 p2j pi1 pi2 pi j (1)pij 0,i,j=1,2,(2)pij =1.(非负性)(正则性
3、)(1)确定随机变量(X,Y)的所有取值数对.(2)计算取每个数值对的概率.(3)列出表格.例3.1.1 将一枚均匀的硬币抛掷4次,X表示正面向上的次数,Y表示反面朝上次数。求(X,Y)的联合分布列.X Y0 41 3 2 2 3 14 0P(X=0,Y=4)=1340.5 0.5C P(X=2,Y=2)=22240.50.5C=1/4=6/16 P(X=3,Y=1)=33140.50.5C=1/4 P(X=4,Y=0)=0.54=1/16P(X=1,Y=3)=0.54=1/16解:概率非零的(X,Y)可能取值对为:其对应的概率分别为:X01234Y 0 1 2 3 4列表为:0 0 0 0
4、1/16 0 0 0 1/4 0 0 0 6/16 0 0 0 1/4 0 0 01/16 0 0 0 0例3.1.2 设随机变量 Y N(0,1),120,|10,|2,1,|11,|2YYXXYY解:(X1,X2)的可能取值数对及相应的概率如下:P(X1=0,X2=0)=P(|Y|1,|Y|2)=P(|Y|2)=2 2(2)=0.0455P(X1=0,X2=1)=P(|Y|1,|Y|2)=P(1|Y|2)=2(2)(1)=0.2719P(X1=1,X2=0)=P(|Y|1,|Y|2)=0P(X1=1,X2=1)=P(|Y|1,|Y|2)=P(|Y|1)=0.6826求 的联合分布列.列表为
5、:X1 0 1X2 0 10.0455 0.2719 0 0.6826设随机变量 X 在 1,2,3,4 四个整数中等可能地取值,另一个随机变量 Y 在 1到X 中等可能地取一整数值。试求(X,Y)的联合分布列.设二维随机变量(X,Y)的分布函数为 F(x,y),若存在非负可积函数 p(x,y),使得则称(X,Y)为二维连续型随机变量。-(,y)=(,)xyF xp u v dvdu称p(x,y)为联合密度函数。(1)p(x,y)0.(非负性)(2)-(,)d d1p x y x y 注意:(,)(,)d dDP X YDp x yx y(正则性)一、多项分布 若每次试验有r 种结果:A1,A
6、2,Ar记 P(Ai)=pi,i=1,2,r记 Xi 为 n 次独立重复试验中 Ai 出现的次数.则(X1,X2,Xr)的联合分布列为:1211221212!(,.,)=!rnnnrrrrnP XnXnXnp ppn nn从中任取 n 只,记 Xi 为取出的n 只球中,第i 种球的只数.口袋中有 N 只球,分成 r 类。第 i 种球有 Ni 只,N1+N2+Nr=N.则(X1,X2,Xr)的联合分布列为:12121122(,.,)=rrrNNNnnnNnP XnXnXn若二维连续随机变量(X,Y)的联合密度为:1,(,)(,)0DSx yDp x y,其 它则称(X,Y)服从 D 上的均匀分布
7、,记为(X,Y)U(D).其中SD为D的面积.若二维连续随机变量(X,Y)的联合密度为:21222121222212121(,)21()()()()1exp22(1)p x yxyxy 则称(X,Y)服从二维正态分布,记为 (X,Y)N().221212,若(X,Y)(23),0,0(,)0,xyAexyp x y其 它试求常数 A.解:1(,)d dp x y x y(23)00d dxyAex y 所以,A=62300ddxyAexey23110023xyAee=A/6若(X,Y)(23)6,0,0(,)0,xyexyp x y其 它试求 P X 2,Y 1.解:P X2,Y1212,1(
8、,)d dxyp x yx yx2,y121(23)00d6dxyxey2123006ddxyexey23211160023xyee 4311ee若(X,Y)(23)6,0,0(,)0,xyexyp x y其 它试求 P(X,Y)D,其中D为 2x+3y6.322x+3y=6(,)P X YD2x 3y 6(,)d dp x yx y013(6 2)(23)300d6dxxyxey3230(62)/3016d3xyxeex32602()dxeex617e解:问题:已知二维随机变量(X,Y)的分布,如何求出 X 和 Y 各自的分布?巳知(X,Y)的联合分布函数为 F(x,y),则 Y FY(y)
9、=F(+,y).X FX(x)=F(x,+),巳知(X,Y)的联合分布列为 pij,则 X 的分布列为:1()ijjiiippP Xxp Y 的分布列为:1()ijijjjppP YypXY12jyyy12ixxx111212122212jjiiijppppppppp ip12ipppjp12jppp巳知(X,Y)的联合密度函数为 p(x,y),则 X 的密度函数为:()(,)dp xp x y y Y 的密度函数为:()(,)dp yp x y x 由联合分布可以求出边际分布.但由边际分布一般无法求出联合分布.所以联合分布包含更多的信息.二维正态分布的边际分布是一维正态:若(X,Y)N(),
10、221212,则 X N(),211,Y N().222,二维均匀分布的边际分布不一定是一维均匀分布.设(X,Y)服从区域 D=(x,y),x2+y2 1时,p(x,y)=0,所以 p(x)=0当|x|1时,22111d()xxyp x221x不是均匀分布 设二维随机变量(X,Y)的密度函数为,0(,)0,yexyp x y其他求概率PX+Y1.解:PX+Y1=y=xx+y=11/21/210ddxyxxey11212ee 若满足以下之一:i)F(x,y)=FX(x)FY(y)ii)pij=pipj iii)p(x,y)=pX(x)pY(y)则称 X 与Y 是独立的,(1)X 与Y是独立的其本
11、质是:,P aXb cYdP aXb P cYd任对实数a,b,c,d,有(2)X 与Y 是独立的,则g(X)与h(Y)也是独立的.(X,Y)的联合分布列为:X01Y 0 1 0.3 0.4 0.2 0.1问 X与Y 是否独立?解:边际分布列分别为:X 0 1P 0.7 0.3Y 0 1P 0.5 0.5因为(0,0)0.3P XY(0)(0)0.70.50.35P XP Y所以不独立已知(X,Y)的联合密度为,0,0;(,)0,.xyexyp x y 其 他问 X 与Y 是否独立?()0d0()00 x yxeyexp xx,0()0,0yeyp yy所以X 与Y 独立。注意:p(x,y)可
12、分离变量.解:边际分布密度分别为:(1)(X,Y)服从矩形上的均匀分布,则X与Y 独立.(2)(X,Y)服从单位圆上的均匀分布,则 X与Y 不独立.见前面例子(3)联合密度 p(x,y)的表达式中,若 x 的取值与 y 的 取值有关系,则 X与Y 不独立.(4)若联合密度 p(x,y)可分离变量,即 p(x,y)=g(x)h(y)则 X与Y 独立。(习题3.2 16题)(5)若(X,Y)服从二元正态 N()则 X与Y 独立的充要条件是 =0.221212,问题:已知二维随机变量(X,Y)的分布,如何求出 Z=g(X,Y)的分布?(1)设(X1,X2,Xn)是n维离散随机变量,则 Z=g(X1,
13、Xn)是一维离散随机变量.(2)多维离散随机变量函数的分布是容易求的:i)对(X1,X2,Xn)的各种可能取值对,写出 Z 相应的取值.ii)对Z的 相同的取值,合并其对应的概率.设X与Y 独立,且 X,Y 等可能地取值 0 和1.求 Z=max(X,Y)的分布列.解:X 0 1P 1/2 1/2Y 0 1P 1/2 1/2Z=max(X,Y)的取值为:0,1P(Z=0)=P(X=0,Y=0)=P(X=0)P(Y=0)=1/4P(Z=1)=P(X=0,Y=1)+P(X=1,Y=0)+P(X=1,Y=1)=3/4设 X1,X2,Xn,独立同分布,其分布函数和密度函数分别为 FX(x)和 pX(x
14、).若记Y=max(X1,X2,Xn),Z=min(X1,X2,Xn)则 Y 的分布函数为:FY(y)=FX(y)n Y 的密度函数为:pY(y)=nFX(y)n1 pX(y)Z 的分布函数为:FZ(z)=11 FX(z)n Z 的密度函数为:pZ(z)=n1 FX(z)n1 pX(z)定理3.3.1 设连续随机变量X与Y 独立,则 Z=X+Y 的密度函数为()()()d =()()dZXYXYpzpx pzxxpzy pyy设离散随机变量 X 与 Y 独立,则 Z=X+Y 的分布列为11)()()()()(=liliiljjjP XxP YzxP XzyP YyP Zz X与Y 是独立同分布
15、的标准正态变 量,求 Z=X+Y 的分布.()()()dZXYpzpx pzxx解:2211()expexp2222dxzxx21exp2222z所以 Z=X+Y N(0,2).进一步的结论见后若同一类分布的独立随机变量和的分布仍是此类分布,则称此类分布具有可加性.若 X b(n1,p),Y b(n2,p),注意:若 Xi b(1,p),且独立,则 Z=X1+X2+Xn b(n,p).且独立,则 Z=X+Y b(n1+n2,p).若 X P(1),Y P(2),注意:X Y 不服从泊松分布.且独立,则 Z=X+Y P(1+2).若 X N(),Y N(),注意:X Y 不服从 N().211,
16、222,且独立,则 Z=X Y N().221212,221212,X Y N().221212,独立正态变量的线性组合仍为正态变量.(见下)Xi N(i,i2),i=1,2,.n.且 Xi 间相互独立,实数 a1,a2,.,an 不全为零,则22111,iiinniiiniiiaaa XN若 X Ga(1,),Y Ga(2,),注意:X Y 不服从 Ga(12,).且独立,则 Z=X+Y Ga(1+2,).若 X 2(n1),Y 2(n2),注意:(1)X Y 不服从 2 分布.且独立,则 Z=X+Y 2(n1+n2).(2)若 Xi N(0,1),且独立,则 Z=2(n).21niiX(1
17、)独立的0-1分布随机变量之和服从二项分布.(2)独立的指数分布随机变量之和服从伽玛分布.设 X 与 Y 独立,XU(0,1),YExp(1).试求 Z=X+Y 的密度函数.解:11,01()0,xXp x其 它2,0()0,0yeyYpyy12()()()dZp zp x p zx x被积函数的非零区域为:0 x0用卷积公式:(见下图)xz1z=x因此有(1)z 0 时pZ(z)=0;(2)0 z 1 时()0d1zz xzexe pZ(z)=(3)1 z 时pZ(z)=1()0d(1)z xzexee1已知(X,Y)的分布,(X,Y)的函数 求(U,V)的分布.12(,)(,)Ug X Y
18、VgX Y有连续偏导、存在反函数则(U,V)的联合密度为若12(,)(,)ug x yvgx y(,)(,)xx u vyy u v(,)(,),(,)|UVXYpu vpx u vy u vJ其中J为变换的雅可比行列式:1(,)(,)(,)(,)x yu vJu vx y可增补一个变量V=g2(X,Y),若要求 U=g1(X,Y)的密度 pU(u),先用变量变换法求出(U,V)的联合密度pUV(u,v),用此方法可以求出卷积公式、积的公式、商的公式然后再由联合密度pUV(u,v),去求出边际密度pU(u)本节主要给出 X 与 Y 的相关系数定理 3.4.1 设(X,Y)是二维随机变量,Z=g
19、(X,Y),则E(Z)=Eg(X,Y)=(,)(,)(,)d dijijijg xypg xyp xyx y 在长为 a 的线段上任取两点 X 与 Y,求两点间的平均长度.求 E(|XY|)1.E(X+Y)=E(X)+E(Y)2.当X与Y独立时,E(XY)=E(X)E(Y),(性质3.4.1)(性质3.4.2)1.Var(XY)=Var(X)+Var(Y)2EXE(X)YE(Y)3.当X与Y独立时,EXE(X)YE(Y)=0.4.当X与Y独立时,Var(X Y)=Var(X)+Var(Y).2.EXE(X)YE(Y)=E(XY)E(X)E(Y)注意:以上命题反之不成立.定义3.4.1 称 Co
20、v(X,Y)=EXE(X)YE(Y)为 X 与 Y 的协方差.(4)Cov(X,Y)=Cov(Y,X).(性质3.4.7)(1)Cov(X,Y)=E(XY)E(X)E(Y).(性质3.4.4)(2)若 X 与 Y 独立,则 Cov(X,Y)=0.(性质3.4.5)(6)Cov(aX,bY)=abCov(X,Y).(性质3.4.9)(3)Var(XY)=Var(X)+Var(Y)2 Cov(X,Y)(性质3.4.6)(5)Cov(X,a)=0.(性质3.4.8)(7)Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z).(性质3.4.10)X 与 Y 独立,Var(X)=6,Var(Y)=3
21、,则 Var(2XY)=().27 X P(2),Y N(2,4),X与Y独立,则 E(XY)=();E(XY)2=().422解:记“Xi=1”=“第 i 个人拿对自己的礼物”“Xi=0”=“第 i 个人未拿对自己的礼物”1,niiXX n 个人、n 件礼物,任意取.X 为拿对自已礼物的人数,求 E(X),Var(X)则因为 E(Xi)=1/n,所以 E(X)=1.又因为1Var()Var(,)2Cov(,)niiijijXXXX所以 E(XiXj)=1/n(n1),XiXjP0 111/n(n1)1/n(n1)由此得2Cov(11,)(1)ijXXn nn21(1)n n又因为2222Va
22、r(111)()iiiXE XnE Xnnn所以先计算 E(XiXj),XiXj的分布列为122Var()Var()2Cov(,)11 2(1)niiijijijXXXXnnnn n21122(1)nnnn n 111nnn所以定义3.4.2 称 Corr(X,Y)=为 X 与 Y 的相关系数.Cov(,)Var()Var()X YXY若记*,()()Var()Var()XYXE XYE YXY则*Corr(,)Cov(,)XYXY(1)施瓦茨不等式 Cov(X,Y)2 Var(X)Var(Y).(2)1 Corr(X,Y)1.(3)Corr(X,Y)=1X 与 Y 几乎处处有线性关系。(性质
23、3.4.11)(性质3.4.12)P(Y=aX+b)=1Corr(X,Y)的大小反映了X与Y之间的线性关系:Corr(X,Y)接近于1,X 与 Y 间 正相关.Corr(X,Y)接近于 1,X 与 Y 间 负相关.Corr(X,Y)接近于 0,X 与 Y 间 不相关.没有线性关系例3.4.1 设(X,Y)的联合分布列为X1 0 1Y 1 0 1 1/8 1/8 1/8 1/8 0 1/8 1/8 1/8 1/8 求 X,Y 的相关系数.解:()iijijE Xx p()ijijijE XYx y p=0同理22()iijijE Xx p=3/4E(Y)=E(X)=0另一方面=1/81/81/8
24、+1/8=0所以 Cov(X,Y)即 Corr(X,Y)=0E(Y2)=E(X2)=3/4=E(XY)E(X)E(Y)=0例3.4.2 (X,Y)p(x,y)=1(),02,0280 x yxy 其 它求 X,Y 的相关系数解:()()E XE Y22001()d d8xxyx y=7/6222001()d d8xxyx y=5/322()()E XE Y所以,Var(X)=Var(Y)=11/36()E XY 22001()d d8xyxyx y=4/34/37/67/6Corr(,)11/36X Y111 二维正态分布的特征数122212(,)(,),X YN (1)X N(1,12),Y
25、 N(2,22);(3)X,Y 独立 =0.(2)参数 为 X 和 Y 的相关系数;(4)不相关与独立等价.定义3.4.3 记称12(,)nXXXX,则12()(),(),()nE XE XE XE X1121212212Var()Cov(,)Cov(,)Cov(,)Var()Cov(,)Cov(,)Cov(,)Var()nnnnnXXXXXXXXXXXXXXX为X的协方差阵,记为Cov(),X或 定理3.4.2 协方差阵对称、非负定.称111212122212.nnnnnnR为X的相关矩阵.设 X N(0,1),Y N(0,1),Var(XY)=0,求(X,Y)的协差阵 .1111 设 X,
26、Y 的协差阵为11/31/31R94,416 求相关阵 R.对二维随机变量(X,Y),在给定Y取某个值的条件下,X的分布;在给定X取某个值的条件下,Y的分布.(1)条件分布列:|(|)iji jijjpP XxYypp(2)条件密度函数:(|)(,)()p x yp x yp y(3)条件分布函数:(,)()(|)(|)(|)diixxxxp t yp yP XxYyF x yp t y dtt定义 3.5.4(|)(|)(|)diiix P XxYyE X Yyxp x yxE(X|Y=y)是 y 的函数.所以记 g(y)=E(X|Y=y).进一步记 g(Y)=E(X|Y).定理 3.5.1()(|)E XE E X Y
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。