1、 4.3 协方差和相关系数协方差和相关系数 对两个随机变量对两个随机变量X 和和Y来说来说E(X)和和E(Y),D(X)和和D(Y),分别,分别刻划了刻划了X 和和Y 本身的特征,却不能反映出本身的特征,却不能反映出X 和和Y 之间的关系在之间的关系在前两节曾讨论过当前两节曾讨论过当X、Y 相互独立时,有相互独立时,有 E(XY)= E(X)E(Y),而,而 D(XY)=E(XY)E(XY)2 =E(XE(X)Y E(Y)2 =EXE(X)22EXE(X)YE(Y) EY E(Y)2 = D(X)D(Y) 其中其中 EXE(X) Y E(Y) = E(XY) E(X)E(Y)=0 一般情况一般
2、情况EXE(X) YE(Y)0,即这个数值反映了,即这个数值反映了X、Y之间的某种关系,这就引出了协方差的概念之间的某种关系,这就引出了协方差的概念 定义定义 设设X、Y为两个随机变量,若为两个随机变量,若EXE(X) YE(Y) 存存在,则称之为在,则称之为X、Y 的的协方差协方差,记为,记为Cov(X, Y)。或。或XY 即即 Cov(X, Y) = EX E(X) Y E(Y) 由前可知由前可知 Cov(X, Y) = E(XY) E(X)E(Y)而而 Cov(X, X)= E(X 2) E(X) 2=D(X) 可见可见方差是协方差的一个特例方差是协方差的一个特例 由数学期望的性质不难验
3、证协方差有以下性质:由数学期望的性质不难验证协方差有以下性质: (1) Cov(X, Y)= Cov(Y, X) (2) Cov(aX, bY)= abCov(X, Y),其中,其中a、b为常数为常数 (3) Cov(X1X2, Y) = Cov(X1, Y) Cov(X2, Y) 在统计学中更常用的是在统计学中更常用的是“标准化标准化”的协方差的协方差, 即刻划随机变即刻划随机变量量X、Y之间线性相关程度的一个数值之间线性相关程度的一个数值相关系数相关系数 定义定义 若若X、Y为两个随机变量,且为两个随机变量,且D(X)、D(Y)(0, +),则,则)()(),(YDXDYXCovXY 称为
4、称为X、Y的的相关系数相关系数. 也可记作也可记作).,(YX 定理定理 设设XY 为随机变量为随机变量X、Y 的相关系数,则有:的相关系数,则有:1| )1( XY . 11| )2( baXYPbaXY使使、存在常数存在常数 证明证明 对任意实数对任意实数 ,有,有 D(YX)=D(Y)D(X)2Cov(Y,X) =D(Y) 2D(X) 2Cov(X, Y)YYXYXX 22,时时当当XXXYb )1()(2YYXXXYYYbXYD )1(2XYYY 由方差的非负性知由方差的非负性知012 XY 。即即1| XY 还可知还可知由由)1()(2XYYYbXYD 0)(1| bXYDXY 由方
5、差的性质由方差的性质410)( abXYPbXYD. 11| baXYPbaXY使使、存在常数存在常数 不难证明不难证明, 对随机变量对随机变量X和和Y, 下面的事实是等价的下面的事实是等价的 (1) Cov(X, Y)= 0 (2) X 和和Y不相关不相关 (3) E(XY) E(X)E(Y) (4) D(XY)= D(X)D(Y) 独立和不相关是不同的概念但两者又有联系独立和不相关是不同的概念但两者又有联系, 独立比不相独立比不相关要更强关要更强, 这一点从下面的性质里可以看到:这一点从下面的性质里可以看到: 性质性质如果随机变量如果随机变量X 和和Y互相独立,则互相独立,则X 和和Y不相
6、关不相关 可见独立性隐含了不相关性,但反之不然,有下例说明可见独立性隐含了不相关性,但反之不然,有下例说明 例例1 若若X、Y 的联合概率密度函数的联合概率密度函数不不相相关关。、时时,称称YXXY0 .,0, 1,1),(22其其他他yxyxf 试验证:试验证:X、Y不相关,但不相关,但X、Y不是相互独立的不是相互独立的 dydxyxxfdxxxfXEX),()()(证证明明: 1111220 xxdyxdx 0),()()(dxdyyxyfdyyyfYEY0),()(111122 xxdxdyxydxdyyxxyfXYE 0)()()(),( YEXEXYEYXCov., 0不相关不相关与
7、与即即从而从而YXXY dyyxfxfX),()(而而 22112, 0,121xxxdy ., 1|其其他他 x f(x, y)fX(x)fY(y),即,即X、Y不相互独立不相互独立 dxyxfyfY),()( 22112, 0,121yyydx .,1|其其他他 y);,;,(),(222211 NYX 2222212121212)()(2)()1(21221121),( yyxxeyxf yx,XY 例例2 设,它的概率密度为,它的概率密度为其中其中,求相关系数,求相关系数)(21)(21212)(1 xexfxX )(21)(22222)(2 yeyfyY ,)(,)(21 YEXE,
8、)(,)(2221 YDXD)()(),(YEYXEXEYXCov dxdyyxfyx),()( )(21 解解 故故 dxdyeyxyyxx2222212121212)()(2)()1(2121221)(121 ,11 xu.22 yv dudvuveYXCovvuvu)2()1(2122122212),( 令令则则 dvduuvevvu12)1()()1(212212222 ddueuvevuv1212222)()1(2122121 其中其中 duuevu22)()1(212121 )1( ,(22 vN. v 恰好是服从正态分布恰好是服从正态分布的随机变量的期望值的随机变量的期望值因此因
9、此 dvevYXCovv2212212),( )|21(222212121dvevevv 21 所以所以 XY而在第三章曾证明了若而在第三章曾证明了若),;,;,(),(222211 NYX . 0 则则X和和Y相互独立的充要条件是相互独立的充要条件是 因此,因此,对于二维正态分布相互独立与不相关是等价的对于二维正态分布相互独立与不相关是等价的。 ),3 , 1(2NX),2 , 0(2NY. 5 . 0 XY ,32YXZ ),(ZE),(ZD),(ZXCov.XZ 例例3 已知随机变量已知随机变量求求. 5 . 0, 4)(, 9)(, 0)(, 1)( XYYDXDYEXE 3)()(),( YDXDYXCovXY )32()(YXEZE 2)(3)(2 YEXE)32()(YXDZD )3 ,2(2)3()2(YXCovYDXD ),(322)(9)(4YXCovYDXD 解解 这里这里所以所以36)3(124994 )32 ,(),(YXXCovZXCov )3 ,()2 ,(YXCovXXCov ),(3),(2YXCovXXCov 5 . 0639)()(),( ZDXDZXCovXZ 9)3(392