1、14 多维随机变量的特征数这一节里, , 我们考察跟多维随机变量相关的有关特征数的计算. .这里面, , 除了我们熟知的各个分量的数学期望和方差外, , 我们将介绍刻画两个变量之间相关关系的特征数: : 协方差以及. .我们还简要介绍多维随机变量作为一个整体( (即向量) )时的数学期望及协方差矩阵. . 2整体概述概述二点击此处输入相关文本内容概述一点击此处输入相关文本内容概述三点击此处输入相关文本内容31. 多维随机变量函数的数学期望与一维随机变量函数的数学期望类似, , 我们可以直接应用公式求多维随机变量函数的数学期望, , 而不必去先求该多维随机变量函数的分布. . 连连续续若若离离散
2、散若若),( ,),(),(),( , ),(),(),()(11YXdxdyyxpyxgYXyYxXPyxgYXgEZEijjiji的的数数学学期期望望为为则则表表示示或或密密度度函函数数的的概概率率分分布布用用分分布布律律若若),(,),(),( ),(YXgZyxpyYxXPYXji 4例一).( ,)1 , 0(,22YXENYX 试求试求分布分布且分别服从且分别服从为相互独立的随机变量为相互独立的随机变量设设解:密密度度函函数数为为的的联联合合则则且且为为相相互互独独立立因因),(),1 , 0(),1 , 0( , YXNYNXYX)(21 2 2 222221 2121),(yx
3、yxeeeyxp 5 dxdyeyxyx)(21 222221 dxdyyxpyxYXE),()(,2222故故 02021 221 rdrdrer sin ,cos:ryrx 作极坐标变换作极坐标变换6 0222drerr22 02 2220drererr72. 数学期望与方差的性质在第二章里我们给出了基于一个变量的数学期望和方差的一些性质, , 这里我们给出涉及到多个变量时, , 数学期望和方差的一些运算性质. .注意: 对于这些性质的证明, 我们仅给出连续型情形的证明, 离散型情形大家可仿而证之.)()()()( , ,).()()( ,:1212121nnnXEXEXEXXXEXXXn
4、YEXEYXEYX 有有个随机变量个随机变量对任意对任意一般地一般地则有则有是两个随机变量是两个随机变量设设性质性质8).(),(,),(),ypxpYXyxpYXYX为为的的边边际际密密度度的的联联合合密密度度为为证证明明:设设( dydxyxpydxdyyxpx),(),( dxdyyxpyxYXE),()()(EYEX dyyypdxxxpYX)()(9故故相互独立,则相互独立,则与与证明:因证明:因).()(),(ypxpyxpYXYX dxdyypxxypYX)()( dxdyyxpxyXYE),()()(EYEX dyyypdxxxpYX)()()()()()( , ,)(,:22
5、12121nnnXEXEXEXXXEXXXEYEXXYEYX 则则有有相相互互独独立立若若一一般般地地相相互互独独立立,则则若若性性质质10)(2)()()( ,:3EYYEXXEYVarXVarYXVarYX 对于任意随机变量对于任意随机变量性质性质有有独立时独立时与与特别地,当特别地,当,YX)()()(YVarXVarYXVar 有有相相互互独独立立时时当当一一般般地地,21nXXX)()()()(2121nnXVarXVarXVarXXXVar 11)()(2)(22EYYEYYEXXEXXE )(2)()(EYYEXXEYVarXVar )( :2YXEYXEY) Var(X 证证明
6、明)()()( YVarXVarYXVar )(EXEYYEXXEYXYE )( ,EYYEXXEYX 相相互互独独立立时时当当02 EXEYEXEYEXEYEXEYEXEYXYE 2)(12例二. 求掷n颗骰子出现点数之和的数学期望和方差.2/7)654321(6/1)(, iXE所所以以的分布为的分布为则则颗骰子得到的点数颗骰子得到的点数为掷第为掷第令令iiXiX,解: 612123561)27()(iiiXVarXi123456P1/61/61/61/61/61/613所所以以相相互互独独立立因因,21nXXX niiniinXEXE1127)( niiniinXVarXVar11123
7、5)(14例三(二项分布). ).(),(),(XDXEpnbX求求设设则则发生的次数为发生的次数为成功成功次试验次试验现记第现记第发生的次数发生的次数成功成功次独立的伯努利试验中次独立的伯努利试验中是是的定义知的定义知由二项分布变量由二项分布变量, 2 , 1 , .,niXinXXi nXXXX 21解: 可以根据X的分布律直接按E(X), D(X)的定义求, 这种方法可以得到结果, 但过程比较繁琐. 现介绍一条简便途径.1)0( ,)1( ,10pXPpXPXiii 其分布律为其分布律为分布分布服从服从且且15所以根据方差的性质有所以根据方差的性质有npXEXEXEXEn )()()()
8、(21).1()( ,)( ppXVarpXEii 本本节节例例二二已已求求出出)1(pnp )()(21nXXXVarXVar )1()1()1(pppppp )()()(21nXVarXVarXVar 163. 协方差(Covariance)上节已谈到, , 如果X X和Y Y相互独立, , 则0)( EYYEXXE.)(.,0)(,协协方方差差介介绍绍的的就就是是我我们们要要而而是是有有一一定定的的关关系系的的不不相相互互独独立立与与时时当当所所以以说说EYYEXXEYXEYYEXXE 17定义: 即即记为记为的协方差的协方差与与称为随机变量称为随机变量量量 ).,(,)( YXCovY
9、XEYYEXXE )(),(EYYEXXEYXCov 18则有则有时时或当或当时时即当即当时时有同方向线性变化关系有同方向线性变化关系当当, EYYEXXEYYEXXYX 0),( , 0)( YXCovEYYEXXE即即:),()1(个个指指标标之之间间线线性性协协同同关关系系的的一一与与是是刻刻画画YXYXCov.,| ),(| ;),(,变化关系越强变化关系越强则说明相应的线性则说明相应的线性越大越大还是反方向线性变化还是反方向线性变化究竟是同方向线性变化究竟是同方向线性变化与与的正负反映了的正负反映了所以所以YXCovYXYXCov 关于定义的说明:则有则有时时或当或当时时即当即当时时
10、有反方向线性变化关系有反方向线性变化关系当当, EYYEXXEYYEXXYX 0),( , 0)( YXCovEYYEXXE即即19., .,0),()2(没没有有任任何何关关系系间间独独立立是是指指而而间间没没有有线线性性关关系系关关是是指指不不相相通通俗俗来来讲讲独独立立是是两两个个不不同同的的概概念念与与不不相相关关不不相相关关与与称称时时当当YXYXYXYXYXYXYXYXCov 20EXEYXYEYXCov )(),( 协方差的简便计算公式:)(),( :EYYEXXEYXCov 证明证明)()()()(YEXEXYEYXEXYE EXEYXYE )(21 从定义立即可知协方差具有以
11、下的重要性质:)(),( ),(),( (1)XVarXXCovXYCovYXCov ),(2)()()( 2)(YXCovYVarXVarYXVar 协方差的性质 ),(),( (3)YXabCovbYaXCov ),(),(),( 4)(2121YXCovYXCovYXXCov ),(),(),(2121YXCovYXCovYYXCov 22例四. ).,()2( );32()1(:, 5)(),4 , 2(),9 , 2( YXYXCovYXVarXYEUYNX 求求已已知知 422, 361)1()(, 1 , 9)(, 2:dxxYVarEYXVarEX解解3125)(),( EXE
12、YXYEYXCov)3 ,2(2)(9)(4)32( )1(YXCovYVarXVarYXVar 273123994 23),( )2(YXYXCov ),(),(YXYCovYXXCov )()(YVarXVar 6 ),(),(),(),(YYCovXYCovYXCovXXCov 24例五 ).,(),(),(:, 0, 10 ,| , 1),( ),(YXCovYEXExxyyxpYX求求其其它它概概率率密密度度设设 25,32dyxdxdxdy)y, x(xf)X(Exx10 xx10, 0ydydxdxdy)y, x(yf)Y(E xx10. 0ydyxdxdxdy)y, x(xyf
13、)XY(E. 0)()()(),( YEXEXYEYXCov26. ; 0),(, 5)(但反之未必成立但反之未必成立相互独立时相互独立时当当 YXCovYX之间的独立性之间的独立性并讨论并讨论求求YXYXCov, ),(例六. 设(X,Y)的分布律为Y X-2-112101/41/4041/4001/427jippYX , 的的边边缘缘分分布布先先求求解:X Y-2-112pi101/41/401/241/4001/41/2pj1/41/41/41/4, 041241141)1(41)2(, iiipxEX所所以以28,25214211 jjjpyEY041841)8(41141)1( )(
14、 ijijjipyxXYE., 不相关不相关所以所以YX, 0)(),( , EXEYXYEYXCov所以所以29但是但是有有独立当且仅当对任意独立当且仅当对任意, , ,jiijpppjiYX ., 不不独独立立所所以以本本题题中中YX.,.,2是一种非线性关系是一种非线性关系在本题中在本题中事实上事实上但可能有其它的关系但可能有其它的关系没有线性关系没有线性关系之间之间这说明这说明但不独立但不独立不相关不相关本题中本题中综上所述综上所述XYYXYX 81)1()2(0)1, 2( YPXPYXP304. 相关系数(Correlation Coefficient)我们有了协方差来描述两个变量
15、之间的线性相关关系, ,为什么又要定义相关系数呢? ?.),(,:,),(的的数数值值也也跟跟着着变变化化则则量量纲纲选选得得不不同同如如果果的的量量纲纲的的影影响响受受到到这这是是因因为为YXCovYXYXYXCov所以, , 为了消除量纲的影响, ,我们基于协方差构造了一个新的概念: :相关系数. .31定义: 则称则称且且是一个二维随机向量是一个二维随机向量设设, 0)(, 0)(,),( YVarXVarYX)()(),(),(YVarXVarYXCovYXCorr .)(相关系数相关系数线性线性的的与与为随机变量为随机变量YX32)(* ,)(* :,YVarEYYYXVarEXXX
16、YX 的的标标准准化化随随机机变变量量若若考考虑虑1*)(*)( , 0*)(*)( YVarXVarYEXE则则.*,),(的协方差的协方差就是标准化变量就是标准化变量即相关系数即相关系数YXYXCorr),( )()(),()()( *)*( *)(*)()*()*, *( ,YXCorrYVarXVarYXCovYVarEYYXVarEXXEYXEYEXEYXEYXCov 所所以以33 相关系数Corr(X,Y)有下列重要性质:1;| ),(| (1) YXCorr. 1, 11| ),(| 2)(概概率率为为具具有有线线性性关关系系的的与与即即使使得得数数充充分分必必要要条条件件是是存
17、存在在常常YXbaXYPa,b,YXCorr 相关系数的性质 34)()(),( ,:)-(2YVarXVarYXCovYXYX 则则有有的的方方差差均均存存在在与与若若对对于于任任意意随随机机变变量量施施瓦瓦茨茨不不等等式式柯柯西西又又因因为为有有则则对对于于任任意意, 0)(, tut )()()(:2EYYEXXtEtu 令令简单证明简单证明性质(1)的证明需要如下的柯西-施瓦茨不等式:., 0)()(4),(2,2整理即得证整理即得证所以所以 YVarXVarYXCov )(),(2)()(2YVarYXtCovXVarttu 35 0, 10 , 1|)()(),(),(,aaaaY
18、VarXVarYXCovYXCorr所以所以 )(),( ),()( ,2XaVarYXCovXVaraYVarbaXY 则则因因为为性质(1)的证明: 利用柯西-施瓦茨不等式即得. . 1| ),(| , YXCorr所以所以性质(2)的证明: 首先证充分性:36 0),(211),(211,2 ,1),()1( YXYXYXYXYXYXYXCorrYXCovYXCovYVarXVarYXVarYXCorr 有有时时当当)(, )(YVarXVarYX 令令再证必要性:371, cYXPYX 所所以以有有.1,1),(,线线性性相相关关以以概概率率与与时时当当所所以以YXYXCorr 1 Y
19、XYcXYP 即即1 , 0 ,1),()2( YXYYXcXYPYXVarYXCorr 进进而而有有类类似似可可算算出出时时当当38 相关系数Corr(X,Y)是刻划X与Y间线性相关程度的数字特征, 常称为线性相关系数. 一般而言, |Corr(X,Y) |越大, 表明X与Y间线性关系越密切, 当|Corr(X,Y)|=1时, X与Y在概率意义上完全相关: Corr(X,Y)=1时, 称X与Y完全正相关; Corr(X,Y)=-1时, 称X与Y完全负相关. Corr(X,Y)=0时, 称X与Y不相关, 此时, X与Y之间没有线性关系(但可能存在其它曲线关系).相关系数性质的说明: 39例七
20、.),(,2 , 0),sin(,sin,2 , 0的相关性的相关性与与并讨论并讨论试求试求为常数为常数且且上的均匀分布上的均匀分布服从区间服从区间设随机变量设随机变量YXYXCorraaZYZXZ 20 ,21)( : zzpZ解解 021)sin()(sin()( 021)sin()(sin)( 2020 dzazaZEYEdzzZEXE所以所以402121)2cos1(2121sin)(202022 dzzdzzXE 21)2cos(1(212121)(sin)(202022 dzazdzazYEadzazadzazzXYEcos2121)2cos(cos(21 21)sin(sin)(
21、2020 cos2/12/1cos21)()(),(),(,aa/YVarXVarYXCovYXCorr 所所以以41XZaZYYXYXCorra sin)sin(, , 1),(, 2 , 0)1(此时此时事实上事实上完全正相关完全正相关此时此时时时当当 sin)sin( , 1),(, (2)XZZYYXYXCorra 事事实实上上此此时时完完全全负负相相关关此此时时时时当当1)(sinsin,., 0),(,232)3(2222 aZZYXYXYXYXCorra因为此时因为此时并不独立并不独立但此时但此时不相关不相关此时此时时时或或当当 关于相关性的一些讨论:42例(p174). 若 (
22、X,Y)服从二维正态分布, 其概率密度为 222221121122212 )1(21exp121),( yyxxyxp),(YXCorrYX的相关系数的相关系数和和求求43),( ),( ),( ,2 :222211 NYNXYX的的边边际际分分布布为为节节已已知知从从本本章章第第解解222121)( ,)( , , , YVarXVarEYEX所以所以dydxxxyyx 2121211222212212)()1(21exp )(121 ) ,11(1111222 xuxyt令令 dxdyyxpyxYXCov),()(),(21 44问题提问与解答问答HERE COMES THE QUESTION AND ANSWER SESSION45感谢参与本课程,也感激大家对我们工作的支持与积极的参与。课程后会发放课程满意度评估表,如果对我们课程或者工作有什么建议和意见,也请写在上边结束语46感谢观看The user can demonstrate on a projector or computer, or print the presentation and make it into a film