1、第十讲第十讲 方差与相关系数方差与相关系数 重点:重点:方差与相关方差与相关系数;系数; 难点:难点:方差与相关方差与相关系数。系数。本次课讲授第三章的本次课讲授第三章的3.2-3.43.2-3.4;下次课讲授下次课讲授4.1-4.5.4.1-4.5.下周上课时交作业下周上课时交作业P39-42P39-42页页,指指数数参参数数分分之之一一。加加均均匀匀一一半半几几何何分分布布倒倒概概率率;二二(项项)泊泊松松积积分分期期望望值值。连连续续变变量量乘乘密密度度,无无穷穷求求和和期期望望值值;离离散散变变量量乘乘概概率率,无无穷穷banp,可可减减独独立立积积常常数数不不变变系系数数提提,可可加
2、加求求和和二二重重积积。二二维维一一维维形形相相似似,两两次次函函数数期期望望值值,只只将将变变量量变变函函数数,就就得得一、方差与标准差一、方差与标准差第十讲第十讲 方差与相关系数方差与相关系数2.2.方差计算方差计算 )()()(XgEXEXEXD 2 由方差定义:由方差定义: 21:() ()()( )iiiXD XE g XxE Xp x例如,若 是离散变量,则称称为为变变量量的的离离差差差差离离差差:将将变变量量与与期期望望之之几几个个概概念念:EXX ) 1 (. 1.)()()()2(2EXXEXDXDXX即即:的的方方差差,记记作作为为的的离离差差平平方方的的数数学学期期望望方
3、方差差:称称)()()()()3(2XXDXDXXX,。即即或或均均方方差差。记记作作的的标标准准差差,又又称称的的方方差差的的算算术术平平方方根根为为标标准准差差:称称阶阶中中心心距距。方方差差都都非非负负;方方差差是是二二以以上上概概念念显显示示:方方差差均均 2() ()()( )XD XE g XxE Xf x dx若 是连续变量,则 2 2:() ()()( )()( ,)iXiiijiijXD XE g XxE XP xxE Xp x y若 是二维离散变量,则2 2 2(, )()() ()( )()( , )( )XX YD XEXE XxE Xfx dxxE Xf x y dx
4、dyD Y 若是二维连续随机变量,则同理,求第十讲第十讲 期望与方差期望与方差 22()()()D XE XE X 由于方差就是二阶中心矩,所以,方差计算还有更方便由于方差就是二阶中心矩,所以,方差计算还有更方便更常用的利用均值计算方差的公式更常用的利用均值计算方差的公式: :证明:证明: 2)()(XEXEXD 2 2)()(2XEXXEXE 22)()()(2)(XEXEXEXE 22)()(XEXE 解解 emmXPm!., 2, 1, 0m )(XE已已知知: emmXEmm022!11!1mmmme 例题例题10-1-110-1-1 设随机变量设随机变量 ,求方差求方差 D(X )。
5、 PX 3.例题讲解例题讲解1mk0!1kkkke eee011!1kkkkkke 1 21 22)()(XEXEXD )()()(222122XEXEvvuXD 实际上,实际上,第十讲第十讲 期望与方差期望与方差方差离差方期望,方期望减期望方。例题例题10-1-210-1-2,baUX设随机变量设随机变量 ,求方差求方差 D(X )。 ., 0;,1其它其它bxaabxf解解其密度函数为其密度函数为dxabxXEba )(.2ba dxabxXEba 22322baba4)(3222bababa12)(2ab 22)()(XEXEXD ,求其方差与标准差,求其方差与标准差服从指数分布服从指数
6、分布设随机变量设随机变量 eXX例题例题10-1-310-1-3 ., 0; 0, 其它其它xexfx解解 其密度函数为其密度函数为第十讲第十讲 期望与方差期望与方差 dxexXEx 022 23 22 2212 21 dtett0221 xt 22)()(XEXEXD 10 dxexXEx)(已知:已知:4.方差性质方差性质 )(2XDabaXD 1.1.定理(定理(1 1、2 2)证明 baXD 2 baXEbaXE 2)( bXaEbaXE 2)( XEXaE 22)(XEXaE 22)( XEXEa )(2XDa )()()3),()(20)(. 12XDaaXDXDbXDCD),推论
7、:第十讲第十讲 期望与方差期望与方差定理定理3)()()(YDXDYXDYX 独独立立,则则、若若. )()(, niiniinXDXDXXX1121独立,则独立,则推论:若推论:若)()()()()()()()()()()()()(YEXEYEXEXYEYEXEYEXEXYYXEYXEYXEYXD222222222222 证明:证明:)()()()()()()()()()()(YDXDYEXEYEXEYEYEXEXEYXDYX 222222独立,独立,、)()()(YDXDYXD 同理可证:同理可证:利用定理利用定理3 3,用归纳法可以证明以下推论,用归纳法可以证明以下推论口诀:方差:常数为
8、零系数方,独立加减都加上。口诀:方差:常数为零系数方,独立加减都加上。第十讲第十讲 期望与方差期望与方差 )()()()(,)(XXEXEZEZDZE 即即可可需需证证证证:由由定定义义和和题题设设,只只10 )()(XXEXE 0 )()()(XXEXE )()()(XXEXDZD )()(XXEXD2 )()(XXD2 122 )()(XX 5.标准变量的概念:标准变量的概念: 若随机变量若随机变量Z Z的均值为的均值为0, 0,方差为方差为1 1,则称,则称Z Z为标准变量。为标准变量。 现有任意随机变量现有任意随机变量X X,且它的标准差不等于,且它的标准差不等于0 0,证明:,证明:
9、的标准变量。的标准变量。为为XXXEXZ)()(的的标标准准变变换换。的的标标准准化化变变量量,又又称称为为其其中中:XXXXEX)()( 第十讲第十讲 期望与方差期望与方差分分布布为为且且,即即则则总总次次数数等等于于各各次次之之和和1-01iniiXXX. 例例10-1-4. 二项分布均值与方差二项分布均值与方差的均值与方差的均值与方差,求变量,求变量设设XpnBX),(0, 1, 1,2,iiAXiAin第 次试验事件 不发生;因此,设第 次试验事件 发生。其中, ( , ),(),( ),10,1,2,mmn mnX B n pP XmC p qpP AqpmnXnA 解:设则,;为
10、次独立试验中 发生的次数。XnAAAA因为 是 次独立试验 发生的总次数,它是每一次试验发生的次数之和,而每一次只有 发生一次或 发生两个事件第十讲第十讲 期望与方差期望与方差 .11npXEXEXEniinii ,1100222pXPXPXEiii ,1222pqppppXEXEXDiii 由于由于X1, X2,Xn相互独立,则相互独立,则 .11npqXDXDXDniinii npqXD 第十讲第十讲 期望与方差期望与方差指指数数期期望望再再平平方方泊泊松松不不变变二二乘乘加加减减都都加加上上。常常数数为为零零系系数数方方,独独立立方方差差:,q 独独立立且且niiXXXqXPpAPXP,
11、;)(2101 ,1100pXPXPXEiii 解解,1101-4 = 2()=3xdxx + y dy =() ()x + y f x, y dxdy 设二维随机变量设二维随机变量( X ,Y )在以点在以点(0,1),(1,0),(1,1)为顶点的三角形为顶点的三角形 区域区域 G 上服从均匀分布上服从均匀分布,求随机变量求随机变量 U=X+Y 的方差的方差. 例题例题10-1-5(2001) GyxGyxyxf),(,),(,),(02)()(YXEUE 22()= () EUE X+Y 2=()()x + yf x, y dxdyGdxdyyx)(21 yx第十讲第十讲 方差与相关系数
12、方差与相关系数,11201-11 = 2()=6xdxx + ydy221() =()-() =.18D UE UE U Gdxdyyx2)(2例例10-1-6(2004,4分)分)._ DXXPX的指数分布,则的指数分布,则服从参数为服从参数为设随机变量设随机变量 0, 00,1)(;0, 00,)(),(xxexFxxexfeXxx 则:则:分析:分析:)()( 11111 xFxXPXPDXXPX数数的的关关系系依依据据区区间间概概率率和和分分布布函函.1,12 DXEX且且第十讲第十讲 方差与相关系数方差与相关系数1111 ee)( 例例10-1-7(2008,4分)分)_12 EXX
13、PX的的泊泊松松分分布布,则则服服从从参参数数为为设设随随机机变变量量于于是是:且且服服从从泊泊松松分分布布得得分分析析:由由,21222 EXDXEXDXEXX1222122 eeXPEXXP !例例10-1-8(2010,4分)分)._)(.,! 2210XEkkCkXPX则则的的概概率率分分布布设设随随机机变变量量 ekkekkXPkkk 0210!,!。且且:想想到到泊泊松松分分布布分分析析:由由题题目目已已知知,联联第十讲第十讲 方差与相关系数方差与相关系数 001011kkkkeCCekCkCkXP,!)()(!1111PekkXP的的泊泊松松分分布布是是于于是是 21122 )(
14、EXDXXE:质:质:由概率函数的和为一性由概率函数的和为一性10 kkXP)(1 DXEX即即第十讲第十讲 方差与相关系数方差与相关系数例例10-1-9(1998,4分)分)._,的的值值最最大大,其其最最大大值值为为时时,成成功功次次数数的的标标准准差差次次独独立立重重复复试试验验,当当进进行行设设一一次次试试验验的的成成功功率率为为 pp100第十讲第十讲 方差与相关系数方差与相关系数2100100)1 ()(,)(),100(pppnpXDnpXEpBXX也也就就是是说说:,为为成成功功次次数数,则则由由题题设设分分析析:设设54110021 )()()()()(XDXXDXXDp 且
15、且最最大大,最最大大,即即标标准准差差时时,得得。于于是是,分分析析驻驻点点求求出出该该函函数数的的驻驻点点即即可可的的表表达达式式的的最最大大值值即即可可。依依据据出出的的最最大大值值,只只需需要要先先求求的的标标准准差差题题目目要要求求, 0200100,1001002pDppDXDXDXDXXp1. 1. 协方差协方差:covariance )( )( YEYXEXE ),(YXcovcov协方差协方差( (相关矩相关矩):):离散型随机变量离散型随机变量 : . ),()()( ijjijiyxpYEyXEx),cov(YX连续型随机变量连续型随机变量: .),()()(dxdyyxf
16、YEyXEx),cov(YX证证 )( )( ),cov(YEYXEXEYX 二、协方差与相关系数二、协方差与相关系数第十讲第十讲 相关系数与正态分布相关系数与正态分布(1 1)均值计算定理:)均值计算定理:2.2.协方差与均值、独立、方差的计算关系协方差与均值、独立、方差的计算关系)()()(),cov(YEXEXYEYX)()()()()()()(YEXEYEXEXEYEXYE )()()(YEXEXYE 证证因为随机变量因为随机变量X与与Y 相互独立相互独立, )()()(YEXEXYE )()()(),cov(YEXEXYEYX 0)()()()( YEXEYEXE )()()()(Y
17、EXEYXEXYEXYE 证证 2 )()( )(YXEYXEYXD 第十讲第十讲 相关系数与正态分布相关系数与正态分布(2)独立计算定理:独立计算定理:设随机变量设随机变量X X与与Y Y 相互独立,则:相互独立,则:0),cov(YX(3)方差计算定理:方差计算定理: 设设X与与Y是任意两个随机变量是任意两个随机变量,则:则:又称方差加法公式),cov(2)()()(YXYDXDYXD 2 2 )()( YEYEXEXE )()(2YEYXEXE ),cov(2)()(YXYDXD 2 )()( YEYXEXE 3.3.协方差的运算性质协方差的运算性质计计算算性性质质:外外,协协方方差差还
18、还具具有有以以下下除除了了均均值值的的计计算算公公式式以以。方差定义公式即可得到方差定义公式即可得到关于这一性质,代入协关于这一性质,代入协。且。且)对称性:即)对称性:即()(),cov(),cov(),cov(XDXXXYYX12cov(,)cov(, ).aX bYabX Y( )变变量量系系数数可可提提:即即将将等等式式左左边边代代入入协协方方差差定定义义即即可可得得到到右右边边。第十讲第十讲 相关系数与正态分布相关系数与正态分布第十讲第十讲 相关系数与正态分布相关系数与正态分布.),cov(),cov(),cov(),cov(),cov(),cov(YZXZYXZZYZXZYX 或或
19、)满满足足分分配配律律,即即(3)()()()()()()(),cov(ZEYEXEYZXZEZEYXEZYXEZYX 证:证:).,cov(),cov()()()()()()(ZYZXZEYEZEXEYZEXZE 4.4.相关系数相关系数标标准准化化随随机机变变量量的的随随机机变变量量,我我们们称称为为,方方差差为为为为是是均均值值,我我们们已已经经知知道道10)()()()(*YYEYYXXEXX (1 1)定义:)定义:X X与与 Y Y 的相关系数的相关系数: 第十讲第十讲 相关系数与正态分布相关系数与正态分布,)()(*0 YEXE)()()(),cov(*YXEYEYXEXEYX
20、XYYXRYXYXYXYXYX或或记记作作的的相相关关系系数数与与为为,变变量量的的协协方方差差的的标标准准、为为其其标标准准变变量量,则则称称、为为随随机机变变量量,、设设),(,)(cov *)(,)(cov),cov(),(*YEYYXEXXYXYXR即即:(2 2)相关系数的计算)相关系数的计算: : )()(),cov(),(YDXDYXYXR )()()()(YXYEYXEXE )()(),cov(YDXDYX ),()()()(* YXYDXDYXD cov2 ),(12)(*YXRYXD 1),( YXR 证证,)()(*0 YEXE11 )(,)(YDXD0),(1 YXR
21、, 0)(* YXD 第十讲第十讲 相关系数与正态分布相关系数与正态分布* ( , )cov(,)R X YX YE X Y()( )()( )XE XYE YEXY13),(YXR)性质定理:)性质定理:(并且 . 0, 1;0, 1),(bbYXR(4)(4)强相关定理强相关定理,bXaY 1),( YXR事事件件,即即:为为必必然然使使得得的的充充分分必必要要条条件件为为存存在在语语言言描描述述为为:强强相相关关定定理理常常用用概概率率注注bXaYbaYXR,),(11.),(),(,)(,),(101011 YXRbYXRbbXaYPbaYXRYX时时,时时,且且:使使得得条条件件为为
22、存存在在的的充充分分必必要要的的相相关关系系数数、随随机机变变量量(证明过程略)第十讲第十讲 相关系数与正态分布相关系数与正态分布2(, )0,XYR X YXY注 :由相关系数的计算公式,相关系数由协方差值决定其分子,而且,变量 、 独立,协方差为零,即变量独立,则相关系数为零。我们将相关系数为零的变量称为不相关(注:若则称 与 相关)。第十讲第十讲 相关系数与正态分布相关系数与正态分布不不相相关关。与与则则称称随随机机变变量量即即若若YXYEXEXYEYXR),()()(,),( 0(5)(5)不相关概念不相关概念由定义容易得到不相关的几个等价结论由定义容易得到不相关的几个等价结论; 0)
23、,()1( YXR式式得得到到)(由由相相关关系系数数的的计计算算公公;),cov()(02 YX到到)由由协协方方差差的的均均值值定定理理得得)()()()(YEXEXYE 3(4)()()( )D XYD XD Y独独立立,则则它它们们不不相相关关。与与变变量量不不相相关关与与独独立立:若若随随机机YX第十讲第十讲 相关系数与正态分布相关系数与正态分布()cov(, )00XYXYE XYEX EYX YXY显然: 与 独立与 不相关。()()( )2cov(, )D XYD XD YX Y上式可由加法公式推出1E协方差离差积,积期望减期望积;方差加减协方差,对称提系分配律;标准变量相关系
24、,协方差比标差积;系数为零不相关,线性强关正负 。例例10-2-110-2-1(20122012数学一,数学一,4 4分)分).)(;)()(;)(1212111 DCBA;)(两两段段长长度度的的相相关关系系数数为为米米的的木木棒棒截截成成两两段段,则则将将长长度度为为DXYXYYXYXXY,故故选选从从而而,显显然然线线性性相相关关,与与则则显显然然另另一一段段为为长长度度为为分分析析:设设其其中中一一段段木木棒棒111,第十讲第十讲 相关系数与正态分布相关系数与正态分布例例10-2-210-2-2(20122012数学一,数学一,1111分)分)020 01002104141311211
25、21XY的概率分布为:的概率分布为:设二维离散型随机变量设二维离散型随机变量),cov()();(YYXYXP 求求)求)求(2214112000221 ),(),()()(,YXPYXPZPYXPYXZ则则)令)令解:(解:(的分布。的分布。并求出并求出的分布,令的分布,令、)由已知,求)由已知,求(XYZXYZYX ,2第十讲第十讲 相关系数与正态分布相关系数与正态分布 613121210X 313131210Y0,1,2,4ZXYZ由,则,依据离散变量函数值的概率等于对应自变量联合概率之和,得(0)(0,0)(0,1)(0,2)1117(1,0)(2,0)441212P ZP XYP X
26、YP XYP XYP XY121402311 )(,)()(ZPZPZP,同理,求出同理,求出 12131127410XYZ第十讲第十讲 相关系数与正态分布相关系数与正态分布21112012,1236352 ()( ) ( ),()33xEXEYE g Xg x P xEYE XYEZ 根据已知分布,可求出同样可求出;通过易得:配律配律于是,根据协方差的分于是,根据协方差的分.)(3222 EYEYDY323213232 DYEXEYXYEYYYXYYX)(),cov(),cov(),cov(例题例题10-2-3(2000,3分)分)2222222222)()()()()();()()()()()()()();()(),YEYEXEXEDYEXECYEYEXEXEBYEXEAYXYXYX ()不不相相关关的的充充要要条条件件为为(与与则则随随机机变变量量)的的方方差差期期望望都都存存在在,设设二二维维随随机机变变量量( 00 ),cov(),( R不相关不相关与与分析:分析:0 )()()(),cov(),cov(YXEYXEYXYXEYXYX 因此,由因此,由022222222 )()()()()()()(YEYEXEXEYEXEYXE得:得:B故选故选第十讲第十讲 相关系数与正态分布相关系数与正态分布