协方差及相关系数-课件.pptx

上传人(卖家):晟晟文业 文档编号:4766694 上传时间:2023-01-08 格式:PPTX 页数:39 大小:1.05MB
下载 相关 举报
协方差及相关系数-课件.pptx_第1页
第1页 / 共39页
协方差及相关系数-课件.pptx_第2页
第2页 / 共39页
协方差及相关系数-课件.pptx_第3页
第3页 / 共39页
协方差及相关系数-课件.pptx_第4页
第4页 / 共39页
协方差及相关系数-课件.pptx_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、协方差及相关系数一、协方差与相关系数的概念及性质一、协方差与相关系数的概念及性质二二、相关系数的意义相关系数的意义三、小结三、小结第三节第三节 协方差及相关系数协方差及相关系数 前面我们学习了随机变量的数学期望与方差前面我们学习了随机变量的数学期望与方差,关于关于多维随机变量多维随机变量,除了其数学期望与方差外除了其数学期望与方差外,我们还要研我们还要研究反映各分量之间关系的数字特征究反映各分量之间关系的数字特征,其中最重要的其中最重要的,就就是现在要讨论的是现在要讨论的协方差与相关系数协方差与相关系数1、问题的提问题的提出出 一、协方差与相关系数的概念及性质一、协方差与相关系数的概念及性质

2、在讨论这个问题之前在讨论这个问题之前,我们先看一个例子。我们先看一个例子。在研在研究子女与父母的相象程度时究子女与父母的相象程度时,有一项是关于父亲的身有一项是关于父亲的身高与其成年儿子身高的关系。高与其成年儿子身高的关系。这个地方有两个变量这个地方有两个变量,一个是父亲的身高一个是父亲的身高,一个是成年儿子身一个是成年儿子身高高、为了研究二者关系为了研究二者关系,英国统计学家皮尔逊收集了英国统计学家皮尔逊收集了1078个父亲个父亲及其成年儿子身高的数据及其成年儿子身高的数据,画出了一张散点图。画出了一张散点图。儿儿子子的的身身高高父亲的身高父亲的身高问问:父亲及其成年儿子身高存在如何的关系呢

3、?父亲及其成年儿子身高存在如何的关系呢?fatherson类似的问题有类似的问题有:1、吸烟和患肺癌有什么关系?、吸烟和患肺癌有什么关系?2、受教育程度和失业有什么关系?、受教育程度和失业有什么关系?3、高考入学分数和大学学习成绩有什么关系?、高考入学分数和大学学习成绩有什么关系??那么那么相互独立相互独立和和若随机变量若随机变量,YX).()()(YDXDYXD 不相互独立不相互独立和和若随机变量若随机变量YX?)(YXD).()(2)()(YEYXEXEYDXD 协方差协方差定义定义 对两个随机向量对两个随机向量(X,Y),若若E(X-EX)(Y-EY)存在存在,则称则称 cov(X,Y)

4、=E(X-EX)(Y-EY)为为X与与Y的协方差。的协方差。特别特别,若若X=Y,则则 cov(X,X)=E(X-EX)2=D(X)因此因此,方差是协方差的特例方差是协方差的特例,协方差刻画两个随机变量之间的协方差刻画两个随机变量之间的“某种某种”关系关系、能够证明能够证明 若若(X,Y)服从二维正态分布服从二维正态分布,即即则则 ),(),(222211 NYX21),cov(YX2、定义定义可见可见,若若X与与Y独立独立,则则4 4、计算协方差的一个简单公式计算协方差的一个简单公式 Cov(X,Y)=0、Cov(X,Y)=E(XY)-E(X)E(Y)D(X+Y)=D(X)+D(Y)+2Co

5、v(X,Y)3 3 随机变量随机变量与的方差与协方差的关系与的方差与协方差的关系(5)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)(3)Cov(X,Y)=Cov(Y,X)(对称性对称性)5 5、简单性质简单性质(4)Cov(aX,bY)=abCov(X,Y)其中其中 a、b是常数是常数下面请大伙儿利用上面所学的知识进行证明。下面请大伙儿利用上面所学的知识进行证明。(1)Cov(X,X)=D(X)(2)Cov(X,c)=0 (c为常数为常数)协方差的数值在一定程度上反映了协方差的数值在一定程度上反映了X与与Y相互间相互间的联系的联系,但它受但它受X与与Y本身数值大小的影响本身

6、数值大小的影响、如令如令X*=kX,Y*=kY,这时这时X*与与Y*间的相互联系与间的相互联系与X与与Y的相互联系应该是一样的的相互联系应该是一样的,然而然而Cov(X*,Y*)=k2Cov(X,Y)为了克服这一缺点为了克服这一缺点,在计算在计算X与与Y的协方差的协方差之前之前,先对先对X与与Y进行标准化进行标准化:)()()()(YDYEYYXDXEXX 再来计算再来计算X*与与Y*的协方差的协方差,如此就引进了相关系如此就引进了相关系数的概念数的概念、为随机变量为随机变量X与与Y的相关系数的相关系数(correlation coefficient)、1、定义定义:若若D(X)0,D(Y)0

7、,且且Cov(X,Y)存在时存在时,称称(,)()()XYCov X YD X D Y 在不致引起混淆时,记在不致引起混淆时,记 为为 .XY二、相关系数二、相关系数2、相关系数的性质相关系数的性质.1)1(XY.1,:1)2(bXaYPbaXY使使存存在在常常数数的的充充要要条条件件是是注意注意|XY|的大小反映了的大小反映了X,Y之间线性关系的紧密程度之间线性关系的紧密程度:XY=0时时,X,Y之间无线性关系之间无线性关系;|XY|=1时时,X,Y之间具有线性关系之间具有线性关系、XY0,X,Y正相关正相关XY0=-1xy0ii.完全负相关完全负相关 Y=aX+b a0 xy0=0iii.

8、完全不相关完全不相关0 1xy0iv.正相关正相关-1 0时时,XY=1a0,当当方差越小时方差越小时,事件事件|X-E(X)|发生的概率也越小发生的概率也越小,即即X的的取值越集中在取值越集中在E(X)附近、这进一步说明方差确实是一附近、这进一步说明方差确实是一个描述随机变量与其期望值离散程度的一个变量、个描述随机变量与其期望值离散程度的一个变量、当当D(X)已知时已知时,切贝雪夫不等式给出了切贝雪夫不等式给出了X与与E(X)的偏的偏差小于差小于 的概率的估计值、的概率的估计值、切比雪夫不等式的切比雪夫不等式的用途用途:(1 1)证明大数定律证明大数定律;(;(2 2)估计事件的概率。估计事

9、件的概率。例例1 已知正常男性成人血液中已知正常男性成人血液中,每一毫升白细胞每一毫升白细胞数平均是数平均是7300,均方差是均方差是700、利用切比雪夫不等利用切比雪夫不等式估计每毫升白细胞数在式估计每毫升白细胞数在52009400之间的概率之间的概率、解解:设每毫升白细胞数为设每毫升白细胞数为X依题意依题意,E(X)=7300,D(X)=7002所求为所求为 P(5200 X 9400)P(5200 X 9400)=P(-2100 X-E(X)2100)=P|X-E(X)|21002)2100()(1XD 由切比雪夫不等式由切比雪夫不等式 P|X-E(X)|21002)2100700(1

10、98911 即估计每毫升白细胞数在即估计每毫升白细胞数在52009400之间的概率不之间的概率不小于小于8/9、例例2 设电站供电网有设电站供电网有10000盏电灯盏电灯,夜晚每盏灯开灯的夜晚每盏灯开灯的概率均为概率均为0、7,假定灯的开、关是相互立的假定灯的开、关是相互立的,使用切贝雪使用切贝雪夫不等式估计夜晚同时开着的灯数在夫不等式估计夜晚同时开着的灯数在6800到到7200盏之间盏之间的概率。的概率。解解 令令X表示在夜晚同时开着的灯数目表示在夜晚同时开着的灯数目,则则X服从服从n=10000,p=0、7的二项分布的二项分布,这时这时 ()7000,E Xnp()2100.D Xnpq2680072002100|7000|20010.95200PXPX由切贝雪夫不等式可得由切贝雪夫不等式可得:感谢您的聆听!

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(协方差及相关系数-课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|