1、高高数知识数知识数理统计基础数理统计基础主主要要内内容容概率论基础概率论基础第1页,共175页。如果如果 表示表示n个数的一个序列,那么我们个数的一个序列,那么我们就把这就把这n个数的总和写为:个数的总和写为:第一第一节节 高高数知识数知识一一、求和、求和n21ixi,:n21n1iixxxx 第2页,共175页。二二、算术平均、算术平均 算术平均(arithmetic mean)就是我们日常生活中使用的普通的平均数,其定义如下式:nXnXXXXn21第3页,共175页。三三、加权算术平均、加权算术平均n加权平均是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:wXwww
2、wXwXwXwXiinnnw212211第4页,共175页。四四、变化率、变化率n变化率的定义如下式:),3,2(11ntXXXttt第5页,共175页。五五、几何平均、几何平均 几何平均是n个数据连乘积的n次方根,其定义如下式:nnXXXG21第6页,共175页。六六、线性函数、线性函数 如果两个变量如果两个变量x和和y的关系是:的关系是:xy10我们便说我们便说y是是x的的线性函数线性函数:而:而 和和 是描述这一关系的两是描述这一关系的两个参数,个参数,为截距(为截距(Intercept),),为斜率。为斜率。0101 一个线性函数的定义特征在于,一个线性函数的定义特征在于,y的改变量总
3、是的改变量总是x的改变的改变量的量的 倍:倍:其中,其中,表示表示“改变量改变量”。换句话说,。换句话说,x对对y的边际效应是的边际效应是一个等于一个等于 的常数。的常数。xy111第7页,共175页。例:例:线性住房支出函数线性住房支出函数 假定每月住房支出和每月收入的关系式是假定每月住房支出和每月收入的关系式是Housing=164+0.27income 那么,每增加那么,每增加1元收入,就有元收入,就有0.27元用于住房支出,如果家元用于住房支出,如果家庭收入增加庭收入增加200元,那么住房支出就增加元,那么住房支出就增加0.27200=54元。元。机械解释上述方程,即时一个没有收入的家
4、庭也有机械解释上述方程,即时一个没有收入的家庭也有164元的住房元的住房支出,这当然是不真实的。对低收入水平家庭,这个线性函数不能很支出,这当然是不真实的。对低收入水平家庭,这个线性函数不能很好的描述好的描述housing和和income之间的关系,这就是为什么我们最终之间的关系,这就是为什么我们最终还得用其他函数形式来描述这种关系。还得用其他函数形式来描述这种关系。第8页,共175页。多于两个变量的线性函数:多于两个变量的线性函数:假定假定y与两个变量与两个变量 和和 有一般形式的关系:有一般形式的关系:由于这个函数的图形是由于这个函数的图形是三维的,所以相当难以想象,不过三维的,所以相当难
5、以想象,不过 仍然是截距(即仍然是截距(即 =0和和 =0时时y的取值),且的取值),且 和和 都是特定斜率都是特定斜率的度量。由方程(的度量。由方程(A.12)可知,给定)可知,给定 和和 的改变量,的改变量,y的改变的改变量是量是 若若 不改变,即不改变,即 ,则有,则有 因此因此 是关系式在是关系式在 坐标上的斜率:坐标上的斜率:1x2x22110 xxy01x2x121x2x2211xxy2x02x0211xxy,11x0211xxy,第9页,共175页。因为它度量了保持因为它度量了保持 固定时,固定时,y如何随如何随 而变,所以常把而变,所以常把 叫叫做做 对对y的的偏效应偏效应。由
6、于偏效应涉及保持其他因素不变,所以。由于偏效应涉及保持其他因素不变,所以它与它与其他条件不变(其他条件不变(Ceteris Paribus)的概念有密切联系,参的概念有密切联系,参数数 可作类似解释:即若可作类似解释:即若 ,则,则 因此,因此,是是 对对y的偏效应。的偏效应。线性函数的性质线性函数的性质2x1x1x1201x22xy22x第10页,共175页。假定大学生每月对假定大学生每月对CD的需求量与的需求量与CD的价格和每个月的零花的价格和每个月的零花钱有如下关系:钱有如下关系:式中,式中,price为每张碟的价格,为每张碟的价格,income以元计算。需求曲线表以元计算。需求曲线表示
7、在保持收入(和其他因素)不变的情况下,示在保持收入(和其他因素)不变的情况下,quantity和和price的关的关系。系。例:例:对对CDCD的需求的需求income.price.quantity03089120第11页,共175页。线性函数的基本性质:线性函数的基本性质:不管不管x的初始值是什么,的初始值是什么,x每变化一个单位都导致每变化一个单位都导致y同样的变化。同样的变化。x对对y的边际效应是常数,这对许多经济关系来说多少有点不真实。的边际效应是常数,这对许多经济关系来说多少有点不真实。例如,边际报酬递减这个重要的经济概念就不符合线性关系。例如,边际报酬递减这个重要的经济概念就不符合
8、线性关系。为了建立各种经济现象的模型,我们需要研究一些为了建立各种经济现象的模型,我们需要研究一些非线性函数。非线性函数。非线性函数的特点是,非线性函数的特点是,给定给定x的变化,的变化,y的变化依赖于的变化依赖于x的初始值。的初始值。七七、若干特殊函数、若干特殊函数第12页,共175页。1.1.二次函数二次函数 刻画报酬递减规律的一个简单方法,就是在线性关系中添加一个二刻画报酬递减规律的一个简单方法,就是在线性关系中添加一个二次项。次项。考虑方程式考虑方程式 式中,式中,和和 为参数。当为参数。当 时,时,y和和x之间的关系呈抛之间的关系呈抛物线状,并且可以证明,函数的最大值出现在物线状,并
9、且可以证明,函数的最大值出现在2210 xxy01202212x第13页,共175页。1.1.二次函数二次函数 例如,若例如,若y=6+8x-2x2。(从而。(从而 =8且且 =-2),则),则y的最大的最大值出现在值出现在x*=8/4=2处,并且这个最大值是处,并且这个最大值是6+82-2(2)2=14。12第14页,共175页。对方程式对方程式 意味着意味着x对对y的的边际效应递减,边际效应递减,这从图中清晰可见,应这从图中清晰可见,应用微积分知识,也可以通过求这个二次函数的一阶导数得出。用微积分知识,也可以通过求这个二次函数的一阶导数得出。斜率斜率=方程右端是此二次函数对方程右端是此二次
10、函数对x的的导数导数。同样,同样,则意味着则意味着x对对y的的边际效应递增边际效应递增,二次函数的图,二次函数的图形就呈形就呈U行,函数的最小值出现在点行,函数的最小值出现在点 处。处。1.1.二次函数二次函数2210 xxy02xxy21202212x第15页,共175页。在计量经济分析中起着最重要作用的非线性函数是在计量经济分析中起着最重要作用的非线性函数是自然对数,自然对数,或简称为或简称为对数函数,对数函数,记为记为还有几种不同符号可以表示自然对数,最常用的是还有几种不同符号可以表示自然对数,最常用的是 或或 。当对数使用几个不同的底数时,这些不同的符。当对数使用几个不同的底数时,这些
11、不同的符号是有作用的。目前,只有自然对数最重要,因此我们都用号是有作用的。目前,只有自然对数最重要,因此我们都用 表示自然对数。表示自然对数。2.2.自然对数自然对数 xlogy xln xloge xlog第16页,共175页。2.2.自然对数自然对数 xlogy 图图2.1.4 y=log(x)的图形的图形第17页,共175页。2.2.自然对数自然对数 有有如下性质:如下性质:1.log(x)可正可负:可正可负:log(x)0,0 x0,x1 2.一些有用的性质(牢记):一些有用的性质(牢记):log(x1x2)=log(x1)+log(x2),),x1,x20 log(x1/x2)=lo
12、g(x1)-log(x2),),x1,x20 log(xc)=clog(x),),x0,c为任意实数为任意实数第18页,共175页。2.2.自然对数自然对数 对数可用于计量经济学应用中的各种近似计算。对数可用于计量经济学应用中的各种近似计算。1.对于对于x0,有有log(1+x)x。这个近似计算随着。这个近似计算随着x变大而越变大而越来越不精确。来越不精确。2.两对数之差可用作比例变化的近似值。令两对数之差可用作比例变化的近似值。令x0和和x1为两个正为两个正数,可以证明(利用微积分),对数,可以证明(利用微积分),对x的微小变化,有的微小变化,有如果我们用如果我们用100乘以上述方程,并记乘
13、以上述方程,并记那么,对那么,对x的的微小微小变化,便有变化,便有“微小微小”的含义取决于具体情况。的含义取决于具体情况。000101xxxxxxlogxlog 01xlogxlogxlog x%xlog100第19页,共175页。2.2.自然对数自然对数近似计算的作用:近似计算的作用:定义定义y对对x的的弹性(弹性(elasticity)为为换言之,换言之,y对对x的弹性就是当的弹性就是当x增加增加1%时时y的百分数变化。的百分数变化。若若y是是x的线性函数:的线性函数:,则这个弹性是,则这个弹性是它明显取决于它明显取决于x的取值(的取值(弹性并非沿着需求曲线保持不变弹性并非沿着需求曲线保持
14、不变)。)。x%y%yxxyxy10 xxyxyxxy1011第20页,共175页。2.2.自然对数自然对数 不仅在需求理论中,在许多应用经济学领域,弹性都是不仅在需求理论中,在许多应用经济学领域,弹性都是非常重要的。在许多情况下,使用一个常弹性模型都很方便,非常重要的。在许多情况下,使用一个常弹性模型都很方便,而对数函数能帮助我们设定这样的模型。如果我们对而对数函数能帮助我们设定这样的模型。如果我们对x和和y都使都使用对数近似计算,弹性就近似等于用对数近似计算,弹性就近似等于因此,一个因此,一个常弹性模型常弹性模型可近似描述为方程可近似描述为方程式中,式中,为为y对对x的弹性(假定的弹性(假
15、定x,y0)。)。这类模型在经验经济学中扮演着重要角色。目前,式中的这类模型在经验经济学中扮演着重要角色。目前,式中的 只是接近于弹性这一事实并不重要,可以忽略。只是接近于弹性这一事实并不重要,可以忽略。xlogylog xlogylog1011第21页,共175页。例例:常弹性需求函数常弹性需求函数 若若q代表需求量而代表需求量而p代表价格,并且二者关系为代表价格,并且二者关系为则需求的价格弹性是则需求的价格弹性是-1.25.初略地说,价格每增加初略地说,价格每增加1%,将导致需求量下,将导致需求量下降降1.25%。plog.qlog25174第22页,共175页。2.2.自然对数自然对数
16、在经验研究工作中还经常出现使用对数函数的其他可能性。假在经验研究工作中还经常出现使用对数函数的其他可能性。假定定y0,且,且则则 ,从而,从而 。由此可知,当由此可知,当y和和x有上述方程所示关系时,有上述方程所示关系时,xylog10 xylog1 xylog1100100 xy%1100第23页,共175页。例例:对数工资方程对数工资方程 假设小时工资与受教育年数有如下关系:假设小时工资与受教育年数有如下关系:根据前面所述方程,有根据前面所述方程,有由此可知,多受一年教育将使小时工资增加约由此可知,多受一年教育将使小时工资增加约9.4%。通常把通常把%y/x称为称为y对对x的的半弹性,半弹
17、性,半弹性表示当半弹性表示当x增加一个增加一个单位时单位时y的百分数变化。在上述模型中,半弹性是个常数并且等的百分数变化。在上述模型中,半弹性是个常数并且等于于 ,在上述例子中,我们可以方便的把工资和教育的关系概,在上述例子中,我们可以方便的把工资和教育的关系概括为:多受一年教育括为:多受一年教育无论所受教育的起点如何无论所受教育的起点如何都将使工资都将使工资提高约提高约9.4%。这说明了这类模型在经济学中的重要作用。这说明了这类模型在经济学中的重要作用。edu.wagelog0940782edu.edu.wage%4909401001100第24页,共175页。2.2.自然对数自然对数 另一
18、种关系式在应用经济学中也是有意义的:另一种关系式在应用经济学中也是有意义的:其中,其中,x0。若取。若取y的变化,则有的变化,则有 ,这又可以写,这又可以写为为 。利用近似计算,可得利用近似计算,可得当当x增加增加1%时,时,y变化变化 个单位。个单位。xlogy10 xlogy1 xlogy1001001x%y10011001第25页,共175页。例例:劳动供给函数劳动供给函数 假定一个工人的劳动供给可描述为假定一个工人的劳动供给可描述为式中,式中,wage为小时工资而为小时工资而hours为每周工作小时数,于是,由方为每周工作小时数,于是,由方程可得:程可得:换言之,工资每增加换言之,工资
19、每增加1%,将使每周工作小时增加约,将使每周工作小时增加约0.45或略或略小于半个小时。若工资增加小于半个小时。若工资增加10%,则,则 或约四个半小时。或约四个半小时。注意:注意:不宜对更大的工资百分数变化应用这个近似计算。不宜对更大的工资百分数变化应用这个近似计算。wagelog.hours14533wage%.wage%.wagelog.hours4510100145145514104510.hours第26页,共175页。考虑方程考虑方程 此处此处log(y)是是x的线性函数,但是怎样写出的线性函数,但是怎样写出y本身作为本身作为x的的一个函数呢?一个函数呢?指数函数指数函数给出了答案
20、。给出了答案。我们把指数函数写为我们把指数函数写为y=exp(x),),有时也写为有时也写为 ,但在我们课程中这个符号不常用。但在我们课程中这个符号不常用。指数函数的两个重要的数值是指数函数的两个重要的数值是exp(0)=1和和exp(1)=2.7183(取(取4位小数)。位小数)。3.3.指数函数指数函数 xylog10 xey 第27页,共175页。3.3.指数函数指数函数 xexpy 图图2.1.4 y=exp(x)的图形的图形第28页,共175页。从上图可以看出,从上图可以看出,exp(x)对任何对任何x值都有定义,而且总大于零。值都有定义,而且总大于零。指数函数在如下意义上是对数函数
21、的反函数:对所有指数函数在如下意义上是对数函数的反函数:对所有x,都有,都有logexp(x)=x,而对,而对x0,有,有explog(x)=x。换言之,对。换言之,对数数“解除了解除了”指数,反之亦然。对数函数和指数函数互为反函数。指数,反之亦然。对数函数和指数函数互为反函数。指数函数的两个有用性质是指数函数的两个有用性质是 exp(x1+x2)=exp(x1)exp(x2)和和 expclog(x)=xc3.3.指数函数指数函数第29页,共175页。记忆:记忆:经济学中常用的一些函数及其导数有经济学中常用的一些函数及其导数有 4.4.微分学微分学xdxdy;xxy2122102 2110
22、xdxdy;xy211102xdxdy;xy xdxdy;xlogy110 xexpdxdy;xexpy10110第30页,共175页。当当y是多元函数时,是多元函数时,偏导数偏导数的概念便很重要。假定的概念便很重要。假定y=f(x1,x2),),此时便有两个偏导数,一个关于此时便有两个偏导数,一个关于x1,另一个关于,另一个关于x2。y对对x1的偏导数记为的偏导数记为 ,就是把,就是把x2看做常数时方程对看做常数时方程对x1的普通导数。类似的,的普通导数。类似的,就是固定就是固定x1时方程对时方程对x2的导数。的导数。若若则则这些偏导数可被视为经济学所定义的偏效应。这些偏导数可被视为经济学所
23、定义的偏效应。4.4.微分学微分学1xy2xy22110 xxy221xyxy1,第31页,共175页。把工资与受教育年数和工作经验(以年计)相联系的一个把工资与受教育年数和工作经验(以年计)相联系的一个函数是函数是exper对对wage的偏效应就是上式对的偏效应就是上式对exper的偏导数:的偏导数:这是增加一年工作经验所导致工资的近似变化。注意这个偏效应与这是增加一年工作经验所导致工资的近似变化。注意这个偏效应与exper和和educ的初始水平都有关系。例如,一个从的初始水平都有关系。例如,一个从educ=12和和exper=5开开始的工人,再增加一年工作经验,将使工资增加约始的工人,再增
24、加一年工作经验,将使工资增加约0.19-0.085+0.00712=0.234元。准确的变化通过计算,结果是元。准确的变化通过计算,结果是0.23,和,和近似计算结果非常接近。近似计算结果非常接近。例例:含交互项的工资方程含交互项的工资方程erexpeduc.erexp.erexp.educ.agew007000401904101032educ.erexp.erexpagew00700080190第32页,共175页。一、随机变量及其概率分布一、随机变量及其概率分布 假设我们掷一枚钱币假设我们掷一枚钱币10次,并计算出现正面的次数,这就次,并计算出现正面的次数,这就是一个是一个实验实验的例子。
25、一般地说,的例子。一般地说,一个实验是指至少在理论上能一个实验是指至少在理论上能够无限重复下去的任何一种程序,并且它有一个定义完好的结够无限重复下去的任何一种程序,并且它有一个定义完好的结果集。果集。一个一个随机变量随机变量是指一个具有数值特征并由一个实验来决定其是指一个具有数值特征并由一个实验来决定其结果的变量。结果的变量。第二节第二节 概率论基础概率论基础第33页,共175页。按照概率和统计学的惯例,我们一律用大写字母如常见的按照概率和统计学的惯例,我们一律用大写字母如常见的W,X,Y和和Z表示表示随机变量随机变量,而用相应的小写字母,而用相应的小写字母w,x,y和和z表示表示随机变量的特
26、定结果随机变量的特定结果。例如,在掷币实验中,令例如,在掷币实验中,令X为一枚钱币投掷为一枚钱币投掷10次出现正面的次出现正面的次数。所以次数。所以X并不是任何具体数值,但我们知道并不是任何具体数值,但我们知道X将在集合将在集合 中取一个值。比方说,一个特殊的结果是中取一个值。比方说,一个特殊的结果是x=6。我们用下标表示一系列随机变量。例如,我们记录随机选择我们用下标表示一系列随机变量。例如,我们记录随机选择的的20个家庭去年的收入。可以用个家庭去年的收入。可以用X1,X2,X20表示这些随机变量,表示这些随机变量,并用并用x1,x2,x20表示其特殊结果。表示其特殊结果。一、随机变量及其概
27、率分布一、随机变量及其概率分布10210,第34页,共175页。如定义所言,即使随机变量描述的是一些定性事件,我们如定义所言,即使随机变量描述的是一些定性事件,我们也总定义它的结果是数值。例如,考虑只掷一枚钱币,其两个也总定义它的结果是数值。例如,考虑只掷一枚钱币,其两个结果是正面和反面。我们可以定义一个随机变量如下:如果出结果是正面和反面。我们可以定义一个随机变量如下:如果出现正面则现正面则X=1;如果出现反面则;如果出现反面则X=0。一个只能取一个只能取0和和1两个值的随机变量叫做两个值的随机变量叫做贝努利随机变量贝努利随机变量。XBernoulli()(读作(读作“X服从一个成功概率为服
28、从一个成功概率为 的贝努利分的贝努利分布)布):P(X=1)=,P(X=0)=1-一、随机变量及其概率分布一、随机变量及其概率分布第35页,共175页。1.1.离散随机变量离散随机变量 离散随机变量离散随机变量是指一个只取有限个或可数的无限个数值的随是指一个只取有限个或可数的无限个数值的随机变量。机变量。“可数的无限个可数的无限个”:虽然随机变量可取无限个值,但这:虽然随机变量可取无限个值,但这些值可以和正整数一一对应。些值可以和正整数一一对应。贝努力随机变量是离散随机变量的最简单的例子。贝努力随机变量是离散随机变量的最简单的例子。一、随机变量及其概率分布一、随机变量及其概率分布第36页,共1
29、75页。一个离散随机变量要由它的全部可能值和取每个值的相一个离散随机变量要由它的全部可能值和取每个值的相应概率来完整描述。如果应概率来完整描述。如果X取取k个可能值个可能值 其概率其概率p1,p2,pk被定义为被定义为 pj=P(X=xj),j=1,2,k(读作:(读作:“X取值取值xj的概的概率等于率等于pj”。)。)其中,每个其中,每个pj都在都在0-1之间,并且之间,并且 p1+p2+pk=11.1.离散随机变量离散随机变量kxxx,21第37页,共175页。X的的概率密度函数(概率密度函数(probability density function,pdf)概括了概括了X的的可能结果及其
30、相应概率的信息:可能结果及其相应概率的信息:而且对某个而且对某个j,凡是不等于,凡是不等于xj的的x都有都有f(x)=0。换言之,对任何实数。换言之,对任何实数x,f(x)都是随机变量)都是随机变量X取该特定值取该特定值x的概率。当我们设计多于一个随机的概率。当我们设计多于一个随机变量时,有时需要给所考虑的变量时,有时需要给所考虑的pdf加一个下标:例如加一个下标:例如fx是是X的的pdf,fY是是Y的的pdf等等。等等。1.1.离散随机变量离散随机变量 kjpxfjj,21第38页,共175页。给定任一离散随机变量的给定任一离散随机变量的pdf,就不难计算关于该随机变量的,就不难计算关于该随
31、机变量的任何事件的概率。例如,设任何事件的概率。例如,设X为一名篮球运动员在两次罚球中的命为一名篮球运动员在两次罚球中的命中次数。因此中次数。因此X的三个可能值是的三个可能值是0,1,2。假定。假定X的的pdf是是 f(0)=0.20,f(1)=0.44和和f(2)=0.36这三个概率之和必然为这三个概率之和必然为1.利用这个利用这个pdf,我们能算出该运动员至少投,我们能算出该运动员至少投中一球的概率:中一球的概率:P(X1)=P(X=1)+P(X=2)=0.44+0.36=0.80。X的的pdf如下图示:如下图示:1.1.离散随机变量离散随机变量第39页,共175页。2.2.连续随机变量连
32、续随机变量 连续随机变量连续随机变量是指一个取任何实数的概率都为零的变量。是指一个取任何实数的概率都为零的变量。这个定义有点违背直觉,因为在任何应用中,我们最这个定义有点违背直觉,因为在任何应用中,我们最终都会观测到一个随机变量取得的某种结果。这里的思想终都会观测到一个随机变量取得的某种结果。这里的思想是,一个连续随机变量是,一个连续随机变量X的可能取值如此之多,以致我们无的可能取值如此之多,以致我们无法用正整数去计算,因而,逻辑上的一致性就要求法用正整数去计算,因而,逻辑上的一致性就要求X必须以零必须以零概率取每一个值。概率取每一个值。一、随机变量及其概率分布一、随机变量及其概率分布第40页
33、,共175页。在计算连续随机变量的概率时,讨论一个连续随机变量取在计算连续随机变量的概率时,讨论一个连续随机变量取某特定值的概率是没有意义的,最方便的是使用某特定值的概率是没有意义的,最方便的是使用累积分布函数累积分布函数(cumulative distribution function,cdf)。)。设设X为任意随机变为任意随机变量,它对任何实数量,它对任何实数x的的cdf被定义为被定义为 F(x)P(Xx)对于一个连续随机变量,对于一个连续随机变量,F(x)就是概率密度函数)就是概率密度函数f之下、点之下、点x以左的面积。因为以左的面积。因为F(x)就是一个概率,所以它总是介于)就是一个概
34、率,所以它总是介于0-1之之间。此外,若间。此外,若x1c)=1-F(c)2.对任何两个数对任何两个数ab,P(ac)和)和 P(aXb)=P(aXb)=P(aXb)=P(a0,则,则sd(aX)=asd(X)。)。4 4.标准差标准差 XVarX第60页,共175页。标准差S的的定义分别如下式:2SS方差第61页,共175页。作为方差和标准差性质的一个应用作为方差和标准差性质的一个应用而且本身也是有实际意义而且本身也是有实际意义的一个问题的一个问题假如给定随机变量假如给定随机变量X,我们将它减去其均值,我们将它减去其均值并除以并除以其标准差其标准差,便定义了一个新的随机变量,便定义了一个新的
35、随机变量 Z这又可写为这又可写为Z=aX+b,其中,其中a=(1/)而)而b=-(/)。可得:)。可得:E(Z)=aE(X)+b=(/)-(/)=0 Var(Z)=a2Var(X)=2/2=1因此,随机变量因此,随机变量Z的均值为零,方差(或者标准差)为的均值为零,方差(或者标准差)为1。这。这一过程有时被称为将随机变量一过程有时被称为将随机变量X标准化,而标准化,而Z则叫做则叫做标准化随标准化随机变量机变量。5.5.标准化一个随机变量标准化一个随机变量X第62页,共175页。1.1.关联度:协方差与相关关联度:协方差与相关 虽然两个随机变量的联合虽然两个随机变量的联合pdf完整地描述了它们之
36、间的关系,完整地描述了它们之间的关系,但对于它们大致如何互相变动,仍需要一个扼要的度量手段。正但对于它们大致如何互相变动,仍需要一个扼要的度量手段。正如期望值和方差一样,这类似于用一个数字来概括整个分布的某如期望值和方差一样,这类似于用一个数字来概括整个分布的某一方面,现在要概括的便是两个随机变量的联合一方面,现在要概括的便是两个随机变量的联合pdf。四、联合与条件分布的特征四、联合与条件分布的特征第63页,共175页。两个随机变量两个随机变量X和和Y之间的之间的协方差协方差(有时也叫做总体协方差,(有时也叫做总体协方差,以强调它考虑的是描述一个总体的两个随机变量之间的关系),被以强调它考虑的
37、是描述一个总体的两个随机变量之间的关系),被定义为乘积(定义为乘积(X-X)()(Y-Y)的期望值:)的期望值:有时又记为有时又记为 。若。若 ,则平均而言,当,则平均而言,当X超过其均值时,超过其均值时,Y也超过其均值;若也超过其均值;若 ,则平均而言,当,则平均而言,当X超过其均值时,超过其均值时,Y低于其均值。低于其均值。2.2.协方差协方差YXYXEY,XCovXY0XY0XY第64页,共175页。计算计算 的几个有用表达式如下:的几个有用表达式如下:协方差度量两个随机变量之间的协方差度量两个随机变量之间的线性相依性线性相依性。一个正的协方。一个正的协方差表示两随机变量同向移动,而一个
38、负的协方差则表示两随机差表示两随机变量同向移动,而一个负的协方差则表示两随机变量反向移动。变量反向移动。2.2.协方差协方差Y,XCov YXYXXYYXYXYXYXXYXYXEYXEXEYYXEXYXEYXEY,XovC第65页,共175页。性质性质Cov.1:若:若X和和Y相互独立,则相互独立,则注意:此性质的反命题并不成立:注意:此性质的反命题并不成立:X和和Y之间的协方差为零并不之间的协方差为零并不意味着意味着X和和Y相互独立。相互独立。性质性质Cov.2:对任意常数:对任意常数a1,b1,a2和和b2,都有,都有此性质的重要含义在于,两个随机变量之间的协方差会因为将两此性质的重要含义
39、在于,两个随机变量之间的协方差会因为将两者或者两者之一乘以一个常数倍而改变。这在经济学中之所以重者或者两者之一乘以一个常数倍而改变。这在经济学中之所以重要,是因为诸如货币变量和通货膨胀率等,都可使用不同的度量要,是因为诸如货币变量和通货膨胀率等,都可使用不同的度量单位进行定义而不改变其实质。单位进行定义而不改变其实质。协方差的性质协方差的性质0YXCov,Y,XCovaabYa,bXaovC212211第66页,共175页。取决于度量单位是协方差的一个缺陷。为克服这一缺陷,取决于度量单位是协方差的一个缺陷。为克服这一缺陷,现引进现引进X和和Y的的相关系数(相关系数(correlation co
40、efficient):):X和和Y的相关系数有时记做的相关系数有时记做 (而且有时称总体相关)。(而且有时称总体相关)。所谓相关系数是用来测量诸如收入与消费、气温和啤酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:3.3.相关系数相关系数 YXXYYsdXsdY,XCovY,XorrCXY第67页,共175页。22)()()(YYXXYYXXR 2222)()(YYnXXnYXXYn第68页,共175页。性质性质Corr.1 -1Corr(X,Y)1
41、若若Corr(X,Y)=0,或等价地,或等价地Cov(X,Y)=0,则,则X和和Y之间之间就不存在线性关系,并称就不存在线性关系,并称X和和Y为不相关随机变量;否则为不相关随机变量;否则X和和Y就是相关的。就是相关的。Corr(X,Y)=1意味着一个完全的正线性关系,意思是说,意味着一个完全的正线性关系,意思是说,我们对某常数我们对某常数a和某常数和某常数b0可以写可以写Y=a+bX。Corr(X,Y)=-1则意味着一个完全的负线性关系,使得对某则意味着一个完全的负线性关系,使得对某个个b0,则则Corr(a1X+b1,a2Y+b2)=Corr(X,Y)若若a1a20,则则Corr(a1X+b
42、1,a2Y+b2)=-Corr(X,Y)作为一个例子,假定薪水和教育的总体相关系数是作为一个例子,假定薪水和教育的总体相关系数是0.15.这一度量将与用美元、千美元或任何其他单位计算薪水都无这一度量将与用美元、千美元或任何其他单位计算薪水都无关;与用年、季、月或其他单位来衡量受教育时间也无关。关;与用年、季、月或其他单位来衡量受教育时间也无关。3.3.相关系数相关系数第70页,共175页。一旦定义了协方差和相关系数,就可以把方差的主要性质完整一旦定义了协方差和相关系数,就可以把方差的主要性质完整地列出来。地列出来。性质性质VAR.3 对于常数对于常数a和和b,有,有由此可知,若由此可知,若X和
43、和Y不相关(从而不相关(从而Cov(X,Y)=0)则)则和和在后一情形中,要注意为什么差的方差是(两个)方差之和,在后一情形中,要注意为什么差的方差是(两个)方差之和,而不是方差之差。而不是方差之差。4.4.随机变量之和的方差随机变量之和的方差 YX,2abCovYVarbXVarabYaXVar22 YVarXVarYXVar YVarXVarYXVar第71页,共175页。例:例:令令X为星期五夜晚某酒店赚到的利润,而为星期五夜晚某酒店赚到的利润,而Y为接下来星期六夜为接下来星期六夜晚赚到的利润。因此,晚赚到的利润。因此,Z=X+Y就是这两个夜晚赚的利润。假定就是这两个夜晚赚的利润。假定X
44、和和Y都有一个都有一个300美元的期望值和一个美元的期望值和一个15美元的标准差(因而美元的标准差(因而方差为方差为225)。两夜晚的期望利润将是)。两夜晚的期望利润将是E(Z)=E(X)+E(Y)=2300=600美元。若美元。若X和和Y独立,从而它们也不相关,则总利润的独立,从而它们也不相关,则总利润的方差便是两个方差之和:方差便是两个方差之和:Var(Z)=Var(X)+Var(Y)=2225=450。于是总利润的标准差是。于是总利润的标准差是 ,约为,约为21.21美元。美元。4.4.随机变量之和的方差随机变量之和的方差450第72页,共175页。从两个变量推广到多于两个变量的情形。从
45、两个变量推广到多于两个变量的情形。若随机变量若随机变量 中的每一个变量与集合中其中的每一个变量与集合中其他任何一个变量都不相关,我们便称其为他任何一个变量都不相关,我们便称其为两两不相关的随机两两不相关的随机变量变量。也就是说,对所有的。也就是说,对所有的 ,都有,都有4.4.随机变量之和的方差随机变量之和的方差nX,X,X21ji 0jiX,XCov第73页,共175页。性质性质VAR.4 若若 是两两不相关的随机变量且是两两不相关的随机变量且 是是常数,则常数,则用求和符号便可写为用求和符号便可写为此性质的一个特殊情形就是,对所有此性质的一个特殊情形就是,对所有i都取都取ai=1.这时,对
46、两两不相关这时,对两两不相关的随机变量来说,和的方差就是方差之和:的随机变量来说,和的方差就是方差之和:4.4.随机变量之和的方差随机变量之和的方差nX,X 1n,iai 1:niiiniiiXVaraXarVa121nnnnXVaraXVaraXa,XaarV212111 niiniiXVarXrVa11第74页,共175页。协方差和相关系数都是对两个随机变量之间线性关系的度量,协方差和相关系数都是对两个随机变量之间线性关系的度量,并且对称地处理两者。在社会科学中更多的情况是,我们想用一个并且对称地处理两者。在社会科学中更多的情况是,我们想用一个变量变量X去解释另一个变量去解释另一个变量Y。
47、而且,若。而且,若Y和和X有非线性形式的关系,则有非线性形式的关系,则我们还希望知道这个形式。把我们还希望知道这个形式。把Y叫做被解释变量,而叫做被解释变量,而X叫做解释变量。叫做解释变量。例如例如Y代表小时工资,而代表小时工资,而X代表受过正式教育的年数。代表受过正式教育的年数。可以通过给定可以通过给定X下下Y的的条件期望条件期望(有时又称条件均值)来概括(有时又称条件均值)来概括Y和和X之间的关系。即,一旦我们知道之间的关系。即,一旦我们知道X取了某个特定值取了某个特定值x,就能根据,就能根据X的这个结果算出的这个结果算出Y的期望值。记作的期望值。记作E(Y|X=x)或简记)或简记E(Y|
48、x)。一)。一般情形是,随着般情形是,随着x的改变,的改变,E(Y|x)也会改变。)也会改变。5.5.条件期望条件期望第75页,共175页。当当Y是取值为是取值为 的离散随机变量时,则有的离散随机变量时,则有当当Y连续时,连续时,E(Y|x)便由对)便由对 的的y的所有可能值求积分的所有可能值求积分来定义。好比无条件期望那样,条件期望也是对来定义。好比无条件期望那样,条件期望也是对Y所有可能值的所有可能值的一个加权平均,只不过这时的权数反映了一个加权平均,只不过这时的权数反映了X已取了某个特殊值的已取了某个特殊值的情形。因此,情形。因此,E(Y|x)是)是x的某个函数,这个函数告诉我们的某个函
49、数,这个函数告诉我们Y的期望的期望值如何随值如何随x而变化。而变化。5.5.条件期望条件期望my,y 1mjiXYixyfyxYE1xyf yiXY第76页,共175页。例例 令(令(X,Y)代表一个工人总体,其中)代表一个工人总体,其中X为受教育年数,为受教育年数,Y为小为小时工资。那么,时工资。那么,E(Y|x=12)便是总体中所有受了)便是总体中所有受了12年教育(相年教育(相当于读完高中)的工人的平均小时工资。当于读完高中)的工人的平均小时工资。E(Y|x=16)则是所有受过)则是所有受过16年教育的工人的平均小时工资。跟踪各种年教育的工人的平均小时工资。跟踪各种教育水平的期望值,便为
50、工资和教育之间的关系提供了重要信息。教育水平的期望值,便为工资和教育之间的关系提供了重要信息。5.5.条件期望条件期望第77页,共175页。原则上,可以在每个教育水平上求出小时工资的期望值,然后原则上,可以在每个教育水平上求出小时工资的期望值,然后将这些期望值列表。由于教育的变化范围很大将这些期望值列表。由于教育的变化范围很大且可度量为一年且可度量为一年的某个分数的某个分数所以用这种方法显示平均工资和受教育程度之间的所以用这种方法显示平均工资和受教育程度之间的关系很烦琐。计量经济学中的典型方法是,设定一些足以刻画这种关系很烦琐。计量经济学中的典型方法是,设定一些足以刻画这种关系的简单函数。作为