1、高数知识高数知识数理统计基础数理统计基础主主要要内内容容概率论基础概率论基础 如果如果 表示表示n个数的一个序列,那么我个数的一个序列,那么我们就把这们就把这n个数的总和写为:个数的总和写为:第一第一节节 高高数知识数知识一、求和一、求和n21ixi,: n21n1iixxxx 二、算术平均二、算术平均 算术平均(arithmetic mean)就是我们日常生活中使用的普通的平均数,其定义如下式:nXnXXXXn21三、加权算术平均三、加权算术平均n加权平均是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:wXwwwwXwXwXwXiinnnw212211四、变化率四、变
2、化率n变化率的定义如下式: ), 3 , 2(11ntXXXttt五、几何平均五、几何平均 几何平均是n个数据连乘积的n次方根,其定义如下式: nnXXXG21六、线性函数六、线性函数 如果两个变量如果两个变量x和和y的关系是:的关系是:xy10我们便说我们便说y是是x的的线性函数线性函数:而:而 和和 是描述这一关是描述这一关系的两个参数,系的两个参数, 为截距(为截距(Intercept),), 为斜率。为斜率。0101 一个线性函数的定义特征在于,一个线性函数的定义特征在于,y的改变量总是的改变量总是x的改变量的的改变量的 倍:倍: 其中,其中, 表示表示“改变量改变量”。换句话说,。换
3、句话说,x对对y的边的边际效应是一个等于际效应是一个等于 的常数。的常数。xy111例:线性住房支出函数例:线性住房支出函数 假定每月住房支出和每月收入的关系式是假定每月住房支出和每月收入的关系式是Housing=164+0.27income 那么,每增加那么,每增加1元收入,就有元收入,就有0.27元用于住房支出,元用于住房支出,如果家庭收入增加如果家庭收入增加200元,那么住房支出就增加元,那么住房支出就增加0.27200=54元。元。 机械解释上述方程,即时一个没有收入的家庭也有机械解释上述方程,即时一个没有收入的家庭也有164元的住房支出,这当然是不真实的。对低收入水平家元的住房支出,
4、这当然是不真实的。对低收入水平家庭,这个线性函数不能很好的描述庭,这个线性函数不能很好的描述housing和和income之间之间的关系,这就是为什么我们最终还得用其他函数形式来的关系,这就是为什么我们最终还得用其他函数形式来描述这种关系。描述这种关系。多于两个变量的线性函数:多于两个变量的线性函数: 假定假定y与两个变量与两个变量 和和 有一般形式的关系:有一般形式的关系: 由于这个函数的图形是由于这个函数的图形是三维的,所以相当难以想象,三维的,所以相当难以想象,不过不过 仍然是截距(即仍然是截距(即 =0和和 =0时时y的取值),且的取值),且 和和 都是特定斜率的度量。由方程(都是特定
5、斜率的度量。由方程(A.12)可知,给定)可知,给定 和和 的改变量,的改变量,y的改变量是的改变量是 若若 不改变,即不改变,即 ,则有,则有 因此因此 是关系式在是关系式在 坐标上的斜率:坐标上的斜率:1x2x22110 xxy01x2x121x2x2211xxy2x02x0211xxy,11x0211xxy, 因为它度量了保持因为它度量了保持 固定时,固定时,y如何随如何随 而变,所而变,所以常把以常把 叫做叫做 对对y的的偏效应偏效应。由于偏效应涉及保持其他。由于偏效应涉及保持其他因素不变,所以它与因素不变,所以它与其他条件不变(其他条件不变(Ceteris Paribus)的的概念有
6、密切联系,参数概念有密切联系,参数 可作类似解释:即若可作类似解释:即若 ,则则 因此,因此, 是是 对对y的偏效应。的偏效应。线性函数的性质线性函数的性质2x1x1x1201x22xy22x 假定大学生每月对假定大学生每月对CD的需求量与的需求量与CD的价格和每个月的价格和每个月的零花钱有如下关系:的零花钱有如下关系: 式中,式中,price为每张碟的价格,为每张碟的价格,income以元计算。需以元计算。需求曲线表示在保持收入(和其他因素)不变的情况下,求曲线表示在保持收入(和其他因素)不变的情况下,quantity和和price的关系。的关系。例:例: 对对CDCD的需求的需求incom
7、e.price.quantity03089120线性函数的基本性质:线性函数的基本性质: 不管不管x的初始值是什么,的初始值是什么,x每变化一个单位都导致每变化一个单位都导致y同样同样的变化。的变化。x对对y的边际效应是常数,这对许多经济关系来说多的边际效应是常数,这对许多经济关系来说多少有点不真实。例如,边际报酬递减这个重要的经济概念就少有点不真实。例如,边际报酬递减这个重要的经济概念就不符合线性关系。不符合线性关系。 为了建立各种经济现象的模型,我们需要研究一些为了建立各种经济现象的模型,我们需要研究一些非线非线性函数。性函数。 非线性函数的特点是,非线性函数的特点是,给定给定x的变化,的
8、变化,y的变化依赖于的变化依赖于x的初始值。的初始值。七、若干特殊函数七、若干特殊函数1. 1.二次函数二次函数 刻画报酬递减规律的一个简单方法,就是在线性关系刻画报酬递减规律的一个简单方法,就是在线性关系中添加一个二次项。中添加一个二次项。 考虑方程式考虑方程式 式中,式中, , 和和 为参数。当为参数。当 时,时,y和和x之间的关之间的关系呈抛物线状,并且可以证明,函数的最大值出现在系呈抛物线状,并且可以证明,函数的最大值出现在2210 xxy01202212x1. 1.二次函数二次函数 例如,若例如,若y=6+8x-2x2。(从而。(从而 =8且且 =-2),则),则y的最大值出现在的最
9、大值出现在x*=8/4=2处,并且这个最大值是处,并且这个最大值是6+82-2(2)2=14。12 对方程式对方程式 意味着意味着x对对y的的边际效应递减,边际效应递减,这从图中清晰可这从图中清晰可见,应用微积分知识,也可以通过求这个二次函数的一见,应用微积分知识,也可以通过求这个二次函数的一阶导数得出。阶导数得出。 斜率斜率=方程右端是此二次函数对方程右端是此二次函数对x的的导数导数。 同样,同样, 则意味着则意味着x对对y的的边际效应递增边际效应递增,二次,二次函数的图形就呈函数的图形就呈U行,函数的最小值出现在点行,函数的最小值出现在点 处。处。1. 1.二次函数二次函数2210 xxy
10、02xxy21202212x 在计量经济分析中起着最重要作用的非线性函数是在计量经济分析中起着最重要作用的非线性函数是自自然对数,然对数,或简称为或简称为对数函数,对数函数,记为记为还有几种不同符号可以表示自然对数,最常用的是还有几种不同符号可以表示自然对数,最常用的是 或或 。当对数使用几个不同的底数时,这些不同的。当对数使用几个不同的底数时,这些不同的符号是有作用的。目前,只有自然对数最重要,因此我符号是有作用的。目前,只有自然对数最重要,因此我们都用们都用 表示自然对数。表示自然对数。2.2.自然对数自然对数 xlogy xln xloge xlog2.2.自然对数自然对数 xlogy
11、图图2.1.4 y=log(x) 的图形的图形2.2.自然对数自然对数 有如下性质:有如下性质: 1. log(x)可正可负:可正可负:log(x)0,0 x0,x1 2.一些有用的性质(牢记):一些有用的性质(牢记): log(x1x2)=log(x1)+log(x2),),x1,x20 log(x1/x2)=log(x1)-log(x2),),x1,x20 log(xc)=clog(x),),x0,c为任意实数为任意实数2.2.自然对数自然对数 对数可用于计量经济学应用中的各种近似计算。对数可用于计量经济学应用中的各种近似计算。 1.对于对于x0,有有log(1+x)x。这个近似计算随着。
12、这个近似计算随着x变变大而越来越不精确。大而越来越不精确。 2.两对数之差可用作比例变化的近似值。令两对数之差可用作比例变化的近似值。令x0和和x1为两为两个正数,可以证明(利用微积分),对个正数,可以证明(利用微积分),对x的微小变化,有的微小变化,有如果我们用如果我们用100乘以上述方程,并记乘以上述方程,并记那么,对那么,对x的的微小微小变化,便有变化,便有“微小微小”的含义取决于具体情况。的含义取决于具体情况。 000101xxxxxxlogxlog 01xlogxlogxlog x%xlog1002.2.自然对数自然对数近似计算的作用:近似计算的作用: 定义定义y对对x的的弹性(弹性
13、(elasticity)为为换言之,换言之,y对对x的弹性就是当的弹性就是当x增加增加1%时时y的百分数变化。的百分数变化。 若若y是是x的线性函数:的线性函数: ,则这个弹性是,则这个弹性是它明显取决于它明显取决于x的取值(的取值(弹性并非沿着需求曲线保持不变弹性并非沿着需求曲线保持不变)。)。x%y%yxxyxy10 xxyxyxxy10112.2.自然对数自然对数 不仅在需求理论中,在许多应用经济学领域,弹性都不仅在需求理论中,在许多应用经济学领域,弹性都是非常重要的。在许多情况下,使用一个常弹性模型都很是非常重要的。在许多情况下,使用一个常弹性模型都很方便,而对数函数能帮助我们设定这样
14、的模型。如果我们方便,而对数函数能帮助我们设定这样的模型。如果我们对对x和和y都使用对数近似计算,弹性就近似等于都使用对数近似计算,弹性就近似等于因此,一个因此,一个常弹性模型常弹性模型可近似描述为方程可近似描述为方程式中,式中, 为为y对对x的弹性(假定的弹性(假定x,y0)。)。 这类模型在经验经济学中扮演着重要角色。目前,式这类模型在经验经济学中扮演着重要角色。目前,式中的中的 只是接近于弹性这一事实并不重要,可以忽略。只是接近于弹性这一事实并不重要,可以忽略。 xlogylog xlogylog1011例:常弹性需求函数例:常弹性需求函数 若若q代表需求量而代表需求量而p代表价格,并且
15、二者关系为代表价格,并且二者关系为则需求的价格弹性是则需求的价格弹性是-1.25.初略地说,价格每增加初略地说,价格每增加1%,将,将导致需求量下降导致需求量下降1.25%。 plog.qlog251742.2.自然对数自然对数 在经验研究工作中还经常出现使用对数函数的其他可在经验研究工作中还经常出现使用对数函数的其他可能性。假定能性。假定y0,且,且则则 ,从而,从而 。 由此可知,当由此可知,当y和和x有上述方程所示关系时,有上述方程所示关系时, xylog10 xylog1 xylog1100100 xy%1100例:例: 对数工资方程对数工资方程 假设小时工资与受教育年数有如下关系:假
16、设小时工资与受教育年数有如下关系:根据前面所述方程,有根据前面所述方程,有由此可知,多受一年教育将使小时工资增加约由此可知,多受一年教育将使小时工资增加约9.4%。 通常把通常把%y/x称为称为y对对x的的半弹性,半弹性,半弹性表示当半弹性表示当x增增加一个单位时加一个单位时y的百分数变化。在上述模型中,半弹性是个的百分数变化。在上述模型中,半弹性是个常数并且等于常数并且等于 ,在上述例子中,我们可以方便的把,在上述例子中,我们可以方便的把工资和教育的关系概括为:多受一年教育工资和教育的关系概括为:多受一年教育无论所受教育无论所受教育的起点如何的起点如何都将使工资提高约都将使工资提高约9.4%
17、。这说明了这类模。这说明了这类模型在经济学中的重要作用。型在经济学中的重要作用。edu.wagelog0940782edu.edu.wage%49094010011002.2.自然对数自然对数 另一种关系式在应用经济学中也是有意义的:另一种关系式在应用经济学中也是有意义的:其中,其中,x0。若取。若取y的变化,则有的变化,则有 ,这又可以,这又可以写为写为 。 利用近似计算,可得利用近似计算,可得当当x增加增加1%时,时,y变化变化 个单位。个单位。 xlogy10 xlogy1 xlogy1001001x%y10011001例:劳动供给函数例:劳动供给函数 假定一个工人的劳动供给可描述为假定
18、一个工人的劳动供给可描述为式中,式中,wage为小时工资而为小时工资而hours为每周工作小时数,于是,为每周工作小时数,于是,由方程可得:由方程可得: 换言之,工资每增加换言之,工资每增加1%,将使每周工作小时增加约,将使每周工作小时增加约0.45或或略小于半个小时。若工资增加略小于半个小时。若工资增加10%,则,则 或约四个半小时。或约四个半小时。注意:注意:不宜对更大的工资百分数变化应用这个近似计算。不宜对更大的工资百分数变化应用这个近似计算。wagelog.hours14533wage%.wage%.wagelog.hours4510100145145514104510.hours 考
19、虑方程考虑方程 此处此处log(y)是是x的线性函数,但是怎样写出的线性函数,但是怎样写出y本身作为本身作为x的一个函数呢?的一个函数呢?指数函数指数函数给出了答案。给出了答案。 我们把指数函数写为我们把指数函数写为y=exp(x),),有时也写为有时也写为 ,但在我们课程中这个符号不常用。但在我们课程中这个符号不常用。 指数函数的两个重要的数值是指数函数的两个重要的数值是exp(0)=1和和exp(1)=2.7183(取(取4位小数)。位小数)。 3.3.指数函数指数函数 xylog10 xey 3.3.指数函数指数函数 xexpy 图图2.1.4 y=exp(x) 的图形的图形 从上图可以
20、看出,从上图可以看出,exp(x)对任何对任何x值都有定义,而且值都有定义,而且总大于零。总大于零。 指数函数在如下意义上是对数函数的反函数:对所有指数函数在如下意义上是对数函数的反函数:对所有x,都有都有logexp(x)=x,而对,而对x0,有,有explog(x)=x。换言之,对数换言之,对数“解除了解除了”指数,反之亦然。对数函数和指数指数,反之亦然。对数函数和指数函数互为反函数。函数互为反函数。 指数函数的两个有用性质是指数函数的两个有用性质是 exp(x1+x2)=exp(x1)exp(x2) 和和 expclog(x)=xc3.3.指数函数指数函数记忆:记忆:经济学中常用的一些函
21、数及其导数有经济学中常用的一些函数及其导数有 4.4.微分学微分学xdxdy;xxy2122102 2110 xdxdy;xy211102xdxdy;xy xdxdy;xlogy110 xexpdxdy;xexpy10110 当当y是多元函数时,是多元函数时,偏导数偏导数的概念便很重要。假定的概念便很重要。假定y=f(x1,x2),),此时便有两个偏导数,一个关于此时便有两个偏导数,一个关于x1,另一个关,另一个关于于x2。y对对x1的偏导数记为的偏导数记为 ,就是把,就是把x2看做常数时方程对看做常数时方程对x1的普通导数。类似的,的普通导数。类似的, 就是固定就是固定x1时方程对时方程对x
22、2的导数。的导数。 若若则则这些偏导数可被视为经济学所定义的偏效应。这些偏导数可被视为经济学所定义的偏效应。 4.4.微分学微分学1xy2xy22110 xxy221xyxy1, 把工资与受教育年数和工作经验(以年计)相联系的一把工资与受教育年数和工作经验(以年计)相联系的一个函数是个函数是exper对对wage的偏效应就是上式对的偏效应就是上式对exper的偏导数:的偏导数:这是增加一年工作经验所导致工资的近似变化。注意这个偏这是增加一年工作经验所导致工资的近似变化。注意这个偏效应与效应与exper和和educ的初始水平都有关系。例如,一个从的初始水平都有关系。例如,一个从educ=12和和
23、exper=5开始的工人,再增加一年工作经验,将使开始的工人,再增加一年工作经验,将使工资增加约工资增加约0.19-0.085+0.00712=0.234元。准确的变化通元。准确的变化通过计算,结果是过计算,结果是0.23,和近似计算结果非常接近。,和近似计算结果非常接近。 例:例: 含交互项的工资方程含交互项的工资方程erexpeduc.erexp.erexp.educ.agew007000401904101032educ.erexp.erexpagew00700080190一、随机变量及其概率分布一、随机变量及其概率分布 假设我们掷一枚钱币假设我们掷一枚钱币10次,并计算出现正面的次数,次
24、,并计算出现正面的次数,这就是一个这就是一个实验实验的例子。一般地说,的例子。一般地说,一个实验是指至少在一个实验是指至少在理论上能够无限重复下去的任何一种程序,并且它有一个理论上能够无限重复下去的任何一种程序,并且它有一个定义完好的结果集。定义完好的结果集。 一个一个随机变量随机变量是指一个具有数值特征并由一个实验来是指一个具有数值特征并由一个实验来决定其结果的变量。决定其结果的变量。 第二节第二节 概率论基础概率论基础 按照概率和统计学的惯例,我们一律用大写字母如常按照概率和统计学的惯例,我们一律用大写字母如常见的见的W,X,Y和和Z表示表示随机变量随机变量,而用相应的小写字母,而用相应的
25、小写字母w,x,y和和z表示表示随机变量的特定结果随机变量的特定结果。 例如,在掷币实验中,令例如,在掷币实验中,令X为一枚钱币投掷为一枚钱币投掷10次出现正次出现正面的次数。所以面的次数。所以X并不是任何具体数值,但我们知道并不是任何具体数值,但我们知道X将在将在集合集合 中取一个值。比方说,一个特殊的结果中取一个值。比方说,一个特殊的结果是是x=6。 我们用下标表示一系列随机变量。例如,我们记录随我们用下标表示一系列随机变量。例如,我们记录随机选择的机选择的20个家庭去年的收入。可以用个家庭去年的收入。可以用X1,X2,X20表表示这些随机变量,并用示这些随机变量,并用x1,x2,x20表
26、示其特殊结果。表示其特殊结果。一、随机变量及其概率分布一、随机变量及其概率分布10210, 如定义所言,即使随机变量描述的是一些定性事件,我如定义所言,即使随机变量描述的是一些定性事件,我们也总定义它的结果是数值。例如,考虑只掷一枚钱币,其们也总定义它的结果是数值。例如,考虑只掷一枚钱币,其两个结果是正面和反面。我们可以定义一个随机变量如下:两个结果是正面和反面。我们可以定义一个随机变量如下:如果出现正面则如果出现正面则X=1;如果出现反面则;如果出现反面则X=0。 一个只能取一个只能取0和和1两个值的随机变量叫做两个值的随机变量叫做贝努利随机变量贝努利随机变量。 XBernoulli( )(
27、读作(读作“X服从一个成功概率为服从一个成功概率为 的贝努利分布)的贝努利分布):P(X=1)=,P(X=0)=1-一、随机变量及其概率分布一、随机变量及其概率分布1. 1.离散随机变量离散随机变量 离散随机变量离散随机变量是指一个只取有限个或可数的无限个是指一个只取有限个或可数的无限个数值的随机变量。数值的随机变量。 “可数的无限个可数的无限个”:虽然随机变量可取无限个值,:虽然随机变量可取无限个值,但这些值可以和正整数一一对应。但这些值可以和正整数一一对应。 贝努力随机变量是离散随机变量的最简单的例子。贝努力随机变量是离散随机变量的最简单的例子。 一、随机变量及其概率分布一、随机变量及其概
28、率分布 一个离散随机变量要由它的全部可能值和取每个值一个离散随机变量要由它的全部可能值和取每个值的相应概率来完整描述。如果的相应概率来完整描述。如果X取取k个可能值个可能值 其概率其概率p1,p2,pk被定义为被定义为 pj=P(X=xj),j=1,2, ,k (读作:(读作:“X取取值值xj的概率等于的概率等于pj”。)。)其中,每个其中,每个pj都在都在0-1之间,并且之间,并且 p1+p2+ +pk=11. 1.离散随机变量离散随机变量kxxx, 21 X的的概率密度函数(概率密度函数(probability density function,pdf)概括了概括了X的可能结果及其相应概率
29、的信息:的可能结果及其相应概率的信息: 而且对某个而且对某个j,凡是不等于,凡是不等于xj的的x都有都有f(x)=0。换言之,对任。换言之,对任何实数何实数x,f(x)都是随机变量)都是随机变量X取该特定值取该特定值x的概率。当我们的概率。当我们设计多于一个随机变量时,有时需要给所考虑的设计多于一个随机变量时,有时需要给所考虑的pdf加一个下加一个下标:例如标:例如fx是是X的的pdf,fY是是Y的的pdf等等。等等。1. 1.离散随机变量离散随机变量 kjpxfjj, 21 给定任一离散随机变量的给定任一离散随机变量的pdf,就不难计算关于该随机变,就不难计算关于该随机变量的任何事件的概率。
30、例如,设量的任何事件的概率。例如,设X为一名篮球运动员在两次罚为一名篮球运动员在两次罚球中的命中次数。因此球中的命中次数。因此X的三个可能值是的三个可能值是0,1,2。假定。假定X的的pdf是是 f(0)=0.20,f(1)=0.44和和f(2)=0.36这三个概率之和必然为这三个概率之和必然为1.利用这个利用这个pdf,我们能算出该运动员,我们能算出该运动员至少投中一球的概率:至少投中一球的概率: P(X1)=P(X=1)+P(X=2)=0.44+0.36=0.80。X的的pdf如下图示:如下图示:1. 1.离散随机变量离散随机变量2.2.连续随机变量连续随机变量 连续随机变量连续随机变量是
31、指一个取任何实数的概率都为零的是指一个取任何实数的概率都为零的变量。变量。 这个定义有点违背直觉,因为在任何应用中,我们这个定义有点违背直觉,因为在任何应用中,我们最终都会观测到一个随机变量取得的某种结果。这里的最终都会观测到一个随机变量取得的某种结果。这里的思想是,一个连续随机变量思想是,一个连续随机变量X的可能取值如此之多,以的可能取值如此之多,以致我们无法用正整数去计算,因而,逻辑上的一致性就致我们无法用正整数去计算,因而,逻辑上的一致性就要求要求X必须以零概率取每一个值。必须以零概率取每一个值。 一、随机变量及其概率分布一、随机变量及其概率分布 在计算连续随机变量的概率时,讨论一个连续
32、随机在计算连续随机变量的概率时,讨论一个连续随机变量取某特定值的概率是没有意义的,最方便的是使用变量取某特定值的概率是没有意义的,最方便的是使用累积分布函数(累积分布函数(cumulative distribution function,cdf)。)。设设X为任意随机变量,它对任何实数为任意随机变量,它对任何实数x的的cdf被定义为被定义为 F(x)P(Xx) 对于一个连续随机变量,对于一个连续随机变量,F(x)就是概率密度函数)就是概率密度函数f之下、点之下、点x以左的面积。因为以左的面积。因为F(x)就是一个概率,所)就是一个概率,所以它总是介于以它总是介于0-1之间。此外,若之间。此外,
33、若x1c)=1-F(c) 2.对任何两个数对任何两个数ab,P(ac)和)和 P(aXb)=P(aXb)=P(aXb) =P (a0,则,则sd(aX)=asd(X)。)。4.4. 标准差标准差 XVarX标准差S的的定义分别如下式:2SS方差 作为方差和标准差性质的一个应用作为方差和标准差性质的一个应用而且本身也是而且本身也是有实际意义的一个问题有实际意义的一个问题假如给定随机变量假如给定随机变量X,我们将,我们将它减去其均值它减去其均值并除以其标准差并除以其标准差,便定义了一个新的随,便定义了一个新的随机变量机变量 Z这又可写为这又可写为Z=aX+b,其中,其中a=(1/)而)而b=-(/
34、)。可)。可得:得:E(Z)=aE(X)+b=(/)-(/)=0 Var(Z)=a2Var(X)=2/2 =1因此,随机变量因此,随机变量Z的均值为零,方差(或者标准差)为的均值为零,方差(或者标准差)为1。这一过程有时被称为将随机变量这一过程有时被称为将随机变量X标准化,而标准化,而Z则叫做则叫做标标准化随机变量准化随机变量。5.5. 标准化一个随机变量标准化一个随机变量X1. 1.关联度:协方差与相关关联度:协方差与相关 虽然两个随机变量的联合虽然两个随机变量的联合pdf完整地描述了它们之间完整地描述了它们之间的关系,但对于它们大致如何互相变动,仍需要一个扼要的关系,但对于它们大致如何互相
35、变动,仍需要一个扼要的度量手段。正如期望值和方差一样,这类似于用一个数的度量手段。正如期望值和方差一样,这类似于用一个数字来概括整个分布的某一方面,现在要概括的便是两个随字来概括整个分布的某一方面,现在要概括的便是两个随机变量的联合机变量的联合pdf。四、联合与条件分布的特征四、联合与条件分布的特征 两个随机变量两个随机变量X和和Y之间的之间的协方差协方差(有时也叫做总体(有时也叫做总体协方差,以强调它考虑的是描述一个总体的两个随机变量协方差,以强调它考虑的是描述一个总体的两个随机变量之间的关系),被定义为乘积(之间的关系),被定义为乘积(X-X)()(Y-Y)的期望值:)的期望值:有时又记为
36、有时又记为 。若。若 ,则平均而言,当,则平均而言,当X超过其均超过其均值时,值时,Y也超过其均值;若也超过其均值;若 ,则平均而言,当,则平均而言,当X超超过其均值时,过其均值时,Y低于其均值。低于其均值。2.2.协方差协方差YXYXEY ,XCovXY0XY0XY 计算计算 的几个有用表达式如下:的几个有用表达式如下: 协方差度量两个随机变量之间的协方差度量两个随机变量之间的线性相依性线性相依性。一个正。一个正的协方差表示两随机变量同向移动,而一个负的协方差则的协方差表示两随机变量同向移动,而一个负的协方差则表示两随机变量反向移动。表示两随机变量反向移动。2.2.协方差协方差Y ,XCov
37、 YXYXXYYXYXYXYXXYXYXEYXEXEYYXEXYXEYXEY ,XovC 性质性质Cov.1:若:若X和和Y相互独立,则相互独立,则注意:此性质的反命题并不成立:注意:此性质的反命题并不成立:X和和Y之间的协方差为之间的协方差为零并不意味着零并不意味着X和和Y相互独立。相互独立。 性质性质Cov.2:对任意常数:对任意常数a1,b1,a2和和b2,都有,都有此性质的重要含义在于,两个随机变量之间的协方差会因此性质的重要含义在于,两个随机变量之间的协方差会因为将两者或者两者之一乘以一个常数倍而改变。这在经济为将两者或者两者之一乘以一个常数倍而改变。这在经济学中之所以重要,是因为诸
38、如货币变量和通货膨胀率等,学中之所以重要,是因为诸如货币变量和通货膨胀率等,都可使用不同的度量单位进行定义而不改变其实质。都可使用不同的度量单位进行定义而不改变其实质。协方差的性质协方差的性质0YXCov,Y ,XCovaabYa ,bXaovC212211 取决于度量单位是协方差的一个缺陷。为克服这一缺取决于度量单位是协方差的一个缺陷。为克服这一缺陷,现引进陷,现引进X和和Y的的相关系数(相关系数(correlation coefficient):):X和和Y的相关系数有时记做的相关系数有时记做 (而且有时称总体相关)。(而且有时称总体相关)。 所谓相关系数是用来测量诸如收入与消费、气温和啤
39、酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:3.3.相关系数相关系数 YXXYYsdXsdY ,XCovY ,XorrCXY22)()()(YYXXYYXXR 2222)()(YYnXXnYXXYn性质性质Corr.1 -1Corr(X,Y)1 若若Corr(X,Y)=0,或等价地,或等价地Cov(X,Y)=0,则,则X和和Y之间就不存在线性关系,并称之间就不存在线性关系,并称X和和Y为不相关随机变量;为不相关随机变量;否则否则X和和Y就是相关的。
40、就是相关的。 Corr(X,Y)=1意味着一个完全的正线性关系,意思意味着一个完全的正线性关系,意思是说,我们对某常数是说,我们对某常数a和某常数和某常数b0可以写可以写Y=a+bX。 Corr(X,Y)=-1则意味着一个完全的负线性关系,使则意味着一个完全的负线性关系,使得对某个得对某个b0, 则则Corr(a1X+b1,a2Y+b2)=Corr(X,Y) 若若a1a20, 则则Corr(a1X+b1,a2Y+b2)=-Corr(X,Y) 作为一个例子,假定薪水和教育的总体相关系数是作为一个例子,假定薪水和教育的总体相关系数是0.15.这一度量将与用美元、千美元或任何其他单位计算薪这一度量将
41、与用美元、千美元或任何其他单位计算薪水都无关;与用年、季、月或其他单位来衡量受教育时间水都无关;与用年、季、月或其他单位来衡量受教育时间也无关。也无关。3.3.相关系数相关系数 一旦定义了协方差和相关系数,就可以把方差的主要一旦定义了协方差和相关系数,就可以把方差的主要性质完整地列出来。性质完整地列出来。 性质性质VAR.3 对于常数对于常数a和和b,有,有由此可知,若由此可知,若X和和Y不相关(从而不相关(从而Cov(X,Y)=0)则)则和和在后一情形中,要注意为什么差的方差是(两个)方差之在后一情形中,要注意为什么差的方差是(两个)方差之和,而不是方差之差。和,而不是方差之差。4.4.随机
42、变量之和的方差随机变量之和的方差 YX,2abCovYVarbXVarabYaXVar22 YVarXVarYXVar YVarXVarYXVar 例:例: 令令X为星期五夜晚某酒店赚到的利润,而为星期五夜晚某酒店赚到的利润,而Y为接下来为接下来星期六夜晚赚到的利润。因此,星期六夜晚赚到的利润。因此,Z=X+Y就是这两个夜晚赚就是这两个夜晚赚的利润。假定的利润。假定X和和Y都有一个都有一个300美元的期望值和一个美元的期望值和一个15美美元的标准差(因而方差为元的标准差(因而方差为225)。两夜晚的期望利润将是)。两夜晚的期望利润将是E(Z)=E(X)+E(Y)=2300=600美元。若美元。
43、若X和和Y独立,独立,从而它们也不相关,则总利润的方差便是两个方差之和:从而它们也不相关,则总利润的方差便是两个方差之和:Var(Z)=Var(X)+Var(Y)=2225=450。于是总利。于是总利润的标准差是润的标准差是 ,约为,约为21.21美元。美元。4.4.随机变量之和的方差随机变量之和的方差450 从两个变量推广到多于两个变量的情形。从两个变量推广到多于两个变量的情形。 若随机变量若随机变量 中的每一个变量与集合中中的每一个变量与集合中其他任何一个变量都不相关,我们便称其为其他任何一个变量都不相关,我们便称其为两两不相关的两两不相关的随机变量随机变量。也就是说,对所有的。也就是说,
44、对所有的 ,都有,都有4.4.随机变量之和的方差随机变量之和的方差nX,X,X21ji 0jiX,XCov 性质性质VAR.4 若若 是两两不相关的随机变量且是两两不相关的随机变量且 是常数,则是常数,则用求和符号便可写为用求和符号便可写为此性质的一个特殊情形就是,对所有此性质的一个特殊情形就是,对所有i都取都取ai=1.这时,对这时,对两两不相关的随机变量来说,和的方差就是方差之和:两两不相关的随机变量来说,和的方差就是方差之和:4.4.随机变量之和的方差随机变量之和的方差nX,X 1n ,iai 1:niiiniiiXVaraXarVa121nnnnXVaraXVaraXa,XaarV21
45、2111 niiniiXVarXrVa11 协方差和相关系数都是对两个随机变量之间线性关系协方差和相关系数都是对两个随机变量之间线性关系的度量,并且对称地处理两者。在社会科学中更多的情况的度量,并且对称地处理两者。在社会科学中更多的情况是,我们想用一个变量是,我们想用一个变量X去解释另一个变量去解释另一个变量Y。而且,若。而且,若Y和和X有非线性形式的关系,则我们还希望知道这个形式。把有非线性形式的关系,则我们还希望知道这个形式。把Y叫做被解释变量,而叫做被解释变量,而X叫做解释变量。例如叫做解释变量。例如Y代表小时工资,代表小时工资,而而X代表受过正式教育的年数。代表受过正式教育的年数。 可
46、以通过给定可以通过给定X下下Y的的条件期望条件期望(有时又称条件均值)(有时又称条件均值)来概括来概括Y和和X之间的关系。即,一旦我们知道之间的关系。即,一旦我们知道X取了某个特定取了某个特定值值x,就能根据,就能根据X的这个结果算出的这个结果算出Y的期望值。记作的期望值。记作E(Y|X=x)或简记)或简记E(Y|x)。一般情形是,随着)。一般情形是,随着x的改变,的改变,E(Y|x)也会改变。)也会改变。5.5.条件期望条件期望 当当Y是取值为是取值为 的离散随机变量时,则有的离散随机变量时,则有当当Y连续时,连续时, E(Y|x)便由对)便由对 的的y的所有可能值求的所有可能值求积分来定义
47、。好比无条件期望那样,条件期望也是对积分来定义。好比无条件期望那样,条件期望也是对Y所有所有可能值的一个加权平均,只不过这时的权数反映了可能值的一个加权平均,只不过这时的权数反映了X已取了已取了某个特殊值的情形。因此,某个特殊值的情形。因此,E(Y|x)是)是x的某个函数,这个的某个函数,这个函数告诉我们函数告诉我们Y的期望值如何随的期望值如何随x而变化。而变化。5.5.条件期望条件期望my,y 1mjiXYixyfyxYE1xyf yiXY 例例 令(令(X,Y)代表一个工人总体,其中)代表一个工人总体,其中X为受教育年数,为受教育年数,Y为小时工资。那么,为小时工资。那么,E(Y|x=12
48、)便是总体中所有受了)便是总体中所有受了12年教育(相当于读完高中)的工人的平均小时工资。年教育(相当于读完高中)的工人的平均小时工资。 E(Y|x=16)则是所有受过)则是所有受过16年教育的工人的平均小时工资。年教育的工人的平均小时工资。跟踪各种教育水平的期望值,便为工资和教育之间的关系跟踪各种教育水平的期望值,便为工资和教育之间的关系提供了重要信息。提供了重要信息。5.5.条件期望条件期望 原则上,可以在每个教育水平上求出小时工资的期望值,原则上,可以在每个教育水平上求出小时工资的期望值,然后将这些期望值列表。由于教育的变化范围很大然后将这些期望值列表。由于教育的变化范围很大且且可度量为
49、一年的某个分数可度量为一年的某个分数所以用这种方法显示平均工所以用这种方法显示平均工资和受教育程度之间的关系很烦琐。计量经济学中的典型资和受教育程度之间的关系很烦琐。计量经济学中的典型方法是,设定一些足以刻画这种关系的简单函数。作为一方法是,设定一些足以刻画这种关系的简单函数。作为一个例子,假设个例子,假设WAGE在给定在给定EDUC时的期望值是如下线性函时的期望值是如下线性函数:数: E(WAGE|EDUC)=1.05+0.45EDUC假定这一关系对工人总体成立,则受假定这一关系对工人总体成立,则受8年和年和16年教育者的平年教育者的平均工资分别是多少?均工资分别是多少?EDUC的系数如何解
50、释?的系数如何解释?5.5.条件期望条件期望 条件期望的一些基本性质对计量经济分析中的推导条件期望的一些基本性质对计量经济分析中的推导颇为有用。颇为有用。 性质性质CE.1 对任意函数对任意函数c(X),都有),都有Ec(X)|X=c(X)。)。 这意味着,当我们计算以这意味着,当我们计算以X为条件的期望值时,为条件的期望值时,X的的函数可视为常数。例如函数可视为常数。例如E(X2|X)=X2。直观上,这无非。直观上,这无非就是说,若知道了就是说,若知道了X,也就知道了,也就知道了X2。 6.6.条件期望的性质条件期望的性质 性质性质CE.2 对任意函数对任意函数a(X)和)和b(X),),