1、1第第 2 讲讲关于优化的数学知识2优化数学优化数学 许多经济理论基于经济参与人寻求某个函数的最优值这个假定 消费者寻求最大化效用 厂商寻求最大化利润 本讲介绍对于这些问题的一些共同的数学知识3优化数学优化数学“新古典”模型方法与优化数学 偏好目标函数 约束选择变量需要满足的条件 最优选择一阶条件和二阶条件 行为变化包络定理4单变量函数的优化单变量函数的优化 简单例子:管理者希望最大化利润)(qf =f(q)数量*q*在q*获得最大化利润*5单变量函数的优化单变量函数的优化 管理者尝试改变 q 寻找最大利润的位置 q1 到 q2 的上升导致 的上升的上升 =f(q)数量*q*1q1 2q20q
2、6单变量函数的优化单变量函数的优化 如果产出增加超过 q*,利润将会下降 q*到 q3 的增加导致利润 下降 =f(q)数量*q*0q 3q37最大值的一阶条件最大值的一阶条件 对于一个单变量函数,为了获得某个最大值点,这点的导数一定是00*qqdqdf8二阶条件二阶条件 一阶条件(d/dq)是最大值的 必要 条件,但不是 充分 条件数量*q*如果利润函数是u型的,一阶条件会导致选择 q*,将会最小化9二阶条件二阶条件 这意味着,为了 q*是最优值,0 *dqqdq对于并且0 *dqqdq对于 因此,在 q*,d/dq 一定是递减的 10二阶导数二阶导数(局部)最大值的二阶条件是0)(*22q
3、qqqqfdqd11利润最大化的例子利润最大化的例子 假定利润和产量的关系是=1,000q-5q2 最大值的一阶条件是d/dq=1,000-10q=0q*=100 因为二阶导数总是-10,q=100 是一个 全局最大值点12多变量函数多变量函数 经济参与人的大多数目标依赖于多个变量 必须进行权衡 一个变量(y)依赖于一系列其他变量(x1,x2,xn)可以记做),.,(nxxxfy2113 y 对于 x1 的偏导数记做偏导数偏导数1111 xyfffxx或或或 在计算偏导数的时候,所有其他的 x 保持不变 偏导数是其他条件不变 假设的数学表达 表明了当其他影响保持不变的时候,一个变量的变化如何影
4、响某个结果14偏导数偏导数 我们必须关注变量的单位 如果q 代表汽油需求数量(单位是十亿加仑),p 代表了每加仑的美元价格,那么 q/p 测量了每加仑汽油价格变化一元,需求数量的改变量(十亿加仑每年)15弹性弹性 弹性测量了一个变量变化对于其他变量的比率效应 无单位 y 对于 x 的弹性是yxxyyxxyxxyyexy,16弹性和函数形式弹性和函数形式 假设y=a+bx+其他项 在这种情况下,bxaxbyxbyxxyexy,ey,x 不是一个常数 必须注意到是在哪点计算的弹性17弹性和函数形式弹性和函数形式 假设y=axb 在这种情况下,baxxabxyxxyebbxy1,18弹性和函数形式弹
5、性和函数形式 假设ln y=ln a+b ln x 在这种情况下,lnlny xy xyebx yx 弹性可以通过对数微分计算19二阶偏导数二阶偏导数 偏导数的偏导数被称作 二阶偏导数ijijjifxxfxxf2)/(20Youngs 定理定理 在一般条件下,计算二阶偏导数的偏微分顺序不重要jiijff 21利用二阶偏导数利用二阶偏导数 二阶偏导数在许多经济定理中起到了重要作用 一个最重要的是一个变量自身的二阶偏导数,fii 表明 xi 对于 y 的边际影响(y/xi)如何随着 xi 增加而变化 fii 0 表明了边际效应递减22全微分全微分 假设 y=f(x1,x2,xn)如果所有的 x 改
6、变很小的单位,对于 y 的总效应将会是nndxxfdxxfdxxfdy.2211nndxfdxfdxfdy.221123最大值最大值(或最小值或最小值)的一阶条件的一阶条件 函数f(x1,x2,xn)最大值(或者最小值)的必要条件是对于x微小变化的任意组合都有dy=0 这个成立的唯一条件是0.21nfff 满足这个条件的点称为 驻点24寻找最大值寻找最大值 假定 y 是x1和 x2的函数y=-(x1-1)2-(x2-2)2+10y=-x12+2x1-x22+4x2+5 一阶条件意味着0420222211xxyxxy或者2121*xx25隐函数定理隐函数定理 不是总可以从隐函数形式 g(x,y)
7、=0 解出唯一的显函数形式 y=f(x)数学家推导了必要条件 在许多经济应用中,这些条件和最大值(或最小值)的二阶条件相同26包络定理包络定理 包络定理关注一个函数的参数改变之后,函数的最优值如何改变 利用一个例子可以很容易地了解这点27包络定理包络定理 假定 y 是 x 的函数y=-x2+ax 对于a 的不同取值,这个函数代表了一族抛物线 如果a 取定一个值,那么 y 变成仅仅是 x 的函数,同时可以计算使得y最大的x的取值28包络定理包络定理A 的值 x*的值 y*的值 0 0 0 1 1/2 1/4 2 1 1 3 3/2 9/4 4 2 4 5 5/2 25/4 6 3 9 对于不同的
8、对于不同的a,x和和y的最优值的最优值29包络定理包络定理随着随着 a 增加增加,y(y*)的最大值上升的最大值上升a 和和 y 的关系是二的关系是二次的次的30包络定理包络定理 假定我们感兴 y*如何随着 a 变化 我们有两种方法可以做到这点 直接计算 y 的斜率 保持 x 在最优值不变,直接计算 y/a31包络定理包络定理 为了计算函数的斜率,我们必须对于任意的a解出 x 的最优值dy/dx=-2x+a=0 x*=a/2 替代,得到y*=-(x*)2+a(x*)=-(a/2)2+a(a/2)y*=-a2/4+a2/2=a2/432包络定理包络定理 因此,dy*/da=2a/4=a/2=x*
9、但是,我们可以利用包络定理节约时间 对于a的微小变化,dy*/da 可以通过保持x 在 x*不变,直接从y 计算y/a33包络定理包络定理y/a=x 保持 x=x*y/a=x*=a/2 这和前面的结果相同34包络定理包络定理 包络定理 表示了,函数最优值对于参数的变化可以通过保持 x(或者几个x)在最优值不变,偏微分目标函数获得)(*axxaydady35包络定理包络定理 包络定理可以扩展到 y 是多变量的函数y=f(x1,xn,a)寻找 y 的最优值包括求解n个一阶条件方程 y/xi=0 (i=1,n)36包络定理包络定理 x 的最优值将是 a 的函数x1*=x1*(a)x2*=x2*(a)
10、xn*=xn*(a).37包络定理包络定理 替代进原目标函数获得了y(y*)最优值的表达式y*=f x1*(a),x2*(a),xn*(a),a 求导,可得afdadxxfdadxxfdadxxfdadynn.*221138包络定理包络定理 考虑一阶条件,如果 x 在它们的最优值,那么所有项,除了 f/a,都等于0 因此,)(*axxafdady39约束最优化约束最优化 如果不是所有的x 取值都是可行的会怎么样?x 的值可能都需要是正的 消费者的选择被购买力所限制 求解约束最大化问题的一种方法是 拉各朗日乘子法40拉各朗日乘子法拉各朗日乘子法 假定我们希望找到 x1,x2,xn 的取值最大化y
11、=f(x1,x2,xn)服从约束,仅仅一些特定的 x 可以使用g(x1,x2,xn)=041拉各朗日乘子法拉各朗日乘子法 拉各朗日乘子法开始于建立表达式L=f(x1,x2,xn)+g(x1,x2,xn)其中 是一个附加变量,称作拉各朗日乘子 当约束起作用的时候,因为 g(x1,x2,xn)=0,L=f42拉各朗日乘子法拉各朗日乘子法 一阶条件L/x1=f1+g1=0L/x2=f2+g2=0.L/xn=fn+gn=0.L/=g(x1,x2,xn)=043拉各朗日乘子法拉各朗日乘子法 可以利用一阶条件解出 x1,x2,xn 和 这些解具有两个性质:x 遵守约束 这些x 使得 L(因此 f)的值最大
12、44拉各朗日乘子法拉各朗日乘子法 拉各朗日乘子()具有重要的经济解释 一阶条件意味着f1/-g1=f2/-g2=fn/-gn=分子衡量了xi 增加一单位对于函数 f 的边际益处 分母反映了xi 增大对于约束的负担45拉各朗日乘子法拉各朗日乘子法 在 x 的最优选择,增加 xi 的收益与边际成本的比率应该对于所有的 x 都相同 是所有 x 共同的成本收益比率 iixx的边际收益的边际成本46拉各朗日乘子法拉各朗日乘子法 如果稍微放松约束,哪个 x 改变并不重要 拉各朗日乘子衡量了约束放松如何影响 y 的值 为约束提供了一个“影子价格”47拉各朗日乘子法拉各朗日乘子法 一个较高的 值意味着放松约束
13、那么y将会上升较大幅度 每个x具有较高的成本收益比率 一个较低的 值意味着放松约束不会有很大收益=0 意味着约束没有起作用48对偶对偶 任何约束最大值问题都伴随着一个 对偶 问题,此问题是一个带约束的 最小化 问题,目标函数是原问题的约束49对偶对偶 参与人在预算约束下最大化效用 对偶问题:参与人最小化可以达到给定效用水平的支出 厂商为了生产一定的产出最小化要素投入成本 对偶问题:给定要素投入成本的条件下,厂商最大化产出50约束最大化约束最大化 假定一个农民有一个长度确定(P)的篱笆,希望圈成一个最大的矩形 令 x 表示一个边的长度 令 y 表示另一条的长度 问题:选择 x 和 y 最大化面积
14、(A=xy)服从约束是周长确定 P=2x+2y51约束最大化约束最大化 建立拉各朗日乘子方程L=xy+(P-2x-2y)最大值的一阶条件是L/x=y-2=0L/y=x-2=0L/=P-2x-2y=052约束最大化约束最大化 因为 y/2=x/2=,x 一定等于 y 这个区域一定是正方形 x 和 y 应该这样选择,使得边际收益与边际成本的比率相同 因为 x=y 并且 y=2,我们可以利用约束获得x=y=P/4=P/853约束最大化约束最大化 对于拉各朗日乘子的解释 如果农民希望知道增长一码篱笆可以增加多少面积,表明是现在周长(P)的八分之一 因此,拉各朗日乘子表示了约束隐含的价值54约束最大化约
15、束最大化 对偶问题:选择 x 和 y 最小化能围起一定区域的篱笆的长度最小化 P=2x+2y 约束 A=xy 建立拉各朗日函数:LD=2x+2y+D(A-xy)55约束最大化约束最大化 一阶条件:LD/x=2-Dy=0LD/y=2-Dx=0LD/D=A-xy=0 求解得到x=y=A1/2 拉各朗日乘子(D)=2A-1/256包络定理和约束最大化问题包络定理和约束最大化问题 假设我们希望最大化y=f(x1,xn;a)服从约束g(x1,xn;a)=0 一种求解方式是建立拉各朗日函数,求解一阶条件57包络定理和约束最大化问题包络定理和约束最大化问题 另外,可以证明dy*/da=L/a(x1*,xn*
16、;a)为了获得参数 a 的改变导致 y 的最大值的变化可以对于 L 在最优值点偏微分58二阶条件二阶条件 单变量函数单变量函数 令 y=f(x)最大值点的必要条件dy/dx=f(x)=0 为了保证这个点是最大值点,y 必须在离开这个点的时候递减59二阶条件二阶条件 单变量函数单变量函数 全微分衡量了 y 的变化dy=f(x)dx 在最大值点,对于 x 的微小增加dy 一定会减小 为了看到 dy 的变化,我们必须利用 y 的二阶导数60二阶条件二阶条件 单变量函数单变量函数 注意 d 2y 0 意味着 f(x)dx2 0 因为 dx2 一定是正的,f(x)0 这意味着函数 f 在驻点一定是凹的2
17、2)()()(dxxfdxdxxfdxdxdxxfdyd61二阶条件二阶条件 双变量函数双变量函数 假定 y=f(x1,x2)最大值点的一阶条件y/x1=f1=0y/x2=f2=0 为了保证这个点是最大值点,从任何方向离开驻点 y 必须减小62二阶条件二阶条件 双变量函数双变量函数 x1 方向的斜率(f1)必须在驻点减小 x2 方向的斜率(f2)必须在驻点减小 但是,交叉导数(f12=f21)也必须满足约束,以保证dy 对于任何方向离开驻点的运动都会减少63二阶条件二阶条件 双变量函数双变量函数 y 的全微分dy=f1 dx1+f2 dx2 这个函数的微分是 d 2y=(f11dx1+f12d
18、x2)dx1+(f21dx1+f22dx2)dx2d 2y=f11dx12+f12dx2dx1+f21dx1 dx2+f22dx22 根据Young定理,f12=f21 并且 d 2y=f11dx12+2f12dx1dx2+f22dx2264二阶条件二阶条件 双变量函数双变量函数d 2y=f11dx12+2f12dx1dx2+f22dx22 为了使得这个方程对于x的任何方向都是负的,f11 和 f22 必须是负的 如果 dx2=0,那么 d 2y=f11 dx12 为了 d 2y 0,f11 0 如果 dx1=0,那么 d 2y=f22 dx22 为了d 2y 0,f22 0 二阶导数(f11
19、 和 f22)负的足够大使得它们足以超过来自交叉导数(f12=f21)的逆效应66约束最大化问题约束最大化问题 假定我们希望选择 x1 和 x2 最大化y=f(x1,x2)服从线性约束c-b1x1-b2x2=0 我们可以建立拉各朗日函数L=f(x1,x2)+(c-b1x1-b2x2)67约束最大化问题约束最大化问题 一阶条件是f1-b1=0f2-b2=0c-b1x1-b2x2=0 为了保证我们有一个最大值,我们必须使用“二阶”全微分d 2y=f11dx12+2f12dx1dx2+f22dx2268约束最大化问题约束最大化问题 仅当 x1 和 x2 的值满足约束的时候,可以被看成不同于驻点的可行
20、解 因此,我们可以计算约束的全微分-b1 dx1-b2 dx2=0dx2=-(b1/b2)dx1 x1 和 x2可行的相对变化69约束最大化问题约束最大化问题 因为一阶条件意味着 f1/f2=b1/b2,我们可以得到dx2=-(f1/f2)dx1 因为d 2y=f11dx12+2f12dx1dx2+f22dx22 我们可以替代 dx2 得到d 2y=f11dx12-2f12(f1/f2)dx12+f22(f12/f22)dx1270约束最大化问题约束最大化问题 合并同类项得到d 2y=f11 f22-2f12f1f2+f22f12 dx12/f22 因此,为了使得 d 2y 0,一定满足f11
21、 f22-2f12f1f2+f22f12 0 这个方程刻画了一系列函数,称为拟凹函数 集合中两点的连线还在集合中71凹和拟凹函数凹和拟凹函数 凹函数和拟凹函数的差别可以利用下面这个函数说明 y=f(x1,x2)=(x1x2)k 其中 x 取值为正,k 为正数72凹和拟凹函数凹和拟凹函数 无论 k 取什么值,这个函数都是拟凹的 这个函数是否是凹函数依赖于 k 的值 如果 k 0.5,函数是凸的73y=f(x1,x2)=(x1x2)0.374y=f(x1,x2)=(x1x2)0.375y=f(x1,x2)=(x1x2)1.576y=f(x1,x2)=(x1x2)1.577齐次函数齐次函数 函数 f
22、(x1,x2,xn)是 k阶齐次的 如果f(tx1,tx2,txn)=tk f(x1,x2,xn)当函数是一阶齐次的,所有自变量扩大一倍函数值扩大一倍 当函数是零次齐次的,所有自变量扩大一倍函数值不变78齐次函数齐次函数 如果一个函数是 k 次齐次的,函数的偏导数是 k-1次齐次的111111111,.,.,.,.nnkknnf txtxf xxttxxftxtxtfxx79欧拉定理欧拉定理 如果我们对于比例因子 t 微分,可以得到ktk-1f(x1,xn)=x1f1(tx1,txn)+xnfn(x1,xn)这个关系是 欧拉定理80欧拉定理欧拉定理 欧拉定理表明,对于齐次函数,函数值和偏导数之间具有确定性的关系