多元线性回归模型课件.ppt_163文库

资源描述

1、t参数估计随机误差项样本容量问题离差分解拟合优度检验决定系数与可调整的决定系数参数估计量的分布参数的区间估计统计推断单个变量的显著性检验（检验）方程总体的显著性检验（F检验）参数的假设检验变量显著性检验与总体显著性检验的关系拟合优度检验与方程显著性检验之间的关系总体均值的点预测总体均值的预测置信区间预测个别值的预测置信区间预测置信区间的特征多元线性回归模型矩阵表示多元线性回归模型基本假设参数的普通最小二乘估计参数的普通最小二乘估计量的性质普通最小二乘样本回归函数的性质的方差的普通最小二乘估计一、单项选择题一、单项选择题1、C 2、A 3、B 4、A 5、C6、C 7、A 8、D 9、B 10、

2、D11、B12、A13、D14、D15、D16、A17、D18、C19、A20、B21、A22、B23、C24、C25、C二、多项选择题二、多项选择题1、ACD 2、BD 3、BCD 4、BC 5、AD6、BCD 7、ABCD 8、BC 9、BC 10、BCD 11、BC三、判断题三、判断题 1、2、3、4、5、6、7、8、9、10、11、12、13、四、简答题四、简答题1、多元线性回归模型与一元线性回归模型的区别表现在如下几个方面：一是解释变量的个数不同；二是模型的经典假设不同，多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相关关系”的假定；三是多元线性回归模型的参数估计式

3、的表达更为复杂。2、在满足经典假设的条件下，参数的最小二乘估计量具有线性性、无偏性以及最小性方差(有效性)，所以被称为最优线性无偏估计量（BLUE）对于多元线性回归最小二乘估计的正规方程组，能解出唯一的参数估计量的条件是（XX）的负一次方存在，或者说各解释变量间不完全线性相关。3.4、对修正的原因：是模型中解释变量个数的非减函数，也就是说，随着模型中解释变量个数的增加，的值会变大，这样为了得到拟合优度较高的模型，似乎加入更多解释变量是合理选择。但是，在建立计量经济模型时，一些影响被解释变量的次要因素没有必要以显性形式作为解释变量出现在模型中，因为，随着解释变量个数增加，待估计的参数也会增多，由

4、此造成样本自由度的减少，模型参数估计准确性下降。因此，在多元回归模型背景下，仅仅依据进行模型比较和选择就会产生问题，在增加新的解释变量时，必须对由其带来的模型自由度下降这一“负面影响”而做出惩罚，因此需要对做出相应的修正。、5、建立多元回归模型时，究竟该引入多少个解释变量视情况而定。如果所建立的计量模型是为验证某一经济理论，则引入变量个数取决于经济理论，如建模目的是检验CAPM模型，则只需包含一个解释变量。如果是根据经验而建立模型，在样本容量允许条件下，可以加入较多解释变量，以得到所关注变量对被解释变量的“净”影响。当然，此时，应当考虑做包含多余变量、遗漏变量等方面的模型设定检验。6、这一假定

5、是针对解释变量之间的关系而设定，根本目的是保证模型的可估计，如果解释变量之间存在共线性，会造成数据观测矩阵X非列满秩，模型参数无法估计。六、计算分析题六、计算分析题1、（1）预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下，子女越多的家庭，每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义，sibs前的参数估计值-0.094表明，在其他条件不变的情况下，每增加1个兄弟姐妹，受教育年数会减少0.094年，因此，要减少1年受教育的时间，兄弟姐妹需增加1/0.094=10.6个。（2）medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时，母亲每增加1年受

6、教育的时间，其子女作为劳动者就会预期增加0.131年的教育时间。（3）首先计算两人受教育的年数分别为 10.36+0.13112+0.21012=14.452 10.36+0.13116+0.21016=15.816因此，两人的受教育年限的差别为15.816-14.452=1.3644、解：、解：（1）不一定，因为题目未告知是否通过了经济意义检验。猜测为：X1为学生数量，X2为附近餐厅的盒饭价格，X3为气温，X4为校园内食堂的盒饭价格；（2）理由是被解释变量应与学生数量成正比，并且应该影响显著；被解释变量应与本食堂盒饭价格成反比，这与需求理论相吻合；被解释变量应与附近餐厅的盒饭价格成正比，因为

7、彼此有替代作用；被解释变量应与气温的变化关系不是十分显著，因为大多数学生不会因为气温变化不吃饭。5、（1）样本容量为 n=14+1=15 RSS=TSS-ESS=66042-65965=77 ESS的自由度为:df.=2 RSS的自由度为:df.=n-2-1=12（2）R2=ESS/TSS=65965/66042=0.9988 =1-(1-R2)(n-1)/(n-k-1)=1-0.0012*14/12=0.9986（3）应该采用方程显著性检验，即F检验，理由是只有这样才能判断X1、X2一起是否对Y有影响。（4）不能。因为通过上述信息，仅可初步判断X1、X2联合起来对Y有线性影响，两者的变化解释

8、了Y变化的99.8%。但由于无法知道X1，X2前参数的具体估计值，因此还无法判断它们各自对Y的影响有多大。6、解：、解：（1）方程B更合理些。原因是：方程B中的参数估计值的符号与现实更接近些，如与日照的小时数同向变化，天长则慢跑的人会多些；与第二天需交学期论文的班级数成反向变化。（2）解释变量的系数表明该变量的单位变化，在方程中其他解释变量不变的条件下，对被解释变量的影响，由于在方程A和方程B中选择了不同的解释变量，方程A选择的是“该天的最高温度”，而方程B选择的是“第二天需交学期论文的班级数”，造成了与这两个变量之间关系的不同，所以用相同的数据估计相同的变量得到了不同的符号。7、解：、解：（

9、1）在降雨量不变时,每亩增加1千克肥料将使当年的玉米产量增加0.1吨/亩;在每亩施肥量不变的情况下,每增加1毫米的降雨量将使当年的玉米产量增加5.33吨/亩。（2）在种地的一年中不施肥也不下雨的现象同时发生的可能性很小,所以玉米的负产量不可能存在.事实上,这里的截距无实际意义。（3）如果的真实值为0.40,则表明其估计值与真实值有偏误,但不能说的估计是有偏估计.理由是0.1是的一个估计值,而所谓估计的有偏性是针对估计的期望来说的,即如果取遍所有可能的样本,这些参数估计值的平均值与0.4有偏误的话,才能说估计是有偏的。（4）不一定。即便该方程并不满足所有的经典模型假设，不是最佳线性无偏估计量，的真实值也有等于5.33的可能性。因为有偏估计意味着参数估计的期望不等于参数本身，并不排除参数的某一估计值恰好等于参数的真实值的可能性。9、

展开阅读全文