多层线性模型课件.ppt_163文库

资源描述

1、多层线性模型简介多层线性模型简介Hierarchical Linear Model (HLM)B主要内容v一、多层线性模型简介v二、多层线性模型基本原理v三、多层线性模型HLM软件的应用B多层线性模型简介v1、多层数据结构的普遍性v多层（多水平）数据指的是观测数据在单位上具有嵌套的关系。v（1）教育研究领域vEG：学生镶嵌于班级，班级镶嵌于学校，或者学生简单地镶嵌于学校，这时学生代表了数据结构的第一层，而班级或学校代表的是数据结构的第二层；如果数据是学生镶嵌于班级，而班级又是镶嵌于学校，那么就是三层数据结构。B多层线性模型简介v（2）组织心理学研究领域vEg:雇员镶嵌于不同的组织、工厂v（3）

2、发展心理学领域vEg:纵向研究、重复研究v在一段时间内对儿童进行多次观察，那么不同时间的观测数据形成了数据结构的第一层，而儿童之间的个体差异则形成了数据结构的第二层。这样，就可以探索个体在其发展趋势或发展曲线上的差异。B 两水平层次结构数据两水平层次结构数据水平2 水平1 B 层次结构数据为一种非独立数据，即某观察层次结构数据为一种非独立数据，即某观察值在观察单位间（或同一观察单位的各次观察间）值在观察单位间（或同一观察单位的各次观察间）不独立或不完全独立，其大小常用组内相关不独立或不完全独立，其大小常用组内相关(intra-class correlation，ICC)度量。度量。例如，来自同

3、一家庭的子女，其生理和心理例如，来自同一家庭的子女，其生理和心理特征较从一般总体中随机抽取的个体趋向于更为特征较从一般总体中随机抽取的个体趋向于更为相似，即子女特征在家庭中具有相似性，数据是相似，即子女特征在家庭中具有相似性，数据是非独立的。非独立的。B违背了传统回归（OLS）中关于残差相互独立的假设采用经典方法可能失去参数估计的有效性并导致不合理的推断结论。B经典方法框架下的分析策略经典方法框架下的分析策略经典的线性模型只对某一层数据的问题进行经典的线性模型只对某一层数据的问题进行分析，而不能将涉及两层或多层数据的问题进行分析，而不能将涉及两层或多层数据的问题进行综合分析。综合分析。但有时

4、某个现象既受到水平但有时某个现象既受到水平1变量的影响，变量的影响，又受到水平又受到水平2变量的影响，还受到两个水平变量变量的影响，还受到两个水平变量的交互影响的交互影响(cross-level interaction)。B 个体的某事件既受到其自身特征的影响，个体的某事件既受到其自身特征的影响，也受到其生活环境的影响，即既有个体效应，也也受到其生活环境的影响，即既有个体效应，也有环境或背景效应有环境或背景效应(context effect)。例如，学生（个体）的学习成绩与学生例如，学生（个体）的学习成绩与学生的勤奋程度有关，还与学校的师资配备有关。的勤奋程度有关，还与学校的师资配备有关。企业

5、的创新能力与企业自身的创新投入、学企业的创新能力与企业自身的创新投入、学习能力有关，还与企业所属产业的习能力有关，还与企业所属产业的R&D强度有关。强度有关。B多层线性模型简介v2、多层数据的传统分析方法v个体的行为既受个体自身特征的影响，也受到其所处环境的影响，所以研究者一直试图将个体效应个体效应与组效应组效应（背景效应或环境效应）区分开来。v个体效应：由个体自身特征所造成的变异。v组效应：由个体所处环境所造成的变异。B多层线性模型简介v（1）只关注个体效应，而忽视组效应v只在个体这一层数据上考虑变量间的关系，那么导致所观测到的效应既包含个体效应，又包含组效应，从而增大了犯一类错误的概率，夸

6、大了变量间的关系。v（2）在组水平上进行分析v把数据集中起来，使其仅在第二层的组间发挥作用，从而丢失了重要的个体信息。B多层线性模型简介v（3）组内分析组间分析v对相同的数据进行三次计算：v一是在组内的个体层上进行的分析，称为组内效应v二是通过平均或整合第一层中的个体数据，得到第二层的组间数据，称为组间效应v三是忽视组的特性而对所有的数据进行分析，称为总效应。v在此基础上，计算组内效应和组间效应在总效应的比例，从而确定变异来自于组间还是组内。v组内分析组间分析的方法较前两种方法更多地考虑到了第一层数据及第二层数据对变异产生的影响，但无法对组内效应和组间效应做出具体的解释，也就无法解释为什么在不

7、同的组变量间的关系存在差异。BHLM数学模型v例如：对73个学校1905名学生进行调查，目的是考虑其刚上高中时的入学成绩与三年后高考成绩之间的关系。考虑方法：（1）如果用传统的线性回归分析，直接在学生水平上进行分析，得出入学学业成绩对高考成绩之间的一条回归直线，如下图1所示，从图1的结果可以看出，传统回归分析没有区分不同的学校之间的差异。B图1：不考虑学校之间差异的回归直线 BHLM数学模型v（2）如果将数据进行简单合并，用每个学校学生的平均成绩代替这个学校的成绩，直接在学校水平上估计入学成绩对高考成绩的影响，得到一条回归直线，如图2所示，这种方法忽略了不同学生（个体）之间的差异；B图2：只考

8、虑学校差异忽略学生差异回归直线 BHLM数学模型v（3）如果假设不同学校入学成绩对高考成绩的回归直线截距不同，斜率相同（平均学习成绩之间存在差异），得到如图3的结果，从图中结果可以看出，不同学校学生平均高考成绩之间存在差异。B图3：考虑不同学校平均成绩差异的回归直线 BHLM数学模型v（4）对73所学校分别做回归分析，得到如图4的结果，如图4所示，从图中结果可以看出，不同学校回归直线的截距和斜率均不同，即：不同学校学生平均高考成绩之间存在差异，入学学业成绩对高考成绩的影响强度不同。B图4：考虑不同学校平均成绩差异和入学对毕业成绩影响程度差异的回归直线 Bv在许多研究中，取样往往来自不同层级和

9、单位，这种数据带来了很多跨级（多层）的研究问题，解决这些问题的一种新的数据分析方法多层模型分析技术。v这一方法的开创及发展的主要贡献者之一是英国伦敦大学的Harvey Goldstein教授及研究者把这种方法称作“多层分析”。另一主要开拓者美国密歇根大学的Stephen W.Raudenbush教授和同行把它称为“分层线性模型结构”。在此，我们按照张雷等人的叫法称其为“多层线性模型”或“多层模型”。B多层线性模型简介v3、多层线性模型分析方法v回归的回归方法vEg:学生成绩（X）学习动机（Y）v v 班级教师教学水平（W）v（1）求各个班级学生成绩对学习动机的回归01ijjji jijYXrB

10、多层线性模型简介v（2）求教师教学水平对0j和 1j 的回归方程jjjjjjWW111101001000B多层线性模型简介v4、多层线性模型的优点v（1）使用收缩收缩估计的参数估计方法，使得估计结果更为稳定、精确v收缩估计：使用两个估计的加权综合作为最后的估计。其一是来自第一层数据的OLS估计，另一个是来自第二层数据的加权最小二乘法估计，最后的估计是对以上两个估计的加权。v（2）可以处理样本不等的数据veg:当某些第二层单位在第一层的取样甚少时，可以借助于其他二层单位和二层预测变量，对取样较少的一层单位进行回归分析。第一层单位3个及以上。B多层线性模型简介v5、多层线性模型的应用范围v（1）组

11、织和管理研究v（2）对个体进行追踪、多次观测的发展研究v（3）教育研究v（4）元分析研究B多层线性模型基本原理v1、多层线性模型的基本形式v水平1（如：学生）v水平2（如：学校）ijijjjijeXY10jju0000Yij-第j个学校的第i个学生jju1101指固定成分随机成分B多层线性模型基本原理v 为固定成分，指第二层单位间0j 和1j 的平均值v 为随机成分，指第二层单位0j 和1j 的变异0010和01jj和000var()j111var()j0110cov(,)jjB多层线性模型基本原理v把第一层和第二层方程整合如下：v误差项间是相关的：同一第二层单位的个体有相同的v误差项间方差不

12、等：相同第二层单位内的个体间相似性比不同单位内个体相似性高v误差项与自变量有关：残差项包含000101ijijjjijijYxxe残差项01jj和ijxB多层线性模型基本原理v因此，多层数据并不满足传统OLS回归分析关于残差项的诸多假设。而多层线性模型将残差项进行了分解，更符合实际情况，所以对于多层数据使用多层线性模型进行分析更为合理。B多层线性模型基本模型v2、多层线性模型的基本模型v零模型（The Null Model）v第一层和第二层均没有预测变量，只是将方程分解为由个体差异造成的部分及由组差异造成的部分，这种方法为方差成分分析。B多层线性模型零模型v第一层：v第二层：v合并模型：ijj

13、ijeY0jju00002var()ije000var()jijojijeuY00B多层线性模型零模型v 指第j个二层单位Y的平均值 v 指第j个二层单位Y的变异v 指所有二层单位的Y的总体平均数v 指第二层方程的残差（随机项）v跨级相关：指Y的总体变异中有多大比例是由第二层的变异引起的。v 0 jije000 j20000/B多层线性模型完整模型v完整模型（The Full Model）v既包含了第一层的预测变量，又包含了第二层的预测变量，可通过理论建构来说明解释Y的总体变异是怎样受第一层和第二层因素的影响。v第一层：ijijjjijeXY102var()ijeB多层线性模型完整模型v第二层

14、：000var()jjjjuW001000jjjuW111101111var()j0110cov(,)jjB多层线性模型完整模型v在第一层方程中，0代表截距，1代表斜率v在第二层方程中，第一个下标代表第一层参数的类型；第二个下标代表第二层参数的类型。v0j和1j的预测变量可以相同，也可以不同。B多层线性模型协方差模型v在零模型与完整模型之间，可通过向各层方程中增加不同的变量，设定不同的随机成分与固定成分来建构各种分析模型。v协方差模型（ANCOVA Model）v第一层：v第二层：_01ijjjijijYxxe1010000jjjuB多层线性模型协方差模型v第一层方程中，预测变量采用总体平均数

15、为参照的离差，与传统协方差分析的区别是0j被进一步分解为和v1j没有随机项，反映了协方差分析的一个重要前提，协变量对因变量的回归系数的组间一致性。检验这种假设的方法是把纳入到方程中，并检验是否成立。0 00 j1j110B多层线性模型随机效应回归模型v随机效应回归模型（Radom Eeffect Regression Model）v第一层：v第二层：ijijjjijeXY10jju0000jju1101B多层线性模型随机效应回归模型v此模型与完整模型的区别在于第二层没有预测变量；与传统OLS回归区别在于第一层的0j和1j是随机的而非固定的，其目的是寻找第一层的截距、斜率在第二层单位上的变

16、异。B多层线性模型发展模型v发展模型v发展模型是把多次观测结果作为时间的某种数学函数来建构模型。它多用于发展研究、纵向研究或者追踪研究。v在这种模型中，第一层数据为不同时间的观察结果，第二层数据为个体的特征。B多层线性模型发展模型v第一层：线性发展模型vTime:一般用编码的形式来反映增量vEg:0、1、2、3、4、5v 5、4、3、2、1、0v线性发展模型的第一层方程并不一定为线性方程，也可以为非线性方程。vEg:01ijjjijYTIMEe2012+ijjjjijYTIMETIMEeB多层线性模型发展模型v“确定发展变异”的第二层：jju0000jju11010110cov(,)jj000

17、var()j111var()j时间变量编码为0时Y的总体平均数线性发展斜率的总体平均值指个体j与平均发展斜率的离差指个体j与平均截距的离差B多层线性模型发展模型v“预测发展变异”的第二层：0110cov(,)jj000var()j111var()jjjjuW001000jjjuW111101考虑第二层的预测变量W后第一层的截距和第一层的斜率在第二层单位间的残差方差代表第二层的变量W对第一层截距的效应B多层线性模型三层模型v三层模型是二层模型的直接扩展，我们也可以根据需要选择零模型与完整模型之间的任何模型。v模型1：零模型v第一层：v第二层：v第三层：0ijkj kijkYe2var()ijke

18、0000jkkjk000var()jk0000000kke0000var()keB多层线性模型三层模型v第一个下标表示第一层方程中的参数；第二个下标表示第二层方程中的参数；第三个下标表示第三层方程中的参数。v 表示第二层单位之间的变异，表示第三层单位之间的变异v跨级相关：v第一层的方差和总方差之比：v第二层的方差和总方差之比：v第三层的方差和总方差之比：2210000/22000000/23000000/B多层线性模型三层模型v模型2：完整模型v第一层：v第二层：01ijkjkjkjkijkYxe0000110jkkkjkjkw1101111jkkkjkjkw2var()ijke000var(

19、)jk111var()jk0110cov(,)jkjkB多层线性模型三层模型v第三层：00000001 0000kkkze01010011 0101kkkze10100101 1010kkkze11110111 1111kkkzeBHLM应用举例vhsb1.sav和hsb2.sav 在水平一的数据文件hsb1.sav中，有7185个观测样本和四个第一水平的变量（不包含第二水平指标变量：学校编号ID），这四个变量所表示的含义如下：minority，学生的种族（1=少数民族，0=其他）female：学生性别（1=女，0=男）ses：学生的社经地位，由学生父母受教育程度、职业和收入合成，变量已被标准

20、化 mathach：学生的数学学业成绩 BHLM应用举例v数据文件hsb2.sav中包含有160个学校，每个学校测量了六个学校水平的变量（不包含学校指标变量ID）。vsize：学校招生人数vsector：学校类型（1=天主教教会学校，0=公立学校）vpracad：从事学术研究的学生的比例vdisclim：学校纪律环境，由量表测量得到vhimnty：学校招生少数民族学生比例描述（1=超过40%少数民族学生，0=其他）vmeanses：包含在水平1数据中，每个学校学生的平均社经地位 B层层1数据数据B层层2数据数据BHLM应用举例目的：分析影响学生数学成绩的学生水平变量和学校水平变量BBBBBB

21、指定层1变量B指定层2变量Bv保存MDM模板v生成MDM文件v查看MDM的统计量BMDM的描述统计量BB选择层选择层1的结果变量的结果变量B无条件模型无条件模型B无条件模型参数估计结果Final estimation of variance components:-Random Effect Standard Variance df Chi-square P-value Deviation Component-INTRCPT1,2.93501 8.61431 159 1660.23259 0.000 level-1,R 6.25686 39.14831-B填加层填加层1解释变量解释变量B含有第

22、一水平预测变量的HLM模型（随机系数模型）B随机系数模型参数估计结果Final estimation of fixed effects(with robust standard errors)-Standard Approx.Fixed Effect Coefficient Error T-ratio d.f.P-value-For INTRCPT1,B0 INTRCPT2,G00 12.664935 0.189251 66.921 159 0.000 For SES slope,B1 INTRCPT2,G10 2.393878 0.117697 20.339 159 0.000-BFinal

23、 estimation of variance components:-Random Effect Standard Variance df Chi-square P-value Deviation Component-INTRCPT1,U0 2.19768 4.82978 159 905.26472 0.000 SES slope,U1 0.64675 0.41828 159 216.21178 0.002 level-1,R 6.06864 36.82835-B含有第二水平预测变量的模型BThe outcome variable is MATHACH Final estimation of

24、 fixed effects(with robust standard errors)-Standard Approx.Fixed Effect Coefficient Error T-ratio d.f.P-value-For INTRCPT1,B0 INTRCPT2,G00 12.658410 0.173263 73.059 158 0.000 DISCLIM,G01 -1.128519 0.160735 -7.021 158 0.000 For SES slope,B1 INTRCPT2,G10 2.409288 0.112194 21.474 158 0.000 DISCLIM,G11

25、 0.570615 0.123906 4.605 158 0.000-BFinal estimation of variance components:-Random Effect Standard Variance df Chi-square P-value Deviation Component-INTRCPT1,U0 1.93467 3.74295 158 730.83940 0.000 SES slope,U1 0.45491 0.20694 158 189.39572 0.045 level-1,R 6.06501 36.78432-BvIn the level-2 model,bo

26、th the intercept and SES slope are to be modeled as dependent on the schools mean social class(MEANSES)and school sector(SECTOR).B填加层填加层2的解释变量的解释变量BB混合模型混合模型BUsing level subscriptsB指定层指定层1系数为随机的或非随机的系数为随机的或非随机的B结果分析结果分析B个体水平模型Yij=0j+1jX1ij+2jX2ij+KjXKij+rij第 j 组第 i 个个体因变量的观测值第 j个组的截距第j 组 X1 对应的斜率第j

27、组 X2 对应的斜率第j 组 XK 对应的斜率B背景（Contextual）模型 Yij=0j+1jX1ij+2jX2ij+KjXKij+rij0j=00 1j=10 2j=20 Kj=K0在传统回归（OLS）模型中,截距和斜率都是固定的，即对不同的第二水平单元均相同B背景（Contextual）影响问题v第二水平不同单元（如不同学校），截距是否相同?v能否用第二水平的协变量预测截距之间的差异?v斜率是否存在第二水平的变异?v能否用第二水平的预测变量解释斜率之间的差异?B截距是否存在第二水平的变异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+u0j1j=10 2

28、j=20 Kj=K0In the random effects model,the intercept varies around some grand mean intercept(00),and the slopes are fixed they are the same in all unitsTest H0:Var(u0j)=0B可否用第二水平的预测变量解释截距之间的差异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+01Z1+02Z2+0MZM+u0j 1j=10 2j=20 Kj=K0Here,the Zms predict the intercept

29、.Test H0:0m=0B斜率是否存在第二水平的变异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+u0j1j=10+u1j2j=20+u2jKj=K0+uKjThe intercept and each of the slopes varies around their grand means(the k0s)Test H0:Var(ukj)=0B能否用第二水平的预测变量解释斜率间的差异?Yij =0j+1jX1ij+2jX2ij+KjXKij+rij0j=00+01Z1+02Z2+0MZM+u0j1j=10+11Z1+12Z2+1MZM+u1j2j=20+21Z1+22Z2+2MZM+u2jKj=K0+K1Z1+K2Z2+KMZM+uKjHere,the Zms predict the slopes.Test H0:km=0B应该注意的问题v低水平预测变量的中心化v高水平样本容量v变量之间共线性问题B

展开阅读全文