1、多层线性模型多层线性模型 原理与应用原理与应用杨涛杨涛 12820048主要内容主要内容一、多层线性模型简介二、多层线性模型基本原理三、多层线性模型的应用一、多层线性模型简介一、多层线性模型简介在许多研究中,取样往往来自不同层级和单位,这种数据带来了很多跨级(多层)的研究问题,解决这些问题的一种新的数据分析方法多层模型分析技术。“多层分析”(Multilevel Analysis),英国伦敦大学Harvey Goldstein教授。“分层线性模型结构”(Hierarchical Linear Modeling),美国密歇根大学Stephen W. Raudenbush教授。“多层线性模型”或“
2、多层模型”,张雷等人。一、多层线性模型简介一、多层线性模型简介 1、多层数据结构的普遍性多层(多水平)数据指的是观测数据在单位上具有嵌套的关系。(1)教育研究领域学生镶嵌于班级,班级镶嵌于学校,或者学生简单地镶嵌于学校。这时学生代表了数据结构的第一层,而班级或学校代表的是数据结构的第二层;如果数据是学生镶嵌于班级,而班级又是镶嵌于学校,那么就是三层数据结构。传统的线性模型,例如方差分析和回归分析,只能对涉及一层数据的问题进行分析。而在教育研究中,更为重要的和令人感兴趣的正是关于学生层的变量与班级或学校层变量之间的交互作用。一、多层线性模型简介一、多层线性模型简介(2)组织心理学研究领域研究者的
3、兴趣常常在于组织与镶嵌于不同组织的雇员之间的关系。雇员层上的变量结果中的差异,或者变量之间关系的差异,可以解释为组织层上预测变量的函数。(3)纵向研究、重复研究在发展心理学中,研究者可以在一段时间内对儿童进行多次观察,那么不同时间的观测数据形成了数据结构的第一层,而儿童之间的个体差异则形成了数据结构的第二层。这样,就可以探索个体在其发展趋势或发展曲线上的差异。一、多层线性模型简介一、多层线性模型简介 2、多层数据的传统分析方法在社会科学研究中,组效应或者背景效应问题已经困扰了研究者大约半个世纪。社会科学研究假设,个体的行为既受个体自身特征的影响,也受到其所处环境的影响,所以研究者一直试图将个体
4、效应与组效应(背景效应或环境效应)区分开来。个体效应:由个体自身特征所造成的变异。组效应(池塘效应):由个体所处环境所造成的变异。一、多层线性模型简介一、多层线性模型简介(1)只关注个体效应,而忽视组效应在个体这一层数据上得到的相关系数可能是错误的,因为相似背景的个体比组外个体相似程度更高;另一个结果就是增大了犯类错误的概率,因为观测到的效应既包含个体效应,又包含组效应。(2)在组水平上进行分析给个体层次的数据加入一个组变量;把数据集中起来,使其仅在第二层的组间发挥作用,从而丢失了重要的个体信息。一、多层线性模型简介一、多层线性模型简介对相同的数据进行三次计算:一是在组内的个体层上进行的分析,
5、称为组内效应;二是通过平均或整合第一层中的个体数据,得到第二层的组间数据,称为组间效应;三是忽视组的特性而对所有的数据进行分析,称为总效应。在此基础上,计算组内效应和组间效应在总效应中的比例,从而确定变异来自组间还是组内。组内分析组间分析的方法较前两种方法更多的考虑到了第一层数据及第二层数据对变异产生的影响,但并无法对组内效应和组间效应做出具体的解释,也就无法解释为什么在不同的组变量间的关系存在差异。一、多层线性模型简介一、多层线性模型简介 3、多层线性模型分析方法回归的回归方法Eg:个体成就目标导向(X) 个体创造力(Y) 组织环境(W)(1)求各个组织个体成员的成就目标导向对创造力的回归(
6、2)求组织环境对 和 的回归方程01ijjjijijYXr0 j1j000010jjjW110111jjjW一、多层线性模型简介一、多层线性模型简介 4、多层线性模型的优点(1)使用收缩估计的参数估计方法,使得估计结果更为稳定、精确。收缩估计:使用两个估计的加权综合作为最后的估计。其一是来自第一层数据的最小二乘(OLS)估计,另一个是来自第二层数据的加权最小二乘法(WLS) 估计。(2)可以处理样本不等的数据当某些第二层单位在第一层的取样甚少时,可以借助于其他二层单位和二层预测变量,对取样较少的一层单位进行回归分析。一、多层线性模型简介一、多层线性模型简介 5、多层线性模型的优点(1) 用于类
7、似组织管理、学校教育等具有多层数据结构的领域研究。( 2) 用于个体重复测量数据的追踪研究。测量层面作为第一水平,个体层面作为第二水平。( 3) 用于做文献综述,即对众多研究成果进行定量综合。探讨不同研究中进行的处理、研究方法、被试特征和背景上的差异与效应之间的关系。 (4) 充分利用多层模型较为高级的统计估计方法来改善单层回归的估计和分析。二、多层线性模型基本原理二、多层线性模型基本原理 1、多层线性模型的基本模型(1) 虚无模型(The Null Model)第一层和第二层都没有预测变量,只是将方程分解为由个体差异造成的部分和由组差异造成的部分,这种方法即方差成分分析。Level-1:Le
8、vel-2: 指第j个二层单位Y的平均值; 反应第j个二层单位对Y的随机效应; 指所有二层单位的Y的总体平均数; 指第二层方程的残差(随机误差项)。0ijjijYe0000jju2var()ije000var()ju0 jije000 ju二、多层线性模型基本原理二、多层线性模型基本原理组内相关系数ICC测量了第二层变异占总体变异的比例,实际上它反映了组内个体间相关,即一层单位在二层单位中聚集性或相似性。(2)完整模型(The Full Model)完整模型既包含了第一层的预测变量,又包含了第二层的预测变量,可通过理论建构来说明解释Y的总体变异是怎样受第一层和第二层因素的影响。最简单的完整模型
9、只包含一个第一层预测变量和一个第二层预测变量。20000/ ()ICC二、多层线性模型基本原理二、多层线性模型基本原理Level-1: (1)Level-2: (2) (3)进一步将上述三个公式进行整合,得到混合模型(mixed model),方程式如下: (4)回归系数 是截距项, 是斜率,用于解释二层对于一层的截距,在式(4)中表示的是组织层次自变量对个体层次因变量的影响; 为第二层对于第一层斜率进行解释的截距,也就是个体层次解释变项对第一层因变项的影响, 为第二层变量对于第一层斜率进行解释的斜率,所反映的是跨层级变项的交互作用效果。 01ijjjijijYXe000010jjjGu110
10、111jjjGuijijjjijjjijijXUUXGGXY101101100000011011二、多层线性模型基本原理二、多层线性模型基本原理 2、协方差模型(ANCOVA Model)在虚无模型与完整模型之间,可通过向各层方程中增加不同的变量,设定不同的随机成分与固定成分来建构各种分析模型。Level-1:Level-2: 第一层方程中,预测变量采用总体平均数为参照的离差,与传统协方差分析的区别是 被进一步分解为 和 。 没有随机项,反映了协方差分析的一个重要前提,协变量对因变量的回归系数的组间一致性。检验这种假设的方法是把 纳入到方程中,并检验 是否成立。_01()ijjjijijYxx
11、e0000jju110j0 j000 ju1j1 ju110二、多层线性模型基本原理二、多层线性模型基本原理 3、随机效应回归模型( Radom Eeffect Regression Model)此模型与完整模型的区别在于第二层没有预测变量;与传统OLS回归区别在于第一层的 和 是随机的而非固定的,其目的是寻找第一层的截据、斜率在第二层单位上的变异。 Level-1:Level-2:01ijjjijijYxe0000jju1101jju0 j1j三、多层线性模型的应用三、多层线性模型的应用预测变量X预测变量Z结果变量Y调节变量W调节变量G组织层面个体层面H1aH1bH2aH2bH3cH3aH3
12、dH3b三、多层线性模型的应用三、多层线性模型的应用考虑到变量间存在嵌套关系,我们遵循多层线性模型分析的步骤运用HLM6.0软件逐次检验四种不同模式: 虚无模式 随机参数回归模式 截距项预测模式 斜率项预测模式为避免人口统计特征变量对结果的干扰,我们引入诸如性别、职务等其他可能影响因素作为控制变量。三、多层线性模型的应用三、多层线性模型的应用具体检验步骤及多层线性模型构建如下: 第一步,检验跨层次效果是否存在。只有组内与组间的变异成份显著,才能够进行下一步的截距与斜率项分析。虚无模式Level-1:Yij=0j+rij,式中rij N(0,2)Level-2:0j=00+0j,式中0j N(0
13、,00)式中,00= Level-2的截距项三、多层线性模型的应用三、多层线性模型的应用 第二步,主要考察个体层面的直接效果,用以验证假设1是否成立,同时也将判定不同个体的因变量是否存在着不同的截距与斜率,为检验调节变量的影响创造条件。随机参数回归模式Level-1:Yij=0j+1jXij+2jZij+ cj(控制变量) +rijLevel-2:0j=00+0j 1j=10+1j 2j=20+2j cj=c0+cj式中,10=预测变量X对结果变量的影响效果 20=预测变量Z对结果变量的影响效果 c0为控制变量对结果变量的影响,c=3,4,5 三、多层线性模型的应用三、多层线性模型的应用 第三
14、步,将检验假设2关于组织层面调节变量对因变量直接影响的跨层次效应,进一步验证截距项的存在是否可由组织层面加以解释和预测。截距项预测模式Level-1: Yij=0j+1jXij+2jZij+ cj(控制变量) +rijLevel-2:0j=00+01Wij+ 02Gij+0j 1j=10+1j 2j=20+2j cj=c0+cj式中,01=调节变量W对结果变量的影响效果 02=调节变量G对结果变量的影响效果三、多层线性模型的应用三、多层线性模型的应用 第四步,分析斜率变异成分是否可由组织层面的变量所解释,进而检验假设3关于调节变量在预测变量与因变量的关系间是否具有调节效应。斜率项预测模式Level-1: Yij=0j+1jXij+2jZij+ cj(控制变量) +rijLevel-2:0j=00+01Wij+ 02Gij+0j 1j=10+11Wij+ 12Gij+1j 2j=20+21Wij+ 22Gij+2j cj=c0+cj式中,11= Level-2的斜率(用来检验H3a) 12= Level-2的斜率(用来检验H3b) 21= Level-2的斜率(用来检验H3c ) 22= Level-2的斜率(用来检验H3d)