1、第十章第十章 协方差结构模型协方差结构模型10.1 验证性因素分析10.2 协方差结构模型10.3 LISREL8.20的使用10.4 AMOS4.0的使用 10.1 验证性因素分析验证性因素分析1、探索性因素分析和、探索性因素分析和验证性因素验证性因素分析的区别分析的区别(1)两者的理论假设不同两者的理论假设不同:探索性因素分析的假设探索性因素分析的假设:所有的公共因素都相关(或都无关);所有的公共因素都直接影响所有的观测变量;特殊因素之间相互独立;所有观测变量只受一个特殊因素的影响;公共因素和特殊因素相互独立。验证性因素分析的基本假设验证性因素分析的基本假设:公共因素之间可以相关也可以无关
2、;观测变量可以只受某一个或几个公共因素的影响而不必受所有公共因素的影响;特殊因素之间可以有相关。还可以出现不存在误差因素的观测变量;公共因素和特殊因素相互独立。(2)前提条件不同)前提条件不同 当因素的结构、因素之间的关系、因素的数量未知时,应使用探索性因素分析; 验证性因素分析是对已有的理论模型与数据拟合程度的一种验证。进行验证性因素分析时,必须明确指明:公共因素的个数、观测变量的个数、观测变量和公共因素之间的关系、观测变量和特殊因素之间的关系以及特殊因素之间的关系。x1x2x3x4x512探索型元素分析验证性因素分析验证性因素分析ks1x3d311x2d21x1d11ks2x5d511x4
3、d412、验证性因素分析的数学模型、验证性因素分析的数学模型验证性因素分析是在对研究问题有所了解的基础之上进行的,这种了解可以是建立在理论、实验研究或是两者结合的基础上。模型假设为:(1)在总体中,模型所有变量(观测变量、潜变量、误差)都设定其平均值为零;(2)公共因素与误差项之间相互独立;(3)各独立因素之间相互独立(这一条件有时得到放宽);(4)观测变量数大于公共因素数。ks1x3d311x2d21x1d11ks2x5d511x4d415252542424323213132121211111 x x x x xx543212152423231211154321X , 0 0 0 0 即:x
4、xxxx的协方差矩阵。的协方差以及、成负荷矩阵的协方差分解阵。该方程把观测变量误差项之间的协方差矩是测量模型中矩阵;是潜变量之间的协方差的负荷矩阵;相应于是观测变量差矩阵;是观测变量之间的协方其中,可以得到:两边求协方差对于上述的数学表达式协方差阵之间的关系,与观测变量的估计,为此必须导出它所以因素方程不能直接可观测的,自变量(潜变量)是不由于验证性因素分析中 X X xxxx 模型的估计就是求解上面协方差方程中的各个参数的估计值,以便使模型更好地重新产生观测变量的协方差矩阵。3、验证性因素分析的步骤、验证性因素分析的步骤(1)模型定义)模型定义 根据理论假设,定义观测变量和潜变量之间的关系,
5、潜变量之间的关系以及特殊因素(误差项)之间的关系。 ks1x2d21x1d11ks2x4d411x3d31观测变量用矩形表示,潜变量用椭圆形表示;单箭头是从潜变量指向观测变量,表明潜变量引起了观测变量的变化;用双箭头表示相关,可以指定潜变量之间、误差项之间的相关。(2)模型识别)模型识别 识别问题就是协方差结构方程有唯一解的问题。)identified-(under)identified-(over)identified-(justble)(identifia不可识别超识别恰好识别可以识别模型的识别1)恰好识别:指方程式的个数等于要估计的参数的个数,因此每个参数能求得唯一解。2)超识别:指方程
6、式的个数多于参数估计所需要方程的个数。3)不可识别:模型中方程式的个数少于待估参数的个数,无法确定模型参数。模型可识别的必要条件:模型中待估参数的个数要小于或等于q(q+1)/2, 其中q为观测变量的个数。模型可识别的充分条件:1) 如果潜变量之间的协方差矩阵,并且因素负荷矩阵的k列中至少有k-1列是规定的元素,则模型可识别。2)如果不是对角矩阵,但对角线上的元素是相同的,若因素负荷矩阵中的每一列中至少有k-1个值为规定的元素,则模型是可识别的。(k为公共因素数目)。3)三指标原则:a.每个潜变量有三个或更多测量变量;b.因素负荷矩阵每一行有且只有一个非零值;c.残差的协方差矩阵为对角阵。如果
7、满足上述三个条件,模型可识别。4)两指标法则:法则1:a. 因素负荷矩阵的每一行有且仅有一个非零值; b. 至少有两个潜变量相关;c. 每个潜变量至少有两个非零的测量变量;d.残差的协方差矩阵为对角阵。同时满足上述四个条件,则模型可识别。法则2: a. 因素负荷矩阵的每一行有且仅有一个非零值; b. 对于每个潜在变量,至少有一个潜变量与之相关; c. 每个潜变量至少有两个非零的测量变量。同时满足上述三个条件,模型可识别。(3)验证性因素分析的参数估计)验证性因素分析的参数估计q-SloglogSTrF(ML) 3S-STrF(GLS) 2-STrFULS 1S , 1ML21 -gls2ULS
8、xx使、用极大似然法估计极大似然法)达到最小。使、计用广义的最小二乘法估广义最小二乘法)达到最小。使、估计用未加权的最小二乘法)未加权的最小二乘法()表示样本协方差矩阵。协方差方程为(4)验证性因素分析模型的评价)验证性因素分析模型的评价 得到了参数的估计值后,需要对模型与数据间是否拟合进行评价。拟合指数主要反映了与S拟合的程度。常用的模型拟合指数有:绝对拟合指数有:2统计量,p0.05拟合优度指数GFI 0.90调整的拟合优度指数AGFI 0.90近似均方根误差RMSEA 0.90标准拟合指数NFI 0.90Tucker-Lewis 指数NNFI 0.90递增拟合指数 IFI 0.90(5)
9、 模型修正模型修正 如果模型不能很好地拟合数据,就需要对模型进行修正或重新设定。研究者需要决定如何删除、增加和修改参数,通过修正模型可以增进模型的拟合程度。另外,对于模型的选取应该遵循省俭原则。即当两个模型同样吻合数据时,应当取两个模型中比较简单的一个。4、验证性因素分析在测量上的应用、验证性因素分析在测量上的应用(1)构想效度和项目信度 通过数据与理论假设模型之间的吻合程度来表示一个测验构想效度的高低。 信度定义为公共因素与观测变量相关的平方,它表示在一个观测变量的总方差中,能够由公共因素所解释的比例。如x1=111+1, 则x1的信度为:REL(x1)= 211(2) 多质多法(multi
10、trait-multimethod. MMMT)ksi2x6d611x5d51x4d41ksi3x9d911x8d81x7d71ksi1x3d311x2d21x1d11ksi4ksi6ksi5(3) 高阶因素分析y1y2y3y4y5y6y7y8y9y10y11y12eta1eta2eta3eta4eta5ksi1ksi2111111111111111115、验证性因素分析的其他问题、验证性因素分析的其他问题(1)样本容量被试数与自由参数的比例至少达到10:1(2)变量数量有的研究者主张每个潜在因子应该用三个或四个指标表示。10.2 协方差结构模型协方差结构模型10.2.1 模型的产生和发展模型
11、的产生和发展1、几个概念、几个概念协方差结构模型(Covariance Structure Models, CSM);结构方程模型(Structural Equation Modeling, SEM);协方差结构分析(the analysis of covariance structure);线性结构分析(the linear structural relations models);矩结构模型(the moments structure models);结构化线性模型中的潜变量方程系统(Latent variable equation system linear model)LISREL模型
12、2、SEM与一般线性模型的关系与一般线性模型的关系(1)SEM实际是一般线性模型(General Linear Models, GLM)的扩展。一般线性模型包括:路径分析、典型相关、因素分析、判别分析、多元方差分析以及多元回归分析。它们都是协方差结构方程模型的特例,许多模型均可用SEM来处理和评价;(2)SEM是路径分析和因素分析的有机结合,它比传统的回归分析有更突出的优点。传统的回归分析的方法不考虑自变量之间的测量误差,会导致高估简单模型变量的真正变异量和低估相关系数。测量误差越大,用传统的回归方法导致的错误越大。3、结构方程的优点、结构方程的优点(1)可处理多个因变量;(2)允许自变量和因
13、变量含有测量误差;(3)容许潜在变量由多个外源指标变量组成,并可同时估计指标变量的信度和效度;(4)可采用比传统方法更有弹性的测量模型,如某一观测变量或项目在SEM内可以同时从属于两个潜在变量。(5)可以考虑潜在变量之间的关系,并估计整个模型是否与数据相吻合。10.2.2 数学模型的设定数学模型的设定1knowledge2knowledge1value2value1satisfaction2satisfaction1performance2performanceknowledgevaluesatisfactionperformanceerror1error2error8error7error6
14、error5error4error3111111111111error91Example 5: Model ARegression with unobserved variablesJob performance of farm managersWarren, White and Fuller (1974)Model Specificationksi1x2d2lx211x1d1lx111ksi2x4d4lx421x3d3lx321ksi3x6d6lx631x5d5lx531eta1y1e1ly111y2e2ly211eta2y3e3ly321y4e4ly421phi13phi12phi23ga
15、11ga12ga22ga32xeta11xeta21be21be12模型中的变量:模型中的变量:X外源观测变量;Y内源观测变量;外源潜在变量;内源潜在变量;外源观测变量的独立因子;内源观测变量的独立因子。外源变量因果关系中不受其他变量影响的变量;内源变量因果关系中受其他变量影响的变量。协方差结构模型由两部分组成协方差结构模型由两部分组成:(1)测量模型)测量模型(Measurement Model) 即验证性因素分析( Confirmatory Factor Analysis )(2) 结构模型结构模型(Structural Equation Model ) 即潜变量的因果关系模型。 测量模型
16、主要用于表示观测变量与潜变量之间的关系;而结构模型主要用来表示潜变量之间的关系。1、测量模型、测量模型测量模型又称验证性因素分析模型,它是在对研究问题有所了解的基础上进行的,这种了解可以是建立在理论、实验研究或是两者相结合的基础上。模型假设为:(1)在总体中,模型中所有的变量(观测变量、潜变量、误差)都设定其平均值为零;(2)公共因子与误差项之间相互独立;(3)各独立因子之间相互独立。模型的数学表达式为: Y yxX观测变量的协方差矩阵与估计参数之间的关观测变量的协方差矩阵与估计参数之间的关系系:协方差矩阵。产生观测变量的方差和以便使模型更好地重新数的估计值,协方差方程中的各个参模型估计就是求
17、解上面的方差与协方差。和的方差和协方差以及、,负荷矩阵的方差和协方差分解成、上述方程把观测变量。差项之间的协方差矩阵分别是两测量模型中误,的因子负荷矩阵;和分别是观测变量和协方差矩阵;是观测变量之间的方差 ,XYXY, ) ,COV() ,COV( )(xyxyxxyxxyyyCOV2、结构方程模型、结构方程模型结构方程模型用来描述潜变量之间的关系。该模型的假该模型的假设为:设为:(1)在总体中,模型所有的潜变量都是平均数为零;(2)方程中的外源变量与误差之间的相关为零;(3)模型中潜变量关系不存在多余的方程。数学表达式为:数学表达式为:+协方差方程为协方差方程为: 矩阵。表示结构方程中的残差
18、方差矩阵,表示外源变量之间的协为结构方程的残差项。的系数矩阵,、为、变量,分别是内源变量和外源、 11 1111113、完整协方差结构模型、完整协方差结构模型模型假定:模型假定:(1)所有变量来自均数为零的总体;(2)没有多余的方程存在;(3)方程中的误差项与外源变量的误差之间不相关。数学表达式:Xx + Y=y + =+协方差结构方程: xxy1xx1y11 11 11yX1为高中平均成绩;X2为高考成绩;X3为高中教师评价;X4为学生性别。Y1为是否在重点院校;Y2为高校第一年平均成绩;Y3为教师对其高校第一年表现的评价。ksi1为高中成绩;ksi2为性别;eta1为是否重点院校;eta2
19、为高校第一年成绩。ksi1x3d31x2d21x1d1lx111ksi2x41eta1y1eta2y2e211y3e3ly3211phi12ga11ga21ga22xeta11xeta21beta21ga121lx31432121x3121x4321212132y2211121222112112121211 00 0 0 1xxxx,0 01 00 1yyy, 0 0 0:为的三个方程具体可表达上例中结构方程模型中10.2.3 协方差结构模型的识别协方差结构模型的识别一、自由度识别一、自由度识别(必要条件必要条件) 根据所定义模型的自由度与最大可能自由度之间的关系来简单判断模型是否有可能识别,
20、这是一个必要条件。1、最大可能自由度的概念 设模型中有p个外源观测变量,q个内源观测变量,那么模型最大可能的自由度为(p+q)(p+q+1)/2.2、自由度识别方法 在协方差方程= ()中包含(p+q)(p+q+1)/2个方程。如果待估参数的个数t大于方程的个数,则模型不可能识别。所以,t (p+q)(p+q+1)/2。 模型的自由度df= (p+q)(p+q+1)/2t0。df 0,模型有可能识别;dfa -1 1PA命令行功能:将LISREL 的参数矩阵规定为由若干个0和1组成的参数矩阵的形式。语法:PA FI文件名 FO RE 矩阵名 变量格式说明 * 数据(整数1和0的模式)例如:1
21、1 0 0 0 1*GAPA 011100(3I1)GAPA 100011(6I1)GAPA free free fixedfixed fixed freeVA和ST命令行功能:VA的功能是对固定参数赋值,ST的功能是对自由参数赋以迭代初始值。语法:VA 数值 参数矩阵的元素 ST ALL例如对以下两矩阵规定初始值PS(4) 0.7 STPS(3) 1.9 STPS(6) PS(1) 1.5 STPS(5) PS(2) BE(3)-BE(1) 0.5 ST:5 . 1 5 . 0 5 . 09 . 1 5 . 05 . 1 ,0 5 . 0 5 . 00 5 . 00命令为MA命令行功能:在U
22、LS、GLS、ML、WLS和DWLS估计方法时作自由参数或固定参数的拟合函数图。NF命令行功能:规定不需要输出修正指数的自由和约束参数PD命令行功能:输出路径图语法:PATH DIAGRAM PD(3)结果输出OU命令行(1)功能:规定参数估计的过程语法:OU ME= RC=c SL=100a NS RO AM SO IVTSULGLMLWLDW关键词:ME 规定估计方法,默认为极大似然法MLRC 规定岭常数,为使矩阵变为正定,需要在矩阵对角线上加一个常数。SL 模型修正指数的置信水平NS 不设待估参数的初始值AM 自动修正。程序将根据修正指数的大小逐个将修正指数显著的固定参数恢复为自由估计。
23、OU命令行(2)功能:选择LISREL的打印结果语法:OU SE TV PC PT RS EF MR MI XM XI FS SS SC ALL TO WPND=D选项:SE 标准误TV t值PC 估计参数的相关矩阵PT 打印技术性结果RS 残差与标准残差,Q图和拟合矩阵EF 总效应和间接效应MR 多方面结果MI 修正指数XM 不计算修正指数FS 因子得分回归SS 标准化解 TO 每行打印80个字符SC 完全标准化解 WP 每行打印132个字符ALL 打印所有结果 ND 输出结果大小数位数,默认值为2OU 命令行(3)功能:程序将输出结果存入指定的文件中。语法:OU 矩阵1文件名1 矩阵2文件
24、名2 .关键词:矩阵i 替换要保存的文件名,可能的名称为LY,LX,BE,GA,PH PS,TE,TD TH AL,KA,TX,TY或MA 重新选择或变量定序后的文件名SI 拟合的方差、协方差或相关矩阵RM 潜变量在显变量上的因子负荷矩阵,使用时要有PS指令。EC 参数估计的协方差矩阵GF 所有的拟合度量PV 估计的自由参数的向量SV 相应的标准误差的向量TV 相应的t值的向量OU命令行(4)功能:选择LISREL的打印结果语法:OU TMf IT=n AD=m EP= off关键词:TM 显示运行程序所用的CPU时间(time)IT 迭代次数(iteration),默认次数为自由参数的三倍AD 检查参数解的可接受性EP 收敛标准,缺省值是EPS=0.000001。LISREL的应用实例的应用实例