1、验证性因素分析(Confirmatory Factor Analysis)验证性因素分析和结构方程 验证性因素分析是结构方程的特例 是测量模型(measurement model)部分 是SEM的子模型何时用CFA?1.CFA的进行必须有特定理论依据或概念架构作为基础,然后藉由数学程序来确认该理论观点所导出的计量模型是否确实、适当2.CFA具有验证性功能。一旦理论假设建立起来,CFA可以用实证数据检验它,体现其独有的直接表达测量误差的特性3.CFA具有构念效度验证的功能。CFA常用于验证量表的心理测量学特性CFA也可用于实验方法的研究中4.CFA也具有探索性的功能。这需要在同一数据中反复应用C
2、FA,尝试建立理论必须得到跨样本的验证EFA 与 CFA的比较EFA 与 CFA的比较Confirmatory Factor AnalysisExploratory Factor AnalysisExploratory Factor AnalysisI2I1FactorII3I4FactorIIEEEEI3I2I4I1FactorIFactorIIEEEE研究举例 大学生自尊量表的6个条目,3个条目设计用于测量学业自尊,3个条目设计用于测量社交自尊。评估量表的构想效度潜变量(潜变量(latent variable)和)和显变量(显变量(manifest variable)潜变量(潜变量(lat
3、ent variable):如):如学业成就自尊和社交自尊,它们是不能直接被测量的,而是间接地由显变量显变量估计的 也称为unobserved variables,factors,constructs。用椭圆表示 显变量(显变量(manifest variable):如):如“我觉得我觉得我的学业发展很有潜力我的学业发展很有潜力”,“我在与人交往我在与人交往的时候很有自信的时候很有自信”。它们是能直接被测量的。也称为observed variables,indicators,measured variables。用方框表示潜变量(潜变量(latent variable)和)和显变量(显变量(m
4、anifest variable)潜变量(潜变量(latent variable)和)和显变量(显变量(manifest variable)潜变量向显变量的单向箭头表示潜变量向显变量的单向箭头表示 潜变量预测了显变量潜变量预测了显变量 或者说或者说学业成就自尊驱动了,或造成了“我觉得我的我觉得我的学业发展很有潜力学业发展很有潜力”,社交自尊造成了“我在与人交我在与人交往的时候很有自信往的时候很有自信”。解决过程 1.模型假设(model hypothesis)2.模型设定(model specification)3.模型估计(model estimation)4.模型评估(model eval
5、uation)5.模型修正(model modification)模型假设(1)大学生的自尊符合简单的二因素模型-学业成就自尊和社交自尊(2)学业成就自尊和社交自尊因素之间有显著相关模型设定 量表的前三个项目是学业成就自尊的indicators,后三个项目是社交自尊的indicators 两个因素之间有相关LISREL简介(1)例:例:6个外显变量,个外显变量,2个外源内隐变量个外源内隐变量 符号符号 外源内隐变量外源内隐变量-KSI()外显变量外显变量-X KSI 在在X 上的效应系数(载荷)上的效应系数(载荷)-LAMDA()X 的误差的误差-delta()LX 5 2 是载荷矩阵的元素:
6、外显变量是载荷矩阵的元素:外显变量X5在在 2上的载荷上的载荷 PHI()3 2是因素的相关矩阵的元素:是因素的相关矩阵的元素:3与与2的相关的相关 TD()4 3 是误差的协方差是误差的协方差 矩阵的元素:矩阵的元素:X 4与与X 3的误差的相的误差的相关关LISREL简介(2)参数估计 Fixed:设定于某一特定数值 Free:未知,无限定 模型设定 所有的误差项无相关 测量模型:X=+LX的设定默认为:FUll Fix自由估计相关的自由估计相关的Lamda系数系数,有两种表示有两种表示方法方法:(1)FR LX 1 1 LX 2 1 LX 3 1 FR LX 4 2 LX 5 2 LX
7、6 2(2)PA LX 3(1,0)3(0,1)PH的设定 默认为:SYmmeteic Free 如果因素间相关,应设 PH=ST,表示表示 PH对称对称 对角线固定对角线固定,值为值为1 对角线以外自由估计对角线以外自由估计 如果因素间不相关,应设 PH=DI,表示表示 对角线为对角线为1 非对角线元素固定为非对角线元素固定为0TD的设定 默认为:DIagonal FRee 对角线为自由对角线为自由 非对角线元素固定为非对角线元素固定为0模型设定-两个不相关因素DA NI=6 NO=200LAX1 X2 X3 X4 X5 X6KM1.0.502 1.0.622.551 1.0.008.072
8、 .028 1.0.027.030-.049.442 1.0-.029-.059.018.537.413 1.0MO NX=6 NK=2 PH=DIFR LX 1 1 LX 2 1 LX 3 1 LX 4 2 LX 5 2 LX 6 2 LKACADEMICSOCIALPDOU SS MI总变量数被试数指标变量的标签相关矩阵,最好用协方差矩阵模型设定指标变量的个数潜变量的个数因素间不相关潜变量的标签输出路径图输出标准化系数,修正指标模型设定-两个相关因素DA NI=6 NO=200LAX1 X2 X3 X4 X5 X6KM1.0.502 1.0.622.551 1.0.008.072 .028
9、 1.0.027.030-.049.442 1.0-.029-.059.018.537.413 1.0MO NX=6 NK=2 PH=STFR LX 1 1 LX 2 1 LX 3 1 LX 4 2 LX 5 2 LX 6 2 LKACADEMICSOCIALPDOU SS MI因素间相关模型估计参数最大似然估计(标准误)t值两潜变量之间的相关模型评估-模型拟合度 2/df 比率0.90 Root Mean Square Error of Approximation 平均残差(RMSEA).90 Adjusted Goodness of Fit Index(AGFI)0.80 Aikaike
10、Information Criteria(AIC)Consistent Aikaike Information Criteria(CAIC)模型拟合度 Hu&Bentler(1999)同时满足:CFI 0.95 RMSEA 0.05 2/df 3.探索性因素分析和验证性因素分析 1.EFA:所有指标在所有因素上载荷CFA:设定特定指标在特定因素上载荷或设定某几个指标的载荷相等。2.EFA:因素是否相关是全或无的决策 CFA:设定哪些因素有内部相关3.EFA:假定指标的误差彼此不相关CFA:误差的相关是模型检验的一部分确证性因素分析的数据要求1.样本容量被试数目为指标数目的10倍,至少为200当
11、p=15,N则需大于150.当题目多时,可打包2.等距/等比甚至等级数据3.对非正态数据有耐受性4.Outlier 对结果影响大,必须进行处理例2:工作倦怠的CFA 假设:工作倦怠分为:耗竭,去人性化,低成就感 burnout.sav包括17个指标变量 用lisrel导入数据例2:工作倦怠的CFADA NI=17 NO=160 MA=CMLAPA1 PA2 PA3 PA4 PA5 PA6 PA7 PA8 PA9 PA10 PA11 PA12 PA13 PA14 PA15 PA16 PA17RAW=burnout.psfMO NX=17 NK=3 PH=DI FR LX 2 1 LX 3 1 L
12、X 4 1 LX 5 1 LX 6 1 LX 7 1 LX 8 2 LX 9 2 LX 10 2 LX 11 2 FR LX 12 2 LX 13 3 LX 14 3 LX 15 3 LX 16 3 LX 17 3LKEX CY EFPDOU MI MI的提示:PH=ST 什么情况下固定?两个变量(指标或因子)间没有关系,将元素固定为0 例如,不从属,将因子负荷(LX 1,2)固定为0。又如,因子和因子没有相关,PH 1,2 固定为0。需要设定因子的度量单位(scale)因子没有单位,无法计算。一种将所有因子的方差固定为1(或其他常数),简称为固定方差法 一种是在每个因子中选择一个负荷固定为1
13、(或其他常数),简称为固定负荷法。什么情况下设定为自由:所有需要估计的参数9个题目,第1、2、3题(第1个因子);第4、5、6题(第2个因子),第7、8、9题(第3个因子)设因子1,2,3互有相关 固定方差法固定方差法?固定负荷法固定负荷法?9个题目,第1、2、3题(第1个因子);第4、5、6题(第2个因子),第7、8、9题(第3个因子)设因子1,2,3互有相关 固定方差法固定方差法 MO NX=9 NK=3 PH=ST TD=STFR LX 1,1 LX 2,1 LX 3,1 LX 4,2 LX 5,2FR LX 6,2 LX 7,3 LX 8,3 LX 9,3 固定负荷法固定负荷法MO N
14、X=9 NK=3 FR LX 2,1 LX 3,1 LX 5,2 LX6,2 FR LX 8,3 LX 9,3VA 1 LX 1,1 LX 4,2 LX 7,39个题目,第1、2、3题(第1个因子);第4、5、6题(第2个因子),第7、8、9题(第3个因子)设因子1和因子3无关,因子1和因子2、因子2和因子3相关 固定方差法?固定负荷法?设因子1和因子3无关,因子1和因子2、因子2和因子3相关 固定方差法 MO NX=9 NK=3 PH=ST FR LX 1,1 LX 2,1 LX 3,1 LX 4,2 LX 5,2 LX 6,2 LX 7,3 LX 8,3 LX 9,3 FI PH 1,3
15、固定负荷法 MO NX=9 NK=3 LX=FU,FI PH=SY,FR TD=DI,FR FR LX 2,1 LX 3,1 LX 5,2 LX 6,2 LX 8,3 LX 9,3 VA 1 LX 1,1 LX 4,2 LX 7,3 FI PH 1,3因子的指标变量 一个因子一般应该有3个或以上的指标变量 单指标变量的因子应进行如下设定:FI LX 和误差项 LX=sqrt(信度)误差项要固定在(1-信度)指标的方差例:FI LX 4,3 TD 4,4 VA.15 TD 4,4!(1-0.85)=0.15 VA.922 LX 4,3!SQRT(.85)=.922嵌套模型 如果乙模型所有自由参数只是甲模型中自由参数的一部分,则称乙模型嵌套于甲模型内嵌套模型的2比较 例:例2-工作倦怠的CFA 3因素模型显著地好于所有2因素模型和一因素模型吗?可否应用相关矩阵作分析?SEM建立在方差和协方差分析上 用相关矩阵,大多数情况下正确 在某些况下并不正确(见Cudeck,1989):误差相关 只在特殊设计(重复测量multi-wave panel),刻意容许误差相关 在一般研究,通常不容许误差可以相关