1、第十二章 结构方程模型知识链接 结构方程模型,你会吗?https:/ 搞量化研究,你为什么要懂结构方程模型?搞量化研究,你为什么要懂结构方程模型?http:/ 结构方程模型是一种非常通用的、主要的线性统计建模技术,广泛应用于心理学、经济学、社会学、行为科学等领域的研究。实际上,它是计量经济学,计量社会学与计量心理学等领域的统计分析方法的综合。多元回归、因子分析和通径分析等方法都只是结构方程模型中的一种特例。结构方程模型是统计分析方法中一个新发展的领域,它的应用始见于世纪年代发表的研究论文中,到了年代初期开始得到广泛的应用。简而言之,结构方程模型还是利用联立方程组求解,但是它没有很严格的假定限制
2、条件,同时允许自变量和因变量存在测量误差(measurement errors)。它还有另外一些特点优越于多元回归、通径分析、计量经济学中的联立方程组以及因子分析等方法。计量经济学中的通径分析和联立方程模型()虽然也使用联立方程组,但是类似于多元回归,它们只能处理有观察值的变量,并且还要假定其观察值不存在测量误差。然而在社会科学中,许多变量诸如智力、能力、信任、自尊、动机、成功、雄心、偏见、异化、保守等概念并不能直接测量。实际上,这些变量基本上是人们为了理解和研究社会的目的而建立的假设概念,对于它们并不存在直接测量的操作方法。人们可以找到一些可观察的变量()作为这些潜在变量()的“标识”(),
3、然而这些潜在变量的观察标识总是包含了大量的测量误差。在统计分析中,即使是对那些可以测量的变量,也总是不断受到测量误差问题的侵扰。自变量测量误差的发生会导致常规回归模型参数估计产生偏差。虽然传统的因子分析允许对潜在变量设立多元标识,也可处理测量误差,但是,它不能分析因子之间的关系。只有结构方程模型既能够使研究人员在分析中处理测量误差,又可分析潜在变量之间的结构关系。二、应用结构方程模型分析的五个主要步骤()模型设定:在进行模型估计之前,研究人员先要根据理论或以往研究成果来设定假设的初始理论模型。()模型识别:这一步骤要决定所研究的模型是否能够求出参数估计的唯一解。在有些情况下,由于模型被错误地设
4、定,其参数不能识别,求不出唯一的估计值,因而模型无解。()模型估计:模型参数可以采用几种不同的方法来估计。最常使用的模型估计方法是最大似然法和广义最小二乘法。()模型评价:在取得了参数估计值以后,需要对模型与数据之间是否拟合进行评价,并与替代模型的拟合指标进行比较。()模型修正:如果模型不能很好地拟合数据,就需要对模型进行修正和再次设定。在这种情况下,研究人员需要决定如何删除、增加或修改模型的参数。通过参数的再设定可以增进模型的拟合程度。研究人员可以根据结构方程模型软件输出中所提供的模型修正指数与初始模型中各通径的检验结果来决定模型的再设定。一旦需要重新设定模型,就要重复以上五个步骤的工作。一
5、个拟合较好的模型往往需要反复试验多次三、模型设定 结构方程模型主要是一种证实性技术,而不是一种探测性技术。这就是说,尽管结构方程模型分析中也涉及一些探测性的因素,但研究人员主要是通过应用结构方程模型来确定一个特定模型是否合理,而不是将其用来寻找和发现一种合适的模型。因此结构方程模型是从设定一个待定模型开始的。设定模型可以用不同的方法。最简单直接的一种方法就是将自己的模型用通径图描述出来。通径图对于结构方程模型是非常基本的手段,因为它使研究人员得以将设定模型以直接和明了的方式来表达。通径图有助于研究人员将其对于变量之间关系的认识得以清晰的表述,在一些分析软件中,通径图还可以直接转化为建模的方程。
6、在研制结构方程模型框图时有几个常规,即在框图中将观测变量用方形或矩形框代表,对潜在变量或因子用圆形或椭圆形框代表。变量之间的关系用线条标志;如果变量之间没有连线则是假设变量之间没有直接联系。线条既可以加单箭头,也可以加双箭头。单箭头的线条表示假设两个变量之间存在因果作用关系,箭头从原因变量指向结果变量。双箭头则表示两者之间有相关或是双向的联系,在这种情况下没有对于因果关系的陈述。四、模型识别 结构方程模型的应用着重于过度识别的结构方程模型。在这种情况下,模型中的自由参数数目少于观测变量中方差和协方差的总数,即数据点。换句话说,就是自由参数数目少于观测变量中方差和协方差的总数。过度识别模型一般不
7、能完全拟合数据,这样,检验这一模型是否拟合观测数据就成为可能。数据点与自由参数的数目之差既是检验模型拟合所需的自由度(标志为犱)。相比之下,恰好识别模型总是完全拟合观测数据,其卡方检验值和自由度永远为零,因为它的自由参数数目等于数据点数。因此,对于恰好识别模型是无法检验其拟合优度的。对于结构方程模型,并没有一套简单的充要条件来作为参数识别手段。然而,有两个必要条件是应该时时加以查验的。第一,数据点的数目不能少于自由参数的数目。数据点的数目就是观测变量的方差和协方差的数目。它等于p(p),其中 是观测变量的数目。这就是说,方差协方差矩阵 中只有对角线上的方差和对角线外的一半协方差(或是上半部或是
8、下半部)才算数。方差协方差矩阵中的另一半协方差实际上对称于这一半,并没有提供新的信息。自由参数的数目指待定的因子负载、通径系数、潜在变量和误差项的方差、潜在变量之间和误差项之间的协方差的总数。要是数据点比自由参数多,这一模型即为过度识别。如果数据点比自由参数少,这一模型就是不能识别的,其参数也无法估计。因为,未知项多于已知项时,估计便不可能进行。第二,必须为模型中的每个潜在变量建立一个测量。为了建立这一尺度,首先,可以将潜在变量的方差设定为。这就是说,将潜在变量标准化,使其有了标准化尺度。其次,也是较常用的方法,是将潜在变量的观测标识中任何一个的因子负载(或)设定为一常数,通常为。如果这一潜在
9、变量的方差被设定为自由,且所有相应的因子负荷也都被设定为自由,这些负荷和这个潜在变量的方差就不能识别。而且,其他一些与这一潜在变量相关的参数也不能识别。更具体地说,对于一个潜在自变量而言,其方差以及由这个潜在变量发射出的所有通径的系数就都不能识别。对于一个潜在因变量来说,其残差的方差,指向这个潜在因变量和从其伸出的所有通径的系数都是不能识别的。最后,我们还可以在一开始建立模型时就尽量削减自由参数,只保留那些绝对必要的参数,使模型简化。要是这个模型得到识别,再考虑在随后修改的模型中加入其他感兴趣的参数。然后,通过比较这些替换模型进行最后的选择。五、模型估计 一旦设定了模型,下一个工作便是根据观测
10、变量的方差和协方差进行参数估计。六、模型评价 程序的首要任务是用样本数据对所设定的模型参数进行估计,再根据这些参数估计来重建()方差协方差,然后尽可能地将重建的(或称引申的)方差协方差矩阵(用表示)与观察方差协方差矩阵 相匹配。引申的方差协方差矩阵匹配观察方差协方差矩阵的程度决定了结构方程模型拟合样本数据的程度。当模型重建的方差协方差矩阵非常接近于观测的方差协方差矩阵时,残差矩阵各元素就接近于零,这样,就可以认为模型拟合数据了。此外,模型及拟合的评价并不完全是统计问题。即使一个模型拟合了数据,也不意味着这个模型“正确”或“最好”。首先,所有的估计参数应该能够得到合理的解释。其次,也许会有许多等
11、价的模型,如果根据任何拟合优度指数,它们都能同样好地拟合数据。如果简单模型的拟合与复杂模型的拟合一样好,就应该接受简单模型。因为我们的目标是建立简约的模型,所以模型中的参数越少越好。从某种程度上说,模型比较是一种艺术,需要多方面的考虑。最重要的是,研究人员应该将他们的结构方程模型建立在有说服力的理论之上。七、模型修正 在应用结构方程模型时进行模型修正,是为了改进初始模型的适合程度。这个修正工作被称为“模型设定的探索”。这一步骤在实际操作时经常是不可缺少的。模型修正有助于认识初始模型的缺陷,并且还能得到其他替换模型的启示。当尝试性初始模型不能拟合观测数据时,即这个模型被数据所拒绝时,我们就需要了
12、解这个模型在什么地方错了,怎样修正模型才能使其拟合得较好。然后我们将模型进行修正,再用同一观测数据来进行检验。在重新设定模型时应该记住,这项工作既是出于数据的驱使,也是出于理论的驱使。模型拟合程度的改进不能单纯追求统计上的考虑,而应该尽量使模型具有实际根据。否则,也许可以建立一个拟合很好的模型,然而其结果却完全没有实际意义。我们的目标是探索一个不仅在统计角度能很好地拟合数据而且每一个参数都能得到符合实际的解释的理论模型。八、结构方程模型分析的示范 这一部分应用软件进行结构方程模型的分析示范。例题中的数据是由作者按第三节所描述的模型模拟制定的。数据中包括七个观察变量(个 变量与个 变量),共有个
13、案例。首先,我们将本章第三节中绘制的结构方程模型“搬”到中,换句话说,我们要在中画出第二节那样的通径图来。整个作图过程可以分为如下三步:第一步,在中绘制测量模型和结构模型,并使其构成一个完整的结构方程模型框架图 第二步,为潜在变量、误差项以及残差命名 第三步,读入数据,为观测变量命名,将模型与数据连接起来九、附录:软件操作说明(一)AMOSGraphics菜单及其常用设置(二)AG常见操作介绍(三)关于应用犃犕犗犛的其他几个问题应用需要注意的几个地方 一是在应用建模的过程中,一定要为每一个变量命名。这里的变量包括潜在变量、观测变量、测量误差项和残差项。如果漏掉变量,将拒绝运行估计过程并报警 二
14、是要注意不要漏掉内生变量的误差项。在设置内生变量的残差项时,最好用快捷按钮来添加残差项,而不要用单独绘制残差变量然后再加上作用路径的方式绘制。因为在快捷键方式下,将自动为路径的回归系数赋值为,而单独绘制残差变量则往往容易漏设回归系数,从而导致模型无解,更无从估计参数值。这一点在绘制复杂模型的情况下尤其重要。三是要充分利用自身提供的功能,特别是类似(,保持对称)以及(,优化变量位置)这样的功能,来尽量让绘制的图形清楚、美观。一个绘制清楚的模型可以非常明了地展示蕴含在模型中的理论或命题。关于和的比较 两个软件相比较,总的说来是以图形界面见长,而以编程见长。在一些技术细节上,二者也有一些差别。和有关
15、符号对比基本概念 可观察的变量 潜在变量 联立方程模型 模型设定 通径图 外生潜在变量 内生潜在 变量 外生标识 内生标识 通径系数 测量尺度 测量模型 因子负载 误差项 结构模型 潜在变量模型 自由参数 固定参数 相关矩阵 观测的方差协方差 预测的引申的方差协 方差 数据点 过度识别 恰好识别 不能识别 独立模型 饱和模型 拟合优度指数 比较 拟合指数 信息标准指数本章要点 研究中的一些抽象的概念变量不能直接观察,称为潜在变量。通常潜在变量是通过一些可观测的标识间接地测量的,但不可避免产生测量误差。结构方程模型可以将多个潜在变量及其标识置于同一模型中分析,研究它们之间的结构关系。结构方程模型
16、分析的主要步骤为:模型设定、模型识别、模型估计、模型评价、模型修正。研究中经常需要多次重复以上步骤才能取得较好的结果本章要点 模型的识别工作是保证模型中每一个位置参数能够由观测数据估计推出唯一解。过度识别模型虽然不能完全拟合数据,但是能够估计所有未知参数,并能够进行模型拟合优度检验。由于模型识别十分复杂,通常是采取预防措施(增加标识和减少自由参数等)避免模型不能识别,待模型分析运行结果确定该模型可以识别时,再修改和扩展模型。在取得模型估计后,需要根据各种评价指标进行模型评价。一方面需要对某个模型对观测数据的拟合情况进行评价,另一方面需要对不同模型的拟合情况进行比较。通过评价,进一步修改模型以增进模型的拟合程度。模型的设定和修正必须以理论假设为基础,不能仅以统计上的最优拟合为标准。参考文献,(),():,(),():