1、在社会生活、经济活动等众多领域中都存在着纷繁复杂的在社会生活、经济活动等众多领域中都存在着纷繁复杂的现象,在这些表象下面其实可能只有少数几个最为本质和现象,在这些表象下面其实可能只有少数几个最为本质和核心的因素在起着支配作用,调节者这些表面现象。因子核心的因素在起着支配作用,调节者这些表面现象。因子分析就是一种能从多个指标中提取出潜在公共因子的统计分析就是一种能从多个指标中提取出潜在公共因子的统计方法,利用它能找出同时影响和支配多个变量的潜在公共方法,利用它能找出同时影响和支配多个变量的潜在公共因子,可以有效的简化数据,快速把握事物的特点和本质。因子,可以有效的简化数据,快速把握事物的特点和本
2、质。因子分析在因子分析在SPSSSPSS中打开方式为:选择中打开方式为:选择“分析分析” “降降维维” “因子分析因子分析”命令,如图所示。命令,如图所示。因子分析作为数据分析和数据挖掘的一种重要的方法,本因子分析作为数据分析和数据挖掘的一种重要的方法,本节主要介绍因子分析的基本概念,与其他相关数据分析方节主要介绍因子分析的基本概念,与其他相关数据分析方法的区别及其步骤。法的区别及其步骤。9.1 9.1 因子分析的基本原理因子分析的基本原理因子分析(因子分析(factor analysisfactor analysis)是一种用于提取多个变量)是一种用于提取多个变量潜在公共因子的统计方法,它是
3、从众多可观测的变量当中潜在公共因子的统计方法,它是从众多可观测的变量当中综合和抽取出少数几个潜在公共因子,并使这些因子能最综合和抽取出少数几个潜在公共因子,并使这些因子能最大程度的概括和解释原有观测变量的信息,从而揭示事物大程度的概括和解释原有观测变量的信息,从而揭示事物的本质。使用因子分析能有效地实现降维,达到简化数据的本质。使用因子分析能有效地实现降维,达到简化数据的目的。因子分析的基本思想就是通过观测变量之间相关的目的。因子分析的基本思想就是通过观测变量之间相关性的大小对其分组,使得各组内的观测变量之间相关性较性的大小对其分组,使得各组内的观测变量之间相关性较高,不同组之间的观测变量相关
4、性较低,每组观测变量代高,不同组之间的观测变量相关性较低,每组观测变量代表一种基本结构,并可以用这些变量的潜在公共因子来表表一种基本结构,并可以用这些变量的潜在公共因子来表示。示。9.1.1 9.1.1 因子分析的含义因子分析的含义因子分析根据不同的方法可以进行不同的分类,一般有以因子分析根据不同的方法可以进行不同的分类,一般有以下两种分类:下两种分类:1 1R R型因子分析和型因子分析和Q Q型因子分析型因子分析2 2探索性因子分析和验证性因子分析探索性因子分析和验证性因子分析9.1.2 9.1.2 因子分析的类别因子分析的类别主成分分析是将多个观测变量通过线性组合转化为少数几主成分分析是将
5、多个观测变量通过线性组合转化为少数几项彼此不相关的综合指变量,即主成分,并用这些主成分项彼此不相关的综合指变量,即主成分,并用这些主成分来解释多变量的方差来解释多变量的方差- -协方差结构。它是一种数学变换方协方差结构。它是一种数学变换方法,在这种变换中,原始观测变量的方差之和保持不变,法,在这种变换中,原始观测变量的方差之和保持不变,具有最大方差的主成分称为第一主成分;具有次大方差的具有最大方差的主成分称为第一主成分;具有次大方差的主成分称为第二主成分。依次类推。主成分称为第二主成分。依次类推。因子分析则是为了寻找多个观测变量中起支配作用的潜在因子分析则是为了寻找多个观测变量中起支配作用的潜
6、在的公共因子,因此需要根据变量间相关性的大小将变量分的公共因子,因此需要根据变量间相关性的大小将变量分组,使得各组内的变量之间相关性较高,不同组变量之间组,使得各组内的变量之间相关性较高,不同组变量之间相关性较低,每组变量可以代表一个基本结构,用公共因相关性较低,每组变量可以代表一个基本结构,用公共因子来表示。子来表示。9.1.3 9.1.3 因子分析与主成分分析因子分析与主成分分析二者都是用较少的变量(因子)来反映多个原始观测变量二者都是用较少的变量(因子)来反映多个原始观测变量的信息。但二者也有一些区别:的信息。但二者也有一些区别:主成分分析中是将主成分表示为多个观测变量的线性组合,主成分
7、分析中是将主成分表示为多个观测变量的线性组合,而因子分析是对观测变量进行分解,将每个原始的观测变而因子分析是对观测变量进行分解,将每个原始的观测变量分解为公共因子和特殊因子,每个观测变量都可以表示量分解为公共因子和特殊因子,每个观测变量都可以表示为公共因子的线性组合。为公共因子的线性组合。主成分分析重点在于解释各变量的总方差,在变异的解释主成分分析重点在于解释各变量的总方差,在变异的解释上它能解释所有变异,而因子分析重点则在于解释各变量上它能解释所有变异,而因子分析重点则在于解释各变量之间的协方差,相对于原有观测变量它只能解释大部分变之间的协方差,相对于原有观测变量它只能解释大部分变异而不是全
8、部。异而不是全部。主成分分析中不需要任何假设,因子分析则有一些假设条主成分分析中不需要任何假设,因子分析则有一些假设条件,如:各公共因子之间彼此独立,特殊因子之间、共同件,如:各公共因子之间彼此独立,特殊因子之间、共同因子和特殊因子之间也需要完全独立。因子和特殊因子之间也需要完全独立。确定一组数据是否适合进行因子分析的检验方法有以下几确定一组数据是否适合进行因子分析的检验方法有以下几种:种:1 1KMOKMO(Kaiser-Meyer-Kaiser-Meyer-OlkinOlkin)取样适合度检验)取样适合度检验KMOKMO统计量的计算公式如下:统计量的计算公式如下:2 2巴特利特球形检验(巴
9、特利特球形检验(Bartlett-test of Bartlett-test of sphericitysphericity)3 3反像相关矩阵检验(反像相关矩阵检验(Anti-image correlation matrixAnti-image correlation matrix)222ijijijijijijrK M Orp 9.1.4 9.1.4 因子分析适合度检验方法因子分析适合度检验方法在实际的研究中,公共因子抽取的数量是一个需要考虑的在实际的研究中,公共因子抽取的数量是一个需要考虑的问题。因为一般来说,公共因子抽取的数量越多,因子模问题。因为一般来说,公共因子抽取的数量越多,因子
10、模型所能解释的变异也越大,模型就越精确;公共因子抽取型所能解释的变异也越大,模型就越精确;公共因子抽取的数量越少,因子模型遗失的信息就越多,所能解释的变的数量越少,因子模型遗失的信息就越多,所能解释的变异就越小,模型的精确性也会显得较差。而如果抽取的因异就越小,模型的精确性也会显得较差。而如果抽取的因子数量太多,又难以达到简化变量结构的目的,失去了进子数量太多,又难以达到简化变量结构的目的,失去了进行因子分析的意义。因此在因子数量的抽取上要在变异的行因子分析的意义。因此在因子数量的抽取上要在变异的解释量与因子结构的简洁性之间进行平衡。解释量与因子结构的简洁性之间进行平衡。因子分析中因子数量的抽
11、取可以参照以下标准:因子分析中因子数量的抽取可以参照以下标准:1 1原始观测变量方差的解释率原始观测变量方差的解释率2 2因子的特征值大小因子的特征值大小3 3碎石图的拐点碎石图的拐点9.1.5 9.1.5 因子数的确定原则因子数的确定原则以以R R型因子分析为例,在型因子分析为例,在SPSSSPSS中因子分析的操作过程如下:中因子分析的操作过程如下:(1 1)打开或建立数据文件。)打开或建立数据文件。(2 2)选择)选择“分析分析” “降维降维” “因子分析因子分析”命令,打命令,打开开“因子分析因子分析”对话框,如图所示。对话框,如图所示。9.2 9.2 因子分析的操作过程因子分析的操作过
12、程 (3 3)选择变量)选择变量(4 4)描述性统计量)描述性统计量(5 5)因子抽取)因子抽取(6 6)旋转)旋转(7 7)得分)得分(8 8)选项)选项(9 9)单击)单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。不同学科之间往往会有一定的一致性,现抽取了某大学机不同学科之间往往会有一定的一致性,现抽取了某大学机械专业的学生考试成绩单,试分析学科成绩之间有无关系?械专业的学生考试成绩单,试分析学科成绩之间有无关系?9.3 9.3 实例分析:学科成绩实例分析:学科成绩(1 1)建立数据文件。)建立数据文件。(2 2)选择)选择“分析分析” “降维降维” “因子分析因子分
13、析”命令,打命令,打开开“因子分析因子分析”对话框,如图所示。对话框,如图所示。9.3.1 9.3.1 操作过程操作过程(3 3)选择变量)选择变量(4 4)描述性统计量)描述性统计量(5 5)因子抽取)因子抽取(6 6)旋转)旋转(7 7)得分)得分(8 8)选项)选项(9 9)单击)单击“确定确定”按钮,执行操作,输出结果。按钮,执行操作,输出结果。根据相应设置,在输出中显示如下结果。根据相应设置,在输出中显示如下结果。1 1描述性统计量描述性统计量2 2相关矩阵表相关矩阵表3 3KMOKMO和和 BartlettBartlett球形检验球形检验4 4变量的共同度变量的共同度5 5方差解释表方差解释表6 6碎石图碎石图7 7旋转前的因子载荷矩阵旋转前的因子载荷矩阵8 8旋转后的因子载荷矩阵旋转后的因子载荷矩阵9 9因子得分系数因子得分系数1010因子变量解因子变量解9.3.2 9.3.2 结果分析结果分析