1、SPSS 16实用教程第第9章章 因子分析因子分析因子分析的定义和数学模型因子分析的定义和数学模型9.1SPSSSPSS中实现过程中实现过程9.2 因子分析是将现实生活中众多相关、重叠因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以指标变成较少的几个综合变量和综合指标,以利于分析判定。本章介绍因子分析的定义、因利于分析判定。本章介绍因子分析的定义、因子分析的数学模型,以及因子分析在子分析的数学模型,以及因子分析在SPSSSPSS中的中的实现过程。实现过程。9.1.1 统计学上的定义统计学
2、上的定义 定义:在社会、政治、经济和医学等领域定义:在社会、政治、经济和医学等领域的研究中往往需要对反映事物的多个变量进行的研究中往往需要对反映事物的多个变量进行大量的观察,收集大量的数据以便进行分析,大量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。在一定的相关关系。因此,有可能用较少的综合指标分析存在因此,有可能用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标称为此是不相关的,代表各类信息的综合指标称为因子。因子
3、分析就是用少数几个因子来描述许因子。因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计学方法。映原资料的大部分信息的统计学方法。因子分析有如下特点。因子分析有如下特点。(1 1)因子变量的数量远少于原有的指标)因子变量的数量远少于原有的指标变量的数量,对因子变量的分析能够减少分析变量的数量,对因子变量的分析能够减少分析中的计算工作量。中的计算工作量。(2 2)因子变量不是对原有变量的取舍,)因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重新组构,它能而是根据原始变量的信息进行重新组构,它能够反映
4、原有变量大部分的信息。够反映原有变量大部分的信息。(3 3)因子变量之间不存在线性相关关系,)因子变量之间不存在线性相关关系,对变量的分析比较方便。对变量的分析比较方便。(4 4)因子变量具有命名解释性,即该变)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。量是对某些原始变量信息的综合和反映。对多变量的平面数据进行最佳综合和简化,对多变量的平面数据进行最佳综合和简化,即在保证数据信息丢失最少的原则下,对高维即在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理。显然,在一个低维空变量空间进行降维处理。显然,在一个低维空间解释系统,要比在一个高维系统空间容易得间解释系统
5、,要比在一个高维系统空间容易得多。多。英国统计学家英国统计学家Moser ScottMoser Scott在在19611961年对英年对英国国157157个城镇发展水平进行调查时,原始测量个城镇发展水平进行调查时,原始测量的变量有的变量有5757个,而通过因子分析发现,只需要个,而通过因子分析发现,只需要用用5 5个新的综合变量(它们是原始变量的线性个新的综合变量(它们是原始变量的线性组合),就可以解释组合),就可以解释95%95%的原始信息。对问题的原始信息。对问题的研究从的研究从5757维度降低到维度降低到5 5个维度,因此可以进个维度,因此可以进行更容易的分析。行更容易的分析。9.1.2
6、 数学模型数学模型因子分析中的几个概念因子分析中的几个概念1 1因子载荷因子载荷2 2变量共同度变量共同度3 3公共因子公共因子FjFj的方差贡献的方差贡献 因子分析有两个核心问题:一是如何构造因子分析有两个核心问题:一是如何构造因子变量;二是如何对因子变量进行命名解释。因子变量;二是如何对因子变量进行命名解释。因子分析有下面因子分析有下面4 4个基本步骤。个基本步骤。(1 1)确定待分析的原有若干变量是否适)确定待分析的原有若干变量是否适合于因子分析。合于因子分析。(2 2)构造因子变量。)构造因子变量。(3 3)利用旋转使得因子变量更具有可解)利用旋转使得因子变量更具有可解释性。释性。(4
7、 4)计算因子变量的得分。)计算因子变量的得分。9.1.3 因子分析的因子分析的4个基本步骤个基本步骤 因子分析是从众多的原始变量中构造出少因子分析是从众多的原始变量中构造出少数几个具有代表意义的因子变量,这里面有一数几个具有代表意义的因子变量,这里面有一个潜在的要求,即原有变量之间要具有比较强个潜在的要求,即原有变量之间要具有比较强的相关性。如果原有变量之间不存在较强的相的相关性。如果原有变量之间不存在较强的相关关系,那么就无法从中综合出能反映某些变关关系,那么就无法从中综合出能反映某些变量共同特性的少数公共因子变量来。因此,在量共同特性的少数公共因子变量来。因此,在因子分析时,需要对原有变
8、量作相关分析。因子分析时,需要对原有变量作相关分析。9.1.4 确定待分析的原有若干变量是确定待分析的原有若干变量是否适合于因子分析否适合于因子分析 最简单的方法就是计算变量之间的相关系最简单的方法就是计算变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验中,数矩阵。如果相关系数矩阵在进行统计检验中,大部分相关系数都小于大部分相关系数都小于0.30.3,并且未通过统计,并且未通过统计检验,那么这些变量就不适合于进行因子分析。检验,那么这些变量就不适合于进行因子分析。1 1巴特利特球形检验(巴特利特球形检验(Bartlett Test Bartlett Test of Sphericityo
9、f Sphericity)2 2反映像相关矩阵检验(反映像相关矩阵检验(AntiAntiimage image correlation matrixcorrelation matrix)3 3KMOKMO(Kaiser-Meyer-OlkinKaiser-Meyer-Olkin)检验)检验 因子分析中有多种确定因子变量的方法,因子分析中有多种确定因子变量的方法,如基于主成分模型的主成分分析法和基于因子如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二分析模型的主轴因子法、极大似然法、最小二乘法等。其中基于主成分模型的主成分分析法乘法等。其中基于主成分模型的主成分分
10、析法是使用最多的因子分析方法之一。下面以该方是使用最多的因子分析方法之一。下面以该方法为对象进行分析。法为对象进行分析。9.1.5 构造因子变量构造因子变量9.1.6 因子变量的命名解释因子变量的命名解释 在实际分析工作中,主要是通过对载荷矩在实际分析工作中,主要是通过对载荷矩阵阵A A的值进行分析,得到因子变量和原变量的的值进行分析,得到因子变量和原变量的关系,从而对新的因子变量进行命名。关系,从而对新的因子变量进行命名。计算因子得分是因子分析的最后一步。因计算因子得分是因子分析的最后一步。因子变量确定以后,对每一样本数据,希望得到子变量确定以后,对每一样本数据,希望得到它们在不同因子上的具
11、体数据值,这些数值就它们在不同因子上的具体数据值,这些数值就是因子得分,它和原变量的得分相对应。有了是因子得分,它和原变量的得分相对应。有了因子得分,在以后的研究中,就可以针对维数因子得分,在以后的研究中,就可以针对维数少的因子得分来进行。少的因子得分来进行。9.1.7 计算因子得分计算因子得分9.2.1 SPSS中实现步骤中实现步骤 研究问题研究问题 表表9-29-2所示为所示为2020名大学生关于价值观的名大学生关于价值观的9 9项测验结果,包括合作性、对分配的看法、行项测验结果,包括合作性、对分配的看法、行为出发点、工作投入程度、对发展机会的看法、为出发点、工作投入程度、对发展机会的看法
12、、社会地位的看法、权力距离、对职位升迁的态社会地位的看法、权力距离、对职位升迁的态度、以及领导风格的偏好。度、以及领导风格的偏好。合作性合作性分分 配配出发点出发点工作投入工作投入发展机会发展机会社会地位社会地位权力距离权力距离职位升迁职位升迁领导风格领导风格16161318161715161618191516181818171917171714171816161617171716191819201916151616181815161620171617181817191818161620151619141716161318161715161618191516181818171917171714
13、1718161616171717161918192019161516161818151616201716171818171918181616201516191417161613181617151616181915161818181719171717141718161616171717161918192019161516161818151616201716171818171918 实现步骤实现步骤 (1 1)SPSSSPSS输出结果文件中的第一部分如输出结果文件中的第一部分如下表所示。下表所示。9.2.2 SPSS结果解释结果解释 (2 2)SPSSSPSS输出结果文件中的第二部分如输出结果文件
14、中的第二部分如下表所示。下表所示。(3 3)SPSSSPSS输出结果文件中的第三部分如输出结果文件中的第三部分如下表所示。下表所示。(4 4)SPSSSPSS输出结果文件中的第四部分如输出结果文件中的第四部分如下表所示。下表所示。(5 5)SPSSSPSS输出结果文件中的第五部分如输出结果文件中的第五部分如下表所示。下表所示。(6 6)SPSSSPSS输出结果文件中的第六部分如输出结果文件中的第六部分如下表所示。下表所示。(7 7)SPSSSPSS输出结果文件中的第七部分为输出结果文件中的第七部分为Total Variance ExplainedTotal Variance Explained
15、表格。如下表所表格。如下表所示。示。(8 8)SPSSSPSS输出结果文件中的第八部分如输出结果文件中的第八部分如图图9-89-8所示。所示。(9 9)SPSSSPSS输出结果文件中的第九部分如输出结果文件中的第九部分如下表所示。下表所示。(1010)SPSSSPSS输出结果文件中的第十部分输出结果文件中的第十部分如下表所示。如下表所示。(1111)SPSSSPSS输出结果文件中的第十一部输出结果文件中的第十一部分如下表所示。分如下表所示。(1212)SPSSSPSS输出结果文件中的第十二部输出结果文件中的第十二部分如图分如图9-99-9所示。所示。(1313)SPSSSPSS输出结果文件中的
16、第十三部输出结果文件中的第十三部分如下表所示。分如下表所示。(1414)SPSSSPSS输出结果文件中的第十四部输出结果文件中的第十四部分如下表所示。分如下表所示。因子分析是对现实生活中众多的相关、重因子分析是对现实生活中众多的相关、重叠信息进行合并和综合,它以最少的信息丢失,叠信息进行合并和综合,它以最少的信息丢失,将原始的众多变量和指标变成较少的几个综合将原始的众多变量和指标变成较少的几个综合变量,以利于分析判定。变量,以利于分析判定。在研究中,因子分析得到的结果经常用于在研究中,因子分析得到的结果经常用于综合判定。综合判定。9.2.3 讨论讨论 因子分析是由因子分析是由Charles S
17、pearmanCharles Spearman在在19041904年首次提出,其在某种程度上可以被看成是主年首次提出,其在某种程度上可以被看成是主成分分析的推广和扩展。因子分析就是用少量成分分析的推广和扩展。因子分析就是用少量几个因子来描述许多指标或因素之间的联系,几个因子来描述许多指标或因素之间的联系,以较少的几个因子反应原资料的大部分信息的以较少的几个因子反应原资料的大部分信息的统计方法。统计方法。因子分析有两个核心问题:一是如何构造因子分析有两个核心问题:一是如何构造变量,二是如何对因子变量命名解释。因子分变量,二是如何对因子变量命名解释。因子分析的基本步骤有四步:(析的基本步骤有四步:(1 1)确定带分析的原)确定带分析的原有若干变量是否适于因子分析;(有若干变量是否适于因子分析;(2 2)构造因)构造因子变量;(子变量;(3 3)利用旋转使得因子变量更具有)利用旋转使得因子变量更具有可解释性;(可解释性;(4 4)计算因子变量得分。)计算因子变量得分。选中选中SPSSSPSS中中“Analyze”/“Data Analyze”/“Data Reduction”/“Factor”Reduction”/“Factor”子菜单可进行因子子菜单可进行因子分析,应计算相应的因子得分。分析,应计算相应的因子得分。