1、BG1版权所有,盗版必究多元线性回归的多元线性回归的SPSS实现实现深大师范学院BG21、多元线性回归的前提假设2、衡量多元线性回归方程优劣的标准 各子对话框介绍 3、多元性回归的SPSS实现 常选按钮 结果分析4、多元线性回归预测和区间估计版权所有,盗版必究概要BG3一、线性回归的前提假设及SPSS操作实现线性趋势(线性趋势(Linear)自变量与因变量的关系是线性的,否则不能采用线性回归,可通过散点图判断。独立性(独立性(Independent)因变量的取值相互独立,没有自相关。也即是要求残差间相互独立,否则应采用自回归来分析。自变量多重共线性的判断。正态性(正态性(Normal)就自变量
2、的任何一个线性组合,因变量均服从正态分布,即要求残差服从正态。方差齐性(方差齐性(Equal)就自变量的任何一个线性组合,因变量的方差均相同,即要求残差方差齐。版权所有,盗版必究BG41、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)当有多个自变量时,可以通过散点图矩阵同时绘制各变量间的散点图,快速发现多个变量间的主要相关。散点图矩阵散点图矩阵版权所有,盗版必究BG51、线性趋势(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)版权所有,盗版必究BG61、线性趋势
3、(GraphsLegaly DialogsScatter/dotMatrix Scatter)(即散点图判断)4个变量两两个变量两两相交形成相交形成4 4的矩阵。的矩阵。由散点图可知题目类型与试题难度间由散点图可知题目类型与试题难度间的线性条件不明显,因此可以不考虑的线性条件不明显,因此可以不考虑题目类型对试题难度的回归。题目类型对试题难度的回归。版权所有,盗版必究BG72、正态性(GraphsLegaly DialogsHistogram)点此,才可给出正态分布曲线图版权所有,盗版必究正态性是指在给定一组X后,Y的分布为正态分布。BG82、正态性(GraphsLegaly DialogsHi
4、stogram)版权所有,盗版必究BG93、方差齐性(AnalyzeRegressionLinear Regression:plot选项介绍)选入ZPRED与ZRESID进入X,Y两个变量框就可实现。版权所有,盗版必究BG10二、衡量多元线性回归模型优劣的标准1、复相关系数R(Multiple Correlation Coefficient):表示模型中所有自变量与因变量之间线性回归关系的密切程度大小,取值范围为(0,1),R值越大越好。2、决定系数R2(Determinate Coefficient):等于复相关系数的平方。表示因变量的总变异中可由回归模型中自变量解释的部分所占的比例。R2越
5、大越好。版权所有,盗版必究BG11二、衡量多元线性回归模型优劣的标准3、校正的决定系数R2adj(Adjusted R Square):当模型中增加的变量没有统计学意义时,校正系数会减小,校正系数越大,模型拟合的越好。4、剩余标准差(Std.Error Of The Estimate):剩余标准差越小,说明建立的模型效果越好。版权所有,盗版必究BG12二、衡量多元线性回归模型优劣的标准版权所有,盗版必究BG13三、线性回归的SPSS实现1、SPSS中的回归分析操作(AnalyzeRegressionLinear Regression):各复选框基本知识介绍因变量框自变量框选取变量的方法版权所有
6、,盗版必究BG14SPSS提供了五种选取变量的方法:提供了五种选取变量的方法:强迫进入变量法(强迫进入变量法(Enter):常用方法,强迫所有变量有顺序):常用方法,强迫所有变量有顺序进入回归方程式。若研究者有事先建立的假设,决定变量重要性层进入回归方程式。若研究者有事先建立的假设,决定变量重要性层次则该适用该法。次则该适用该法。逐步多元回归分析法(逐步多元回归分析法(Stepwise):逐一、重复筛查引入变量,):逐一、重复筛查引入变量,直至获得最好模型。直至获得最好模型。向前进入法(向前进入法(Forward):对各变量拟合其与因变量的模型,):对各变量拟合其与因变量的模型,将将p值最小的
7、模型对应的自变量首先选入方程。值最小的模型对应的自变量首先选入方程。向后进入法(向后进入法(Backward):对各变量拟合其与因变量的模型,):对各变量拟合其与因变量的模型,将将p值最大的模型对应的自变量首先剔除出方程。值最大的模型对应的自变量首先剔除出方程。删除法(删除法(Remove):自变量被强制剔除出模型。):自变量被强制剔除出模型。版权所有,盗版必究BG151、SPSS中的回归分析操作(AnalyzeRegressionLinear Regression):各复选框基本知识介绍各子对话框版权所有,盗版必究BG16默认输出项,输出与回归系数相关的默认输出项,输出与回归系数相关的统计量
8、,如回归系数、回归系数标准统计量,如回归系数、回归系数标准误、标准回归系数、统计量和相应的误、标准回归系数、统计量和相应的相伴概率值、各自变量容忍度等。相伴概率值、各自变量容忍度等。1、SPSS中的回归分析操作(Statistics介绍)奇异值判别(默认值为三个标准差之外)。多重共线性的识别:对自变量的考察。默认输出判定系数、调整默认输出判定系数、调整判定系数、回归方程的标判定系数、回归方程的标准误、准误、F 检验分析表。检验分析表。版权所有,盗版必究BG17多重共线性的识别(Collinearity Diagnostics)容忍度(Tolerance):等于1减去以该自变量为反应变量Inde
9、pendent框中选入的其他自变量为自变量所得到的线性回归模型的决定系数。容忍度越小,多重共线性越严重。方差膨胀因素(Variance Inflation Factor,VIF):容忍度的倒数;VIF越大,多重共线性问题越大。条件指针(Condiction Index,CI 值):等于最大的主成分与当前主成分的比值的算术平方根。所以第一个主成分相对应的条件指数总为1.同样,如果几个条件指数较大(如30),则提示存在多重共线性。版权所有,盗版必究BG18多重共线性的识别(Collinearity Diagnostics)特征根(Eigenvalue):对模型中常数项及所有自变量计算主成分,如果自
10、变量间存在较强的线性相关关系,则前面的几个主成分数值较大,而后面的几个主成分较小,甚至接近0。变异构成(Variance Proportion):回归模型中各项(包括常数项)的变异被各主成分所解释的比例,如果某个主成分对两个或多个自变量的贡献均较大(大于0.5),说明这几个自变量间存在一定程度的共线性。版权所有,盗版必究BG19多重共线性的识别版权所有,盗版必究BG201、SPSS中的回归分析操作(Statistics介绍)输出每一个非标准回归输出每一个非标准回归系数系数 95%95%的可信区间。的可信区间。输出方程各自变量间的相输出方程各自变量间的相关系数矩阵和各变量的协关系数矩阵和各变量的
11、协方差矩阵。方差矩阵。引入一个变量后,决定系引入一个变量后,决定系数的变化。数的变化。自变量、因变量的描述统自变量、因变量的描述统计值及相关系数等。计值及相关系数等。版权所有,盗版必究BG211、SPSS中的回归分析操作(Statistics介绍)自变量、因变量的简单相自变量、因变量的简单相关系数、偏相关系数等。关系数、偏相关系数等。关于残差分析选择区关于残差分析选择区D-W检验值检验值版权所有,盗版必究BG221、SPSS中的回归分析操作(Plot介绍)版权所有,盗版必究因变量标准化预测值标准化残差剔除残差BG231、SPSS中的回归分析操作(Plot介绍)Plot按钮提供了绘制残差的直方图
12、及PP图法。注意:自变量与因变量间关系并非线性、残差参差不齐、观测值间不独立等情况均会导致残差的直方图和PP图表现出非正态。因此建议在确认残差服从线性回归的其他几项条件后,再来研究残差分布是否正态。版权所有,盗版必究修正后预测值学生化残差学生化剔除残差BG241、SPSS中的回归分析操作(Plot介绍)版权所有,盗版必究输出每一个变量相对于因变量的残差散点图输出带有正态曲线的标准化残差的直方图。输出P-P图:即残差的正态效率图,检查残差的正态性。BG251、SPSS中的回归分析操作(Plot介绍)残差直方图残差直方图版权所有,盗版必究BG261、SPSS中的回归分析操作(Plot介绍)残差残差
13、PP图图版权所有,盗版必究BG271、SPSS中的回归分析操作(Plot介绍)标化预测值和标化残差散点图标化预测值和标化残差散点图版权所有,盗版必究BG281、SPSS中的回归分析操作(Plot介绍)版权所有,盗版必究自变量内容深度的残差相对于因变量试题难度的散布图BG291、SPSS中的回归分析操作(save介绍)预测值输出残差值距离栏输出影响点的统计量预测区间BG301、SPSS中的回归分析操作(Save介绍)非标准化预测值标准化预测值预测值复选框修正后预测值预测值的标准误版权所有,盗版必究BG311、SPSS中的回归分析操作(Save介绍)版权所有,盗版必究预测区间预测区间高低值的平均值
14、观测量上、下限的间距置信区间,默认为95%,可键入0-99.99间的值BG321、SPSS中的回归分析操作(Save介绍)残差复选框残差复选框非标化残差标准化残差学生化残差剔除残差学生化剔除残差版权所有,盗版必究BG332、回归分析的SPSS实现(AnalyzeRegressionLinear Regression):实现时各子对话框最常用的选项版权所有,盗版必究statisticsBG342、回归分析的SPSS实现(AnalyzeRegressionLinear Regression):实现时各子对话框最常用的选项版权所有,盗版必究plotsBG352、回归分析的SPSS实现(Analyze
15、RegressionLinear Regression):实现时各子对话框最常用的选项版权所有,盗版必究saveBG363、回归分析的SPSS实现(AnalyzeRegressionLinear Regression)结果分析由图可知,模型1是仅包含自变量能力层次的模型,模型2是包含自变量能力层次和内容深度的模型。经逐步回归,模型2是最终得到的模型(剔除了自变量题目类型),其决定性系数 =0.8862R其决定性系数为0.886版权所有,盗版必究BG373、回归分析的SPSS实现(AnalyzeRegressionLinear Regression)结果分析y=-1.598+0.283x1+0.
16、205x2常数值容忍度大小适中,方差膨胀因子数值不大,可以拒绝它们之间的共线性假设。版权所有,盗版必究对各自变量的回归系数的显著性检验。BG38 由图可知,模型1和模型2的回归方差均显著大于剩余方差,F值分别为77.399和65.925,=0.000,均小于0.01,说明所建回归方程均是有效的。3、回归分析的SPSS实现(AnalyzeRegressionLinear Regression)结果分析(显著性检验)版权所有,盗版必究BG39 SPSS输出的每一步被排除在模型之外的自变量其回归系数估计、偏相关系数、多重共线性的容忍度等。3、回归分析的SPSS实现(AnalyzeRegression
17、Linear Regression)结果分析(显著性检验)版权所有,盗版必究BG403、回归分析的SPSS实现(AnalyzeRegressionLinear Regression)结果分析(显著性检验)残差是正态的版权所有,盗版必究BG413、回归分析的SPSS实现(AnalyzeRegressionLinear Regression)结果分析(显著性检验)版权所有,盗版必究回归模型优劣判断BG423、回归分析的SPSS实现(AnalyzeRegressionLinear Regression)结果分析由以上分析说明,所建立的回归方程模型是有效的:题目难度要受到能力层次与内容深度的影响。版权所有,盗版必究BG43四、回归预测与区间估计预测值预测区间版权所有,盗版必究在SPSS中,回归预测和区间估计均可在Save按钮中实现。BG44四、回归预测与区间估计版权所有,盗版必究输出的各种预测值预测值的解释BG45四、回归预测与区间估计版权所有,盗版必究预测区间解释预测值标准化预测值预测区间下限的平均值。预测区间上限的平均值。观测量预测值下限观测量预测值上限BG46版权所有,盗版必究