1、第九讲第九讲 回归分析的回归分析的SPSSSPSS实现实现精品线性回归分析线性回归分析 被解释变量和各个解释变量各对应一个spss变量 一元线性回归和多元线性回归分析的功能菜单是集成到一起的 数据:高校科研研究.data精品一、描绘散点交互图一、描绘散点交互图 基本步骤 Graphs-interactive-Scatterplot Assign Variable-y=课题数;x=高级职称人数 Fit-Method-选择Regression OK精品Linear Regression with95.00%Mean Prediction Interval0.01000.02000.03000.0投
2、入高级职称的人年数(上年)投入高级职称的人年数(上年)0.01000.02000.03000.04000.0课题总数课题总数课题总数=-24.52+0.95*X3课题总数=-24.52+0.95*X3R-Square=0.89R-Square=0.89精品二、用Linear Regression分析 Analyze-Regression-Linear 选择被解释变量进入选择被解释变量进入Dependent框框-课题数课题数 选择一个或多个解释变量进入选择一个或多个解释变量进入Independent(s)框框 METHOD-Enter;stepwise;-单击单击Statistics,选择全部核
3、选框选择全部核选框 单击单击Plots,选择选择”Histogram”核选框和核选框和”Normal probality plot”选择选择”ZPRED”输入到输入到”Y”;选择选择”SRESID”输入到输入到”X”;OK精品(一)立项课题数多元线性回归分析结果(enter策略)M Mo od de el l S Su um mm ma ar ry yb b.969a.939.924231.5255.93961.532624.0001.838Model1RR SquareAdjustedR SquareStd.Error ofthe EstimateR SquareChangeF Change
4、df1df2Sig.F ChangeChange StatisticsDurbin-WatsonPredictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),专著数(上年),投入人年数,投入高级职称的人年数(上年)a.Dependent Variable:课题总数b.结果一:模型综述表 结果说明:1)调整后的R2=0.939,因此模型的拟和优度较高;模型的F检验达到了0.00的极显著水平.说明模型的线性关系较显著,具有较强的解释能力2)D.W值=1.838接近于2,说明模型的序列相关性不强.精品结果二:模型方差分析表ANOVAANOVAb b197
5、9031363298385.48061.532.000a12864972453604.0472107681030RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),专著数(上年),投入人年数,投入高级职称的人年数(上年)a.Dependent Variable:课题总数b.结果说明结果说明:模型的模型的F检验值检验值=61.532,对应的概率值对应的概率值P=0.00,远小于远小于0.01的极显著水平的极显著水平,应该拒
6、绝回归系数为零的原假设应该拒绝回归系数为零的原假设,即认为回归即认为回归系数不同时为零系数不同时为零,被解释变量与解释变量全体的线性关系是显被解释变量与解释变量全体的线性关系是显著的著的,可以建立线性模型可以建立线性模型.精品结果三:系数分析表C Co oe ef ff fi ic ci ie en nt ts sa a-35.313 76.580-.461.649-193.367122.740.698.2081.3613.352.003.2681.128.959.565.169.015 64.811-.467.626-.464-.747.463-1.759.824.944-.151-.038
7、.007 151.824.003.002.2371.601.122-.001.007.862.311.081.1178.576.022.377.014.059.953-.755.800.868.012.003.046 21.875-.064.053-.252-1.198.243-.173.046.887-.238-.060.058 17.384.712.503.1191.416.170-.3261.751.665.278.071.3582.796(Constant)投入人年数投入高级职称的人年数(上年)投入科研事业费(百元)(上年)专著数(上年)论文数(上年)获奖数(上年)Model1BStd
8、.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower Bound Upper Bound95%Confidence Interval for BZero-order PartialPartCorrelationsTolerance VIFCollinearity StatisticsDependent Variable:课题总数a.精品结果说明:1)由于回归方程:课题立项数=-35.313+0.698投入人年数+-2)变量的显著性检验:只有“投入人年数”达到了0.003 的极显著水平,其他变量都不显著,说明
9、除了“投入人年数”外,其他变量都与课题立项数没有显著的线性关系。3)多重共线性检验:容忍度(tolerance)越接近于0,多重共线性越强;方差膨胀因子(VIF)越大,一般大于等于10时,说明解释变量Xi 与其余解释变量之间有较强的多重共线性。4)结论:由于模型保留了一些不应保留的变量,该模型不可用;从容忍度和方差膨胀因子看,“投入高级职称人数”与其他解释变量之间多重共线性严重。再重新建模,应考虑提出该变量。精品结果四:相关系数矩阵表Coefficient CorrelationsCoefficient Correlationsa a1.000-.048-.310.396.181-.239-.
10、0481.000.347-.363.057-.226-.310.3471.000.070.017-.404.396-.363.0701.000.506-.666.181.057.017.5061.000-.860-.239-.226-.404-.666-.8601.000.253.000-.008.075.019-.075.000.000.000.000.000.000-.008.000.003.001.000-.013.075.000.001.142.040-.157.019.000.000.040.043-.112-.075.000-.013-.157-.112.392获奖数(上年)投入科
11、研事业费(百元)(上年)论文数(上年)专著数(上年)投入人年数投入高级职称的人年数(上年)获奖数(上年)投入科研事业费(百元)(上年)论文数(上年)专著数(上年)投入人年数投入高级职称的人年数(上年)CorrelationsCovariancesModel1获奖数(上年)投入科研事业费(百元)(上年)论文数(上年)专著数(上年)投入人年数投入高级职称的人年数(上年)Dependent Variable:课题总数a.精品结果五:多重共线性检验表Collinearity DiagnosticsCollinearity Diagnosticsa a6.1371.000.01.00.00.00.00.
12、00.00.4523.684.33.00.00.03.01.00.04.2944.572.32.00.00.01.00.00.39.0739.142.26.01.00.39.00.06.29.02814.719.09.03.00.37.55.02.15.01421.020.00.12.01.17.00.82.06.00258.796.00.84.98.03.44.10.05Dimension1234567Model1EigenvalueConditionIndex(Constant)投入人年数投入高级职称的人年数(上年)投入科研事业费(百元)(上年)专著数(上年)论文数(上年)获奖数(上年)V
13、ariance ProportionsDependent Variable:课题总数a.结果说明:1)特征根是诊断解释变量间是否存在多重共线性的另一种有效的方法.2)如果某一个特征根能够刻画某解释变量方差的较大部分比例,(0.7以上),同时有刻画了另一个变量的方差的较大部分,则表明这两个解释变量之间存在较强的线性相关关系.3)第 7个特征根既能解释“投入人年数”方差的84%,又能解释“投入高级职称人数”方差的98%,同时还能解释专著数“的44%,因此有理由认为这三个变量间存在多重共线性。4)因此应重新建立回归模型精品(一)立项课题数多元线性回归分析结果(backward策略)Model Sum
14、maryModel Summaryg g.969a.939.924231.5255.93961.532624.000.969b.939.927226.8644.000.004124.953.968c.937.927226.5820-.002.935125.343.965d.931.923232.0833-.0062.327126.139.963e.927.921234.8694-.0041.676127.206.959f.919.917241.9582-.0072.777128.1071.747Model123456RR SquareAdjustedR SquareStd.Error ofth
15、e EstimateR SquareChangeF Changedf1df2Sig.F ChangeChange StatisticsDurbin-WatsonPredictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),专著数(上年),投入人年数,投入高级职称的人年数(上年)a.Predictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),投入人年数,投入高级职称的人年数(上年)b.Predictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),投入人年数c
16、.Predictors:(Constant),获奖数(上年),论文数(上年),投入人年数d.Predictors:(Constant),论文数(上年),投入人年数e.Predictors:(Constant),投入人年数f.Dependent Variable:课题总数g.结果一:模型综述表精品方差分析A AN NO OV VA Ag g1979031363298385.48061.532.000a12864972453604.04721076810301979012453958024.75376.903.000b12866862551467.4492107681030197419854493
17、5496.32896.135.000c13348252651339.41121076810301962251936540839.536121.436.000d14542912753862.64421076810301953222829766114.116177.039.000e15445822855163.635210768103019379040119379040.05331.018.000f16977702958543.7912107681030RegressionResidualTotalRegressionResidualTotalRegressionResidualTotalRegr
18、essionResidualTotalRegressionResidualTotalRegressionResidualTotalModel123456Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),专著数(上年),投入人年数,投入高级职称的人年数(上年)a.Predictors:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),投入人年数,投入高级职称的人年数(上年)b.Predictors:(Constant),获奖数(上年),投入科
19、研事业费(百元)(上年),论文数(上年),投入人年数c.Predictors:(Constant),获奖数(上年),论文数(上年),投入人年数d.Predictors:(Constant),论文数(上年),投入人年数e.Predictors:(Constant),投入人年数f.Dependent Variable:课题总数g.精品回归系数CoefficientsCoefficientsa a-35.31376.580-.461.649-193.367122.740.698.2081.3613.352.003.2681.128.959.565.169.01564.811-.467.626-.46
20、4-.747.463-1.759.824.944-.151-.038.007151.824.003.002.2371.601.122-.001.007.862.311.081.1178.576.022.377.014.059.953-.755.800.868.012.003.04621.875-.064.053-.252-1.198.243-.173.046.887-.238-.060.05817.384.712.503.1191.416.170-.3261.751.665.278.071.3582.796-36.24673.442-.494.626-187.504115.011.692.17
21、61.3493.932.001.3291.054.959.618.194.02148.202-.443.458-.439-.967.343-1.385.500.944-.190-.048.01284.526.003.002.2401.778.088.000.006.862.335.088.1347.446-.064.052-.253-1.230.230-.170.043.887-.239-.061.05817.299.701.453.1171.548.134-.2321.633.665.296.076.4242.358-29.79173.047-.408.687-179.942120.360.
22、553.1021.0795.411.000.343.764.959.728.267.06116.325.002.001.1521.525.139-.001.004.862.287.075.2464.069-.088.045-.348-1.934.064-.181.006.887-.355-.095.07513.309.716.452.1201.586.125-.2121.645.665.297.078.4252.355-63.38571.340-.889.382-209.76282.991.644.0851.2557.527.000.468.819.959.823.380.09210.876-
23、.096.046-.381-2.081.047-.191-.001.887-.372-.105.07613.119.589.455.0991.295.206-.3441.522.665.242.065.4402.274-67.92572.109-.942.354-215.63379.783.628.0861.2247.330.000.452.803.959.811.375.09410.650-.070.042-.278-1.666.107-.156.016.887-.300-.085.09410.650-94.52472.442-1.305.202-242.68553.637.492.027.
24、95918.194.000.436.547.959.959.9591.0001.000(Constant)投入人年数投入高级职称的人年数(上年)投入科研事业费(百元)(上年)专著数(上年)论文数(上年)获奖数(上年)(Constant)投入人年数投入高级职称的人年数(上年)投入科研事业费(百元)(上年)论文数(上年)获奖数(上年)(Constant)投入人年数投入科研事业费(百元)(上年)论文数(上年)获奖数(上年)(Constant)投入人年数论文数(上年)获奖数(上年)(Constant)投入人年数论文数(上年)(Constant)投入人年数Model123456BStd.ErrorUns
25、tandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95%Confidence Interval for BZero-orderPartialPartCorrelationsToleranceVIFCollinearity StatisticsDependent Variable:课题总数a.精品多重共线性检验Collinearity DiagnosticsCollinearity Diagnosticsa a6.1371.000.01.00.00.00.00.00.00.4523.684.
26、33.00.00.03.01.00.04.2944.572.32.00.00.01.00.00.39.0739.142.26.01.00.39.00.06.29.02814.719.09.03.00.37.55.02.15.01421.020.00.12.01.17.00.82.06.00258.796.00.84.98.03.44.10.055.2471.000.01.00.00.00.00.01.3823.706.52.00.00.06.00.01.2804.325.16.00.00.04.00.55.0738.466.29.01.00.41.06.38.01419.403.00.18.0
27、2.14.80.06.00341.788.02.80.97.35.14.004.2731.000.01.00.01.00.01.3693.401.54.00.13.00.00.2773.925.14.00.09.00.54.0677.987.31.07.59.13.41.01318.195.00.93.17.87.043.5141.000.02.00.00.02.3143.346.73.00.00.22.1574.727.23.06.02.65.01515.232.02.93.97.112.7321.000.04.00.00.2513.299.95.02.02.01712.725.01.97.
28、981.8001.000.10.10.2003.001.90.90Dimension123456712345612345123412312Model123456EigenvalueConditionIndex(Constant)投入人年数投入高级职称的人年数(上年)投入科研事业费(百元)(上年)专著数(上年)论文数(上年)获奖数(上年)Variance ProportionsDependent Variable:课题总数a.精品剔除的变量Excluded VariablesExcluded Variablesf f.014a.059.953.012.04621.875.007-.103b-.5
29、92.559-.118.08212.179.059-.439b-.967.343-.190.01284.526.012.080c.632.533.123.1646.091.064.104c.299.767.059.02246.195.022.152c1.525.139.287.2464.069.061.016d.131.897.025.1885.314.065.035d.100.921.019.02245.121.022.123d1.220.233.229.2543.930.061.099d1.295.206.242.4402.274.076.023e.182.857.034.1885.308
30、.188-.119e-.343.734-.065.02441.733.024.152e1.528.138.278.2673.748.267.030e.411.684.077.5421.846.542-.278e-1.666.107-.300.09410.650.094专著数(上年)专著数(上年)投入高级职称的人年数(上年)专著数(上年)投入高级职称的人年数(上年)投入科研事业费(百元)(上年)专著数(上年)投入高级职称的人年数(上年)投入科研事业费(百元)(上年)获奖数(上年)专著数(上年)投入高级职称的人年数(上年)投入科研事业费(百元)(上年)获奖数(上年)论文数(上年)Model2345
31、6Beta IntSig.PartialCorrelationToleranceVIFMinimumToleranceCollinearity StatisticsPredictors in the Model:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),投入人年数,投入高级职称的人年数(上年)a.Predictors in the Model:(Constant),获奖数(上年),投入科研事业费(百元)(上年),论文数(上年),投入人年数b.Predictors in the Model:(Constant),获奖数(上年),论文数(上年),投入人年
32、数c.Predictors in the Model:(Constant),论文数(上年),投入人年数d.Predictors in the Model:(Constant),投入人年数e.Dependent Variable:课题总数f.精品曲线估计常见的曲线模型:二次曲线;对数曲线(logarithmic);复合函数(compound);幂函数(Power)等例如:人均消费支出和教育.data要求:分析教育支出和消费支出的关系精品常见的曲线模型 二次曲线(Quadratic):y=0+1x+2x2 复合曲线(Compound):y=01x 增长曲线(Growth):y=e0+1x 对数曲线
33、(Logarithmic):y=0+1ln(x)指数曲线(Exponential):y=0e1x 幂函数(Power):y=0 x1 逆函数(Inverse):y=0+1/x精品基本步骤 1)Analyze-Regression-Curve estimation 2)选择被解释变量进入)选择被解释变量进入Dependent框框-教育支出教育支出 3)选择消费支出进入)选择消费支出进入Independent(s)框;如果选择框;如果选择time参数,则表示解释变量为时间参数,则表示解释变量为时间 4)Models-选择几种模型选择几种模型 复合函数、幂函数等复合函数、幂函数等 5)选择)选择 P
34、lots models选项绘制回归线;选择选项绘制回归线;选择Display ANOVA table输出各个模型的方差分析表和回归系数的显输出各个模型的方差分析表和回归系数的显著性检验著性检验精品MODEL:MOD_2.Dependent variable.x5 Method.CUBICListwise Deletion of Missing DataMultiple R .99711R Square .99422Adjusted R Square .99230Standard Error 32.23848 Analysis of Variance:DF Sum of Squares Mean
35、 SquareRegression 3 1610303.3 536767.78Residuals 9 9353.9 1039.32F=516.46087 Signif F=.0000-Variables in the Equation-Variable B SE B Beta T Sig Tx2 .075378 .069194 .579897 1.089 .3043x2*2 -1.987684665861E-05 1.3446E-05 -1.685204 -1.478 .1734x2*3 2.596263004613E-09 7.7924E-10 2.112252 .(Constant)-41
36、.313805 97.204131 -.425 .6808精品Dependent variable.x5 Method.POWERListwise Deletion of Missing DataMultiple R .97687R Square .95428Adjusted R Square .95012Standard Error .26578 Analysis of Variance:DF Sum of Squares Mean SquareRegression 1 16.217387 16.217387Residuals 11 .777033 .070639F=229.58009 Si
37、gnif F=.0000-Variables in the Equation-Variable B SE B Beta T Sig Tx2 1.845988 .121832 .976871 15.152 .0000(Constant)3.5781705054E-05 3.7164E-05 .963 .3563精品0.00200.00400.00600.00800.001000.001200.000.002000.004000.006000.008000.0010000.00?ObservedCubicPower?复合函数的拟和效果更好。因此应选择复合函数精品练习 人均消费支出和教育.data 要求:1)分析教育支出和人均可支配收入的关系 2)分析在外就餐支出和人均可支配收入的关系精品练习 数据:温度与产卵数 要求:找出一个较佳的回归函数,并做简要的分析 精品