1、 从实践意义讲上,手机的用户满意度应该与产品的质量、从实践意义讲上,手机的用户满意度应该与产品的质量、价格和形象有关,因此我们以价格和形象有关,因此我们以“用户满意度用户满意度”为因变量,为因变量,“质量质量”、“形象形象”和和“价格价格”为自变量,作线性回归分为自变量,作线性回归分析。利用析。利用SPSSSPSS软件的回归分析,得到回归方程如下:软件的回归分析,得到回归方程如下:用户满意度用户满意度=0.008=0.008形象形象+0.645+0.645质量质量+0.221+0.221价格价格 对于对于SIMSIM手机来说,质量对其用户满意度的贡献比较大,手机来说,质量对其用户满意度的贡献比
2、较大,质量每提高质量每提高1 1分,用户满意度将提高分,用户满意度将提高0.6450.645分;其次是价格,分;其次是价格,用户对价格的评价每提高用户对价格的评价每提高1 1分,其满意度将提高分,其满意度将提高0.2210.221分;分;而形象对产品用户满意度的贡献相对较小,形象每提高而形象对产品用户满意度的贡献相对较小,形象每提高1 1分,用户满意度仅提高分,用户满意度仅提高0.0080.008分。分。SIMSIM手机用户满意度与相关变量线性回归分析手机用户满意度与相关变量线性回归分析 方程各检验指标及含义如下:方程各检验指标及含义如下:相关分析相关分析研究的是现象之间是否相关、相关的方研究
3、的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。向和密切程度,一般不区别自变量或因变量。回归分析回归分析则要分析现象之间相关的具体形式,确则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。定其因果关系,并用数学模型来表现其具体关系。比如说,从相关分析中我们可以得知比如说,从相关分析中我们可以得知“质量质量”和和“用户满意度用户满意度”变量密切相关,但是这两个变量变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回归分析方法来确定。度如何,则需要通过回归分析方法来确定
4、。进行相关分析进行相关分析 回归分析是对具有因果关系的影响因素(自变量)回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的和预测对象(因变量)所进行的数理统计数理统计分析处理。分析处理。只有当变量与因变量确实存在某种关系时,建立的只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的的把握性多大,就成为进行回归分析必须要解决的问题
5、。进行相关分析,一般要求出相关关系,以问题。进行相关分析,一般要求出相关关系,以相相关系数关系数的大小来判断自变量和因变量的相关的程度。的大小来判断自变量和因变量的相关的程度。回归分析按照涉及的自变量的多少,可分为一元回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和之间的关系类型,可分为线性回归分析和非线性非线性回归回归分析。分析。如果在回归分析中,只包括一个自变量和一个因如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这变量,且二者的关系可用一条
6、直线近似表示,这种回归分析称为种回归分析称为一元线性回归分析一元线性回归分析。如果回归分。如果回归分析中包括两个或两个以上的自变量,且因变量和析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为自变量之间是线性关系,则称为多元线性回归多元线性回归分分析。析。5.1 5.1 线性回归线性回归一元线性回归一元线性回归 一元线性回归,又称直线回归,即模型为一元线性回归,又称直线回归,即模型为Y=aX+b+,这里,这里X X是自变量,是自变量,Y Y是因变量,是因变量,是是随机误差随机误差,通常假定随机误差的,通常假定随机误差的均值均值为为0 0,方差方差为为22(22大于大于0 0
7、)22与与X X的的值无关。值无关。多元线性回归多元线性回归 根据多个自变量的最优组合建立回归方程来根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元回归分析。预测因变量的回归分析称为多元回归分析。多元线性回归分析拟合后的方程为多元线性回归分析拟合后的方程为01 1nnybb xb x常数项常数项变量的偏回归系数变量的偏回归系数复相关系数复相关系数的判定系数的判定系数2R异常值,影响点和共线性判断异常值,影响点和共线性判断 异常值:标准化残差的绝对值异常值:标准化残差的绝对值33异常值异常值影响点影响点 识别影响点的指标:识别影响点的指标:1.1.Dresid,剔除残差。剔除残
8、差。2.2.Sdresid,学生化残差。残差除以它的标准误,学生化残差。残差除以它的标准误,其值其值22 3.3.Cook距离距离 4.4.Mahalanobis距离距离 5.5.Leverage values,中心点杠杆值中心点杠杆值 6.6.Covariance Ratio,协方差比,衡量某个观测,协方差比,衡量某个观测量是否对回归系数有显著的影响。量是否对回归系数有显著的影响。共线性问题共线性问题 定义:某些自变量彼此相关定义:某些自变量彼此相关 分为精确共线性与近似共线性。分为精确共线性与近似共线性。共线性问题共线性问题 识别共线性的统计量:识别共线性的统计量:1.容许度容许度(Tol
9、erance):值越小,共线性越强:值越小,共线性越强 2.方差膨胀因子方差膨胀因子(VIF):值越大,共线性越强:值越大,共线性越强 3.特征值特征值(Eigenvalues):越接近:越接近0,共线性越强,共线性越强 4.条件系数条件系数(Condition Index):15 5.方差比例方差比例(Variance Proportions):值越大,:值越大,共线性越强共线性越强 常用的共线性问题的解决方法:常用的共线性问题的解决方法:1.1.从产生共线性问题的自变量中剔除不重从产生共线性问题的自变量中剔除不重要的自变量要的自变量 2.2.增加样本量增加样本量 3.3.重新抽取样本数据重
10、新抽取样本数据作数据散点图作数据散点图 观察因变量与自变量之间关系是否有线性关系。观察因变量与自变量之间关系是否有线性关系。Graphs Legacy Dialogs Scatter/Dot Simple Scatter输出结果:输出结果:初始与当前工资散点图初始与当前工资散点图奇异值判别奇异值判别确定影响点确定影响点检测模型的直线性和方差的齐性。检测模型的直线性和方差的齐性。标准化残差标准化残差标准化预测值标准化预测值输出结果:输出结果:引引入入或或从从模模型型中中剔剔除除的的变变量量输出结果:输出结果:拟合过程小结拟合过程小结输出结果:输出结果:方差分析方差分析输出结果:输出结果:逐步回归
11、过程中不在方程中的变量逐步回归过程中不在方程中的变量输出结果:输出结果:各步回归过程中的统计量各步回归过程中的统计量3850.7 1.9222.4expsalarysalbeginprev当前工资变量的异常值表当前工资变量的异常值表输出结果:输出结果:残差统计量残差统计量输出结果:输出结果:影响点查找影响点查找2/4740.091842/4740.09184输出结果:输出结果:输出结果:输出结果:当前工资的预测值与学生化残差散点图当前工资的预测值与学生化残差散点图5.2 5.2 曲线估计曲线估计xbby102210 xbxbbyxbby10 xbbey10 xbbyln10332210 xbx
12、bxbbyxbbey10 xbeby10 xbby/1010bxby xbbuy10/1/1散点图散点图废品率=2.628+0.002生产率0.0001,0.0001,显著显著性检验不成立性检验不成立72废品率=5.843+4.468 10 生产率0.0001,0.0001,显著显著性检验不成立性检验不成立1生产率废品率=4.0030.0001,0.0001,回归方程回归方程有统计意义有统计意义1.1.制作观测量数据的散点图制作观测量数据的散点图 Graphs Legacy Dialogs Scatter/Dot 以变量以变量mpg做做Y轴,变量轴,变量weightt做做X轴。轴。输出结果:输出结果:每加仑里程与车重散点图每加仑里程与车重散点图2.2.建立若干个曲线模型进行比较建立若干个曲线模型进行比较输出结果:输出结果:Quadratic结果结果72二次:mpg=52.540-0.012 weight+7.597 10weight输出结果:输出结果:Cubic结果结果52931.591三次:mpg=9.555+0.033 weight-1.434 10weight10weight输出结果:输出结果:Compound结果结果weight指数:mpg=60.152 1输出结果:输出结果: