判别分析方法与SPSS分析课件.ppt

上传人(卖家):三亚风情 文档编号:2921511 上传时间:2022-06-11 格式:PPT 页数:33 大小:401.50KB
下载 相关 举报
判别分析方法与SPSS分析课件.ppt_第1页
第1页 / 共33页
判别分析方法与SPSS分析课件.ppt_第2页
第2页 / 共33页
判别分析方法与SPSS分析课件.ppt_第3页
第3页 / 共33页
判别分析方法与SPSS分析课件.ppt_第4页
第4页 / 共33页
判别分析方法与SPSS分析课件.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、判别分析方法基于基于SPSS应用软件应用软件 一、判别分析意义 判别分析是根据表明事物特点的变量值和它们所属的类,求出判别函数。根据判别函数对未知所属类别的事物进行分类的一种分析方法。 在自然科学和社会科学的各个领域经常遇到需要对某个个体属于哪一类进行判断。如动物学家对动物如何分类的研究和某个动物属于哪一类、目、纲的判断。 不同:判别分析和聚类分析不同的在于判别分析要求已知一系列反映事物特征的数值变量的值,并且已知各个体的分类(训练样本)。方法有 距离判别根据个案与总体均值间的距离大小的原则,进行判别。 贝叶斯判别根据后验概率最大的原则。根据后验概率最大的原则。 典型判别典型判别求原始变量的线

2、性组合,使产生求原始变量的线性组合,使产生的新变量之更能将类分开。的新变量之更能将类分开。 逐步判别逐步判别有逐步筛选的办法,将对判别有有逐步筛选的办法,将对判别有贡献的变量选出。贡献的变量选出。 例 中小企业的破产模型 为了研究中小企业的破产模型,选定4个经济指标: X1总负债率(现金收益/总负债) X2收益性指标(纯收入/总财产) X3短期支付能力(流动资产/流动负债) X4生产效率性指标(流动资产/纯销售额) 对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得如下资料:总负债率总负债率收益性指标收益性指标短期支付能力短期支付能力生产效率指标生产效率指标类别类别-.45-.

3、411.09.451-.56-.311.51.161.06.021.01.401-.07-.091.45.261-.10-.091.56.671-.14-.07.71.281-.23-.30.22.181.07.021.31.251.01.002.15.701-.28-.231.19.661.15.051.88.271.37.111.99.381-.08-.081.51.421.05.031.68.951.01.001.26.601.12.111.14.171-.28-.271.27.511.51.102.49.542.08.022.01.532.38.38.11.113.273.27.55.

4、552 2.19.19.05.052.252.25.33.332 2.32.32.07.074.244.24.63.632 2.31.31.05.054.454.45.69.692 2.12.12.05.052.522.52.69.692 2-.02-.02.02.022.052.05.35.352 2.22.22.08.082.352.35.40.402 2.17.17.07.071.801.80.52.522 2.15.15.05.052.172.17.55.552 2-.10-.10-1.01-1.012.502.50.58.582 2.14.14-.03-.03.46.46.26.26

5、2 2.14.14.07.072.612.61.52.522 2-.33-.33-.09-.093.013.01.47.472 2.48.48.09.091.241.24.18.182 2.56.56.11.114.294.29.45.452 2.20.20.08.081.991.99.30.302 2.47.47.14.142.922.92.45.452 2.17.17.04.042.452.45.14.142 2.58.58.04.045.065.06.13.132 2.04.04.01.011.501.50.71.71待判待判-.06-.06-.06-.061.371.37.40.40待

6、判待判.07.07-.01-.011.371.37.34.34待判待判-.13-.13-.14-.141.421.42.44.44待判待判.15.15.06.062.232.23.56.56待判待判.16.16.05.052.312.31.20.20待判待判.29.29.06.061.841.84.38.38待判待判.54.54.11.112.332.33.48.48待判待判 距离的判别距离的判别 由于已经知道所有点的类别了,所以可以求由于已经知道所有点的类别了,所以可以求得每个类型的中心。这样只要定义了如何计算距得每个类型的中心。这样只要定义了如何计算距离,就可以得到任何给定的点(企业)到这

7、三个离,就可以得到任何给定的点(企业)到这三个中心的三个距离。中心的三个距离。 显然,最简单的办法就是离哪个中心距离最显然,最简单的办法就是离哪个中心距离最近,就属于哪一类。通常使用的距离是所谓的近,就属于哪一类。通常使用的距离是所谓的Mahalanobis距离(马氏距离)。用来比较到距离(马氏距离)。用来比较到各 个 中 心 距 离 的 数 学 函 数 称 为 判 别 函 数各 个 中 心 距 离 的 数 学 函 数 称 为 判 别 函 数(discriminant function).这种根据远近判这种根据远近判别的方法,原理简单,直观易懂。别的方法,原理简单,直观易懂。 贝叶斯判别贝叶斯

8、判别 根据后验概率最大的原则,在企业的财务状根据后验概率最大的原则,在企业的财务状况下,利用贝叶斯公式计算其判给各类的后验概况下,利用贝叶斯公式计算其判给各类的后验概率,哪个概率越大,则判给哪类。率,哪个概率越大,则判给哪类。 典型典型判别法判别法(先计算新变量的线性组合先计算新变量的线性组合) 考虑只有两个(预测)变量的判别分析问题。考虑只有两个(预测)变量的判别分析问题。 假定这里只有两类。数据中的每个观测值是二维空假定这里只有两类。数据中的每个观测值是二维空间的一个点。见图(下一张幻灯片)。间的一个点。见图(下一张幻灯片)。 这里只有两种已知类型的训练样本。其中一类有这里只有两种已知类型

9、的训练样本。其中一类有38个点(用个点(用“o”表示),另一类有表示),另一类有44个点(用个点(用“*”表表示)。按照原来的变量(横坐标和纵坐标),很难将这示)。按照原来的变量(横坐标和纵坐标),很难将这两种点分开。两种点分开。 于是就寻找一个方向,也就是图上的虚线方向,沿于是就寻找一个方向,也就是图上的虚线方向,沿着这个方向朝和这个虚线垂直的一条直线进行投影会使着这个方向朝和这个虚线垂直的一条直线进行投影会使得这两类分得最清楚。可以看出,如果向其他方向投影,得这两类分得最清楚。可以看出,如果向其他方向投影,判别效果不会比这个好。判别效果不会比这个好。 有了投影之后,再用前面讲到的距离远近的

10、方法来有了投影之后,再用前面讲到的距离远近的方法来得到判别准则。这种首先进行投影的判别方法就是得到判别准则。这种首先进行投影的判别方法就是典型典型判别法。判别法。 -4-20246-4-3-2-10123 逐步判别法逐步判别法(仅仅是在前面的方法中加入变仅仅是在前面的方法中加入变量选择的功能量选择的功能) 有时,一些变量对于判别并没有什么作用,为有时,一些变量对于判别并没有什么作用,为了得到对判别最合适的变量,可以使用逐步判别。了得到对判别最合适的变量,可以使用逐步判别。也就是,一边判别,一边引进判别能力最强的变也就是,一边判别,一边引进判别能力最强的变量,量, 这个过程可以有进有出。一个变量

11、的判别能力这个过程可以有进有出。一个变量的判别能力的判断方法有很多种,主要利用各种检验,例如的判断方法有很多种,主要利用各种检验,例如Wilks Lambda、Raos V、The Squared Mahalanobis Distance、Smallest F ratio或或The Sum of Unexplained Variations等检验。其细节这里就不赘述了;这等检验。其细节这里就不赘述了;这些不同方法可由统计软件的各种选项来实现。逐些不同方法可由统计软件的各种选项来实现。逐步判别的其他方面和前面的无异。步判别的其他方面和前面的无异。第一步:打开判别分析的窗口。变量全部选入。变量逐步

12、选入全部选入。第二步:定义类的代码。第三步:将变量放入独立变量框。Means计算平均数;Univariate ANOVAs讨论单变量的方差分析,看哪些本来在组间有差异;Boxs M统计量总体的协方差相等的检验。Fishers判别函数的系数;Unstandardized 没有标准化的判别函数的系数;关于协方差矩阵的要求。第四步:选择统计量。Prior对先验概率的要求,上一个选项是先验概率相等,后一个是以样本的频率为先验概率;Display对输出数据的要求。Casewise result所有个案的结果; Summary table判别结果的表格; Leave-out-classification交

13、叉核实。Use Covariance利用什么矩阵计算判别函数。组内的协方差矩阵,还是分组协 方差矩阵;Plot对典型变量进行分组,画直方图。 分类区域散点图。 第五步:选择判类的一些前提条件和输出。关于逐步判别的选项。下面来观察输出结果一、首先做全模型 要求:所有本来均进入;先验概率相等;输出判别函数;做交叉核实;画分类散点地图;保存后验概率,判类结果和判别函数得分。Standardized Canonical Discriminant Function CoefficientsStandardized Canonical Discriminant Function Coefficients.

14、670-.266.672-.115总负债率(现金收益/总负债)收益性指标(纯收入/总财产)短期支付能力(流动资产/流动负债)生产效率性指标(流动资产/纯销售额)1Function 标准化的典型变量的函数*12340.670.2660.6720.115FxxxxStructure MatrixStructure Matrix.846.751.255.031短期支付能力(流动资产/流动负债)总负债率(现金收益/总负债)收益性指标(纯收入/总财产)生产效率性指标(流动资产/纯销售额)1FunctionPooled within-groups correlations between discrimi

15、natingvariables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. 典型判别函数和原始变量的相关系数。Canonical Discriminant Function CoefficientsCanonical Discriminant Function Coefficients2.947-1.291.767-.590-1.648总负债率(现金收益/总负债)收益性指标(纯收入/总财产)短期支付能力(流

16、动资产/流动负债)生产效率性指标(流动资产/纯销售额)(Constant)1FunctionUnstandardized coefficients 典型判别函数的系数,判别函数的得分由此计算。12342.9471.2910.7670.5901.648FxxxxFunctions at Group CentroidsFunctions at Group Centroids-.987.799破产企业为1,正常运行企业为2121FunctionUnstandardized canonical discriminantfunctions evaluated at group means典型变量在两类的

17、均值。Classification Function CoefficientsClassification Function Coefficients-2.9612.303-.509-2.8151.5332.9029.3978.344-3.887-6.664总负债率(现金收益/总负债)收益性指标(纯收入/总财产)短期支付能力(流动资产/流动负债)生产效率性指标(流动资产/纯销售额)(Constant)12破产企业为1,正常运行企业为2Fishers linear discriminant functions 距离判别法的判别函数。在正态假定下,它与贝叶斯判别等价。112343.8872.961

18、0.5091.5339.397Fxxxx 212346.6642.3032.8152.9028.344Fxxxx Classification ResultsClassification Resultsb,cb,c152175162144888.211.8100.023.876.2100.050.050.0100.0152176152188.211.8100.028.671.4100.0破产企业为1,正常运行企业为212Ungrouped cases12Ungrouped cases1212Count%Count%OriginalCross-validateda12Predicted Grou

19、pMembershipTotalCross validation is done only for those cases in the analysis. In cross validation,each case is classified by the functions derived from all cases other than thatcase.a. 81.6% of original grouped cases correctly classified.b. 78.9% of cross-validated grouped cases correctly classifie

20、d.c. 错判和正判的结果。标志处是回代核实和交叉核实的正判率。误判和正确判别率误判和正确判别率p从这个表来看,我们的分类能够100%地把训练数据的每一个观测值分到其本来的类。p该表分成两部分;上面一半(Original)是用从全部数据得到的判别函数来判断每一个点的结果(前面三行为判断结果的数目,而后三行为相应的百分比)。p下面一半(Cross validated)是对每一个观测值,都用缺少该观测的全部数据得到的判别函数来判断的结果。p这里的判别结果是100%判别正确,但一般并不一定。 二、利用二、利用SPSS软件的逐步判别法的结果软件的逐步判别法的结果 选择了两个变量。选择了两个变量。Var

21、iables Entered/RemovedVariables Entered/Removeda,b,c,da,b,c,d短期支付能力(流动资产/流动负债).6271136.00021.450136.000.000总负债率(现金收益/总负债).5602136.00013.772235.000.000Step12EnteredStatisticdf1df2df3Statisticdf1df2Sig.Exact FWilks LambdaAt each step, the variable that minimizes the overall Wilks Lambda is entered.Max

22、imum number of steps is 8.a. Minimum partial F to enter is 3.84.b. Maximum partial F to remove is 2.71.c. F level, tolerance, or VIN insufficient for further computation.d. 判别分析要注意什么判别分析要注意什么?p训练样本中必须有所有要判别的类型,分类必须清楚,不能有混杂。 p要选择好可能由于判别的预测变量。这是最重要的一步。当然,在应用中,选择的余地不见得有多大。 p要注意数据是否有不寻常的点或者模式存在。还要看预测变量中

23、是否有些不适宜的;这可以用单变量方差分析(ANOVA)和相关分析来验证。p判别分析是为了正确地分类,但同时也要注意使用尽可能少的预测变量来达到这个目的。使用较少的变量意味着节省资源和易于对结果进行解释。 判别分析要注意什么?判别分析要注意什么?p在计算中需要看关于各个类的有关变量的均值是否显著不同的检验结果(在SPSS选项中选择Wilks Lambda、Raos V、The Squared Mahalanobis Distance或The Sum of Unexplained Variations等检验的计算机输出),以确定是否分类结果是仅仅由于随机因素。p此外成员的权数(SPSS用prior

24、 probability,即“先验概率”,和贝叶斯统计的先验概率有区别)需要考虑;一般来说,加权要按照各类观测值的多少,观测值少的就要按照比例多加权。p对于多个判别函数,要弄清各自的重要性。p注意训练样本的正确和错误分类率。研究被误分类的观测值,看是否可以找出原因。 SPSS选项选项 打开.sav数据。然后点击AnalyzeClassifyDiscriminant, 把group放入Grouping Variable,再定义范围,即在Define Range输入13的范围。然后在Independents输入所有想用的变量;但如果要用逐步判别,则不选Enter independents toge

25、ther,而选择Use stepwise method,在方法(Method)中选挑选变量的准则(检验方法;默认值为Wilks Lambda)。 为了输出Fisher分类函数的结果可以在Statistics中的Function Coefficient选 Fisher和UnStandardized(点则判别函数系数) ,在Matrices中选择输出所需要的相关阵; 还可以在Classify中的Display选summary table, Leave-one-out classification;注意在Classify选项中默认的Prior Probability为All groups equal表示所有的类都平等对待,而另一个选项为Compute from group sizes,即按照类的大小加权。 在Plots可选 Combined-groups, Territorial map等。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(判别分析方法与SPSS分析课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|