判别分析的案例分课件.ppt

上传人(卖家):三亚风情 文档编号:2185454 上传时间:2022-03-17 格式:PPT 页数:16 大小:724.50KB
下载 相关 举报
判别分析的案例分课件.ppt_第1页
第1页 / 共16页
判别分析的案例分课件.ppt_第2页
第2页 / 共16页
判别分析的案例分课件.ppt_第3页
第3页 / 共16页
判别分析的案例分课件.ppt_第4页
第4页 / 共16页
判别分析的案例分课件.ppt_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、判别分析的案例分析4. 实例分析 例1、 为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了5059岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如下表所示。试做判别分析,建立判别函数以便在临床中用于筛选在临床中用于筛选冠心病人(数据文件:discriminant.sav)冠心病人组冠心病人组正常人组正常人组编号编号舒张压舒张压胆固醇胆固醇编号编号舒张压舒张压胆固醇胆固醇19.865.18110.662.07213.333.73212.534.45314.663.89313.333.0649.337.1049.333.94512.805.49510.664.45610.664.

2、09610.664.92710.664.4579.333.68813.333.63810.662.77913.335.96910.663.211013.335.701010.665.021112.006.191110.403.941214.664.01129.334.921313.334.011310.662.691412.803.631410.662.431513.335.961511.203.42169.333.63操作步骤: Step1:读取数据文件discriminant.sav。其中,变量名“舒张压”、“胆固醇”代表两项指标值。病人资料和正常人资料合并一同输入,定义变量名为“组别”的

3、变量用于区分冠心病人资料和正常人资料,即冠心病人资料的“组别”值均为1,正常人资料的“组别”值均为2. Step2:选择“Analysis” “Classify” “Discriminant”命令,在“Discriminant Analysis”对话框中,选择“组别”变量进入“Grouping Variable”文本框;单击“Define Range”按钮,在“Minimum”文本框中输入1,在“Maximum”文本框中输入2,单击“Continue”按钮,返回主对话框。 Step3:选择变量“舒张压”和“胆固醇”移动到“Independents”列表框中,本例选择“Enterindepend

4、ents together”判别方式作为判别分析的方法。 Step4:单击“Statistics”按钮,在“Descriptive”选项中选择“Mean”;在“Function Coefficients”选择“Unstandardized”。单击“Continue”按钮,返回主对话框。 Step5:单击“Classify”按钮,在“Plot”选项组中选择“Combined-groups”选项,在“Display”选项组中选择“Casewise result”和“Summmary table”选项;单击“Continue”按钮,返回主对话框。 Step6:单击“Save”按钮,在弹出的对话框中选

5、择“Predicted group membership”选项,单击“Continue”按钮,返回主对话框。 Step7:单击“OK”按钮,执行判别分析操作。判别分析的结果1、分析个案综合统计量表1.2和表1.3所示为系统处理的数据简明表明中的数据,按变量“组别”分组共有31个样本为判别基础数据进入分析,其中第一组十五例,第二组十六例。Analysis Case Processing SummaryUnweighted CasesNPercentValid31100.0ExcludedMissing or out-of-range group codes0.0 At least one mis

6、sing discriminating variable0.0 Both missing or out-of-range group codes and at least one missing discriminating variable0.0 Total0.0Total31100.0表1.2 分析个案综合统计量2、分组统计量 表1.3所示为分组统计量列表。表中给出分组变量和合计的均数(means)、标准差(standard deviation)和有效个案的例数。Group Statistics 组别 MeanStd. DeviationValid N (listwise)Unweight

7、edWeightedUnweightedWeighted1.00舒张压12.37941.649991616.00016.00015.000 15.00031.000 31.000胆固醇4.69311.29614162.00舒张压10.62671.1352815胆固醇3.7687.8502115Total舒张压11.53131.6599631胆固醇4.24581.1823131表1.3 分组统计量3、典型判别函数的特征函数的特征值表 表1.4所示是典型判别函数的特征值表,其特征(Eigenvalue)为组间平方和与组内平方和之比,计算得0.713,典型相关系数(Canonical Corr)为0

8、.645。EigenvaluesFunctionEigenvalue% of VarianceCumulative %Canonical Correlation1.713(a)100.0100.0.645a First 1 canonical discriminate functions were used in the analysis.表1.4 典型判别函数的特征值表4、Wilks检验结果 表1.5所示为典型判别分析的Wilks检验结果。其中Wilks值为0.584,卡方检验统计量的观测值为15.071,概率P值为0.001,小于0.05。 Wilks LambdaTest of Func

9、tion(s)Wilks LambdaChi-squaredfSig.1.58415.0712.001表1.5 Wilks 检验5、标准化典型判别函数系数表1.6给出典型判别函数的系数,其标准化函数为:根据判别函数方程的标准化系数,确定各变量对结果的作用大小,本例舒张压的标准化系数为0.873,大于胆固醇的标准化系数0.669,因而舒张压对冠心病的影响作用大于胆固醇。Standardized Canonical Discriminant Function Coefficients Function 1舒张压舒张压.873胆固醇胆固醇.669表1.6 标准化典型判别函数系数21669. 0873

10、. 0 xxZFunc6、典型判别函数系数 表所示为典型判别函数的系数,其典型函数为:Canonical Discriminant Function Coefficients Function 1舒张压.613胆固醇.606(Constant)-9.638Unstandardized coefficients表1.7典型判别函数系数21606. 0613. 0638. 9xxFunc7、分类过程摘要 表1.8分类过程摘要,显示参与分类的个案例数和剔除例数Classification Processing SummaryProcessed31ExcludedMissing or out-of-r

11、ange group codes0 At least one missing discriminating variable0Used in Output31表1.8分类过程摘要 8、个案统计量表 表1.9所示为原始数据逐一回代的判别结果和预测分类的结果显示,其中病人组有3人被错判(标注*者,编号为1,6,7)正常人组有3人被错判(标注*者,16,17,18)C Ca as se ew wi is se e S St ta at ti is st ti ic cs s12*.6991.669.1491.3311.557-.45711.9991.791.0002.2092.665.78911.3

12、631.944.8282.0566.4731.70111.6831.661.1672.3391.503.38311.4591.927.5492.0735.6421.53212*.8301.728.0461.2722.013-.62812*.6651.652.1881.3481.442-.41011.9501.774.0042.2262.471.72811.1771.9721.8242.0288.9092.14111.2331.9641.4232.0367.9931.98411.4991.920.4562.0805.3351.46611.3261.950.9662.0506.8491.77311

13、.8671.833.0282.1673.248.95911.6991.669.1502.3311.555.40411.1771.9721.8242.0288.9092.14112*.3131.9521.0201.0486.991-1.85321*.9561.776.0032.2242.494.73621*.6831.661.1672.3391.503.38322.4901.922.4771.0785.404-1.53422.6651.652.1881.3481.442-.41022.4721.540.5161.460.838-.12522.3961.938.7191.0626.162-1.69

14、222.5581.908.3421.0924.926-1.42922.7501.865.1011.1353.813-1.16222.4361.515.6071.485.731-.06422.9721.801.0011.1992.786-.87822.9231.816.0091.1842.994-.94022.5261.915.4021.0855.144-1.47722.4291.933.6261.0675.884-1.63522.8891.752.0201.2482.234-.70422.3801.941.7721.0596.313-1.722Case Number12345678910111

15、213141516171819202122232425262728293031OriginalActual GroupPredictedGrouppdfP(Dd | G=g)P(G=g | D=d)SquaredMahalanobisDistance toCentroidHighest GroupGroupP(G=g | D=d)SquaredMahalanobisDistance toCentroidSecond Highest GroupFunction 1DiscriminantScoresMisclassified case*. 9、分类结果 表1.10给出分类结果。最后系统对回代判别

16、情况做出评价,即病人组正确率为75.0%。正常人组为86.7%,总判别正确率为80.65%,说明该判别函数的正确率还是较高的。Classification Results(a) 组别组别Predicted Group MembershipTotal 1.002.001.00OriginalCount1.0012416 2.0021315 %1.0075.025.0100.0 2.0013.386.7100.0a 80.6% of original grouped cases correctly classified.表1.10 分类结果 例2、某气象站预报某地区有无春旱的观测资料中, 与 是与

17、气象有关的综合预报因子,数据包括发生春旱的6个年份的 和 的观测值和无春旱的8个年份的相应观测值(见下表),试建立距离判别函数并估计误判率。1x2x1x2xG1(春旱春旱)G2(无春旱)(无春旱)序号序号x1x2序号序号x1x2124.8-2.0122.1-0.7224.7-2.4221.6-1.4326.6-3.0322.0-0.8423.5-1.9422.8-1.6525.5-2.1522.7-1.5627.4-3.1621.5-1.0722.1-1.2821.4-1.3某地区有无春旱观测数据 例3、1991年全国大陆个省市、自治区城镇居民月平均收入情况见表,考察下列指标:(元/人) X1:人均生活费收入; X2:人均全民所有制职工工资; X3:人均来源于全民标准工资; X4:人均集体所有制工资; X5:人均集体职工标准工资 X6:人均各种奖金及超额工资; X7:人均各种紧贴; X8:职工人均从工作单位得到的其他收入; X9:个体劳动者收入 试判定广东和西藏属于哪种收入类型,并确定回代误判概率与交叉误判概率。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(判别分析的案例分课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|