第8章判别分析-课件.ppt

上传人(卖家):晟晟文业 文档编号:5167339 上传时间:2023-02-15 格式:PPT 页数:21 大小:213KB
下载 相关 举报
第8章判别分析-课件.ppt_第1页
第1页 / 共21页
第8章判别分析-课件.ppt_第2页
第2页 / 共21页
第8章判别分析-课件.ppt_第3页
第3页 / 共21页
第8章判别分析-课件.ppt_第4页
第4页 / 共21页
第8章判别分析-课件.ppt_第5页
第5页 / 共21页
点击查看更多>>
资源描述

1、SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通第八章第八章 判别分析判别分析l 判别分析简介l 一般判别分析l 典型判别分析l 逐步判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通一、判别分析简介一、判别分析简介 判别分析是一种应用性很强的统计方法。它通常是根据已有的数据资料,来建立一种判别方法,然后再来判断一个新的样品归属于哪一类。例如,医院拥有以往就诊的各种病人的资料,包括他们的心率、血压、体温、化验指标等很多数据。现在有一个新的病人来医院就诊,对他也测量了相关的指标数据,要判断他患有哪一种病,这就属于一个判别归类的问题。又如,在矿产勘探中积累了丰富的

2、地质资料,现在某地区新采到了一个岩石标本,要从它的基本特征判断该地区有无矿产,是贫矿还是富矿,则也需要进行判别分析。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、一般判别分析二、一般判别分析1、距离判别法、距离判别法 距离判别法是通过计算距离函数来进行判别,即样品与哪个总体之间的距离最近,则判断它属于哪个总体。如何衡量样品与总体间的这种抽象的距离?我们一般利用马氏距离来描述。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、一般判别分析二、一般判别分析2、Bayes判别法判别法 前一节介绍距离判别法十分简便实用,但是也存在一些缺点。例如,距离判别法没有考虑到

3、关于总体的先验概率,而且没有考虑可能出现错判而带来的损失。Bayes判别法正是为了克服这些缺陷而提出来的一种判别方法。Bayes判别法是基于Bayes统计的思想,即假定事先对所研究的对象有一定的了解,并通过先验概率分布来进行描述,当抽取样本后,用样本来修正先验概率分布,并得到后验概率分布,然后根据后验概率分布进行各种统计推断。Bayes判别法首先计算给定样品属于各个总体的条件概率,然后比较这些概率值的大小,将样品判归于条件概率最大的总体。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通一般判别分析一般判别分析DISCRIM过程过程PROC DISCRIM DATA=数据集名;CL

4、ASS 分类变量名;VAR 变量名列表;PRIORS 概率值;BY 分组变量名;RUN;SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通一般判别分析一般判别分析DISCRIM过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通一般判别分析一般判别分析DISCRIM过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、一般判别分析二、一般判别分析3、DISCRIM过程过程语句说明:(1)PROC语句用于规定开始运行DISCRIM过程并指定要分析的数据集名。选项有:TESTDATA=数据集名指定需要进行分类的观测组成的数据集。该数据集中定量变量的

5、名称必须和DATA=数据集中的定量变量的名称相匹配。METHOD=选项规定进行分类的方法。LIST规定对每个观测显示重新分类的结果。TESTLIST规定显示TESTDATA=数据集中观测的分类结果。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通二、一般判别分析二、一般判别分析3、DISCRIM过程过程 (2)CLASS语句用于规定分类变量,可以是数值型变量也可以是字符型变量。分类变量的不同取值则代表了不同的类别。(3)VAR语句用于规定要分析的定量变量。若不使用此语句,则默认分析数据集中所有的数值型变量。(4)PRIORS语句用于规定各类别的先验概率。(5)BY语句规定了分组变

6、量,它使得BY过程对分组内进行处理。在使用BY语句前,应对数据集按照分组变量进行排序。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通三、典型判别分析三、典型判别分析1、Fisher判别法判别法 典型判别分析采用了与主成分分析和典型相关分析类似的降维技术,以找到能最好概括类别区分的变量的线性组合。降维时要求同一类中的区别尽可能小,而不同类间的区别尽可能大。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析CANDISC过程过程PROC CANDISC DATA=数据集名;CLASS 分类变量名;VAR 变量名列表;BY 分组变量名;RUN;SA

7、S 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析CANDISC过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析CANDISC过程过程SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通典型判别分析典型判别分析DISCRIM过程过程PROC DISCRIM DATA=典型变量数据集;CLASS 分类变量名;VAR 典型变量名;RUN;SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通四、逐步判别分析四、逐步判别分析1、基本原理、基本原理 逐步判别分析考察了p维指标(即p个变量)对总体的区分能力是

8、否显著,对判别分类不起作用的变量则予以删除,优化了判别的效果。逐步判别的基本思想与我们在上一章介绍的逐步回归相似:在建立判别函数时逐个引入变量,每一步选择都一个判别能力最显著的变量进入判别函数,同时对已有的变量也进行检验,将不显著的变量剔除。直到在可选的变量中,既没有变量被选入也没有变量被删除为止。这样在最后得到的判别函数中,所有变量都是显著的。通过使用逐步判别法,提高了判别样品的能力,也增强了判别函数的稳定性。SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程PROC STEPDISC DATA=数据集名;CLASS 分类变量名;VAR 变量名列表;BY

9、分组变量;RUN;逐步判别分析逐步判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程逐步判别分析逐步判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程逐步判别分析逐步判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通STEPDISC过程过程逐步判别分析逐步判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通2、STEPDISC过程过程语句说明:(1)PROC语句用于规定运行STEPDISC过程,并指定要分析的数据集名。选项有:METHOD=选项规定对判别函数中的变量进行

10、选择的方法。(2)CLASS语句用于规定分类变量,可以是数值型变量也可以是字符型变量。分类变量的不同取值则代表了不同的类别。(3)VAR语句用于规定要筛选的定量变量。若不使用此语句,则默认筛选数据集中所有的数值型变量。(4)BY语句规定了分组变量,它使得BY过程对分组内进行处理。在使用BY语句前,应对数据集按照分组变量进行排序。四、逐步判别分析四、逐步判别分析SAS 统计分析与应用统计分析与应用 从入门到精通从入门到精通DISCRIM过程过程 在进行逐步判别分析时,使用STEPDISC过程只能完成变量的筛选。要实现完整的判别分析,则还需要联合使用DISCRIM过程。一般的做法是:首先使用STEPDISC过程对变量进行筛选,在得出筛选结果后,再利用DISCRIM过程依据筛选出的变量进行判别分析。逐步判别分析逐步判别分析

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第8章判别分析-课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|