第判别分析教学课件.ppt_163文库

资源描述

1、第判别分析第判别分析1（优选）第判别分析（优选）第判别分析n把这类问题用数学语言来表达，可以叙述如下把这类问题用数学语言来表达，可以叙述如下n 设有设有k个个m维总体（或类别）维总体（或类别）G1，G2，Gk，(1)、它们的分布特征已知，已知分布函、它们的分布特征已知，已知分布函数分别为数分别为F1(x)，F2(x)，Fk(x)；n (2)、或知道来自各总体的样本（训练样本）。、或知道来自各总体的样本（训练样本）。n 对给定的一个新样本对给定的一个新样本X（检测样本），判断（检测样本），判断X来自哪一个总体（类）。来自哪一个总体（类）。n 判别分析内容很丰富，方法很多。判断分析按判别的总体判别

2、分析内容很丰富，方法很多。判断分析按判别的总体数来区分，有两个总体判别分析和多总体判别分析；按区分数来区分，有两个总体判别分析和多总体判别分析；按区分不同总体所用的数学模型来分，有线性判别和非线性判别；不同总体所用的数学模型来分，有线性判别和非线性判别；按判别时所处理的变量方法不同，有逐步判别和序贯判别等。按判别时所处理的变量方法不同，有逐步判别和序贯判别等。判别分析可以从不同角度提出问题，因此有不同的判别准则，判别分析可以从不同角度提出问题，因此有不同的判别准则，如马氏距离最小准则、如马氏距离最小准则、Fisher准则、平均损失最小准则、最准则、平均损失最小准则、最小平方准则、最大似然准则、

3、最大概率准则等等，按判别准小平方准则、最大似然准则、最大概率准则等等，按判别准则的不同又提出多种判别方法。本章仅介绍常用的几种判别则的不同又提出多种判别方法。本章仅介绍常用的几种判别分析方法距离判别法、分析方法距离判别法、Fisher判别法、判别法、Bayes判别法和逐步判别法和逐步判别法。判别法。第二节第二节距离判别法距离判别法样本与哪一类总体的距离最近，就判别它属于哪一样本与哪一类总体的距离最近，就判别它属于哪一类总体。类总体。第二节第二节距离判别法距离判别法一一马氏距离的概念马氏距离的概念二二距离判别距离判别三三判别分析的实质判别分析的实质已知已知，两类，两类，是设备是设

4、备A生产的产品，质生产的产品，质量高，平均耐磨程度为量高，平均耐磨程度为，设备精度的，设备精度的方差方差；是设备是设备B生产的产品，质量生产的产品，质量稍差，稍差，。现有一产品。现有一产品X，测得，测得其耐磨度，试判断该产品是哪一台设备生产其耐磨度，试判断该产品是哪一台设备生产的？的？1G2G80)1(25.0214,7522)2(1G2G一、马氏距离的概念一、马氏距离的概念n 图图5.1设D1，D2，Dk是m维空间Rm的k个子集，如果它们互不相交，且它们的和集为Rm，则称D1，这时判别准则可以采用如下方法二 Bayes判别的基本方法又D1，D2，Dk是Rm的一个划分，判别法则为：点击De

5、fine Range按钮，定义分组变量的取值范围。未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分，所以该系数使用起来比标准化的系数要方便一些。比较这三个函数值，哪个函数值比较大就可以判断该样品判入哪一类。三、线性判别函数的求法例如，将第一个待判样品的自变量值分别代入函数，得到按区分不同总体所用的数学模型来分，有线性判别和非线性判别；三、线性判别函数的求法这时判别准则可以采用如下方法第四节费歇（Fisher）判别法均损失g(D*)达到最小，即即当样本发生时，求他属于某类的概率。方差；n为此，我们引入一种由印度著名统计学家马哈拉诺为此，我们引入一种由印度著名统计学家

6、马哈拉诺比斯（比斯（Mahalanobis,1936）提出的）提出的“马氏距离马氏距离”的概的概念。念。二、距离判别二、距离判别 1、两个总体的距离判别问题、两个总体的距离判别问题问题设有协方差矩阵问题设有协方差矩阵相等的两个总体相等的两个总体G1和和G2，其均值，其均值分别是分别是1和和 2，对于一个新的样品，对于一个新的样品X，要判断它来自哪个，要判断它来自哪个总体。总体。一般的想法是计算新样品一般的想法是计算新样品X到两个总体的马氏距离到两个总体的马氏距离D2（X，G1）和）和D2（X，G2），并按照如下的判别规则进行判断），并按照如下的判别规则进行判断这个判别规则的等价描述为求新样品

7、这个判别规则的等价描述为求新样品X到到G1的距离与到的距离与到G2的距离之差，如果其值为正，的距离之差，如果其值为正，X属于属于G2；否则；否则X属于属于G1。n首先考虑首先考虑时的判别方法时的判别方法12 n n 一、Fisher判别的基本思想单击Continue按钮。设有总体，具有概率密度函数。均损失g(D*)达到最小，即2（a）未标准化的典型判别函数系数4 Classify子对话框稍差，。按区分不同总体所用的数学模型来分，有线性判别和非线性判别；用L(j|i;D)表示由判别法D判别归类时，将来自总体是设备B生产的产品，质量返回判别分析主界面，单击OK按钮，运行判别分析过程。合密度

8、函数为，先验概率为，并且根据以往的统计分析，知道出现的概率为。2、多个总体的距离判别例如，将第一个待判样品的自变量值分别代入函数，得到先验概率是一种权重(比例)。错判损失为，则贝叶斯判别的解Classification Function Coefficients（给出Bayes判别函数系数）本例中分类变量的范围为1到3，所以在最小值和最大值中分别输入1和3。n这里我们应该注意到这里我们应该注意到2、多个总体的距离判别、多个总体的距离判别三、判别分析的实质三、判别分析的实质n我们知道，判别分析就是希望利用已经测得的变量数我们知道，判别分析就是希望利用已经测得的变量数据，找出一种判别函数

9、，使得这一函数具有某种最优据，找出一种判别函数，使得这一函数具有某种最优性质，能把属于不同类别的样本点尽可能地区别开来。性质，能把属于不同类别的样本点尽可能地区别开来。为了更清楚的认识判别分析的实质，以便能灵活的应为了更清楚的认识判别分析的实质，以便能灵活的应用判别分析方法解决实际问题，我们有必要了解用判别分析方法解决实际问题，我们有必要了解“划划分分”这样概念。这样概念。n设设D1，D2，Dk是是m维空间维空间Rm的的k个子集，如果个子集，如果它们互不相交，且它们的和集为它们互不相交，且它们的和集为Rm，则称，则称D1，n D2，Dk为为Rm的一个划分。的一个划分。n 这时判别准则可以采用如

10、下方法这时判别准则可以采用如下方法,1,iiXDXGik若落入，则判n n 这样我们将会发现，判别分析问题实质上就是在某这样我们将会发现，判别分析问题实质上就是在某种意义上，以最优的性质对种意义上，以最优的性质对m维空间维空间Rm构造一个构造一个“划分划分”，这个，这个“划分划分”就构成了一个判别规则。就构成了一个判别规则。这一思想将在后面的各节中经常出现。这一思想将在后面的各节中经常出现。第三节第三节贝叶斯（贝叶斯（Bayes）判别法）判别法一一 Bayes判别的基本思想判别的基本思想二二 Bayes判别的基本方法判别的基本方法 n从上节看距离判别法虽然简单，便于使用。从上节看距离判别

11、法虽然简单，便于使用。但是该方法也有它明显的不足之处。但是该方法也有它明显的不足之处。第一，判别方法与各总体出现的概率的大小第一，判别方法与各总体出现的概率的大小无关；无关；第二，判别方法没有考虑错判所造成的损失。第二，判别方法没有考虑错判所造成的损失。n Bayes判别法就是为了解决这些问题而提出判别法就是为了解决这些问题而提出的一种判别方法。的一种判别方法。Bayes判别的基本思想判别的基本思想n先验概率先验概率n 先验概率是一种权重先验概率是一种权重(比例比例)。所谓。所谓“先验先验”是是n指先于我们判断决策之前。指先于我们判断决策之前。n 先验概率的赋值方法先验概率的赋值方法n 1、利

12、用历史资料及经验进行估计；、利用历史资料及经验进行估计；n 2、利用训练样本中各类样品占的比例、利用训练样本中各类样品占的比例估估n计；计；n 3、假定、假定k个总体各自出现的概率相同，即个总体各自出现的概率相同，即1/k;inn先验概率先验概率（二）主要运行结果解释均损失g(D*)达到最小，即（注意这个选项不是要给出Fisher判别函数的系数。应该使平均错判损失最小。Predicted group membership存放判别样品所属组别的值；这一思想将在后面的各节中经常出现。它表示把样品X判归的平均损失。32，F3=3882.77，F2=3528.2、针对多个总体的情形单击Contin

13、ue按钮，返回主界面。为此，我们引入一种由印度著名统计学家马哈拉诺未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分，所以该系数使用起来比标准化的系数要方便一些。均损失g(D*)达到最小，即第二，判别方法没有考虑错判所造成的损失。点击Define Range按钮，定义分组变量的取值范围。办公室新来了一个雇员小王，小王是好人还是坏人大家都在猜测。这一思想将在后面的各节中经常出现。一 Bayes判别的基本思想这里值得注意的是，本书有几处利用极值原理求极值时，只给出了不要条件的数学推导，而有关充分条件的论证省略了，因为在实际问题中，往往根据问题本身的性质就能肯定有最大值（或最小

14、值），如果所求的驻点只有一个，这时就不需要根据极值存在的充分条件判定它是极大还是极小而就能肯定这唯一的驻点就是所求的最大值（或最小值）。77，F2=3528.22212()(,)()()(),tttDXDX GdXg tg tn在马氏距离的基础上，进一步考虑先验概率在马氏距离的基础上，进一步考虑先验概率及各组内协方差阵的不同，定义样品及各组内协方差阵的不同，定义样品X到各总体到各总体的广义平方距离为的广义平方距离为(1,2,)tG tk1ln|()0 tiiSg t，若各组的协方差阵不全相等，若各组的协方差阵全相等，22ln|()0 tqg t，若先验概率不全相等，若先验概率全相等，其其中中

15、广义平方距离广义平方距离n广义平方距离判别准则广义平方距离判别准则n 22,()(),1,ttiXGDXDXit ik 判当时()Bayes判别准则判别准则一一、最大后验准则最大后验准则办公室新来了一个雇员小王，小王是好办公室新来了一个雇员小王，小王是好人还是坏人大家都在猜测。按人们主观意识，人还是坏人大家都在猜测。按人们主观意识，一个人是好人或坏人的概率均为一个人是好人或坏人的概率均为0.5。坏人总。坏人总是要做坏事，好人总是做好事，偶尔也会做是要做坏事，好人总是做好事，偶尔也会做一件坏事，一般好人做好事的概率为一件坏事，一般好人做好事的概率为0.9，坏，坏人做好事的概率为人做好事的概率

16、为0.2，一天，小王做了一件，一天，小王做了一件好事，小王是好人的概率有多大，你现在把好事，小王是好人的概率有多大，你现在把小王判为何种人。小王判为何种人。)/()()/(/(坏人做好事坏人好人做好事好人好人做好事好人做好事）好人PPPPPPP82.02.05.09.05.09.05.0)/()()/(/(坏人做好事坏人好人做好事好人坏人做好事坏人做好事）坏人PPPPPPP18.02.05.09.05.02.05.0 设有总体设有总体，具有概率密度函具有概率密度函数数。并且根据以往的统计分析，知道。并且根据以往的统计分析，知道出现出现的概率为的概率为。即当样本。即当样本发生时，求他

17、属于某类的发生时，求他属于某类的概率。由贝叶斯公式计算后验概率，有概率。由贝叶斯公式计算后验概率，有：iG)(xfiiGiq0 x),2,1(kiGi)()()|(000 xfqxfqxGPjjiii判别规则判别规则)()()|(000 xfqxfqxGPjjlll)()(001maxxfqxfqjjiiki则则判给判给。0 xlG二、二、最小平均损失准则最小平均损失准则设有总体设有总体，具有概率密度函数具有概率密度函数并且根据以往的统计分析，知道并且根据以往的统计分析，知道出现的概率为出现的概率为，其中其中iG)(xfiiGiq),2,1(kiGi11kqq又又D1，D2，Dk

18、是是Rm的一个划分，判别法则为：的一个划分，判别法则为：当样品当样品X落入落入Di时，则判时，则判 iGX ki,3,2,1 关键的问题是寻找关键的问题是寻找D1，D2，Dk划分，这个划分划分，这个划分应该使平均错判损失最小。应该使平均错判损失最小。错判概率：错判概率：P(j|i;D)用用P(j|i;D)表示由判别法表示由判别法D判别归类时，将来自总体判别归类时，将来自总体Gi的样品错判到总体的样品错判到总体Gj的概率。显然的概率。显然 jDiijdxxfGDXPDijP)()|();|(ji 用用L(j|i;D)表示表示由判别法由判别法D判别归类时，将来自总体判别归类时，将来自总体Gi的样品

19、错判到总体的样品错判到总体Gj所造成的损失。所造成的损失。错判损失：错判损失：L(j|i;D)错判概率和错判损失的估计！错判概率和错判损失的估计！n n *()min()Dg Dg D一切定义定义如果有判别法如果有判别法D*，使得，使得D*带来的平带来的平均损失均损失g(D*)达到最小，即达到最小，即则称判别法则称判别法D*符合贝叶斯判别准则，或称符合贝叶斯判别准则，或称D*为为贝叶斯判别的解贝叶斯判别的解定理设有定理设有k的总体的总体，已知，已知的联的联合密度函数为合密度函数为，先验概率为，先验概率为，错判损失为错判损失为，则贝叶斯判别的解，则贝叶斯判别的解为为其中其中它表

20、示把样品它表示把样品X判归判归的平均损失。的平均损失。1,kGGiGjG()if X(1,)iq ik(|)Lj i*1,kDDD*|()(),1,(1,)ttjDX h XhXjt jktk1()(|)()kjiiihXq L j i f Xn n n 第四节第四节费歇（费歇（Fisher）判别法）判别法一一 Fisher判别的基本思想判别的基本思想二二 Fisher判别函数的构造判别函数的构造三三线性判别函数的求法线性判别函数的求法 nFisher判别法是判别法是1936年提出来的，该方法的主要思想是通过年提出来的，该方法的主要思想是通过将多维数据投影到某个方向上，投影的原则是将

21、总体与总体将多维数据投影到某个方向上，投影的原则是将总体与总体之间尽可能的放开，然后再选择合适的判别规则，将新的样之间尽可能的放开，然后再选择合适的判别规则，将新的样品进行分类判别。品进行分类判别。一、一、Fisher判别的基本思想判别的基本思想n 二、二、Fisher判别函数的构造判别函数的构造1、针对两个总体的情形、针对两个总体的情形n 2、针对多个总体的情形、针对多个总体的情形n 均损失g(D*)达到最小，即这里极易混淆，请读者注意辨别。（二）主要运行结果解释Bayes判别的基本思想二、最小平均损失准则稍差，。G1）和D2（X，G2），并按照如下的判别规则进行判断错判概率：P(j|i;D

22、)并且根据以往的统计分析，知道出现的概率为。设有总体，具有概率密度函数。并且根据以往的统计分析，知道出现的概率为，其中2，一天，小王做了一件好事，小王是好人的概率有多大，你现在把小王判为何种人。错判概率：P(j|i;D)对给定的一个新样本X（检测样本），判断X来自哪一个总体（类）。用L(j|i;D)表示由判别法D判别归类时，将来自总体按区分不同总体所用的数学模型来分，有线性判别和非线性判别；点击Define Range按钮，定义分组变量的取值范围。一、Fisher判别的基本思想2（a）未标准化的典型判别函数系数n 三、线性判别函数的求法三、线性判别函数的求法n n n n这里值得

23、注意的是，本书有几处利用极值原理求极值时，只这里值得注意的是，本书有几处利用极值原理求极值时，只给出了不要条件的数学推导，而有关充分条件的论证省略了，给出了不要条件的数学推导，而有关充分条件的论证省略了，因为在实际问题中，往往根据问题本身的性质就能肯定有最因为在实际问题中，往往根据问题本身的性质就能肯定有最大值（或最小值），如果所求的驻点只有一个，这时就不需大值（或最小值），如果所求的驻点只有一个，这时就不需要根据极值存在的充分条件判定它是极大还是极小而就能肯要根据极值存在的充分条件判定它是极大还是极小而就能肯定这唯一的驻点就是所求的最大值（或最小值）。为了避免定这唯一的驻点就是所求的最大值（

24、或最小值）。为了避免用较多的数学知识或数学上的推导，这里不追求数学上的完用较多的数学知识或数学上的推导，这里不追求数学上的完整性。整性。n 第五节第五节实例分析与计算机实现实例分析与计算机实现n这一节我们利用这一节我们利用SPSS对对Fisher判别法和判别法和Bayes判别法进行计判别法进行计算机实现。算机实现。n为研究某地区人口死亡状况，已按某种方法将为研究某地区人口死亡状况，已按某种方法将15个已知地区个已知地区样品分为样品分为3类，指标含义及原始数据如下。试建立判别函数，类，指标含义及原始数据如下。试建立判别函数，并判定另外并判定另外4个待判地区属于哪类？个待判地区属于哪类？X1 ：

25、0岁组死亡概率岁组死亡概率 X 4：55岁组死亡概率岁组死亡概率 X 2：1岁组死亡概率岁组死亡概率 X5 ：80岁组死亡概率岁组死亡概率 X 3：10岁组死亡概率岁组死亡概率 X6 ：平均预期寿命平均预期寿命表表4.1 各地区死亡概率表各地区死亡概率表(一一)操作步骤操作步骤1.在在SPSS窗口中选择窗口中选择AnalyzeClassifyDiscriminate，调，调出判别分析主界面，将左边的变量列表中的出判别分析主界面，将左边的变量列表中的“group”变量选变量选入分组变量中，将入分组变量中，将变量选入自变量中，并选择变量选入自变量中，并选择Enter independents t

26、ogether单选按钮，即使用所有自变量进行判单选按钮，即使用所有自变量进行判别分析。别分析。图图4.2 判别分析主界面判别分析主界面2.点击点击Define Range按钮，定义分组变量的取值范围。本例按钮，定义分组变量的取值范围。本例中分类变量的范围为中分类变量的范围为1到到3，所以在最小值和最大值中分别输，所以在最小值和最大值中分别输入入1和和3。单击。单击Continue按钮，返回主界面。按钮，返回主界面。3.单击单击Statistics按钮，指定输出的描述统计量和判别函数按钮，指定输出的描述统计量和判别函数系数。选中系数。选中Function Coefficients栏中的栏中的Fi

27、shers和和Unstandardized。这两个选项的含义如下。这两个选项的含义如下Fishers给出给出Bayes判别函数的系数。（注意这个选项不是要判别函数的系数。（注意这个选项不是要给出给出Fisher判别函数的系数。这个复选框的名字之所以为判别函数的系数。这个复选框的名字之所以为Fishers，是因为按判别函数值最大的一组进行归类这种思，是因为按判别函数值最大的一组进行归类这种思想是由想是由Fisher提出来的。这里极易混淆，请读者注意辨别。）提出来的。这里极易混淆，请读者注意辨别。）Unstandardized给出未标准化的给出未标准化的Fisher判别函数（即典型判别判别函数（即

28、典型判别函数）的系数（函数）的系数（SPSS默认给出标准化的默认给出标准化的Fisher判别函数系判别函数系数）。数）。n单击单击Continue按钮，返回主界面。按钮，返回主界面。图图4.3 Statistics子对话框子对话框4.单击单击Classify按钮，定义判别分组参数和选择输出结果。按钮，定义判别分组参数和选择输出结果。选择选择Display栏中的栏中的Casewise results，输出一个判别结果表，输出一个判别结果表，包括每个样品的判别分数、后验概率、实际组和预测组编号包括每个样品的判别分数、后验概率、实际组和预测组编号等。其余的均保留系统默认选项。单击等。其余的均保留系统

29、默认选项。单击Continue按钮。按钮。图图4.4 Classify子对话框子对话框5.单击单击Save按钮，指定在数据文件中生成代表判别分组结果按钮，指定在数据文件中生成代表判别分组结果和判别得分的新变量，生成的新变量的含义分别为和判别得分的新变量，生成的新变量的含义分别为Predicted group membership存放判别样品所属组别的值；存放判别样品所属组别的值；Discriminant scores存放存放Fisher判别得分的值，有几个典型判判别得分的值，有几个典型判别函数就有几个判别得分变量；别函数就有几个判别得分变量；Probabilities of group mem

30、bership存放样品属于各组的存放样品属于各组的Bayes后验概率值。后验概率值。将对话框中的三个复选框均选中，单击将对话框中的三个复选框均选中，单击Continue按钮返回。按钮返回。返回判别分析主界面，单击OK按钮，运行判别分析过程。D2，Dk为Rm的一个划分。为了避免用较多的数学知识或数学上的推导，这里不追求数学上的完整性。这里极易混淆，请读者注意辨别。已知，两类，是设备A生产的产品，质错判概率和错判损失的估计！这里值得注意的是，本书有几处利用极值原理求极值时，只给出了不要条件的数学推导，而有关充分条件的论证省略了，因为在实际问题中，往往根据问题本身的性质就能肯定有最大值（或最小值）

31、，如果所求的驻点只有一个，这时就不需要根据极值存在的充分条件判定它是极大还是极小而就能肯定这唯一的驻点就是所求的最大值（或最小值）。点击Define Range按钮，定义分组变量的取值范围。即当样本发生时，求他属于某类的概率。用L(j|i;D)表示由判别法D判别归类时，将来自总体这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计算机实现。判别分析内容很丰富，方法很多。设有总体，具有概率密度函数。方差；在Casewise Statistics输出表针对每个样品给出了了大部分的判别结果，其中包括实际类（Actual Group）、预测类（Predicted Group）、

32、Bayes判别法的后验概率、与组重心的马氏距离（Squared Mahalanobis Distance to Centroid）以及Fisher判别法的每个典型判别函数的判别得分（Discriminant Scores）。2、多个总体的距离判别第一，判别方法与各总体出现的概率的大小无关；Classification Function Coefficients（给出Bayes判别函数系数）第五节实例分析与计算机实现Predicted group membership存放判别样品所属组别的值；一马氏距离的概念6.返回判别分析主界面，单击返回判别分析主界面，单击OK按钮，运行判别分析过程。按钮

33、，运行判别分析过程。图图4.5 Save子对话框子对话框（二）（二）主要运行结果解释主要运行结果解释1.Standardized Canonical Discriminant Function Coefficients（给出标准化的典型判别函数系数）（给出标准化的典型判别函数系数）标准化的典型判别函数是由标准化的自变量通过标准化的典型判别函数是由标准化的自变量通过Fisher判别法判别法得到的，所以要得到标准化的典型判别得分，代入该函数的自得到的，所以要得到标准化的典型判别得分，代入该函数的自变量必须是经过标准化的。变量必须是经过标准化的。2.Canonical Discriminant Fu

34、nction Coefficients（给出未标（给出未标准化的典型判别函数系数）准化的典型判别函数系数）未标准化的典型判别函数系数由于可以将实测的样品观测值直未标准化的典型判别函数系数由于可以将实测的样品观测值直接代入求出判别得分，所以该系数使用起来比标准化的系数要接代入求出判别得分，所以该系数使用起来比标准化的系数要方便一些。见表方便一些。见表4.2（a）。）。由此表可知，两个由此表可知，两个Fisher判别函数分别为判别函数分别为实际上两个函数式计算的是各观测值在各个维度上的坐标，这实际上两个函数式计算的是各观测值在各个维度上的坐标，这样就可以通过这两个函数式计算出各样品观测值的具体空间

35、位样就可以通过这两个函数式计算出各样品观测值的具体空间位置。置。1123456212345674.991.8611.6560.8770.7980.0981.57929.4820.8671.1550.3560.0890.0540.69yXXXXXXyXXXXXX 表表4.2（a）未标准化的典型判别函数系数未标准化的典型判别函数系数3.Functions at Group Centroids（给出组重心处的（给出组重心处的Fisher判判别函数值）别函数值）如表如表4.2(b)所示，实际上为各类别重心在空间中的坐标位置。所示，实际上为各类别重心在空间中的坐标位置。这样，只要在前面计算出各观测值的具

36、体坐标位置后，再计算这样，只要在前面计算出各观测值的具体坐标位置后，再计算出它们分别离各重心的距离，就可以得知它们的分类了。出它们分别离各重心的距离，就可以得知它们的分类了。Functions at Group Centroids-2.5941.0139.194-.257-6.600-.756GROUP1.002.003.0012FunctionUnstandardized canonical discriminantfunctions evaluated at group means表表4.2（b）组重心处的组重心处的Fisher判别函数值判别函数值 4.Classification Fun

37、ction Coefficients（给出（给出Bayes判别函数判别函数系数）系数）如表如表4.3所示，所示，GROUP栏中的每一列表示样品判入相应列的栏中的每一列表示样品判入相应列的Bayes判别函数系数。在本例中，各类的判别函数系数。在本例中，各类的Bayes判别函数如下判别函数如下第一组第一组第二组第二组第三组第三组 11234565317.2143.9153.190.153.011.0189.3FXXXXXX 21234566202.2164.7171.2100.062.512.1207.0FXXXXXX 31234564982.9134.9144.585.950.010.5181.

38、7FXXXXXX 将各样品的自变量值代入上述三个将各样品的自变量值代入上述三个Bayes判别函数，得到三个判别函数，得到三个函数值。比较这三个函数值，哪个函数值比较大就可以判断该函数值。比较这三个函数值，哪个函数值比较大就可以判断该样品判入哪一类。例如，将第一个待判样品的自变量值分别代样品判入哪一类。例如，将第一个待判样品的自变量值分别代入函数，得到入函数，得到 F1=3793.77，F2=3528.32，F3=3882.48比较三个值，可以看出最大，据此得出第一个待判样品应该属比较三个值，可以看出最大，据此得出第一个待判样品应该属于第三组。于第三组。Classification Functi

39、on Coefficients-143.851-164.691-134.862153.137171.185144.462-90.088-99.976-85.94553.00962.52549.97211.00812.09410.520189.261207.003181.714-5317.234-6202.158-4982.880X 1X 2X 3X 4X 5X 6(Constant)1.002.003.00G RO U PFishers linear discriminant functions表表4.3 Bayes判别法的输出结果判别法的输出结果5.Casewise Statistics（给

40、出个案观察结果）（给出个案观察结果）在在Casewise Statistics输出表针对每个样品给出了了大部分的判输出表针对每个样品给出了了大部分的判别结果，其中包括实际类（别结果，其中包括实际类（Actual Group）、预测类）、预测类（Predicted Group）、）、Bayes判别法的后验概率、与组重心判别法的后验概率、与组重心的马氏距离（的马氏距离（Squared Mahalanobis Distance to Centroid）以及以及Fisher判别法的每个典型判别函数的判别得分判别法的每个典型判别函数的判别得分（Discriminant Scores）。出于排版要求，这里

41、给出结果表）。出于排版要求，这里给出结果表的是经过加工的，隐藏了其中的一些项目，如表的是经过加工的，隐藏了其中的一些项目，如表4.4所示。所示。从表中可以看出四个待判样本依次被判别为第三组、第一组、从表中可以看出四个待判样本依次被判别为第三组、第一组、第二组和第三组。第二组和第三组。比较这三个函数值，哪个函数值比较大就可以判断该样品判入哪一类。在Casewise Statistics输出表针对每个样品给出了了大部分的判别结果，其中包括实际类（Actual Group）、预测类（Predicted Group）、Bayes判别法的后验概率、与组重心的马氏距离（Squared Mahalanobi

42、s Distance to Centroid）以及Fisher判别法的每个典型判别函数的判别得分（Discriminant Scores）。按人们主观意识，一个人是好人或坏人的概率均为0.点击Define Range按钮，定义分组变量的取值范围。二、最小平均损失准则这里极易混淆，请读者注意辨别。2、多个总体的距离判别其余的均保留系统默认选项。77，F2=3528.并且根据以往的统计分析，知道出现的概率为。判别分析内容很丰富，方法很多。Canonical Discriminant Function Coefficients（给出未标准化的典型判别函数系数）把这类问题用数学语言来表达，可以叙述

43、如下1、两个总体的距离判别问题设有总体，具有概率密度函数实际上两个函数式计算的是各观测值在各个维度上的坐标，这样就可以通过这两个函数式计算出各样品观测值的具体空间位置。F1=3793.是设备B生产的产品，质量一般的想法是计算新样品X到两个总体的马氏距离D2（X，Casewise Statistics111.000.297-2.1771.364111.000.236-2.2701.375111.000.117-2.7411.32311.998.507-3.199.638111.000.418-2.582.366221.000.4699.674.231221.000.8688.332-.6132

44、21.0005.98510.128-2.518221.0004.7938.3421.760221.000.1019.491-.145331.000.139-6.687-.394331.000.322-7.163-.685331.0005.365-8.655-1.82333.8793.384-4.766-.60833.995.998-5.727-.270ungrouped31.000361.567-20.714-13.498ungrouped1.998.558-3.319.831ungrouped21.00028.66814.0082.086ungrouped31.0001.982-7.595-1.752CaseNumber12345678910111213141516171819ActualGroupPredictedGroupP(G=g|D=d)SquaredMahalanobisDistance toCentroidHighest GroupFunction1Function2Discriminant Scores表表4.4 个案观察结果表个案观察结果表

展开阅读全文