1、第七章判别分析 n判别分析原理及模型n逐步判别分析n判别分析应用及实例 判别分析原理及模型 n判别分析概述 n判别分析方法 判别分析概述 (一)什么是判别分析 判别分析是多元统计中用于判别样品所属类型的一种统计分析方法。是一种在一些已知研究对象用某种方法已经分成若干类的情况下,确定新的样品的观测数据属于那一类的统计分析方法。判别准则:用于衡量新样品与各已知组别接近程度的思路原则。常用的有,距离准则、Fisher准则、贝叶斯准则。判别函数:基于一定的判别准则计算出的用于衡量新样品与各已知组别接近程度的描述指标,即判别函数。(二)判别分析的种类 按照判别组数划分有两组判别分析和多组判别分析;按照区
2、分不同总体的所用数学模型来分有线性判别分析和非线性判别分析;按照处理变量的方法不同有逐步判别、序贯判别等;按照判别准则来分有费舍准则与贝叶斯判别准则。判别分析方法(一)距离判别法基本思想:首先根据已知分类的数据,分别计算各类的重心,即分组(类)均值,判别准则是对于任给一次观测值,若它与第i类的重心距离最近,就认为它来自第i类。因此,距离判别法又称为最邻近方法(nearest neighbor method)。距离判别法对各类总体的分布没有特定的要求,适用于任意分布的资料。3多组费舍判别分析(三)贝叶斯判别法(三)贝叶斯判别法 第二节 逐步判别分析 n一、逐步判别分析的基本概念及基本思想逐步判别
3、分析的基本概念及基本思想n二、逐步判别的理论基础逐步判别的理论基础n三、引入和剔除变量计算三、引入和剔除变量计算n四、建立判别式四、建立判别式,对样品判别分类对样品判别分类n五、具体计算步骤五、具体计算步骤 一、基本概念及基本思想基本概念及基本思想 在判别问题中,当判别变量个数较多时,如果不加选择地一概采用来建立判别函数,不仅计算量大,还由于变量之间的相关性,可能使求解逆矩阵的计算精度下降,建立的判别函数不稳定。因此适当地筛选变量的问题就成为一个 很重要的事情。凡具有筛选变量能力的判别分析方法就统称为逐步判别法。逐步判别法和通常的判别分析一样,也有许多不同的原则,从而产生各种方法。这里讨论的逐
4、步判别分析方法是在多组判别分析基础上发展起来的一种方法,判别准则为贝叶斯判别函数,其基本思路类似于逐步回归分析,采用“有进有出”的算法,即按照变量是否重要,从而逐步引入变量,每引入一个“最重要”的变量进入判别式,同时要考虑较早引入的变量是否由于其后的新变量的引入使之丧失了重要性变得不再显著了(例如其作用被后引入地某几个变量的组合所代替),应及时从判别式中把它剔除,直到判别式中没有不重要的变量需要剔除,剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。也就是说每步引入或剔除变量,都作相应的统计检验,使最后的贝叶斯判别函数仅保留“重要”的变量。为协方差矩阵。组的数学期望向量,为个变量个样品
5、的第组第为其中,;,),(),(样,即:各组的协方差矩阵都一互独立的正态随机向量假定各组的样品都是相和多组判别分析一样,而),(),(),(个指标即为:每个样品有个样品、分别抽取个母体,从这个母体中设有)()()()()()()()()()()(jkxnkmNxxxxxxXniXniXniXpnnnmkjkpkkipiiimmiiim21212121212121221121二二、逐步判别分析的理论基础、逐步判别分析的理论基础)为总的离差矩阵()为组内离差矩阵;(则,)()(记个变量的总平均。第个变量的均值,组中第为记)()()()()()()()()()(ijijjlkjilkimlnkijl
6、jlkjlimlnklkiijjljmmlnklkjjnklkjlljtTWpjixxxxtxxxxjxjlxnnnnxnxxnxllll2111111121111 TWWilksmpmmHmHHmm)统计量:(检验,可采用维尔克斯)问题的变量。对于(个母体不带附加信息的对区分去掉一些同样的效果,也就是说标是否可以减少而达到个指择的这个母体的目的,原来选但为了达到区分这。的判别函数是有意义的个母体可以区分,建立说明这被否定时,效果不好。当假定基础上建立的判别函数此个总体是无意义的,在被接受时,说明区分这当)(:需要检验:个母体建立判别函数,为了对这)()()(1.71.700210111112
7、221112111112221112111112111ln121TWWilkspTTTTTWWWWWTWmppppmpxmpnpPPPP)统计量为个变量的维尔克斯(于是,对前分块:、矩阵能力是否有所增长。将个总体的鉴别这个变量后,对于区分、了第附加信息,即是说增加否提供个指标后对区分母体是加第个变量,我们要检验增已选中如果通过某种步骤个变量分解为两部分,将为进一步考虑这个问题)(样本的的极限分布是服从于大)(而当增加第p个变量后,p个变量的维尔克斯统计量加信息。是否对区分母体提供附相等,即个指标的条件均值是否第个指标的条件下,增加用它来检验给定前)(),(的极限分布是)()(统计量即所以有:为
8、:ppmpnmFmmpnFWWWWWWWWTTTTWWWWTTTTTTTTWWWWTTTTTWWWWWTTTTWWWWTWppppppppp1111111112111212212111212212111212211211121221211121221121112122121112122112111212211121112122112221121122211211三、引入和剔除变量计算 假定计算了l步,已入选了L个变量,不妨设为)(。和总离差阵分别记为个变量的组内离差阵和,则这组为一个变量个已入选的变量,第二组为前个变量分成两组,第一将的判别能力。步添加一个新变量息,即考查在第变量后能否提供附加
9、信个,现检验增加新选的第步引入一个新变量,设第、lrrLLLLrrrlWWTTTTTTTWWWWWWWTWLxLLxlLxlxxx1121122221112111211222211121112111111rrLLlrrlrrrrlrrlrrLlrrlrrLrrrrlrrlrrrrrrlrrVVtVttTWTWTTTTTTTTttTTWWWWWWWW11111111111111211121221111111121112122有:所以,令所以维尔克斯统计量其中,其中,)()()()()()()()()(n由附加信息准则,则得引入变量的检验统计量为:,都是进行如下的变换剔除变量步无论是引入或个变量,
10、则第步,引入了已进行了施行一次变换,设)从它们开始,每一步离差矩阵为(),初始总的内离差矩阵为(判别的一步,记初始组量称为逐步,每引入或剔除一个变将变量逐步引入或剔除变换法”上采用“求解求逆紧凑原则。逐步判别在计算于引进的量剔除,剔除的原则同不能提供附加信息的变及时把有没有较大的变化,应选入的变量中其重要性个变量中,要考虑较早。对已入选的入选的变量作为由此将的“判别能力”显著,附加信息,即提供了时,则认为变量,当,达到最小值的变量择使在未选入的变量中,选。它服从于分布)()()()()(rijijLrrrrrrlrrlrrlrrxlLltLxxxxmLnmFFxVmLnmF1)1(),1(1m
11、mLnt1mmLnVV1F0011rr1r)(,)(,:,都是进行如下的变换剔除变量)()()()()()()()()()()()()()()()()()()()(3.712.7111rjrittrjritrjrittttrjritttrjrirjrirjrirjrixlrrlirlrrlrrlrjlirlijlrrlijlijlrrlirlrrlrrlrjlirlijlrrlijlijrn如果除。,可把它从判别式中剔的“判别能力”不显著不能提供附加信息,则认为变量)(,(:具有最大值,并且满足个变量中的),使得已入选的(如果对某个变量)()(统计量为:相应的剔除变量的检验)有:)和(的判别能
12、力,由变换(步引入的判别能力等价于第步剔除变量),则第(步是剔除变量第)()()()()()()()()(rrrrrlrrlrrlrrrrrlrrlrrlrrlrrlrrlrrrrrrxxmLnmFFVLLrxmmLnttmmLnVVFtttVxlxlLrxl11111111113.72.71112211w逐步判别过程,就是不断的引入和剔除变量的过程,可以证明,前三步都只引入,而不必考虑剔除,在以后的各步中则首先考虑剔除,如果不能剔除则再考虑引入,当既不能剔除又不能引入时,逐步计算的过程即告终止,将已选中的变量建立判别函数。四、建立判别式四、建立判别式,对样品判别分类对样品判别分类n经过第二步
13、选出重要变量后,可用各种方法建立判别函数和判别准则,这里使用Bayes判别法建立判别式,假设l+1步,最终选出L个变量,设判别式为:合。大时,往往是最优的组不。但在基础上引入新的变量)都是在保留已引入变量合(因为每次引入个变量组合中最优的组一般不是所有个变量的中可知用逐步判别选出需要注意的是,由算法总体。属于第,则)(若个判别式中去。入个样品之一。)分别代也可以是原来可以是一个新样品,(),(将每一个样品,)()(LLLhxxgyxhymnxxxxmgxCCqlymgpiLigigggmax111011五、具体计算步骤则全部变量被引入。,等等。显然如果取,变量可取,等等。如果想多选入,几个变量
14、可取,如果想少选入微,所以一般取很大时,它们的变化甚量而变化,但是当样本容变量或剔除变量的个数由于临界值是随着引入据具体问题,事先给定不是查分布表,而是根时,通常临界值的确定在利用电子计算机计算程必在有限步后停止)以保证逐步筛选变量过,(取临界值和变量的临界值)规定引入变量和剔除(。)(和)(的均值和总均值以及)计算各总体中各变量(、准备工作出进出进出进出进出进出进05.018100211FFFFFFFFFnFFFFtTWppijppij 量为检验:剔除变量时统计属已入选变量。作示表,这里)假设(即最小的取最大的著的变量,剔除可能存在的最不显)在已入选变量中考虑(,计算对已入选的变量,计算对未
15、选入的变量别能力”)计算全部变量的“判(步计算内容如下:,则第,不妨设个变量,某),在判别式中引入了步(包括假设已计算、逐步计算)()()()(FxLjVVrFVLjtVxPLitVxlxxxLlljjLjjjlijlijjjlijlijiiLmax2212111102)。(即最大的最小的找出选出最显著变量,即要,则从未入选的变量中若作消去变换。和,然后,则剔除若)(量为:检验:剔除变量时统计属于未入选变量。作表示,这里)。假设(即最大的最小的找出选出最显著变量,即要,则从未入选的变量中若作消去变换。和,然后,则剔除若)(出)()(出出)()(出rirllrrriiLirirllrrrFVFF
16、TWxFFmLmnVrVrFFxLiVVrFVFFTWxFFmLmnVrVrF12221222111111min 逐步计算结束。又不能引入新变量时,)直到不能剔除)(上面的(步计算结束后,再重复在第作消去变换。和,然后对,则引入若引入变量时统计量为:检验属于未入选变量。作表示,这里假设)()(进2111111minlTWxFFmLmnVrVrFFxLiVVrllrrriiLi第三节判别分析应用及实例 11醉翁亭记 1反复朗读并背诵课文,培养文言语感。2结合注释疏通文义,了解文本内容,掌握文本写作思路。3把握文章的艺术特色,理解虚词在文中的作用。4体会作者的思想感情,理解作者的政治理想。一、导入
17、新课范仲淹因参与改革被贬,于庆历六年写下岳阳楼记,寄托自己“先天下之忧而忧,后天下之乐而乐”的政治理想。实际上,这次改革,受到贬谪的除了范仲淹和滕子京之外,还有范仲淹改革的另一位支持者北宋大文学家、史学家欧阳修。他于庆历五年被贬谪到滁州,也就是今天的安徽省滁州市。也是在此期间,欧阳修在滁州留下了不逊于岳阳楼记的千古名篇醉翁亭记。接下来就让我们一起来学习这篇课文吧!【教学提示】结合前文教学,有利于学生把握本文写作背景,进而加深学生对作品含义的理解。二、教学新课目标导学一:认识作者,了解作品背景作者简介:欧阳修(10071072),字永叔,自号醉翁,晚年又号“六一居士”。吉州永丰(今属江西)人,因
18、吉州原属庐陵郡,因此他又以“庐陵欧阳修”自居。谥号文忠,世称欧阳文忠公。北宋政治家、文学家、史学家,与韩愈、柳宗元、王安石、苏洵、苏轼、苏辙、曾巩合称“唐宋八大家”。后人又将其与韩愈、柳宗元和苏轼合称“千古文章四大家”。关于“醉翁”与“六一居士”:初谪滁山,自号醉翁。既老而衰且病,将退休于颍水之上,则又更号六一居士。客有问曰:“六一何谓也?”居士曰:“吾家藏书一万卷,集录三代以来金石遗文一千卷,有琴一张,有棋一局,而常置酒一壶。”客曰:“是为五一尔,奈何?”居士曰:“以吾一翁,老于此五物之间,岂不为六一乎?”写作背景:宋仁宗庆历五年(1045年),参知政事范仲淹等人遭谗离职,欧阳修上书替他们分
19、辩,被贬到滁州做了两年知州。到任以后,他内心抑郁,但还能发挥“宽简而不扰”的作风,取得了某些政绩。醉翁亭记就是在这个时期写就的。目标导学二:朗读文章,通文顺字1初读文章,结合工具书梳理文章字词。2朗读文章,划分文章节奏,标出节奏划分有疑难的语句。节奏划分示例环滁/皆山也。其/西南诸峰,林壑/尤美,望之/蔚然而深秀者,琅琊也。山行/六七里,渐闻/水声潺潺,而泻出于/两峰之间者,酿泉也。峰回/路转,有亭/翼然临于泉上者,醉翁亭也。作亭者/谁?山之僧/曰/智仙也。名之者/谁?太守/自谓也。太守与客来饮/于此,饮少/辄醉,而/年又最高,故/自号曰/醉翁也。醉翁之意/不在酒,在乎/山水之间也。山水之乐,
20、得之心/而寓之酒也。节奏划分思考“山行/六七里”为什么不能划分为“山/行六七里”?明确:“山行”意指“沿着山路走”,“山行”是个状中短语,不能将其割裂。“望之/蔚然而深秀者”为什么不能划分为“望之蔚然/而深秀者”?明确:“蔚然而深秀”是两个并列的词,不宜割裂,“望之”是总起词语,故应从其后断句。【教学提示】引导学生在反复朗读的过程中划分朗读节奏,在划分节奏的过程中感知文意。对于部分结构复杂的句子,教师可做适当的讲解引导。目标导学三:结合注释,翻译训练1学生结合课下注释和工具书自行疏通文义,并画出不解之处。【教学提示】节奏划分与明确文意相辅相成,若能以节奏划分引导学生明确文意最好;若学生理解有限
21、,亦可在解读文意后把握节奏划分。2以四人小组为单位,组内互助解疑,并尝试用“直译”与“意译”两种方法译读文章。3教师选择疑难句或值得翻译的句子,请学生用两种翻译方法进行翻译。翻译示例:若夫日出而林霏开,云归而岩穴暝,晦明变化者,山间之朝暮也。野芳发而幽香,佳木秀而繁阴,风霜高洁,水落而石出者,山间之四时也。直译法:那太阳一出来,树林里的雾气散开,云雾聚拢,山谷就显得昏暗了,朝则自暗而明,暮则自明而暗,或暗或明,变化不一,这是山间早晚的景色。野花开放,有一股清幽的香味,好的树木枝叶繁茂,形成浓郁的绿荫。天高气爽,霜色洁白,泉水浅了,石底露出水面,这是山中四季的景色。意译法:太阳升起,山林里雾气开
22、始消散,烟云聚拢,山谷又开始显得昏暗,清晨自暗而明,薄暮又自明而暗,如此暗明变化的,就是山中的朝暮。春天野花绽开并散发出阵阵幽香,夏日佳树繁茂并形成一片浓荫,秋天风高气爽,霜色洁白,冬日水枯而石底上露,如此,就是山中的四季。【教学提示】翻译有直译与意译两种方式,直译锻炼学生用语的准确性,但可能会降低译文的美感;意译可加强译文的美感,培养学生的翻译兴趣,但可能会降低译文的准确性。因此,需两种翻译方式都做必要引导。全文直译内容见我的积累本。目标导学四:解读文段,把握文本内容1赏析第一段,说说本文是如何引出“醉翁亭”的位置的,作者在此运用了怎样的艺术手法。明确:首先以“环滁皆山也”五字领起,将滁州的
23、地理环境一笔勾出,点出醉翁亭坐落在群山之中,并纵观滁州全貌,鸟瞰群山环抱之景。接着作者将“镜头”全景移向局部,先写“西南诸峰,林壑尤美”,醉翁亭坐落在有最美的林壑的西南诸峰之中,视野集中到最佳处。再写琅琊山“蔚然而深秀”,点山“秀”,照应上文的“美”。又写酿泉,其名字透出了泉与酒的关系,好泉酿好酒,好酒叫人醉。“醉翁亭”的名字便暗中透出,然后引出“醉翁亭”来。作者利用空间变幻的手法,移步换景,由远及近,为我们描绘了一幅幅山水特写。2第二段主要写了什么?它和第一段有什么联系?明确:第二段利用时间推移,抓住朝暮及四季特点,描绘了对比鲜明的晦明变化图及四季风光图,写出了其中的“乐亦无穷”。第二段是第
24、一段“山水之乐”的具体化。3第三段同样是写“乐”,但却是写的游人之乐,作者是如何写游人之乐的?明确:“滁人游”,前呼后应,扶老携幼,自由自在,热闹非凡;“太守宴”,溪深鱼肥,泉香酒洌,美味佳肴,应有尽有;“众宾欢”,投壶下棋,觥筹交错,说说笑笑,无拘无束。如此勾画了游人之乐。4作者为什么要在第三段写游人之乐?明确:写滁人之游,描绘出一幅太平祥和的百姓游乐图。游乐场景映在太守的眼里,便多了一层政治清明的意味。太守在游人之乐中酒酣而醉,此醉是为山水之乐而醉,更是为能与百姓同乐而醉。体现太守与百姓关系融洽,“政通人和”才能有这样的乐。5第四段主要写了什么?明确:写宴会散、众人归的情景。目标导学五:深
25、入解读,把握作者思想感情思考探究:作者以一个“乐”字贯穿全篇,却有两个句子别出深意,不单单是在写乐,而是另有所指,表达出另外一种情绪,请你找出这两个句子,说说这种情绪是什么。明确:醉翁之意不在酒,在乎山水之间也。醉能同其乐,醒能述以文者,太守也。这种情绪是作者遭贬谪后的抑郁,作者并未在文中袒露胸怀,只含蓄地说:“醉能同其乐,醒能述以文者,太守也。”此句与醉翁亭的名称、“醉翁之意不在酒,在乎山水之间也”前后呼应,并与“滁人游”“太守宴”“众宾欢”“太守醉”连成一条抒情的线索,曲折地表达了作者内心复杂的思想感情。目标导学六:赏析文本,感受文本艺术特色1在把握作者复杂感情的基础上朗读文本。2反复朗读
26、,请同学说说本文读来有哪些特点,为什么会有这些特点。(1)句法上大量运用骈偶句,并夹有散句,既整齐又富有变化,使文章越发显得音调铿锵,形成一种骈散结合的独特风格。如“野芳发而幽香,佳木秀而繁阴”“朝而往,暮而归,四时之景不同,而乐亦无穷也”。(2)文章多用判断句,层次极其分明,抒情淋漓尽致,“也”“而”的反复运用,形成回环往复的韵律,使读者在诵读中获得美的享受。(3)文章写景优美,又多韵律,使人读来不仅能感受到绘画美,也能感受到韵律美。目标导学七:探索文本虚词,把握文言现象虚词“而”的用法用法文本举例表并列1.蔚然而深秀者;2.溪深而鱼肥;3.泉香而酒洌;4.起坐而喧哗者表递进1.而年又最高;
27、2.得之心而寓之酒也表承接1.渐闻水声潺潺,而泻出于两峰之间者;2.若夫日出而林霏开,云归而岩穴暝;3.野芳发而幽香,佳木秀而繁阴;4.水落而石出者;5.临溪而渔;6.太守归而宾客从也;7.人知从太守游而乐表修饰1.朝而往,暮而归;2.杂然而前陈者表转折1.而不知人之乐;2.而不知太守之乐其乐也虚词“之”的用法用法文本举例表助词“的”1.泻出于两峰之间者;2.醉翁之意不在酒;3.山水之乐;4.山间之朝暮也;5.宴酣之乐位于主谓之间,取消句子独立性而不知太守之乐其乐也表代词1.望之蔚然而深秀者;2.名之者谁(指醉翁亭);3.得之心而寓之酒也(指山水之乐)【教学提示】更多文言现象请参见我的积累本。三、板书设计路线:环滁琅琊山酿泉醉翁亭风景:朝暮之景四时之景山水之乐(醉景)风俗:滁人游太守宴众宾欢 太守醉宴游之乐(醉人)心情:禽鸟乐人之乐乐其乐与民同乐(醉情)可取之处重视朗读,有利于培养学生的文言语感,并通过节奏划分引导学生理解文意,突破了仅按注释疏通文义的桎梏,有利于引导学生自主思考;不单纯关注“直译”原则,同时培养学生的“意译”能力,引导学生关注文言文的美感,在一定程度上有助于培养学生的核心素养。不足之处文章难度相对较高,基础能力低的学生难以适应该教学。会员免费下载