1、资料仅供参考,不当之处,请联系改正。聚类分析概述相似性度度量聚类分析方法中药分析聚类分析的应用聚类分析的意义资料仅供参考,不当之处,请联系改正。概述概述资料仅供参考,不当之处,请联系改正。聚类分析概述聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类的目的根据已知数据,计算各观察个体或变量之间亲疏关系的统计量(距离或者相关系数)。根据某种准则(最短距离法、最长距离法、中间距离法、重心法),使得同一类内的差别较小,而类与类之间差别较大,最终将观察个体或变量分为若干类。资料仅供参考,不当之处,请联系改正。聚类分析概述聚类分析的特点聚类分析可以将一组数据按照本身的内在规
2、律较合理地分为几类,大大缩小了以往全凭主观判断所造成的误差,使数据分析结果更具客观性。更重要的是,聚类分析的应用可以完成以往人工所不能完成的工作。资料仅供参考,不当之处,请联系改正。聚类分析概述聚类分析用于中药研究中药复方中包括多味中药,通过不同的组合实现对疾病的治疗;每一种中药中包含了大量的化合物成分,不同功能的中药中含有不同的化合物成分,也可能含有相同的成分,这些化合物成分之间相互作用(协同或抑制)通过多靶点、多途径而实现了药效;因此,无论是复方还是单味中药其组成都很复杂,分析困难;资料仅供参考,不当之处,请联系改正。聚类分析概述聚类分析用于中药研究中药组成复杂这一特点使得对中药作用机理的
3、研究比较困难,如果可以对这些复杂的成分进行分类分类,在分类的基础上去分析每个类内类内的成分特性,和类别类别之间之间的关联,将有助于作用机理的研究。资料仅供参考,不当之处,请联系改正。聚类分析相似度度量资料仅供参考,不当之处,请联系改正。聚类分析相似度度量相似度度量方法距离测度关联性测度相关性测度资料仅供参考,不当之处,请联系改正。距离测度假设每个对象有n个相关变量,每个变量对应于一个数值,则每个对象可以看成是n维空间的一个点,m个对象就是n维空间的m个点,通过计算两个点之间的聚类表示相关度;距离定义方法:欧式(Euclidian)距离明氏(Minkowski)距离马氏(Mahalanobls)
4、距离 21nijijikjkkdxxxx1rnrijijikjkrkdxxxx1ijijijdxxxx资料仅供参考,不当之处,请联系改正。距离测度例子:不同种类但药用类似的中药中往往含有相同的化合物或金属元素,但它们含量不同,根据组成成分的含量分析中药相关度可以采用距离测度,进而运用聚类研究药物金属元素与药物疗效的相关性.如下表(成分指成分的含量占整个中药的比例)中药成分1成分2成分n10.450.040.3120.330.0980.1230.030.030.24m0.0220.040.6资料仅供参考,不当之处,请联系改正。关联性测度当个案不能由有意义的n维数值来表示时,常根据某些特征的存在与
5、否来比较个案之间的相似性。相似个案比不相似有更多的共同特征。关联性度量时,研究对象有n个特征,可以用0/1表示该对象是否符合某个特征,对两个研究对象各个特征进行匹配计算其相似度。关联性测度方法:简单匹配系数:s=(a+d)/n;(a:1-1匹配的个数,d:0-0匹配的个数,n:特征个数)雅可比系数:s=a/n;资料仅供参考,不当之处,请联系改正。关联性度量例子1:方剂相似性每个方剂对应不同的中药组成,分别用0/1表示某种方剂是否含有某味中药,通过关联度量来计算方剂之间在组成的相似性;方剂中药1中药2中药m-1中药m1011021000301101010n0001资料仅供参考,不当之处,请联系改
6、正。关联性度量例子1:方剂相似性每个方剂对应不同的功能,分别用0/1表示某种方剂是否具有某种功能,通过关联度量来计算方剂之间的功能相似性;方剂功能1功能2功能k-1功能k1110121000310100111n0011资料仅供参考,不当之处,请联系改正。关联性度量例子2:中药相似性 每一味中药对应多种功能,通过关联度计算中药在功能方面的相似性;单味药功能1功能2功能k-1功能k药11101药21000药310100111药n0011资料仅供参考,不当之处,请联系改正。关联性度量例子2:中药相似性每一味中药都包含很多成分,通过关联度计算中药成分组成方面的相似性;单味药成分1成分2成分m-1成分m
7、药11101药21000药310100111药n0011资料仅供参考,不当之处,请联系改正。相关度研究多个对象之间的相似性常用距离,研究指标(变量)之间的相似性常用的有:夹角余弦和相关系数。相关度方法夹角余弦Pearson相关系数12112221211niiinniiiiX XrXX112211222112211()()()()niiinniiiiXXXXrXXXX资料仅供参考,不当之处,请联系改正。相关度例子:分析两味中药在某类功能的方剂中的相关性(每个中药根据其在方剂中起到的作用进行排序)计算两种中药的相关性,辅助于分析两种不同中药在实现某种药效的方剂中的相关性,进而在新方研究中考虑对二者
8、的处理。方剂号中药1排名中药2排名154243332435525资料仅供参考,不当之处,请联系改正。相似度度量小结除了以上三种度量相似性的方法之外,针对中药研发中遇到问题的实际情况,可以在这三种方法的基础上定义新的相似性度量,以更好地表示研究对象在某个方面的相似性程度;例如很多来自于中医药相关文献资料的关于中医药的功效等文本的内容,则可以利用语义相似性来分析资料仅供参考,不当之处,请联系改正。注意事项数据的标准化问题:以距离测度度量相似性时,聚类变量的量纲对度量结果的影响较大,所以在计算相似测度之前,通常需要进行标准化处理在中药研发方法,根据中药资料等得到中药相关信息,为了进行聚类分析,需要对
9、这些信息进行标准化处理,转变为统一的表示方式;资料仅供参考,不当之处,请联系改正。注意事项相似性度量方法的选择:根据分析问题的和数据不同选择不同的相似性度量方法;当研究对象可以用多维的数据进行量化表示可以采用距离测度;当研究对象适合于用0/1类型数据表示其功能或特性时则采用关联性测度;当研究对象本事是变量时,则采用相关系数。资料仅供参考,不当之处,请联系改正。聚类分析方法资料仅供参考,不当之处,请联系改正。聚类分析方法聚类方法传统聚类方法:(1)划分方法,(2)层次的方法,(3)基于密度的方法,(4)基于网格的方法,(5)基于模型的方法其中(1)和(2)比较常用资料仅供参考,不当之处,请联系改
10、正。常用聚类方法划分的方法-以K均值方法为例开始读取数据初始化K个聚类中心将数据对象按照近邻原则分配至各类重新计算类中心类中心是否变化算法结束是否利用K均值分类:K=51,2,3,4,5是最后得到的聚类中心资料仅供参考,不当之处,请联系改正。常用聚类方法层次聚类方法层次聚类算法是将所有的样本点自底向上合并组成一棵树或者自顶向下分裂成一棵树的过程,这两种方式分别称为凝聚和分裂。凝聚层次算法分裂层次算法图中,从上向下是凝聚方法;从下到上是分裂方法资料仅供参考,不当之处,请联系改正。聚类分析方法改进的聚类方法系统聚类方法结合频数分析系统聚类方法结合主成分分析模糊聚类分析主成分聚类分析基于模型的神经网
11、络聚类分析基于扩展熵的无监督聚类分析资料仅供参考,不当之处,请联系改正。应用资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的应用中药分析聚类分析的方法运用到中药的分析当中,可以将功能相似的对象(化合物/单味药/方剂/药物靶标等)聚集在一起,将功能不同的对象区分开来,从而将中药的复杂的成分分为几个不同的功能类别,这就从一定程度上降低了对中药处理分析的复杂度。在聚类的过程中,通过不同的特征的选择(比如:化合物结构,化合物靶标,化合物ADME特性,中药的性、味、归、经等)和相似度的定义方法,则可以从不同的角度对化合物进行分类,从不同侧面来发现中药或复方的功能特点及其组成规律。资料仅供参考,
12、不当之处,请联系改正。聚类分析在中药研发中的用例化合物聚类例:针对步长脑心通方剂中每种化合物在靶标方面的相似性对化合物进行聚类,结果有大量化合物聚为一类,这一类化合物靶标都和脂蛋白,脂质的代谢、消化、运输相关,进而说明了该方剂的主要成分,及其主要功能;资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的用例化合物聚类除了根据化合物性质对其聚类,另外,每一种化合物出现在不同的中药中,针对不同功能类型的中药,根据化合物对应的中药对所有的化合物成分进行聚类,从而分析化合物的划分是否符合中药的功能类别的划分;问题中药的组成成分复杂,很多中药成分并没有被识别出来或者可能是未知的化合物,通过聚类分析
13、有利于预测新化合物的功能;资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的用例中药聚类例:对已知传统分类的解表、泻下、化湿药共5l味根据性味归经及功效等相关因素建立一个中药数据集规范量化,作为自变量,将中药药味作为因变量;层次聚类:结果将聚类分析所得出的结果和传统的中药分类方法大体相同,但也存在差别。结论聚类分析方法用于中药分类有一定的可行性,从一定程度上符合传统中药分类。归纳,整理量化赋值是客观分类的关键,传统主观分类与现代客观分类之间结果的不同正是我们要思考和探索的问题。资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的用例中药聚类例:原子吸收分光光度法检测了丹参、枸杞子
14、等共11种中药中钾、钙、镁、铁、锰、铜、锌和铬元素的含量;运用模糊分类方法研究药物金属元素与药物疗效的相关性。发现药物中金属元素含量丰富,相关系数较大的药物,其药物疗效相似性较大,揭示中药中微量元素与药物疗效密切相关。该研究为中药的质量评价,聚类分析为研制新型的药物提供了有用的科学数据资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的用例方剂聚类例:收集清代医籍中治疗噎膈的内服方剂,对其进行采集、整理和编排,运用聚类分析总结用药规律,总结常用有效药物,探索高频药物之间的配伍关系.资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的用例中医证候研究目前,有很多种聚类分析的方法用于中
15、医证候聚类分型的研究当中。由于对聚类分析方法优劣的评价至今尚无系统的检验理论,因此在样品聚类分析中,常常是根据病人四诊指标的变量类型,进行多种聚类方法下的探索性分析,并且对每次聚类的结果结合专业知识进行判断,最后选取较为符合专业特征的分类结果并给予临床较为合理的证候名称。资料仅供参考,不当之处,请联系改正。聚类分析在中药研发中的用例中医证候研究目前已经有很多聚类方法应用于中医证候分析中,随着中医辨证的客观化、标准化的不断深入,将会有更多的聚类分析方法运用于中医证候的聚类分析中,而且随着更多的聚类分析方法的应用,中医证候的聚类研究将更为客观化。资料仅供参考,不当之处,请联系改正。意义资料仅供参考
16、,不当之处,请联系改正。聚类分析对于中药研发的意义聚类分析的结果对中药相关的研究对象进行聚类分析,根据不同的问题从不同角度将研究对象划分为不同的类别,类别内的研究对象有着相似的特点,类间的对象则有所不同;但是类别之间也可能包含着某种意义的关联;在聚类分析以后,需要对分类的结果进行进一步的研究,从分类结果中发现新的内涵资料仅供参考,不当之处,请联系改正。聚类分析对于中药研发的意义类内分析聚类分析的结果中,可以针对不同的类,根据类别的大小和类内对象的共性来对问题进行解释,同时分别分析每个类中对象之间的相互作用进一步进行分析;例:对某个方剂中的化合物成分进行功能上的聚类类别的大小从一定程度上说明了该
17、方剂中这个功能的强弱;类别内的化合物则存在着潜在的增效作用,可以进一步研究,这些同一类别的化合物之间如何相互作用而提高药效;聚类得到4个大小不同的类别资料仅供参考,不当之处,请联系改正。聚类分析对于中药研发的意义类间关系聚类分析结果中得到不同的类别,虽然这些类别存在某种意义上的相异性,但是类别之间也存在着关联;尤其对于中药研究,中药强调整体观,辨证论治,因此对于中药相关聚类得到的不同类别,需要进一步研究类别之间的联系和区别;例:根据中药的功效将多种中药分为几个类别同一类别的中药对应了相似的功效,不同类别则对于不同功效;然而,大部分方剂是通过多种功效达到治疗目的的,因此需要分析这些类别之间的关联
18、,从而发现通过哪些功效的联合能更好地实现药效;资料仅供参考,不当之处,请联系改正。聚类分析对于中药研发的意义在聚类分析的基础之上,通过对类内和类间研究对象的进一步研究,有利于从不同侧面,从整体把握对中药相关问题的研究;解释中药机理资料仅供参考,不当之处,请联系改正。聚类分析对于中药研发的意义总结在聚类基础上可以发现新的药对、药组,为旧药新用以及设计新方开辟道路,为运用计算机辅助的手段研究中医药方剂配伍规律奠定基础;聚类的结果可以作为中医药配伍规律系统运行的知识库;聚类药所具有的相似性,意味着它们之间存在着一定的关系,为中医药学理论研究提供客观的分析材料,为中医其它领域的研究提供参考,如药的有效化学成分的分析研究等。