机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt

上传人(卖家):三亚风情 文档编号:3598797 上传时间:2022-09-23 格式:PPT 页数:114 大小:2.98MB
下载 相关 举报
机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt_第1页
第1页 / 共114页
机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt_第2页
第2页 / 共114页
机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt_第3页
第3页 / 共114页
机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt_第4页
第4页 / 共114页
机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt_第5页
第5页 / 共114页
点击查看更多>>
资源描述

1、第6章 状态识别方法的原理 l 近邻决策算法l贝叶斯(Bayes)分类法2022-7-121机械故障诊断理论与方法第2篇 基于人工智能的故障诊断技术 l 对比分析法l 距离函数分类法l Fisher判别方法l 势能函数分类法l 基于粗糙集理论的诊断方法l 主成分分析及独立成分分析l 模糊诊断方法l 故障树分析法l 逻辑推理法l 灰色理论诊断法l 模型分析法工况监测与故障诊断 - 状态分类问题本章以状态监测识别为主,介绍几种常用方法的原理及其应用。如对比分析法模型分析法逻辑推理法贝叶斯(Bayes)分类法距离函数分类法模糊诊断故障树分析等l 概述2022-7-1221、两种诊断原理比较信号源传感

2、器信号采集及记录简易诊断统计量阈值趋势图正常状态或异常状态状态识别精密诊断信号分析典型故障的振动特征振动特征故障的类型、原因、部位等诊断决策模式识别图简易诊断与精密诊断过程比较2022-7-1232、模式(状态)识别方法原理模式识别:把待检模式Xt与k种典型故障模式X i(i=1,2,3,k)进行比较、分类的方法 。2022-7-124待检模式Xt典型模式X1典型模式X2典型模式X3模式识别(比较、分类)典型模式Xk图 模式识别方法原理2022-7-1253、模式识别方法-其理论基础是聚类分析法1)直接观察法(经验法):将待检模式的特征与典型模式的特征进行直观比较、分析后进行分类。2)计算机辅

3、助诊断法:有时序诊断法、模糊诊断法、灰色系统诊断法等,解决模式边界不太清晰问题。3)计算机自动识别法:又称诊断专家系统。由专家知识、各种故障全部诊断信息组成知识库,通过计算机自动识别和诊断的方法。2022-7-126在故障机理研究的基础上,通过计算分析、试验研究、统计归纳等手段,确定与各有关状态的特征作为标准模式(参考模式)。在机械设备运行过程中,选择某种特征量,根据其变化规律和参考模式比较比较,用人工分析方法,判别机械设备的运行状态。例如,在旋转机械运行过程中,人们常用频谱分析仪,分析振动信号幅值谱的谱峰及频率位置的变化,和标准模式对比,就可判断工况是否正常,甚至可以识别某些故障的原因。一、

4、对比分析方法一、对比分析方法 2022-7-127旋转机械的转子是一个转动体,由于加工误差、轴与轴承间间隙、材料质量不均、因结构设计造成转动体质量不均及加工装配误差等,当转子按一定转数旋转时,离心力很难避免。这种离心力激励着转子系统产生简谐振动,在谱图上的表征是有固定的工作频率 f 及其相应的谱峰。如果轴线不对中,就产生二倍频2f,且工作频率f 的幅值也会改变;2022-7-128该方法能否取得成功取决于两个条件两个条件:一是对人的技术水平依赖性很大,专业面要宽,对现有科学技术工具的原理要有一定的基础,能灵活使用计算机及仪器;二是对机器设备的物理背景或运行历史要有一定的了解。2022-7-12

5、9由n个特征参数组成的特征向量相当于n 维特征空间上的一个点。同类模式同类模式点具有聚类性,不同类不同类状态的模式点有各自的聚类域和聚类中心。如果事先知道各类状态的模式点的聚类域作为参考模参考模式式,则可将待检模式与参考模式间的距离作为判别函判别函数数,判别待检状态的属性。二、距离函数分类法二、距离函数分类法 2022-7-1210X ( x1 , x2 , xn )TDE2n ( xi zi )2 ( X Z )T ( X Z )i 11 欧氏距离(Euclidean distance)在欧氏空间中,设矢量和Z ( z1 , z2 , zn )T ,两点距离越近,表明相似性越大,则可认为属于

6、同一个群聚域,或属于同一类别,欧氏距离(Z为标准模式矢量,X为待检矢量。):2022-7-1211d 2Ax 1x 2d 10 10 2M几何概念如图DE2n ( xi zi )2 ( X Z )T ( X Z )i 12022-7-1212 w1 0wn 考虑到特征矢量中的诸分量对分类起的作用不同,可采用加权方法,构造加权欧氏距离。Dw2 ( X Z )T W ( X Z )式中W为权系数矩阵。当W为单位矩阵时即为上述等式W 0 w2当 w1、w2、wn 取不同值时,表明矢量中各个分量的作用不同。2022-7-12132 马氏距离(Mahalanobis distance)这是加权欧氏距离中

7、用得较多的一种,其形式为Dm2 ( X Z )T R 1 (X Z)R为 x与 z的互相关矩阵(协方差矩阵),即R XZ T马氏距离的优点是排除了特征参数之间的相互影响相互影响。2022-7-1214 2.5x nx g X 1 g 2 1 2 0.5x 1x 2 x X 1.5x 特征矢量的构成统计、时序模型参数特征频率其他特征量,如信息量等2022-7-1215基于局部Hilbert边际能量谱的特征能量法例: 基于局部Hilbert边际能量谱的故障诊断方法(1) 基于局部Hilbert边际能量谱的特征能量法输入输入振动振动信号信号HHT变换变换特征特征能量能量提取提取故障故障模式模式识别识

8、别马氏距马氏距离判别离判别函数函数2022-7-1216d i 计算待检信号特征值S x与各状态下的标准特征值之间的马氏马氏距离:Si 和Var (S i )各状态下相应的标准特征值和方差S x S iVar ( S i )2022-7-1217某型号滚动轴承标准特征值及其方差状态正常状态外圈故障内圈故障特征值0.8702.02310.058方差0.15990.91413.18052022-7-1218马氏距离函数诊断结果被检信号及状态(1)正常状态(2)正常状态(3)外圈故障(4)外圈故障(5)外圈故障(6)外圈故障(7)内圈故障(8)内圈故障(9)内圈故障(10) 内圈故障d10.5399

9、0.01697.79107.64543.58733.489864.165061.076931.052529.2741d21.35421.26280.10220.07670.63270.649810.13209.41744.16863.8577d32.91602.88972.49692.50432.70842.71330.38890.18331.32691.4163诊断结果正确正确正确正确正确正确正确正确正确正确2022-7-12192022-7-1220三、近邻决策算法三、近邻决策算法 最初的近邻法是由Cover和Hart于1968年提出的,随后得到理论上深入的分析与研究,是非参数法中最重要的

10、方法之一。u最近邻法最近邻法:nearest neighborhood classifier (nnc),将与测试样本最近邻样本的类别作为决策的结果决策的结果。u设样本集xi,i=1,2,n每个样本xi所属的类别均已知,对于状态模式点分别为k(k=1,2,m)的m分类问题,样本集中每类样本的个数为Ni个,i1,m,则可以规定第i类i的判别函数为: ( )min,1,.,kiiikgkNxxx|.|表示距离,或相似度。可以是欧式距离,曼哈坦距离,明考斯基距离等。2022-7-1221if ( )min( ) then jijiggxxxu最近邻法在原理上最直观,方法上也十分简单。u明显的缺点就是

11、计算量大,存储量大。(一)欧几里得距离欧式距离由对应元素间差值平方和的平方根所表示,即)()()(),(),(),(2222112121bnanbababnbbbanaaaxxxxxxbadxxxxxxxxnba维向量,两个和设有(二)曼哈坦距离对应元素间差值绝对值的和表示,即bnanbabaxxxxxxbad2211),(欧几里得距离与曼哈坦距离的共同点(1)即距离是一个非负的数值 (2)自身的距离为0 (3)即距离函数具有对称性 (4)即距离函数满足三角不等式 0),(bad0),(, 0),(bbdaad),(),(abdbad),(),(),(kbdkadbad距离计算方法距离计算方法

12、2022-7-1222uk-近邻法近邻法: 最近邻法的扩展,其基本规则是,在所有N个样本中找到与测试样本的k个最近邻者。u设样本集xi,i=1,2,n每个样本xi所属的类别均已知,对应得状态模式分别为k(k=1,2,m) ,不考虑样本的属性,在已知样本集中找出x的k个近邻,若k1,k2,km分别为k个近邻中属于1, 2 , n类的个数,则k-近邻规则的判别判别函数函数定义为 gi(x)=ki, i=1, 2,m。 若 则i(x)=max(x)jiggjxk-近邻一般采用k为奇数,跟投票表决一样跟投票表决一样,避免因两种票数相等而难以决策。2022-7-1223取k=5,在样本x的5近邻中形状为

13、“ ”的样本个数为3,形状为“ ”的样本个数为2,则测试样本x被归为“ ”形状所属的类别。x5-近邻规则x1ox22022-7-1224近邻法算法的改进u近邻法的一个严重问题是需要存储全部训练样本,以及繁重的距离计算量。u两类改进的方法:一种是对样本集进行组织与整理,分群分层,尽可能将计算压缩到在接近测试样本邻域的小范围小范围内,避免盲目地与训练样本集中每个样本进行距离计算。另一种则是在原有样本集中挑选出对分类计算有效的样本,使样本总数合理地减少,以同时达到既减少计算量,又减少存储量的双重效果。 2022-7-1225最近邻与最近邻与k-k-近邻法近邻法比较比较3-近邻最近邻2022-7-12

14、26表示,并有+=1。P(1 )P( 2 )机械设备运行和机械制造过程的状态都是一个随机变量,事件出现的概率在很多的情况下是可以估计的,这种根据先验知识对工况状态出现的概率作出的估计,称之为先验概率 j ( 1 , i , m )在工况监视过程中,主要是判别工况正常与异常正常与异常两种状态,它们的先验概率用 P(1 ) 和 P( 2 )四、贝叶斯四、贝叶斯(Bayes)(Bayes)分类法分类法2022-7-1227p(x/1 )正常正常状态的类条件概率密度;p(x/ 2)异常异常状态的类条件概率密度;则Bayes公式有p( x i ) P( i )P( i x) 2 p( x j ) P(

15、j )j式中 P( i / x) 表示已知样本条件下, i 出现的概率,称为后验概率后验概率。2022-7-1228对两类状态有p( x 1 ) P( 1 )2P( 1 x) p( x j ) P( j )jp( x 2 ) P( 2 )2P( 2 x) p( x j ) P( j )j 最小错误率的贝叶斯决策规则P( 1 / x) P( 2 / x)P( 1 / x) P( 2 / x )x 1x 22022-7-1229Bayes判别方法是基于最小错误率,错误率是分类性能好坏的一种度量,它是指平均错误率而言,用P(e)表示,其定义为: P(e) P(e, x)dx P(e / x) p(

16、x)dx2022-7-1230五、五、FisherFisher判别方法判别方法 适用于指标为定量指标的两类判别(或多类判别)nFisher判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的分开,然后再选择合适的判别规则,将新的样品进行分类判别。2022-7-1231FisherFisher判别法判别法(先进行投影先进行投影) 所谓Fisher判别法,就是一种先投影的方法。 考虑只有两个(预测)变量的判别分析问题。 假定这里只有两类。数据中的每个观测值是二维空间的一个点。见图。 这里只有两种已知类型的训练样本。其中一类有38个点(用

17、“o”表示),另一类有44个点(用“*”表示)。按照原来的变量(横坐标和纵坐标),很难将这两种点分开。 于是就寻找一个方向,也就是图上的虚线方向虚线方向,沿着这个方向朝和这个虚线垂直的一条直线进行投影会使得这两类分得最清楚两类分得最清楚。可以看出,如果向其他方向投影,判别效果不会比这个好。 有了投影之后,再用前面讲到的距离远近的方法来得到判别准则。这种首先进行投影的判别方法就是Fisher判别法。 2022-7-1232两类Fisher判别示意图YXL=b1X+b2YG1G22022-7-12331. Fisher判别的原理(两类判别)1122 mmZC XC XC X2022-7-1234A

18、B22AB (6-5-1)ZZSS2022-7-12352022-7-12362022-7-1237AoooxxxxxxxxxxxxxxxxxBxxmmQ分界线起点 sb)ooooooo oo oo o o oo o o o oo o o o oo o o o o oo o o o oo o o o o oo o o o oo o o oo oooxQox oo oo xox 21sxox x六、势能函数分类法六、势能函数分类法 2022-7-1238 势能函数的含义是把模式点看成能量源,其能量由势能函数描述 正常工况模式样本聚类性好,在聚类中心A附近,模式点密集密集,由势能累积的能量多,能量

19、大,势能累积形成能量峰高。离开聚类中心远,模式样本分布稀疏,累积的能量峰相对较低 异常工况模式点的分布更为稀疏稀疏,能量峰低。两类状态的能量场交叉,所形成的峰谷自然把类别不同的状态分开,这就是用势能构成判别函数的概念。K( X, X k ) 2i i X i X k i 1任意一点的势能函数可用下式表示( i X 为归一化正交函数 )2022-7-1239第6章 状态识别方法的原理 l 近邻决策算法l贝叶斯(Bayes)分类法2022-7-1240机械故障诊断理论与方法第2篇 基于人工智能的故障诊断技术 l 对比分析法l 距离函数分类法l Fisher判别方法l 势能函数分类法l 基于粗糙集理

20、论的诊断方法l 主成分分析及独立成分分析l 模糊诊断方法l 故障树分析法l 逻辑推理法l 灰色理论诊断法l 模型分析法机器运行过程的动态信号及其特征值都具有某种不确定性,如偶然性和模糊性。如故障征兆特征用许多模糊的概念来描述,如“振动强烈”、“噪声大”,故障原因用“偏心大”、“磨损严重”等。同一种机器,在不同的条件下,由于工况的差异,使机器的动态行为不尽一致,人们对同一种机器的评价只能在一定范围内作出估计,而不能作出明确的判断,还有不同的技术人员由于种种原因,这些都导致对同一台机器的评价得到不确切的结论。七、模糊诊断方法七、模糊诊断方法2022-7-1241以模糊数学为基础,把模糊现象与因素间

21、关系用数学表达方式描述、运算,即模糊诊断2022-7-1242 ( )x()x( x ) 1 exp( k( x a )2 ), x a隶属函数模糊数学将0、1二值逻辑推广到可取0,1闭区间中任意取值的连续逻辑,此时的特征函数称为隶属函数(x),它满足0 (x) 110ax0 x ax a0,( x ) 1,xa10 0, 0 x a升半正态分布升半矩形分布2022-7-1243 t)0很 好较 好一 般很 差x较差2022-7-1244 Rmn 模糊关系方程模糊关系方程为: B = RAR称为模糊关系矩阵 R1n R2 n R12R22Rm 2 R11 RR 21 Rm12022-7-124

22、5 特 征 矢 量 B A 故 障 模糊诊断准则最大隶属准则即取B中隶属度最大最大的元素1i m i max 1 , 2 , , m隶属于模糊子集 i ,即发生了第i 种故障2022-7-1246故障树分析法是把所研究系统的最不希望发生的故障状态作为故障分析的目标,然后寻找直接导致这一故障发生的全部因素,再找出造成下一事件发生的全部直接因素,一直追查到毋需再深究的因素为止。通常,把最不希望发生的事件称为顶事件,毋需再深究的事件称为底事件,介于顶事件与底事件之间的一切事件称为中间事件。用相应的符号代表这些事件,再用适当的逻辑门把顶事件、中间事件和底事件联结成树形图,这样的树形图称就称为故障树,用

23、以表示系统或设备的特定事件(不希望发生的事件)与它的各个子系统或各个部件故障事件之间的逻辑结构关系。八、故障树分析法八、故障树分析法2022-7-1247 应用故障树分析的步骤:1) 给系统以明确的定义,选定可能发生的不希望事件作为顶事件。2) 对系统的故障进行定义,分析其形成原因 (如设计、运行、人为因素等)。3) 作出故障树逻辑图。4) 对故障树结构作定性分析,分析各事件结构重要度,应用布尔代数对故障树简化,寻找故障树的最小割集,以判明薄弱环节。5) 对故障树结构作定量分析。如掌握各元件、各部件的故障率数据,就可以根据故障树逻辑,对系统的故障作定量分析。2022-7-12484531反应装

24、置2化学反应流程及控制系统示意图。系统由冷却装置2、供料装置4和卸压装置5组成。温度计1,压力计32022-7-1249危险状态&不 能正 常运 行不 能停 料卸 压装 置不 正常 1 1 11231:43:5为了使反应装置的冷却水温度、压力维持一定关系,可依靠温度计1与压力计3的输出信号,由计算机控制系统的调节器与控制信号调节冷却水量,并靠调节阀使化学反应维持在正常状态。若反应装置中的温度超标,温度计1显示工况不正常,操作员即关闭手动阀4,停止供料,防止系统出现危险。如果选择系统出现危险的状态作为顶事件顶事件(不希望发生事件),就可得到如图所示的故障树。2022-7-1250T&T 1112

25、2nn.与或门故障树a) 与门故障b) 或门故障树2022-7-1251、同心度不好滤油器堵塞液压动力源故障排油故障噪声压力脉动油泵运转故障泵轴端外泄油温过高无流量流量不足无压力压力不足噪声过大压力脉动大油泵运转不灵油泵咬死骨架油封磨损骨架油封被冲出液流损失大溢流阀调整不当油箱液面过低无流量造成溢流阀调压失灵吸油不畅吸油管路漏气溢流阀阀芯受阻油箱内有气泡发动机与泵轴的配合间隙过小油污染严重油封老化磨损油泵反转内泄严重油粘度过高溢流严重2022-7-1252、滤油器堵塞推顶部分故障推顶缸不动作推顶缸速度低推顶缸无力爬行及噪声换向不灵油泵无输出流量无压力机械故障油泵流量不足旁路流量过大系统压力过低

26、内泄严重空气混入机械摩擦较大换向控制失灵换向阀芯卡死油箱液面过低机械卡死溢流阀卸荷吸油不畅发动机转速过低溢流阀调压过低节流开口过大调压阀调压过低油封破坏严重换向阀内泄过大漏气吸油不畅润滑条件差2022-7-1253粗糙集的含义 粗糙集(RoughSets)理论是由波兰数学家Pawlak Z 于1982年提出的。 粗糙集方法是基于一个机构(或一组机构)关于现实的大量数据信息,以对观察和测量所得数据进行分类的能力为基础,从中发现、推理知识和分辨系统的某些特点、过程、对象等的一种方法。 经过二十多年的发展以及研究的深入,粗糙集方法在理论和实际应用上都取得了长足的发展。在知识发现、数据挖掘、模式识别、

27、故障检测、医疗诊断等领域得到了广泛应用。九、基于粗糙集理论的诊断方法九、基于粗糙集理论的诊断方法 2022-7-1254粗糙集理论在故障诊断中的作用 在数据预处理过程中,粗糙集理论可以用于对特征更准确对特征更准确的提取的提取 在数据准备过程中,利用粗糙集理论的数据约简特性,对对数据集进行降维操作。数据集进行降维操作。 在数据挖掘阶段,可将粗糙集理论用于分类规则的发现用于分类规则的发现。 在解释与评估过程中,粗糙集理论可用于对所得到的结果对所得到的结果进行统计评估进行统计评估。2022-7-1255 粗糙集理论是一种处理不精确、不确定与不完全数据的新的数学方法。由于它在机器学习与知识发现、数据挖

28、掘、决策支持与分析、专家系统、归纳推理、模式识别等方面的广泛应用广泛应用,现已成为一个热门的研究领域。 RS理论主要兴趣在于它恰好反映了人们用Rough集方法处理不分明问题的常规性,即以不完全信息或知识去处理一些不分明现象的能力。或依据观察,度量到的某些不确定的结果而进行分类数据的能力。粗糙集理论的基本概念2022-7-1256粗糙集理论的基本概念 RS理论认为知识即是将对象进行分类的能力,假定我们起初对全域里的元素(对象)具有必要的信息、或知识,通过这些知识能够将其划分到不同的类别。若我我们对两个元素具有相同的信息,则它们就是不可区分的们对两个元素具有相同的信息,则它们就是不可区分的(即根据

29、已有的信息不能够将其划分开)。显然这是一种等价关系。不可区分关系是不可区分关系是RSRS理论最基本概念理论最基本概念。在此基础上引入了成员关系、上近似和下近似等概念来刻划不精确性与模糊性。2022-7-1257样本 粗糙集方法处理 具有优化指标的样本 评审样本学习样本 数据预处理(粗糙集方法、模糊集方法)模糊、粗糙推理神经网络遗传算法智能信息系统2022-7-1258不可分辨关系 给定一个有限的非空集合U称为论域。任何子集X U,称为U中的一个概念或范畴。U中的任何概念族称为U的抽象知识,简称知识。设R是U上的一个等价关系,U|R表示R的所有等价关系构成的集合,xR表示包含元素 x U的R等价

30、类。 设R是U上的一族等价关系,若P R,且P ,则P(P中所有等价关系的交集)也是一个等价关系,称为P上的不可分辨关系,用ind(P)来表示,即: (6-9-1) ( ),:,ind Px yUUf x afy a aP2022-7-1259 不可分辨关系是物种由属性集P表达时,论域U中的等价关系。U|ind(P)表示由等价关系ind(P)划分的所有等价类,且将其定义为与等价关系P的族相关的知识,称为P基本知识。同时,也将U|ind(P)记为U|P,ind(P)的等价类称为关系P的基本概念或基本范畴。 不可分辨关系2022-7-1260 设R为U上的一族等价关系。R将U划分为互不相交的基本等

31、价类,二元对K=(U, R)构成一个近似空间(Approximation Space)。设X为U的一个子集,a为U中的一个对象,aR表示所有与a不可分辨的对象所组成的集合,即a决定的等价类,可表示为: ,y x yind R Ra等价类2022-7-1261例题1R1(温度)R2(压力高否)D(流量超过临界)X1正常是否x2高是是x3高是是x4正常否否x5高高否否否否x6高高否否是是x7高高否否是是x8正常否否取B为各种属性组合, 则得到不同等价类,取B=A则等价类为:x1,x2,x3,x4,x8,x5,x6,x72022-7-1262 当集合X能表示成基本等价类组成的并集时,则称集合X是R可

32、精确定义的,称作R精确集;否则,集合X是R不可精确定义的,称作R非精确集或R粗糙集。对于粗糙集可近似利用两个精确集,即下近似和上近似来描述。 X关于R的下近似(Lower Approximation)定义为: 是由那些根据已有知识判断肯定肯定属于X的对象所组成的最大的集合,也称为正域正域。 :RR XaUaXR X上近似和下近似2022-7-1263 X关于R的上近似(Upper Approximation)定义为: 是所有与X相交非空的等价类aR的并集,是那些可能可能属于X的对象组成的最小集合,也称为负域负域。 :RR XaUaX )(xR上近似和下近似2022-7-1264 称为X的R边界

33、域; 称为X的R正域; 称为X的R负域。 显然, 。 若 ,即 , 称集合X为R可精确定义的,称作R R精确集精确集;否则,集合X是R不可精确定义的,即 称作R R非精确集或非精确集或R R粗糙集粗糙集。 XRXRXbnRposR XR XnegR XUR XR XposR XbnR XR XR XbnR X R XR X边界域、正域、负域2022-7-1265 当且仅当 ,X是精确集; 当且仅当 ,X是粗糙集; 精确集与粗糙集=R XR XR XR X2022-7-1266 假定有一个信息系统, 有两个属性. 属性一有5个值, 属性二有6个值. 现在有一个要近似的集近似的集合合, 在图中用红

34、色的圆表示.例题22022-7-1267仅使用第一个属性第一个属性进行划分的情形. 正区域为空. 蓝色区域为负区域.2022-7-1268使用两个属性两个属性进行划分的情况加入第二个属性负区域正区域正区域( (下近似下近似) )2022-7-1269边界区域上近似上近似综合表示2022-7-1270 边界的存在导致集合的不精确,边界区越大,精确性越低。在粗糙集理论中不精度的定义如下: 其中,card( )表示该集合的基数,精度 反映了对于集合X的知识的完全掌握程度。也即对U中的任意一个对象,根据R中各属性的属性值属性值确定它属于(或不属于)X的可信度。 RcardR XX,XcardR X确定

35、度(精度)RX2022-7-1271 对于每一个R且 ,有0aR(X)1。当aR(X)=1时,U中的全部对象根据R中各属性的属性值就可以确定其是否属于X,X为R的可定义集; 当0aR(X)1时,集合X有非空边界与,U中的部分对象根据R中各属性的属性值就可以确定其是否属于X,而另一部分对象不能不能确定其是否属于X,X为R的部分可定义集; 当aR(X)=0时,U中的全部对象都不能根据R中各属性的属性值确定其是否属于X,X为R的完全不可定义集。当X为R的部分可定义集或完全不可定义集时,X X为为R R的粗糙集的粗糙集。 确定度(精度)性质:XU2022-7-1272条件与决策 对于每个xU,定义函数

36、:dx:A V,其中dx(a)=a(x), 。函数dx称为决策表S中的决策规则,x是决策规则dx的标识。规则dx对条件属性集C的约束记为dx|C,dx对决策属性D的约束记为dx|D,dx|C和dx|D分别称为dx的条件和决策。aCD 2022-7-1273例题:磨屑烧伤状态识别 取磨屑流热辐射信号的均值均值、标准差标准差以及其一阶自回归其一阶自回归系数系数、二阶自回归系数二阶自回归系数为特征量,假设存在如表所示的决策表。 其中, 列表示属性,行表示对象,每行表示该对象的一条信息,其中条件属性c1表示磨屑流热辐射信号的均值,条件属性c2表示磨屑流热辐射信号的标准差,条件属性c3表示AR(2)模型

37、的一阶自回归系数,条件属性c4表示AR(2)模型的二阶自回归系数;ci=1表示属性值小, ci=2表示属性值大。决策属性d表示磨削工况,d=1表示工况正常,d=2表示砂轮磨钝,d=3表示工件烧伤。2022-7-1274表6.9.1 磨削故障识别决策表 属性序号c1c2c3c4d111121211111311121411111511111611211712221812222922123102222311221232022-7-1275表6.9.2 基于分类模式的决策表 属性序号c1c2c3c4d111121211111311211412221512222622123722223根据式(6.9.1

38、)对表6.9.1进行合并处理,所有条件属性值ci和决策属性值d都相同的样本元素约简为一个分类模式,将磨削故障识别的决策表转换转换为表6.9.2所示的只包含分类模式的决策表,该决策表中的每个元素代表一个分类模式,每个分类模式对应于样本空间的多个样本。表中序号4、5对应的规则条件相同,但是决策不同规则条件相同,但是决策不同,即: d4|C= d5|C, d4|D= d5|D,因此,决策表6.9.2是不相容决策表。2022-7-1276十、主成分分析及独立成分分析十、主成分分析及独立成分分析通过多个传感检测得到的设备状态信息彼此之间往往高度相关,尽管更多更多的信息可以减少减少系统状态的不确定性,提高

39、诊断精度,但是大量的冗余信息也给故障分类带来了更大的复杂度。因此,消除信息冗余,提取对故障分类最为有效的特征以改善故障诊断系统的效率一直是人们追求的目标之一, 主成分分析主成分分析(PCA,Principal Components Analysis) 和 独立成分分析独立成分分析(ICA,Independent Component Analysis) 就是其中两种较为有效的方法。2022-7-1277对这两个相关变量所携带的信息进行浓缩处理。假定只有两个变量x1和x2,从散点图可见两个变量存在相关关系,这意味着两个变量提供的信息有重叠。主成分分析的基本思想 (以两个变量为例)如果把两个变量用一

40、个变量来表示,同时这一个新的变量又尽可能包含原来的两个变量的信息,这就是降维降维的过程2022-7-1278椭圆中有一个长轴和一个短轴,称为主轴。在长轴方向,数据的变化明显较大较大,而短轴方向变化则较小较小如果沿着长轴方向设定一个新的坐标系,则新产生的两个变量和原始变量间存在一定的数学换算关系换算关系,同时这两个新变量之间彼此不相关,而且长轴变量携带了大部分的数据变化信息,而 短轴变量只携带了一小部分变化的信息(变异) 此时,只需要用长轴方向的变量就可以代表原来两个变量的信息。这样也就把原来的两个变量降维降维成了一个变量。长短轴相差越大,降维也就越合理主成分分析的基本思想 (以两个变量为例)2

41、022-7-1279多维变量的情形类似,只不过是一个高维椭球,无法直观地观察每个变量都有一个坐标轴,所以有几个变量就有几主轴。首先把椭球的各个主轴都找出来,再用代表大多数数据信息的最长的几个轴作为新变量,这样,降维过程也就完成了。找出的这些新变量是原来变量的线性组合,叫做主成分叫做主成分主成分分析的基本思想 (以两个变量为例)2022-7-1280主成分分析的基本原理 假定有样本X,每个样本共有p个特征,构成一个np阶的数据矩阵npnnppxxxxxxxxxX212222111211 2022-7-1281 当p较大时,在p维空间中考察问题比较麻烦。 为了克服这一困难,就需要进行降维处理,即用

42、较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。主成分分析的基本原理 2022-7-1282 定义:记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标pmpmmmppppxlxlxlzxlxlxlzxlxlxlz22112222121212121111. 系数lij的确定原则: zi与zj(ij;i,j=1,2,m)不相关;主成分分析的基本原理 2022-7-1283 z1是x1,x2,xP的一切线性组合中方差方差最大者最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最

43、大者方差最大者; zm是与z1,z2,zm1都不相关的x1,x2,xP, 的所有线性组合中方差最大者方差最大者。 则新变量新变量指标z1,z2,zm分别称为原变量原变量指标x1,x2,xP的第1,第2,第m主成分。 主成分分析的基本原理 2022-7-1284 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 , p)在诸主成分zi(i=1,2,m)上的荷载 lij( i=1,2,m; j=1,2 ,p)。 从数学上可以证明,它们分别是相关矩阵m个较大的特征值特征值所对应的特征向量特征向量。 2022-7-1285主成分分析的计算步骤 1 计算相关系数矩阵计算相关系数矩阵

44、 rij(i,j=1,2,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为pppppprrrrrrrrrR212222111211nknkjkjikinkjkjikiijxxxxxxxxr11221)()()(2022-7-12862 2 计算特征值与特征向量计算特征值与特征向量 解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ; 0RI021p 分别求出对应于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j个分量。i), 2 , 1(pieiie112pjijeijeie2022-7-1287 计算主成分贡献率及累计贡献率 贡献率),2, 1

45、(1pipkki累计贡献率 ),2, 1(11pipkkikk 一般取累计贡献率达85%95%的特征值所对应的第1、第2、第m(mp)个主成分。m,21 计算主成分载荷 ), 2 , 1,(),(pjiexzplijijiij2022-7-1288第6章 状态识别方法的原理 l 近邻决策算法l贝叶斯(Bayes)分类法2022-7-1289机械故障诊断理论与方法第2篇 基于人工智能的故障诊断技术 l 对比分析法l 距离函数分类法l Fisher判别方法l 势能函数分类法l 基于粗糙集理论的诊断方法l 主成分分析及独立成分分析l 模糊诊断方法l 故障树分析法l 逻辑推理法l 灰色理论诊断法l 模

46、型分析法独立成分分析法(ICA,Independent Component Analysis)的历史 是90年代后期发展起来的,是盲信号处理的一种 。 ICA是盲信号处理的一个组成部分,20世纪90年代后期(1986、1991)发展起来的一项新新处理方法,最早是针对“鸡尾酒会问题”这一声学问题发展起来的。( )S tH( )X t信道2022-7-1290独立成分分析的鸡尾酒会问题鸡尾酒会问题: 从嘈杂的人声中提取所关心对象的声音。ICA一种盲源分离的方法2022-7-1291根据源信号的统计特性,仅仅由观测的混合信号恢复(分离)出未知原始源信号的过程雷达、声纳、通信、语音处理、地震预报和生物

47、医学等“盲”源信号不可观测混合系统的特性事先不可知盲源分离(Blind Source Seperation)独立成分分析2022-7-1292信号的分离信号的分离盲源分离(Blind Source Seperation)2022-7-1293独立成分分析的模型与假定n设某个混合系统由个k传感器和m个信号源组成,其混合模混合模型型可以表述如下: (6.9.2) 其中, n为了保证上式的可分解性。需有如下的假设限制(约束条件) :p 1.每个源信号之间是统计独立的,其联合概率密度函数联合概率密度函数可分解为边缘密度的乘积。p2.混合矩阵 ,为列满秩的矩阵,即rank( )= 。p3.在 的分量中,

48、服从高斯分布的分量不超过一个。12 ( ), ( ), ( )Tks t s ts ts12 ( ),( ),( )Tmx t x tx tx(t)=(t)xAs121122( ,.,)( )().()nnnP s ssp s p sp sm nAR Ak( )s t2022-7-1294由(6.9.2)可见,信号S放大 k 倍与A的相应列缩小k倍的结果相同,从而决定了ICA得到的信号存在强度的不确定性。为此, 在求解时往往把观测信号先转化为有单位协方差的信号,即在ICA之前先有一个白化过程白化过程。 设信号向量y的联合概率密度为p(y),而每一个信号成分的概率密度为p(yi),则信号向量的互

49、信息互信息可以表示为:当各个信号成份相互独立相互独立时, 则 I(y)=0 。p(y)=Mi=1p(yi) 2022-7-1295ICA的目的是:在我们不知道混合矩阵的情况下,寻找线性线性映射映射w w,从观测信号中提取不能被直接观测的原信号,这里把它记为: y=wx=wAsy=wx=wAs2022-7-1296(1)互信息极小判据MiiiiiiiiiiiiiiiiiiykkkkkCpI12222674481)(互信息极小简化成了四阶累积量最大,从而可以通过对四阶累积量的计算,实现独立成份的分离。(2)信息极大判据理论分析表明, 如果把完成ICA的过程用一个运算网络表示,并在此网络的输出端输出

50、端, 引入相应的信源的累积分布函数为变换函数的一个非线性环节, 则的熵最大就等效于式(6.9.3)互信息极小 。独立成分分析的基本理论(目标函数)(6.9.3)2022-7-1297(3)极大似然估计判据 当N足够大时,其对数似然概率收敛于它的期望期望 上式可改写为: NtTwtxpNwL1);(log1lim)(dxwxpxpwL);(log)()(dxwxpxpxpdxxpxpwL);()(log)()(log)()();(|)()(wxpxpDxH 极大似然估计的目的是通过对观测模型式x=Asx=As进行估计,得到潜在的信号S,利用 即,可通过极大似然估计判据 提取独立成份2022-7-

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(机械故障诊断学-钟秉林-第6章状态识别方法原理课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|