1、周瑞坤周瑞坤魏宇涛魏宇涛曹凯曹凯2015-11-05基于数据驱动的故障诊断方法背景基于统计分析基于信号分析基于定量知识致谢故障诊断技术的现状 近20年来,现代化工、冶金、机械、物流等工业呈现大型化、复杂化发展的新趋势,这些大型复杂化工业过程的一个共同点就是一方面无法依靠传统方法建立精确的物理模型,另一方面产生大量反应过程运行机理和运行状态的数据,由于实际限制、成本优化、技术商机等因素的考量,如何利用这些数据来满足日益提高系统可靠性要求已经成为亟待解决的问题。基于数据驱动的故障检测技术,实现了大型复杂系统需要监控的变量大幅度增加和获得的大型数据和小型简单过程相比呈量级增长的需要。分类故障诊断方法
2、可以分为三类:基于数据故障诊断方法 基于数据驱动故障诊断方法可以看做是基于数据驱动的控制优化方法的一个子领域,其核心思想是如何利用受控系统的在线和离线数据,该方法所采用的数据来源于当前采样的在线数据和系统存储的大量历史离线数据。所以,明确离线、在线的区别和对于数据的要求,是实现数据利用的第一步。基于数据驱动的故障诊断方法可作为基于机理模型方法的重要补充,目前采用的分布式控制系统(DCS)可以提供一个用于全局管理监控的平台,用高质量的过程数据进行过程优化和监控。基于统计分析基于统计分析的方法主要依靠分析过程数据统计量,从其中的变化提取特征。应用统计理论进行故障诊断的前提是系统中必须出现故障,否则
3、过程数据的特征统计量只能在一定的、可以接受的范围内波动。虽然某个变量每次观测的具体数值不能准确预测,但其平均值和方差等特征统计量会保持不变,这种特性成为特征统计量的可重复性,利用该重复性可以针对特定变量设定特定的门限值,从而有效地检测出异常状态。基于PCA基于规则变量基于PLS基于规则变量基于Fisher判别基于Fisher判别基于PCAPCA技术将系统高维历史数据组成矩阵,进行一系列矩阵运算后确定若干正交向量,历史数据在这些向量上的投影反映数据变化最大的几个方向,舍去数据变化较小的方向,由此可将高维数据降维表示.PCA降维自相关性 对于间隔较短的优化工程,除了考虑不同变量之间的相关性,还要考
4、虑自相关性。方法:采用动态的PCA技术,构造一个t时刻和历史数据的训练矩阵。利用PCA技术降维后,通常只需23维即可反映历史数据的大部分变化方向,进而从海量数据中抓住主要部分,极大简化数据利用。111212122212mmnnnmxxxxxxXxxx11211TTTttt hTTTttt hTTTt h nt h nt nxxxxxxXxxx 基于PCAPCA综述与扩展从以上可以看出,PCA本质上是对历史数据集所构成的输入空间作线性变换,使的它只对服从高斯分布数据特征的提取效果明显,但在多数情况下数据集具有任意分布的特点,特别是在非线性结构和不能用线性分类的情况下,传统PCA方法显得力不从心。
5、KPCA是一种非线性是一种非线性PCA技术,技术,首先通过一个非线性映射函首先通过一个非线性映射函数数将历史数据映射到特征将历史数据映射到特征空间空间F的数据空间中;然而对的数据空间中;然而对F中数据集运用中数据集运用PCA技术进行技术进行数据分类。数据分类。KPCA的关键在于,的关键在于,通过预选的核函数代替映射通过预选的核函数代替映射函数函数作用时,要进行内积作用时,要进行内积运算,不用必须找到运算,不用必须找到,将,将PCA方法扩展到基于神经网方法扩展到基于神经网络的非线性络的非线性PCA,在某些数,在某些数据具有非线性的情况下,非据具有非线性的情况下,非线性线性PCA神经网络比传统神经
6、网络比传统PCA能够更多地捕捉到数据变化。能够更多地捕捉到数据变化。PLSPLS方法相比于PCA的优缺点 PCA PCA方法找出训练数据方法找出训练数据X X变化最变化最大的几个方向,代表这几个方向大的几个方向,代表这几个方向的向量组成装载矩阵对新观测数的向量组成装载矩阵对新观测数据进行归类,从而到故障分类的据进行归类,从而到故障分类的作用。作用。PLS PLS方法通过最大化方法通过最大化X X和和Y Y之间之间的协方差来确定装载向量,这样的协方差来确定装载向量,这样找出的的装载向量能够准确地表找出的的装载向量能够准确地表现不同故障差异,利于进行分类。现不同故障差异,利于进行分类。不足之处:是
7、装载向量只反映不足之处:是装载向量只反映了了X X变化最大的几个方向,当这变化最大的几个方向,当这些方向不足以包含区分故障所需些方向不足以包含区分故障所需要的足够信息时,要的足够信息时,PCAPCA就不能起就不能起到故障分类的作用。到故障分类的作用。100010000100010000000001Y 在模式分类中,通常用“1”表示同类,“0”表示非同类,前n1行只有第1列元素为1,其余为0,表示有n1个数据属于故障类1,后N2行与前n1行数据线性无关,表示n2个数据属于故障类2,以此类推。在PLS方法中,行列重新排列,假设有p类故障,每类故障观测到的向量数分别为ni(1ip),X中的前n1行放置属于故障类1的观测数据,n2行放置故障类2的观测数据,以此类推,对应X选取的Y的一种形式如下:基于信号分析基于信号分析的故障诊断方法就是利用各种信号分析技术提取信号时域和频域的特征。小波变换S变换希尔伯特-黄变换(HHT)基于定量知识基于知识的故障诊断方法不需要定量的数学模型,利用人工智能技术,即通过教计算机如何学习、推理和决策等实现故障诊断。人工神经网络支持向量机模糊逻辑谢谢!