王村松(1990-), 男, 博士生, 从事数据驱动的故障预测与健康管理的研究, E-mail:
陆宁云(1977-), 女, 教授, 博士生导师, 从事数据驱动的故障诊断、故障预测与健康管理等研究, E-mail:
程月华(1977-), 女, 教授, 博士, 从事航天器故障预测、故障诊断与容错控制等研究, E-mail:
姜斌(1966-), 男, 教授, 博士, 从事故障诊断和容错控制、航空航天应用等研究, E-mail:
缺少先验知识和完备信息的设备健康评估一直是预测与健康管理(PHM)领域的难点问题.针对设备运行状态观测数据的无标签、不均衡、初值不确定性问题, 提出一种多变量深度森林的设备健康评估方法.首先, 提出一种基于相关性指标和趋势性指标的特征选择方法以去除冗余特征; 然后, 利用三维数据标准化和量子模糊聚类方法, 动态设定设备健康状态并且解决数据初值的不确定问题; 最后, 采用一种多变量深度森林分类器实现设备健康状态的离线训练与在线评估.案例分析结果验证了所提出的健康评估方法的有效性和可行性.
Equipment health risk assessment without prior knowledge and complete observation information is still a hard problem in the prognostic and health management (PHM) field. To solve the problems caused by unlabeled, unbalanced data under uncertain initial condition upon the health states of engineering equipment, a multivariate deep forest based health assessment method is proposed. Firstly, a correlation and trend metric based feature selection strategy is proposed to remove redundant features. Then, the three-dimensional data is unfolded to be a two-dimensional data, and a quantum fuzzy clustering is utilized to define the health states, which can overcome the problem of initial condition uncertainty. Finally, a multivariate deep forest classifier is adopted for offline training and online health assessment. Case study results show that the proposed health assessment method is effective and feasible.
航空航天装备结构精密复杂、对安全性和可靠性要求极为苛刻, 在极端使用环境下长时间连续工作过程中, 装备性能不可避免地产生退化, 极易引发各类故障, 威胁系统安全.以健康评估和故障预测为核心的预测与健康管理(prognostics and health management, PHM)技术, 是实现装备预测维护、保障系统可靠性的关键, 已成为航空航天领域的关注焦点.
健康评估的主要目的是评估一个组件, 一个子系统或整个系统当前的健康状态[
数据驱动的健康评估方法又可细分为3类[
现有的多变量方法需事先设定健康状态的类别个数, 然后动态地评估设备所处的健康状态, 然而很少涉及设备各个健康阶段及切换过程中存在的不确定性[
本文主要针对观测数据的不均衡问题、无健康状态标签问题和健康状态初值不确定和阈值不确定问题, 在现有多变量方法框架下提出一种数据驱动的健康评估新方法.主要的创新点在于: 1)将多个样本的数据描述为不等长三维矩阵并统一标准化处理, 解决健康状态初值不确定问题; 2)利用量子模糊聚类, 解决观测数据的无标签、不均衡问题; 3)采用深度森林分类算法, 实现设备所处不同健康阶段的在线概率型健康评估.
用于系统健康评估的观测数据理论上可分成4类[
通常, 对于可进行加速寿命实验的一些简单部件, 可以得到有标签、均衡的观测数据.但对于实际应用中的复杂工程设备, 观测数据大都是无标签、不均衡数据.这是因为:一方面, 人们很难事先得到某个观测时刻下准确的设备健康状态信息; 另一方面, 系统健康状态随时间的退化过程一般呈非线性, 观测数据中处于完全健康或轻微损伤状态下的数据量远远高于严重损伤和临近失效状态下的数据, 导致数据分布的不均衡性.
无标签问题导致一类有监督数据建模或机器学习算法很难直接适用于系统健康评估领域; 而不均衡问题会导致数量多的数据类淹没掉数量少的数据类, 使得传统分类或聚类算法效果不理想.目前, 不均衡分类问题可以通过人为调整数据分布或采用数据重采样技术得以解决, 本文中使用的随机森林算法是基于bagging的集成学习算法, 而bagging本质上是一种数据自助重采样技术.
健康评估方法在实际应用中面临的最大问题是多源不确定性问题[
1) 系统工作参数的不确定性:不同工作任务或工作模式导致的系统物理参数值的不确定性.
2) 系统模型的不确定性:因系统机理不明、全局强非线性以及模型简化等原因导致的系统模型不确定性.
3) 退化过程的不确定性:实际中, 即使是在相同条件下完成的加速寿命实验, 所产生的观测数据往往也具有不同的退化趋势.
4) 观测数据的不确定性:观测量在测量过程中存在各种不确定性.
5) 初始状态和观测时间的不确定性:对于连续的健康评估过程, 存在不同样本设备的初始健康状态不一致性(如
观测样本初始健康状态不确定性问题
6) 健康状态不同阶段的阈值不确定性:实际中, 健康阶段阈值不是固定不变的, 通常会随着时间而改变.
上述罗列的多种不确定性中, 2)和3)主要影响基于模型的健康评估方法, 4)~6)主要影响基于数据的健康评估方法.由于本文提出的方法属于数据驱动中的多变量方法, 主要考虑解决5)中的初始健康状态不确定性问题和6)中的阈值不确定性问题, 对测量本身带来的不确定性暂不作考虑.
假定有
全寿命周期设备观测数据的三维表示
为了更好地描述设备性能退化, 以开展健康评估研究, 理想的性能退化特征需具有同类个体普适性、性能退化一致性等.因此, 在对数据进行平滑处理的基础上, 本文利用相关性和趋势性两种指标进行特征选择.相关性指标反映了特征与时间的线性相关程度, 一定程度上体现了同类个体普适性.趋势性指标可以刻画出相似设备间退化特征的性能退化一致性.
1) 相关性指标.
本文采用斯皮尔曼等级相关系数.较其他两种相关分析方法(皮尔森和肯德尔相关性系数), 斯皮尔曼等级相关系数法是一种无监督的方法, 不在乎两个变量的总体分布形态和样本容量的大小.设备特征与时间之间的相关性的计算公式为
其中: Corr(
相关性指标取值在[-1, 1]内, 正值代表与时间正相关, 负值代表与时间负相关.相关性指标绝对值越大, 其与时间的线性相关性越大.
2) 趋势性指标.
本文定义了观测变量
若
根据相关性指标和趋势性指标可以实现设备性能退化的特征选择.如果观测变量
其中
针对退化数据存在的无标签、不均衡和不确定问题, 本文提出一种退化特征的健康状态分类方法, 主要包括三维数据的标准化和基于量子模糊聚类的健康状态标签定义.
经过2.1节的特征选择, 假设设备的观测变量由
其中:
针对观测数据存在的无标签和不均衡问题, 本文将量子聚类理论[
相对于硬分类方法, 量子模糊聚类是一种不需事先指定类别数的软分类方法, 聚类算法本身也可以消除阈值不确定性给后续健康评估带来的影响.因此, 基于量子模糊聚类的健康标签定义过程可以总结如下:
step 1:通过输入的数据集
其中:
step 2:根据模糊理论将分类问题看作下式中目标函数
其中:
求解该极值问题, 先构造拉格朗日函数, 令
step 3:利用
step 4:输出观测数据的健康标签Tag.
基于深度森林的健康评估框架[
类似于深度神经网络(DNN)层数的扩展, 深度森林[
本文采用深度森林算法是因为其相对于DNN方法具有超参数少、模型对超参数调节不敏感、根据结果精度自动扩展级联层数、可以用于小规模数据等优势.此外, 深度森林算法的一个重要优势是能够给出分类结果的概率值, 在健康评估中可以刻画不确定性.深度森林算法中, 决策树可以在特征空间中不断划分子空间, 并且为每个子空间打上标签, 在叶节点能够得到训练样本中不同类别的概率分布.最后, 在每个森林中通过对所有决策树的各类比例取平均, 输出整个森林中各类的比例,
基于深度森林的健康评估方法训练过程如
基于深度森林的健康评估算法训练过程
首先, 将输入的训练集划分成训练样本和验证样本, 并且类似于卷积神经网络(CNN), 利用滑动窗口对数据进行扫描切割; 然后, 在第1层中利用完全随机森林和随机森林进行训练, 并且计算OOB(out-of-bag)估计值; 最后, 进行森林级联层次的扩展, 计算健康评估精度并且给出相对应的类别概率信息, 如果评估精度有所提高则自动继续进行层次扩展, 否则终止层次扩展输出最终结果.本文将常用的分类准确率作为算法的评价指标.此外, 由于深度森林模型对超参数调节不敏感, 参照文献[
其中:
本文以航空发动机为例, 验证所提出的设备健康评估算法.航空发动机数据源自NASA故障预测研究中心公布的民用航空发动机全寿命周期数据集[
发动机主要部件[
本文采用的“FD001.txt”中的数据集包含了3个操作状态和21个传感器观测变量(见
传感器数据集描述
序号 | 符号 | 描述 | 单位 |
1 | | 风扇入口总温 | °R |
2 | | 低压压气机出口总温 | °R |
3 | | 高压压气机出口总温 | °R |
4 | | 低压涡轮出口总温 | °R |
5 | | 风扇入口压力 | psia |
6 | | 外涵总压 | psia |
7 | | 高压压气机出口总压 | psia |
8 | Nf | 风扇物理转速 | rpm |
9 | Nc | 核心机物理转速 | rpm |
10 | epr | 发动机压比(P50/P2) | — |
11 | Ps30 | 高压压气机出口静压 | psia |
12 | phi | 燃油流量与P30比值 | pps/psi |
13 | NRf | 风扇换算转速 | rpm |
14 | NRc | 核心机换算转速 | rpm |
15 | BPR | 涵道比 | — |
16 | farB | 燃烧室燃气比 | — |
17 | htBleed | 引气焓值 | — |
18 | Nf_dmd | 设定风扇转速 | rpm |
19 | PCNfR_dmd | 设定核心机换算转速 | rpm |
20 | W31 | 高压涡轮冷却引气流量 | lbm/s |
21 | W32 | 低压涡轮冷却引气流量 | lbm/s |
根据3.1节描述, 航空发动机退化数据集表示为
发动机1数据平滑示意图
首先, 利用式(1)分别计算各传感器变量与运行周期的相关性指标; 然后, 利用式(2)计算各变量的单调性指标; 最后, 满足式(3)和(4)的传感器观测变量4、7、11、12、15、20和21被保留下来, 数据可表示为
不同传感器变量相关性分析
退化特征数据集
本节首先对退化特征数据集按变量展开, 进行统一标准化, 解决初始状态不确定问题, 经过多次测试选择量子模糊聚类的波函数宽度调节参数
发动机81健康状态训练结果
发动机83健康状态训练结果
从
离线训练准确率
序号 | 深度森林 | ANN/% | SVM/% |
81 | 100 | 90.42 | 86.25 |
82 | 98.60 | 81.76 | 80.37 |
83 | 99.32 | 68.94 | 62.46 |
84 | 97.75 | 60.30 | 82.02 |
85 | 100 | 92.55 | 78.72 |
86 | 99.64 | 89.93 | 91.73 |
87 | 98.31 | 85.96 | 50.99 |
88 | 97.65 | 75.59 | 98.12 |
89 | 99.54 | 86.64 | 86.64 |
90 | 99.35 | 74.68 | 63.64 |
发动机93健康状态在线评估结果
本文针对设备观测数据的无标签、不均衡、初始状态不确定等问题, 提出了一种多变量深度森林的设备健康评估方法, 能够动态设定设备不同健康状态阈值, 给出上述问题的解决方法.案例结果表明, 本文提出的健康评估方法优于一些常用的健康评估方法, 如ANN和SVM等.更重要的是, 本文能够准确评估设备各阶段的健康状态并且给出不同阶段的分类概率结果.
本文方法应用的两个前提是: 1)有比较充足的全寿命周期退化数据样本集; 2)假定历史样本处于相同的工作工况.然而, 忽略了在缺少全寿命周期观测数据和处于不同工况下的设备健康评估, 在后续的研究中将重点考虑.此外, PHM技术的重要核心是对设备的故障预测, 它的主要目的是估计设备的故障趋势及剩余使用寿命, 未来将在本文的基础上对此进行重点研究.
责任编委:方华京.
姜斌, 吴云凯, 陆宁云, 等.高速列车牵引系统故障诊断与预测技术综述[J].控制与决策, 2018, 33(5): 841-855.
Jiang B, Wu Y K, Lu N Y, et al. Review of fault diagnosis and prognosis techniques for high-speed railway traction system[J]. Control and Decision, 2018, 33(5): 841-855.
Moghaddass R, Zuo M J. An integrated framework for online diagnostic and prognostic health monitoring using a multistate deterioration process[J]. Reliability Engineering & System Safety, 2014, 124: 92-104.
祁海铭, 程月华, 姜斌, 等.基于多状态故障的卫星姿态控制系统剩余寿命预测方法[J].南京航空航天大学学报, 2015, 47(1): 29-36.
Qi H M, Cheng Y H, Jiang B, et al. Residual life prediction of satellite attitude control system based on multi-state failures[J]. Journal of Nanjing University of Aeronautics & Astronautics, 2015, 47(1): 29-36.
Wang X L, Jiang B, Lu N Y, et al. Dynamic fault prognosis for multivariate degradation process[J]. Neurocomputing, 2018; 275: 1112–1120.
顾胜, 魏蛟龙, 皮德常.一种粒子群模糊支持向量机的航天器参量预测方法[J].宇航学报, 2014, 35(11): 1270-1276.
Gu S, Wei J L, Pi D C. Particle swarm optimization-fuzzy support vector machine based prediction of spacecraft parameter[J]. Journal of Astronautics, 2014, 35(11): 1270-1276.
Liao L, Köttig F. A hybrid framework combining data-driven and model-based methods for system remaining useful life prediction[J]. Applied Soft Computing, 2016, 44(C): 191-199.
Hong M, Wang Q, Su Z, et al. In situ, health monitoring for bogie systems of CRH380 train on Beijing–Shanghai high-speed railway[J]. Mechanical Systems & Signal Processing, 2014, 45(2): 378-395.
Javed K, Gouriveau R, Zerhouni N. State of the art and taxonomy of prognostics approaches, trends of prognostics applications and open issues towards maturity at different technology readiness levels[J]. Mechanical Systems & Signal Processing, 2017, 94: 214-236.
Tamilselvan P, Wang P. Failure diagnosis using deep belief learning based health state classification[J]. Reliability Engineering & System Safety, 2013, 115(7): 124-135.
Ramasso E, Rombaut M, Zerhouni N. Prognostic by classification of predictions combining similarity-based estimation and belief functions[C]. Proceedings of the 2nd International Conference on Belief Functions. Berlin: Springer, 2012: 61-68.
Javed K, Gouriveau R, Zerhouni N. A new multivariate approach for prognostics based on extreme learning machine and fuzzy clustering[J]. IEEE Transactions on Cybernetics, 2015, 45(12): 2626-2639.
Zhou H, Huang J, Lu F. Reduced kernel recursive least squares algorithm for aero-engine degradation prediction[J]. Mechanical Systems & Signal Processing, 2017, 95: 446-467.
Atamuradov V, Medjaher K, Dersin P, et al. Prognostics and health management for maintenance practitioners-review, implementation and tools evaluation[J]. International Journal of Prognostics & Health Management, 2017, 8: 1-31.
胡昌华, 施权, 司小胜, 等.数据驱动的寿命预测和健康管理技术研究进展[J].信息与控制, 2017, 46(1): 72-82.
Hu C H, Shi Q, Si X S, et al. Data-driven life prediction and health management: State of the art[J]. Information and Control, 2017, 46(1): 72-82.
Gouriveau R, Ramasso E, Zerhouni N. Strategies to face imbalanced and unlabelled data in PHM applications[J]. Chemical Engineering Transactions, 2013, 33: 115-120.
Sankararaman S. Significance, interpretation, and quantification of uncertainty in prognostics and remaining useful life prediction[J]. Mechanical Systems & Signal Processing, 2015, 52/53(1): 228-247.
Atamuradov V, Medjaher K, Dersin P, et al. Prognostics and health management for maintenance practitioners-review, implementation and tools evaluation[J]. International Journal of Prognostics & Health Management, 2017, 8: 1-31.
孙强, 岳继光.基于不确定性的故障预测方法综述[J].控制与决策, 2014, 29(5): 769-778.
Sun Q, Yue J G. Review on fault prognostic methods based on uncertainty[J]. Control and Decision, 2014, 29(5): 769-778.
Horn D, Axel I. Novel clustering algorithm for microarray expression data in a truncated SVD space[J]. Bioinformatics, 2003, 19(9): 1110-1115.
Bezdek J C. Pattern recognition with fuzzy objective function algorithms[J]. Advanced Applications in Pattern Recognition, 1981, 1171(22): 203-239.
Wang C S, Lu N Y, Cheng Y H, et al. Deep forest based multivariate classification for diagnostic health monitoring[C]. Proceedings of the 30th Chinese Control and Decision Conference. Shenyang: IEEE, 2018: 6233-6238.
Zhou Z H, Feng J. Deep forest[J]. National Science Review, 2018, DOI: 10.1093/nsr/nwy108.
Fan W, Wang H, Yu P S, et al. Is random model better? on its accuracy and efficiency[C]. Proceedings of the 3rd IEEE International Conference on Data Mining. Melbourne: IEEE, 2003: 51-58.
Breiman L. Random forest[J]. Machine Learning, Machine Learning, 2001, 45(1): 5-32.
Saxena A, Goebel K, Simon D, et al. Damage propagation modeling for aircraft engine run-to-failure simulation[C]. Proceedings of the 2008 International Prognostics and Health Management. Denver: IEEE, 2008: 1-9.
Frederick D K, DeCastro J A, Litt J S. User's guide for the commercial modular aero-propulsion system simulation (C-MAPSS)[Z]. NASA/ARL Technical Manual TM2007-215026, 2007.
Ramasso E, Rombaut M, Zerhouni N. Joint prediction of continuous and discrete states in time-series based on belief functions.[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics, 2013, 43(1): 37-50.