• 工作总结
  • 工作计划
  • 心得体会
  • 述职报告
  • 事迹材料
  • 申请书
  • 作文大全
  • 读后感
  • 调查报告
  • 励志歌曲
  • 请假条
  • 创先争优
  • 毕业实习
  • 财神节
  • 高中主题
  • 小学一年
  • 名人名言
  • 财务工作
  • 小说/有
  • 承揽合同
  • 寒假计划
  • 外贸信函
  • 励志电影
  • 个人写作
  • 其它相关
  • 生活常识
  • 安全稳定
  • 心情短语
  • 爱情短信
  • 工会工作
  • 小学五年
  • 金融类工
  • 搞笑短信
  • 医务工作
  • 党团工作
  • 党校学习
  • 学习体会
  • 下半年工
  • 买卖合同
  • qq空间
  • 食品广告
  • 办公室工
  • 保险合同
  • 儿童英语
  • 软件下载
  • 广告合同
  • 服装广告
  • 学生会工
  • 文明礼仪
  • 农村工作
  • 人大政协
  • 创意广告
  • 您现在的位置:六七范文网 > 其它相关 > 正文

    基于自监督学习框架的发电柴油机故障诊断

    来源:六七范文网 时间:2022-12-17 22:20:02 点击:

    胡继敏,罗梅杰

    基于自监督学习框架的发电柴油机故障诊断

    胡继敏1,罗梅杰2

    (1. 海装驻上海地区第一军事代表室,上海,201913;
    2. 海军研究院,上海,200030)

    针对采集的船舶发电柴油机有标签状态数据集为小样本而造成的分类精度较低的问题,本文提出了一种新型的自监督学习框架用于机电设备的故障诊断,挖掘无标签数据集中的特征信息,以提高模型的分类能力。首先,通过KNN算法,将采集到的无标签数据集划分为正类样本和负类样本,并通过添加噪声的方法对原始数据进行数据增强,以此构造自监督任务。然后,设计基于卷积神经网络的编码器,根据正类、负类的伪标签,来提取无标签数据中的监督信息。最后,基于小样本的标签数据,通过编码器得到新的特征表征,对分类模型进行参数微调,提高模型精度。船舶柴油发电机故障实验证明,该自监督学习框架下的分类模型的准确率、精确率和召回率均高于直接用小样本标签数据训练的分类模型。

    船舶机电设备 小样本数据集 自监督学习 故障诊断

    船舶机电设备长时间在恶劣的环境下工作,运行工况复杂与设备频繁操作,极易发生故障。为保障其安全运行,需对机舱机电设备进行故障监测与诊断,以保证船舶运行安全运行。目前,根据数据采集系统提供的机电设备状态数据进行故障诊断主要依靠操作人员的专业知识进行判断,主观性较大,且要求丰富的工作经验。但机舱机电设备结构复杂、种类繁多,仅靠专家经验难以对复杂的状态进行判断。随着互联网和信息技术的快速发展,基于数据驱动的故障诊断技术得到了广泛研究。基于系统采集的大量设备状态数据,挖掘数据中存在的设备状态信息与特征,建立基于数据驱动的故障诊断模型,可实时进行机电设备的故障诊断。

    近年来,基于采集的大规模工业数据,机器学习和深度学习理论在机电设备的故障诊断研究中取得了广泛的应用。王瑞涵等人[1]引入孤立森林模型实现对船舶柴油机异常状态的监测。吉哲等人[2]通过采集的舰船机电设备的振动信号实现对常见的故障进行智能诊断。Yu等[3]利用开集故障诊断方法,提升卷积神经网络对训练集和测试集分布不一致情况下的状态分类。然而上述的基于数据驱动的故障诊断模型是一种监督学习,该模型的良好性能需要足够多的有标签数据集,在小样本数据情况下,该模型的性能会大大地降低。针对船舶数据采集系统采集的数据,对各状态数据进行手动标签需要人工参与和专业知识,耗时耗力,代价昂贵,难以扩大有标签数据规模。因此,采集的状态信息数据中未标记的数据量远远超过人工标记的数据集。目前针对采集的小样本有标签数据的模型训练主要基于数据增强,基于元学习、基于迁移学习及混合方法[4]。刘云鹏等人[5]为解决非均衡数据集对自适应算法的影响,提出一种结合AdaBoost和代价敏感的Adacost算法,提高了非均衡数据集下诊断模型的故障识别能力。Chen等人[6]利用混合采样方法对随机森林中的子模型提供均衡数据集,提高了随机森林处理不平衡数据集的故障诊断的稳定性和高效性。许自强等人[7]利用Wasserstein生成对抗网络产生更多的故障样本,实现样本库的类别均衡化目标,实现对电力变压器的故障样本增强。

    但是,现有的数据增强方法只能缓解而不能根本解决小样本有标签数据集。通过生成样本数量来扩大训练集,由于先验知识的不完美,生成的数据与真实数据之间的差异会导致概念偏移[8]。同时,如果生成模型训练过好,生成数据严格遵循了原小样本数据集的分布,缺失了样本的多样性。如果能够利用大量无标签数据中的信息,对模型进行预训练,进而通过少量有标签数据对模型参数进行微调,最终实现对数据的分类,是一种新思路[9]。因此,本文设计一种新型的自监督学习框架用于船舶机电设备的故障诊断,解决由标签数据量过少导致分类模型中大量参数难以拟合的问题。利用数据系统采集的大量无标签数据,设置合适的辅助任务,从无标签数据集中构建标签信息,从而训练一个能够提取数据中状态信息的编码器,通过该编码器为最终的分类任务提供信息,最终通过标签数据对分类器参数进行微调,解决标签数据规模较少的问题,实现基于小样本的船舶机电设备故障诊断。本文提出的自监督学习框架主要贡献如下:

    1)引入KNN算法,通过无监督学习,挖掘无标签数据中的数据信息,构建标签信息,将无标签数据集划分为正类样本与负类样本,为接下来的自监督学习提供标签信息。

    2)通过增加添加噪声的方式对原数据样本进行数据增强,设计一个多层卷积神经网络的编码器,充分挖掘无标签数据的内在信息,实现在正、负类标签下的无标签数据信息的对齐。

    3)将标签数据集输入至卷积神经网络的编码中,得到信息重表征,用新的特征向量训练随机森林分类器,进行参数微调,最终实现数据分类。

    图1 信号重表征

    1)正类、负类样本构造

    2)信息重表征

    3)损失函数设计

    编码器通过构造的正、负类样本进行训练。本文通过余弦相似度来表示同类数据增强后样本的相似度,公式为:

    同理,根据余弦相似度可以得到异类样本的相似性,公式为:

    编码器是通过最大化同类样本的相似性,最小化异类样本的相似性进行训练的。

    步骤1,通过无监督学习,将无标签样本分为正类、负类样本。采用的无监督学习为K最临近算法(K-Nearest Neighbor,KNN),通过计算不同样本间的距离,来寻找每个样本的邻近样本。本文中,的取值为2,计算公式为:

    图2 基于自监督学习框架的故障诊断

    3.1 数据描述

    实验对象为船用R6105AZLD型柴油发电机组[10]。采样频率为4 kHz,柴油机转速为1 500 r/min,以1 600个点为一个采样周期。实验共采集了五种状态数据,包括四种故障工况数据和一种正常工况数据。实验数据描述如表1所示。实验采集的振动信号时域波形如图3所示。

    表1 五种振动信号实验数据集

    3.2 编码器参数设置

    本文编码器选择卷积神经网络模型。卷积神经网络为两层卷积层,两层池化层,一层全连接层。池化层的操作为最大池化,卷积层中的激活函数为ReLu,优化器为Adam。经反复实验,确定该编码器的迭代次数与学习率,最终迭代次数为200次,学习率为0.01。具体参数如表2所示:

    表2 卷积神经网络结构相关参数设置

    3.3 性能分析

    本文所提出的基于自监督学习框架的柴油发电机故障诊断框架中分类器选择的是随机森林模型。随机森林模型通过组合多个决策树模型,来提高模型的分类精度和泛化能力。在随机森林模型中,通过Bagging法,在原始数据集中有放回的对新样本进行分类,再用多数投票或者对输出求均值的方法统计所有分类器的分类结果,结果最高的类别即为最终标签。这种随机性导致随机森林的偏差会有稍微的增加(相比于单一决策树),但是由于随机森林的“平均”特性,会使得它的方差减小,而且方差的减小补偿了偏差的增大,因此总体而言是对故障模型更好的处理。

    将设计的自监督学习框架与其他分类算法进行对比,对比算法为支持向量机(Support vector machine, SVM),决策树(Decision Tree),BP神经网络(Back Propagation Neural Network,BPNN),随机森林(Random Forest,RF),卷积神经网络(Convolutional Neural Network,CNN)以及循环神经网络(Recurrent Neural Network, RNN)。除本文提出的自监督学习框架外,其他的模型均采有有标签数据集进行模型训练,数据如3.1节所描述。使用四个常见的评价指标:准确率(Accuracy)、精准率(Precision)、以及召回率(Recall)对各个算法的性能进行分析,公式如下:

    式中,True Positive(真正,)表示将正类预测为正类的数目、True Negative(真负,)表示将负类预测为负类的数目、False Positive(假正,)表示将负类预测为正类的数目、False Negative(假负,)表示将正类预测为负类的数目。

    本文中,训练⁃测试重复实验 30 次,最终以平均准确率、平均精确率和平均召回率作为模型的性能指标,以降低随机性对分类模型的干扰。表10表示各个分类模型的性能。SVM模型然在解决小样本、非线性的数据分类问题中具有优势,但是在本文研究的船舶柴油发电机故障诊断中,效果较差,分类准确率仅仅为48.27%,这是由于本文采集的柴油机振动信号纬度较高,超高纬度数据在对SVM模型训练时,参数不能得到最优解,因此分类效果最差。DT模型作为弱分类器,在这次的故障诊断任务中效果同样较差,各性能指标均达不到50%。RF模型的分类效果要好于SVM模型、DT模型和BPNN模型,这是由于RF模型是集成学习模型,通过集成多个决策树模型来训练得到一个性能更高的强分类模型,其准确率、精准率和召回率可以分别到达81.78%、82.72%和81.62%。针对振动信号这种高纬数据,深度学习发挥了比传统机器学习模型更加的性能。CNN模型和RNN模型可以达到85%以上的准确率,性能远远高于传统的机器学习模型,其中,CNN模型性能要优于RNN模型,其准确率、精准率和召回率可到达87.12%、88.79%和89.01%。但是,由于本文柴油机发电机的标签数据集样本过少,通过小样本数据对深度学习模型进行训练,而深度学习模型需要大量的数据进行参数调优,因此模型训练效果较差,不能对柴油发电机的运行状态进行精确识别。本文提出的自监督学习框架,通过设计的卷机神将网络编码器,对标签数据进行特征提取,再对随机森林分类器进行训练。该模型的比单一的随机森林分类器的性能提高众多,各性能指标均提高了超过了10%。同时,该自监督学习模型对比深度学习模型也有了一定的性能提升,通过采集的无监督数据进行训练编码器,进而对数据进行信息重表征,大大减少了有标签数据集数量的需要,弥补了深度学习模型需要大量数据集数量的弊端,最终的准确率,精准率和召回率可达到93.15%,93.29%和92.68%,各个模型性能指标如表3所示。

    表3 不同分类模型的性能指标

    为了进一步验证本文提出的自监督学习框架性能,通过改变不同训练集样本数量,来分析各个模型的分类准确率。不同训练样本数量下的各模型准确率如图4所示。SVM模型和DT模型随着训练样本数量的增多,其性能并没有明显的提升。但是随着训练样本的增多,BPNN、RF、CNN、RNN等模型的性能均有一定程度的提高。其中,BPNN模型性能提升最为明显,由60.39%提升至78.32%。本文使用的CNN模型和RNN模型在训练样本数量达到250后,其性能也有了明显的提升,分别可达到93.96%和94.91%。该实验证明,有标签数据样本数量的增多,可以极大程度上提升分类模型的性能。本文提出的自监督学习框架,在有标签训练样本数量增多后,其性能也有了一定程度的提高。当训练样本达到300时,其分类准确率可达到96.83%。

    图4 不同训练样本数量下的分类模型准确率

    针对船舶柴油发电机采集的状态数据大多数为无标签数据,有标签数据仅仅是小样本数据的问题,提出了基于自监督学习框架的船舶柴油发电机故障诊断,将采集到的有标签数据集和无监督数据集对分类模型进行联合训练。通过设计辅助任务标签,挖掘无标签数据样本中的特征表征作为监督信息,从而提高模型的特征提取能力。实验证明,在采集的柴油机发电机状态数据大量是无标签数据集的情况下,本文提出的自监督学习框架可提升分类模型的性能,模型具有更高的准确率,精确率和召回率,减少了对标签数据依赖。研究具有较强工程应用价值。

    [1] 王瑞涵, 陈辉, 管聪, 基于机器学习的船舶机舱设备状态监测方法[J]. 中国舰船研究, 2021, 16(01): 158-167.

    [2] 吉哲, 张松涛, 代春明. 基于机器学习的舰船机电装备故障诊断[J]. 船电技术, 2022, 42(2): 4.

    [3] Yu X, Zhao Z, Zhang X, 等. Deep-learning-based open set fault diagnosis by extreme value theory[J]. IEEE Transactions on Industrial Informatics, 2022, 18(1): 185-196.

    [4] 史家辉, 郝小慧, 李雁妮. 一种高效的自监督元迁移小样本学习算法[J]. 西安电子科技大学学报, 2021, 48(6): 9.

    [5] 刘云鹏, 和家慧, 许自强, 刘一瑾, 王权, 杨宁, 韩帅, 结合AdaBoost和代价敏感的变压器故障诊断方法[J]. 华北电力大学学报(自然科学版): 1-9.

    [6] Chen H, Jiang B, Lu N. A newly robust fault detection and diagnosis method for high-speed trains[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(6): 2198-2208.

    [7] 刘云鹏, 许自强, 和家慧, 王权, 高树国, 赵军. 基于条件式Wasserstein生成对抗网络的电力变压器故障样本增强技术[J]. 电网技术, 2020(04 vo 44): 1505-1513.

    [8] 吴兰, 王涵, 李斌全, 等. 基于自监督任务的多源无监督域适应法[J]. 浙江大学学报: 工学版, 2022, 56(4): 10.

    [9] Chen T, Kornblith S, norouzi M, 等. A simple framework for contrastive learning of visual representations[M]. ArXiv, 2020[2022-06-01].

    [10] 王瑞涵, 陈辉, 管聪. 随机卷积神经网络的内燃机健康监测方法研究[J]. 振动工程学报, 2021, 34(04): 849-860.

    Research on the fault diagnosis of the marine diesel generator based on self-supervised learning framework

    Hu Jimin1, Luo Meijie2

    (1. No. 1 Military Representative Office of the Navy in Shanghai District, Shanghai, 201913,China; 2. Naval research Institute, Shanghai, 200030, China)

    U672

    A

    1003-4862(2022)09-0019-06

    2022-06-03

    胡继敏(1985-),男,博士研究生,工程师。研究方向:舰船动力系统保障技术。E-mail: hujimin85111@163.com

    猜你喜欢 编码器准确率故障诊断 基于ResNet18特征编码器的水稻病虫害图像描述生成农业工程学报(2022年12期)2022-09-09比亚迪秦EV充电系统故障诊断与排除汽车实用技术(2022年16期)2022-08-31基于神经网络的船舶电力系统故障诊断方法舰船科学技术(2022年11期)2022-07-15WDGP36J / WDGA36J编码器Wachendorff自动化有限公司传感器世界(2022年3期)2022-05-24迈腾B81.8T起动机无法启动故障诊断分析汽车实用技术(2022年9期)2022-05-20乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析健康之家(2021年19期)2021-05-23多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析健康之家(2021年19期)2021-05-23不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨医学食疗与健康(2021年27期)2021-05-13基于Beaglebone Black 的绝对式编码器接口电路设计*数字技术与应用(2021年1期)2021-03-24颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察健康体检与管理(2021年10期)2021-01-03

    推荐访问:柴油机 发电 故障诊断