• 工作总结
  • 工作计划
  • 心得体会
  • 述职报告
  • 事迹材料
  • 申请书
  • 作文大全
  • 读后感
  • 调查报告
  • 励志歌曲
  • 请假条
  • 创先争优
  • 毕业实习
  • 财神节
  • 高中主题
  • 小学一年
  • 名人名言
  • 财务工作
  • 小说/有
  • 承揽合同
  • 寒假计划
  • 外贸信函
  • 励志电影
  • 个人写作
  • 其它相关
  • 生活常识
  • 安全稳定
  • 心情短语
  • 爱情短信
  • 工会工作
  • 小学五年
  • 金融类工
  • 搞笑短信
  • 医务工作
  • 党团工作
  • 党校学习
  • 学习体会
  • 下半年工
  • 买卖合同
  • qq空间
  • 食品广告
  • 办公室工
  • 保险合同
  • 儿童英语
  • 软件下载
  • 广告合同
  • 服装广告
  • 学生会工
  • 文明礼仪
  • 农村工作
  • 人大政协
  • 创意广告
  • 您现在的位置:六七范文网 > 其它相关 > 正文

    多域融合的高速列车维修性设计知识图谱构建

    来源:六七范文网 时间:2023-05-10 10:10:18 点击:

    郭 恒 黎 荣 张海柱 魏永杰 戴钺滨

    西南交通大学机械工程学院,成都,610031

    维修性设计是贯穿产品设计全过程的重要组成部分。我国高速列车体量大、品种多,在长达30年的运行周期里,会经受复杂的作用关系、地理气候及运用工况的考验,极易诱发各类故障,威胁运行安全[1],因此需要制定复杂的计划修、状态修及事后修等运行保障计划以保证列车运行安全。自2007年实施第六次铁路大提速以来,我国高速列车经过引进、消化、吸收、再创新,形成了CRH1、CRH2等系列产品并 逐步走到世界前列。但一方面由于设计时缺乏可信的维修性设计知识支持,另一方面高速列车运行、维修数据积累不足,且缺乏合理的运维知识沉淀形式,造成现阶段高速列车产品生命周期设计研发要素考虑不全面,难以为高速列车维修性设计提供“数据+模型+知识”[2],因此,将高速列车设计、故障、维修知识融合关联,使产品数据中的隐性知识显性化、数据知识标准化[3],是解决高速列车缺乏基于运维数据的维修性设计知识支持的有效方法。

    对于高速列车维修性设计这类开放知识领域,在设计域、故障域及维修域各领域数据与知识存在的基础上,构建融合多个领域的概念知识数据库能够为高速列车设计阶段提供设计活动所需的维修性设计知识。不同领域的概念关系及数据知识结构存在较大的差异,为了便于多领域知识的管理及使用,需要构建统一的多领域概念关系表达模型及跨领域数据共享体系,而将数据以语义结构存储,描述领域概念及领域概念之间关系的知识图谱可以实现各领域概念关系统一表达及数据知识结构化、可视化。但要构建适合高速列车领域的维修性设计知识图谱,需要重点考虑以下几点:①借助基于本体的知识图谱模式层如何描述表达高速列车各领域复杂的概念关系,构建跨领域概念关系融合的统一表达模型;
    ②从海量多源异构数据中如何高效地获取高速列车产品故障率、平均维修时间等维修性设计因素相关知识,形成知识图谱数据层;
    ③如何有效降低获取知识的冗余及错误,提高维修性设计知识质量;
    ④所构建的知识图谱如何支持高速列车维修性设计。

    随着人工智能、知识工程等技术的发展,越来越多的学者开始研究如何从数据、知识、模型三个方向探索解决产品过程、数据、知识分离等问题的方法[4]。针对跨领域概念关系表达问题,李佳静等[5]提出了基于本体的复杂产品多学科知识表达方法,形式化地表达了多学科设计知识及关系,解决了高速列车设计阶段多学科知识异构问题;
    针对跨领域概念关系复杂不易表述的问题,CHHIM等[6]提出了一种联合产品设计及制造过程两阶段的知识重用本体,清晰表达了领域概念之间的关系;
    针对海量异构数据人工提取有用知识困难的问题,在电力[7-8]及煤矿领域[9],研究人员通过自然语言处理技术从设备运维数据中抽取设备维修知识,构建了领域知识图谱,并通过知识融合方法减少了知识冗余及错误,高效率地获得了设备维护知识,提高了设备维护效率;
    针对知识图谱应用问题,蒲天骄等[10]描述了领域知识图谱的应用场景并构建了基于电力领域知识图谱的智能问答系统。

    现阶段部分学者在跨领域本体及领域知识图谱构建方面取得了不错的成果,但还未有将多域融合知识图谱应用于产品维修性设计。因此,本文提出多域融合的高速列车维修性设计知识图谱构建方法,对高速列车设计域、故障域及维修域的领域概念及数据进行分析研究,通过模式层构建、数据层构建、知识融合及存储完成多域融合的高速列车维修性设计知识图谱构建,采用多域本体融合、多域异构知识抽取、知识融合等技术解决高速列车多域数据异构、跨领域信息知识反馈较难的问题,并基于构建的知识图谱开发智能检索系统辅助设计人员进行产品维修性设计,提高高速列车产品的可维修性、可靠性,促进产品设计质量的进一步提高。

    知识图谱是以三元组“实体-关系-实体”的形式描述知识的概念及其相互关系的网状知识库[11]。知识图谱的逻辑结构分为模式层和数据层,如果将基于本体的知识图谱模式层看作房子的框架,那么知识图谱的数据层则是房子的内饰。框架决定建造房子的目的,而内饰决定房子的舒适性,即模式层决定知识图谱的用途,数据层决定知识图谱的知识质量。知识图谱构建一般有两种方式:自底向上和自顶向下[12]。

    目前在高速列车设计领域,相关知识关联研究还未涉及运维阶段,缺乏相应的技术来支持高速列车设计-故障-运维知识的有效关联及检索,因此,考虑运维数据集大小以及图谱的知识质量,本文提出自顶向下与自底向上结合的高速列车维修性设计知识图谱构建方法。维修性设计知识图谱构建流程如图1所示。

    步骤(1)在专家帮助下参考七步法[13]和IDEF5法[14]提出高速列车维修性设计知识本体构建方法自顶向下地构建模式层:确定高速列车维修性设计本体的领域范围及构建目的;
    构建各领域的概念层次及关系;
    采用概念语义解释机制,将高速列车多域本体融合问题转化为基于高速列车不同领域的概念语义关系判定,实现三个域的本体与其余两个本体的概念、关系匹配及融合,最终形成由多域本体融合的高速列车维修性设计知识本体并用protégé建模,完成高速列车维修性设计知识图谱模式层的构建。

    步骤(2)自底向上构建高速列车维修性设计知识图谱数据层。由于高速列车数据高保密性要求以及领域知识图谱数据较难获取,通过文献对比分析,本文选取了即使数据量相对较少也能达到高精确度的BERT(bidirectional encoder representations from transformers)-BiLSTM(bidirectional long short-term memory)-CRF(conditional random field)模型来进行命名实体识别。数据层构建分为以下三步:①模型训练及实体识别;
    ②基于模板的关系抽取;
    ③通过知识融合消除冗余、错误的知识。在实体识别阶段,还会发现模式层未定义的概念,经专家审核后,可以更新到知识图谱模式层,使模式层更加准确。

    步骤(3)将protégé中所构建的本体模型映射到Neo4j图数据库中,将多域数据经过知识抽取融合得到的高速列车维修性设计知识存储到Neo4j中,完成高速列车维修性设计知识图谱的构建。

    高速列车各领域所包含的领域概念十分复杂,且概念包含的语义逻辑关系及其相关属性又具有各自的特点。如“CRH3A”车型在以下三个领域都具有涵盖领域特点的概念关系及属性:在设计域,设计人员关注的重点在于该车型的设计属性、设计约束、零部件型号以及该车型设计的线路、速度等级等概念属性;
    在故障域,运行保障人员关注的是该车型的故障模式、故障等级以及采取何种运行措施能避免故障发生,保证产品的运行安全;
    而在维修域,维修人员关注的是发生故障的列车对应的维修等级、走行里程以及采取何种维修工艺能经济、快捷地使列车恢复其功能。这些概念与属性都与列车设计阶段维修性设计因素有关,而现阶段各领域数据相互独立,数据格式不统一,设计人员无法基于运维数据得到该产品的故障发生率、维修工时、维修成本等信息。对于设计人员来说,如何打破领域之间的概念关系壁垒,构建统一的多领域概念关系融合模型,实现多域数据基于概念关系的语义关联及结构化存储,是多域融合知识图谱构建的关键目的。

    为了让高速列车各阶段领域的结构、关系特征能够更准确清晰地表达出来,使高速列车设计、运行及维修过程在特征表达上更加地灵活,及时捕捉高速列车全生命周期阶段中的维修性设计知识,本文提出一种图2所示的高速列车多领域维修性设计概念分析表达模型。该分析表达模型主要对高速列车设计时、运行时以及维修时所包含的维修性设计知识概念进行表达,具有很好的适应性,提高了高速列车领域维修性设计知识表达的灵活性,降低了本体模型构建的成本。基于概念分析表达模型,本文首先构建了高速列车设计域、故障域及维修域维修性设计知识本体,以设计域及故障域维修性设计知识本体为例,采用巴科斯-诺尔范式(Backus-Naur form,BNF)对领域本体概念作进一步描述如下。

    图2 高速列车多领域维修性设计概念分析表达模型

    设计域:

    〈DesignDomainOntology〉::=[〈Product〉]{〈Design_Constraints〉〈Functional_Requirements〉〈Structure_Composition〉〈Designer〉}

    〈DesignDomainOntology〉::=[〈Product〉]{Type, Design_Attributes}

    故障域:

    〈FaultDomainOntology〉::=[〈Trouble_Location〉]{〈Fault_Product〉〈Fault_Cause〉〈Fault_Mode〉〈Structure_Composition〉〈Detection_Equipment〉〈Monitoring_Equipment〉}

    〈FaultDomainOntology〉::=[〈Fault_Product〉]{Production_Date,Running_Mileage,Type}

    在BNF范式中,概念描述的形式为〈类〉::=[〈父类〉]{〈子类1〉〈子类2〉…},〈类〉::=[〈父类〉]{属性1,属性2…},即〈DesignDomainOntology〉::= [〈Product〉]{Type, Design_Attributes}表示在设计域本体中的“产品”父类包含“型号”和“设计属性”两种属性。

    在完成三个域本体构建后,本文通过描述逻辑构建概念关系规则来判定三个领域概念语义关系,实现高速列车多域本体融合[15-16]。高速列车设计域、故障域及维修域包含的概念、属性符合以下定义:当且仅当对于三个领域任意概念与概念、概念与属性、属性与属性,满足以下五种映射关系:等价、包含于(泛化)、包含(特化)、重叠及相离关系,其中包含于与包含关系互为逆关系。以设计域、故障域维修性设计本体概念与概念关系为例,基于五种映射关系形成的四种概念规则(包含于与包含同为包含规则)如表1所示。

    表1 概念之间的描述逻辑规则

    假设设计域维修性设计知识本体记为i,本体i中包含的概念记为C,故障域维修性设计知识本体记为j,本体j中包含的概念记为D,a表示概念包含的任意个体。以概念重叠规则为例,如在设计域维修性设计知识本体概念“产品”中包含两种属性:车型和设计属性,且在故障域维修性设计知识本体概念“故障产品”中含有故障日期、运行里程、车型三种属性,可以得到设计域概念“产品”与故障域概念“故障产品”中都包含“车型”属性,但都有属于各自领域的属性,因此,设计域维修性设计知识本体中的概念“产品”与故障域维修性设计知识本体中的概念“故障产品”为重叠关系。

    经过概念关系规则的多领域概念、属性、关系判定后,确定了多域融合的高速列车维修性设计知识本体概念集以及概念间关系定义。表2所示为部分概念间关系定义,共24种。

    表2 多域融合的高速列车维修性设计知识概念关系

    基于上述定义的概念、属性及关系,本文构建了多域本体融合的高速列车维修性设计知识本体表达模型,如图3所示。

    多域本体融合的高速列车维修性设计知识本体由一个四元组描述形式组成,记为

    High-speed Train Maintenance Design Ontology Based on Multi-domain Ontology Fusion= {Entity,Attribute,Relation,Part}

    其中,Entity为实体相关概念集,用于表示设计-故障-维修领域客观实体的集合;
    Attribute为属性相关概念集,表示Entity具有的一些属性特征;
    Relation中包含了实体、属性相关概念之间的除了层级关系外的所有的关联关系,记为〈概念C1,关系R,概念C2〉,其中,概念C1与概念C2是包含于实体相关概念集Entity和属性相关概念集Attribute中的;
    Part包含了本体中除Relation关系集之外的概念之间的具有层级结构的关系,表示某一概念层级隶属于另一概念层级,即子类概念集与父类概念集的关系,在本体中用part_of及subclass_of关系表示。

    在明确了多域本体融合的高速列车维修性设计知识本体的概念及属性关系后,使用protégé5.0工具进行本体构建,领域专家可通过该工具对本体进行编辑及可视化管理,图4所示为在protégé中构建的本体。然后将本体中的Entity映射为Neo4j的节点,Relation及Part映射为Neo4j中的边,Attribute映射为节点属性,将本体模型映射存储到Neo4j中,使最终的知识图谱信息更加完整。

    图3 多域本体融合的高速列车维修性设计知识本体表达模型

    图4 在protégé中构建的高速列车维修性设计知识本体

    数据层构建流程分为三步:①命名实体识别;
    ②关系抽取;
    ③知识融合。首先选取部分数据作为训练数据训练BERT-BiLSTM-CRF模型,训练好后直接输入故障-维修数据文本,进行命名实体识别,再基于关系模板进行关系抽取,得到知识三元组,最后经过知识融合消除所抽取的维修性设计知识中的冗余及错误信息。

    3.1 基于BERT-BiLSTM-CRF的命名实体识别

    3.1.1模型简介

    在命名实体识别任务中,BERT模型负责命名实体识别的预训练任务,并且BERT模型可以根据文本语境训练出表达不同语义的动态词向量,BiLSTM-CRF负责对BERT输出的词向量进行分类,而BERT模型大大减少了分类工作的任务量,使模型整体识别效果更好。

    (1)BERT模型的优势在于不需要提前训练字向量及词向量,并且已经有预训练好的中文模型可以直接使用,因此只需将中文文本直接输入到BERT中,该模型会自动提取文本中的词特征、语法语义特征等。图5所示为BERT模型的网络结构,其中Ei(i=1,2,…,N)指输入的字或者词,Ti指BERT模型最终得到的预测结果,Trm为Transformer模型。

    图5 BERT模型网络结构

    CRF模型可以弥补BiLSTM模型无法处理相邻标签依赖关系的缺点,并且通过相邻标签获得一个最优预测序列,它采用Softmax分类器对数据标签进行预测,使用线性模型来表示特征序列的联合概率,能够更好地保证BERT模型输出序列标注中的标签合法性,并且在训练数据时,CRF层可以自动学习到这些约束条件。

    3.1.2识别过程

    本文的数据由中国中车股份有限公司某主机厂提供,记录了部分列车的故障及维修数据,时间跨度为5年,部分初始数据如表3所示(由于保密性要求,隐去部分信息)。该数据集涵盖了故障事件、处理措施、责任方、处理结果等多方面高速列车故障数据。首先需要对数据进行清洗,剔除一些重要度较低(如零部件脱漆等)以及记录模糊的故障记录数据,并对一些缺失数据值进行填补。在数据清洗后,将一些重要属性数据按行进行整合,目的是使之后的模型训练结果能达到最优。

    表3 部分初始数据

    接着进行模型训练前的数据标注。本文采用BIO(begin inner other)标注策略。在高速列车故障数据中部分待预测的实体标签如表4所示。

    表4 数据标签释义

    将标注好的训练集按8∶1∶1分为训练集、测试集及验证集,输入到模型中进行训练。为了验证BERT-BiLSTM-CRF模型在高速列车故障数据命名实体识别任务中的效果,本文分别选取了Word2vec-BiLSTM-CRF、BERT-CRF、BERT-BiLSTM-CRF模型进行识别对比,如表5所示。

    表5 高速列车故障数据命名实体识别结果对比

    从实验结果可以看出,BERT-BiLSTM-CRF与另两个模型相比,精确率、召回率和F1值(用来衡量二分类模型精确度)均有显著的提高。

    3.2 基于模板的关系抽取

    实体间的关系是知识图谱最重要的部分之一[17],关系抽取是信息抽取中的关键一步,关系实例构成了知识图谱的边。在知识图谱构建过程中,关系抽取产生的结果即为知识三元组,表示主客体之间以谓词所表达的关系,例如,〈齿轮箱,发生,裂纹〉表示齿轮箱这个零件发生了裂纹这个故障模式。

    本文通过对高速列车领域数据的特点进行分析,总结出以下几点:①本文所构建的知识图谱为高速列车维修性设计知识图谱,面向高速列车领域可维修性设计知识,领域专业性强;
    ②通过对高速列车领域故障及维修记录数据的分析,发现记录格式较为统一,实体及关系类型较为清晰;
    ③在领域专家的帮助下,已经构建了高速列车各领域维修性设计本体及多域融合的高速列车维修性设计本体,且对领域的概念关系进行了详细的定义。

    基于上述原因,本文采用基于模板的关系抽取方法,虽然需要花费一定时间设计关系匹配模板,但由于该方法提取的关系是由领域专家定义,因此能显著提高知识图谱知识质量。下面以故障事件为例设计关系匹配模板。

    图6所示为本文设计的故障事件关系匹配模板。故障关系匹配模板以词为单元进行匹配,首先,在输入的文本中确定零件的位置,并以零件为中心检索其余元素。匹配模板输入输出:①输入T、E1、E2、E3、E4、E5、E6;
    ②输出R。其中,T为text,指输入的故障数据文本;
    E1、E2、E3、E4、E5、E6为命名实体识别结果生成的词典(E1为零件实体词典;
    E2为故障模式实体词典;
    E3为触发词典;
    E4为转向架结构词典;
    E5为列车型号词典;
    E6为故障日期词典);
    R为输出的故障关系三元组的集合。

    故障事件关系匹配模板输入:T、E1、E2、E3、E4、E5、E6输出:R步骤结果(1)检索输入文本中是否包含故障事件关系触发词有触发词,进行下一步;否则,该输入文本无事件(2)确定输入文本中零件实体词的位置“零件实体词”位置(3)确定输入文本中与零件实体词距离最近的故障模式实体词〈零件,发生,故障模式〉(4)确定输入文本中零件实体词与转向架结构关系〈零件,属于,模块〉〈模块,属于,系统〉〈系统,属于,车辆〉〈车辆,属于,列车〉(5)确定输入文本中列车型号实体词的位置〈列车,车型,列车型号〉(6)确定输入文本中故障日期实体词位置〈故障日期,发生,故障模式〉return R一个基于输入文本的故障事件知识图谱实例

    3.3 知识融合

    本文采用字符串相似度与结构相似度结合的方法进行实体词相似度计算。首先采用字符串相似度计算实体词之间的相似度,设实体词1和实体词2分别为字符串i和字符串j,计算公式为

    (1)

    式中,λ为相似度调节系数,随相似字符个数增大而增大;
    A为字符串i与j中相同字符的个数;
    B为字符串i中存在,但字符串j中不存在的字符个数;
    C为字符串i中不存在,但字符串j中存在的字符个数;
    D为字符串i与j中字符的总数。

    在高速列车领域,普遍存在着语义相似的词,但在实际应用过程中需要当作不同个体的实体词,如牵引电机的两种类型,如果仅凭字符串相似度计算,则两种型号的电机会被融合为一种,那么在维修性设计知识粒度较细的详细设计阶段,无法通过两种牵引电机的设计特性等选择适合当前产品的型号,因此,当通过字符串计算两实体可能存在相似时,还需要经过结构相似度计算来确定最终的实体相似度。结构相似度指两个相似实体词在本体概念结构上的相似度,主要通过两个实体词所属本体结构的父级节点及子类节点相似度判断,判断规则如下:①若两实体词的父级节点相同,子节点相同,那么两实体词指代同一实体,则进行融合;
    ②若两实体词的父级节点相同,子节点概念相同但值域不同,如属性概念相同但属性值不同,那么两实体词为同级节点,分别存储。高速列车维修性设计知识融合过程如图7所示。

    (a)相同实体节点融合

    (b)同级节点分别存储图7 知识融合过程

    3.4 知识存储

    经过知识抽取及融合后,高速列车故障数据已经由非结构化文本数据转化为了结构化的知识三元组。采用Neo4j图数据库进行知识存储,它将获取的结构化知识存储在网络中,数据的构成主要由可以构建属性的节点和边组成,Neo4j图数据库的优点有:①相较于关系数据库,图数据库能够处理大量的、复杂多变的、低结构化的数据;
    ②图数据库拥有很高的可扩展性,处理大量数据时只会受到所布置机器硬件性能的影响;
    ③图数据库提供了高速检索遍历工具、高速运算性能的图算法以及推荐系统。目前,越来越多的研究人员将Neo4j图数据库应用到各个领域。

    本文将高速列车维修性设计知识三元组及构建的本体都存储在Neo4j图数据库中,并形成一对多的“概念-实体”关系。这样做的好处一是在进行基于知识图谱的知识推理时,本体层概念的约束公理能够保证知识推理逻辑的正确性;
    二是在数据层知识有残缺时,可以用本体层概念作为补充,最大程度地保证图谱知识的完整性。

    将三元组数据导入Neo4j图数据库进行存储与展示,并集成到项目所开发的转向架知识图谱平台,高速列车维修性设计知识图谱的应用主要在维修性设计知识检索方面。设计人员输入查询语句,与命名实体识别类似,由知识图谱对查询语句中的关键词进行解析,将其映射到知识图谱存储的本体概念及相应的维修性设计实体上,基于知识图谱丰富的语义网络,向设计人员返回全面且准确的维修性设计知识。设计人员在进行产品维修性定量分析,确定产品维修性指标时,可以在高速列车维修性设计知识图谱智能检索系统中查询同类型产品或相似产品的故障率、故障修复时间、预防维修作业项目数、在规定使用期限内的维修耗时等,根据同类产品的相关维修性数据来综合考量现阶段产品维修性指标及维修计划的制定。同时,还可根据故障率、维修次数、维修人员数、维修设备等预估产品的维修成本,为高速列车全生命周期成本优化提供维修性设计知识支持。图8所示为基于高速列车维修性设计知识图谱开发的智能检索系统。驱动系统设计人员在进行牵引电机选型配置时,想选取平均维修时间较短的牵引电机,在上方搜索框输入“永磁电机的维修时间长吗”,系统检索出与“永磁电机”有关的维修事件供设计人员查询,并按照故障次数的多少及不同的故障模式进行排序展示,点击右侧“查看详情”箭头还能详细了解发生过该故障模式的永磁电机的详细信息,包括电机型号、配属车型、设计属性等相关信息。

    图8 高速列车维修性设计知识图谱智能检索系统

    本文研究了多域数据融合的高速列车维修性设计知识图谱构建技术,详细论述了高速列车维修性设计知识图谱模式层与数据层的构建过程。基于高速列车故障维修数据记录,实现了从非结构化高速列车数据到结构化维修性设计知识存储的过程,不仅能很好地从高速列车海量数据中挖掘有用知识,提高知识搜集效率,而且能促进高速列车维修性设计优化,提高产品质量,从而促进我国高速列车更好更快地发展。

    目前,本文所构建的高速列车维修性设计知识图谱仅依靠主机厂提供的部分数据作为基础,未来还将进一步扩充语料数据并动态更新知识图谱。

    猜你喜欢 维修性本体图谱 高清大脑皮层发育新图谱绘成军事文摘(2022年24期)2022-12-30基于图对比注意力网络的知识图谱补全北京航空航天大学学报(2022年8期)2022-08-31新能源汽车永磁电机维修性设计研究汽车工程师(2021年11期)2021-12-21舰船装备维修性设计要求生成方法研究计算机仿真(2021年11期)2021-12-10眼睛是“本体”哈哈画报(2021年10期)2021-02-28绘一张成长图谱少先队活动(2020年12期)2021-01-14汽车维修性设计研究汽车实用技术(2019年1期)2019-10-21一种基于社会选择的本体聚类与合并机制小型微型计算机系统(2019年6期)2019-06-06一种新的民用飞机维修性分配方法民用飞机设计与研究(2019年4期)2019-05-21主动对接你思维的知识图谱领导科学论坛(2016年9期)2016-06-05

    推荐访问:图谱 列车 融合