一种基于图注意力模型的高速列车轴温长时预测方法
1.本发明属于数据挖掘技术领域,特别涉及一种基于图注意力模型的高速列车 轴温长时预测方法。
背景技术:
2.目前绝大多数关于轴温进行预测的模型都是短时预测模型,虽然能够取得不 错的效果,但是受限于预测模型感知范围,一般仅预测1小时之内的轴温变化情 况。这对于处理列车紧急故障而言已经有足够的时间,但是对于超过1天的列车 长时轴温预测没有过多的研究。
3.实际上,长时轴温预测在列车状态评估和日常维护中具有十分重要的作用。 例如,列车转向架作为机械部件,随着列车的运行,转向架也在不断地磨损。如 果可以提前预测转向架运行1天甚至是1周的状态变化情况,可以帮助列车管理 与维护人员提前对可能出现故障的部件进行检修和维护。此外,随着我国高速铁 路的发展,长时列车逐渐普遍。在高速列车实际开行计划中,有超过15h运行的 高速列车,而如何对长时轴温数据进行合理建模是一个亟待解决的难题。
4.随着移动互联网的发展和车载设备的更新迭代,轴温检测不再局限于人工巡 检方式,以传感器检测系统和大数据平台为依托的实时检测技术逐渐成为主流的 轴温检测手段。与此同时,列车运行信息也有了爆炸式增长。海量的列车实时检 测数据为轴温预测的研究提供了坚实的数据基础。受益于列车轴温数据的扩增, 基于数据驱动的机器学习模型可以更加有效地挖掘列车轴温数据中隐含的时间 特征和空间特征,在处理系统级别的轴温数据时,显示出比仿真等传统方法更强 大的潜力。
技术实现要素:
5.本发明的目的是提出一种基于图注意力模型的高速列车轴温长时预测方法, 其特征在于,包括以下步骤:
6.步骤1、从高速列车的转向架上采集传感器数据,对传感器数据进行清洗、 去噪处理,使用皮尔森相关系数对转向架上的传感器进行特征筛选,得到与轴温 变化最相关的传感器数据;
7.步骤2、构建轴温信息图结构;
8.步骤3、获取步骤1的时间序列数据和步骤2的图结构,使用gru(门限循 环单元)模型有效提取高速列车轴温的时序特征,使用gat(图注意力网络)模 型有效提取列车转向架图结构的空间特征;结合gru模型和gat模型,使用gat 单元代替gru内部原有的线性连接层,从而构建可以融合列车轴温的时空信息的 grgat单元;
9.步骤4、基于生成对抗网络构建生成器和判别器,其中生成器和判别器都包 括了编码操作和解码操作;
10.步骤5、基于生产对抗网络和grgat单元构建高速列车轴温长时预测 ga-grgat模
型;并基于pytorch深度学习框架融合列车轴温的时空信息的grgat 单元的ga-grgat模型训练;
11.步骤6:使用高速列车真实在途运行数据带入ga-grgat模型,得到轴温的长 时预测值。
12.所述步骤2中图结构定义如下所示:
[0013][0014]
其中graph代表一个网络,v是网络中的一组顶点,e是网络graph中的一组 边,并且e
ij
表示从节点vi到vj的方向;此外,w是网络graph中的一组权重,w
ij
表 示从节点vi到vj的权重。
[0015]
所述步骤3具体按以下步骤实施:
[0016]
步骤31,将t时刻的轴温数据输入x
t
和t-1时刻的隐藏层输出h
t-1
横向拼接得 到更新门z
t
=[h
t-1
||x
t
],将gru模型原有的线性重置门r
t
和更新门z
t
使用两个不同 的k层gat网络替代;具体公式如下所示:
[0017]rt
=σ(gat
rk
(z
t
))
[0018]zt
=σ(gat
zk
(z
t
))
[0019]
其中σ(
·
)为sigmoid激活函数;
[0020]
步骤,32:将t-1时刻的隐藏层输出h
t-1
与t时刻的重置门r
t
相乘,然后和t时刻 的轴温数据x
t
输入,横向拼接得到z
′
t
=[r
t
*h
t-1
||x
t
],将gru模型原有的线性单元 gat
xk
使用一个k层gat网络替代,从而计算t时刻的隐藏层h
t
输出;公式如下所 示:
[0021]ht
=(1-z
t
)
⊙ht-1
+z
t
⊙
(tanh(σ(gat
xk
(z
′
t
))))。
[0022]
所述步骤3中gat模型,定义t时刻输入gat模型的列车轴温数据为列车转向架图结构的邻接矩阵a∈rn×n,n为列车转向架图结构的顶点数量,p为 输入列车轴温属性的维度,为可学习参数,q为输出的列车轴温的特征维 度,节点i的重构向量如下所示
[0023][0024]
其中,leakyrelu(w
t
[wxi||wxj])为激活函数,exp(leakyrelu(w
t
[wxi||wxj])) 为指数操作,时刻i和时刻j的轴温为xi和xj,节点i和节点j的一阶领域为和 学习参数为w,训练参数为w。
[0025]
所述步骤4具体按以下步骤实施:
[0026]
步骤41,生成器构建
[0027]
(1)编码器输入阶段,在该阶段首先将t时刻输入的列车转向架时序特征c
t
, 通过fmlp
映射为c
′
t
∈rn×1,然后将列车轴温数据x
t
和时序特征c
′
t
进行拼接,拼接的 结果作为grgat单元的输入;
[0028]
(2)解码器生成阶段,首先将c
t
按照step 1的方法通过f
mlp
映射为c
′
t
∈rn×1, 然后将t-1时刻由step 1输出的数据和c
′
t
进行拼接,拼接的结果作为grgat 单元的输入,经过循环收敛之后得到隐藏矩阵h
t
和输出矩阵y
t
。其中,需要在解 码器阶段使用注意力机制,使用注意力单元att将y
t
映射为
[0029]
步骤42,判别器构建
[0030]
(1)t时刻输入的时序特征c
t
,通过f
mlp1
映射为c
′
t
∈rn×1。映射向量c
′
t
与温 度信息x
t
进行拼接,输入grgat单元进行循环,迭代之后得到隐藏矩阵 h=(h1,h2,...,h
l+r
)和输出矩阵y=(y1,y2,...,y
l+r
);
[0031]
(2)将y
t
映射为t时刻带有自注意力机制的映射向量;
[0032]
(3)f
mlp2
将映射为真实数据的概率p。
[0033]
所述步骤6具体按以下步骤实施:
[0034]
步骤61,生成器生成序列
[0035]
在t时刻编码器(encoder)的轴温数据x
t
为输入和时序特征c
t
,经过l步循 环迭代之后,得到z和he,在解码器(decoder)的输入数据为上一时刻的和 c
t
,计算得到再经过r步循环迭代之后得到
[0036]
步骤62,判别器判别真伪
[0037]
样本数据包含两个部分,分别是序列数据和标签数据。前者的长度为l+r, 包括x
t
和c
t
;后者为0或者1;
[0038]
步骤63,对抗训练
[0039]
对生成器g和判别器d进行初始化得到g0和d0,具体步骤如下所示:
[0040]
(1)g0不变,优化d0得到d1,优化方法为梯度下降算法;
[0041]
(2)d1不变,优化g0得到g1,优化方法与第一步相似;
[0042]
(3)在模型收敛之前重复上述两个步骤对g和d进行优化,最终得到最佳 的g
*
和d
*
,其中,g
*
即为预测阶段使用的生成器。
[0043]
所述步骤5基于pytorch深度学习框架融合列车轴温的时空信息的grgat单 元的ga-grgat模型训练;ga-grgat模型的训练算法伪代码如下所示:
[0044][0045][0046]
本发明的有益效果是本发明选取轴温作为轴承状态监测特征,将图结构引入 到高速列车轴温预测的场景中,形成轴温网络。基于轴温网络,使用嵌入式架构 融合图注意力网络gat模型和门限循环单元gru模型构建了grgat框架,其中gat 模型较图卷积神经网络gcn模型而言,使用注意力机制针对不同的邻居学习不同 的权重,有效解决了图中的动
态卷积操作;然后使用生成对抗网络gan模型构建时间时序特征,对历史列车轴温信息进行融合,从而提高ga-grgat模型的长时预测准确度;本发明的轴温长时预测可以为列车日常维护和状态提供决策依据。
附图说明
[0047]
图1动力转向架单轴温度传感器分布情况。
[0048]
图2网络结构构造流程
[0049]
图3grgat单元的结构。。
[0050]
图4ga-grgat结构图。
[0051]
图5数据集v1上不同时刻的24小时温度预测。
[0052]
图6数据集v2上不同时刻的24小时温度预测。
[0053]
图7高速列车轴温长时预测流程图。
具体实施方式
[0054]
本发明提出一种基于图注意力模型的高速列车轴温长时预测方法,高速列车轴温监测系统采用在转向架上电机、齿轮箱、轴箱等关键部件中轴承位置附近安装温度传感器的方式来实现对轴承温度的实时采集监测功能。每个转向架配置有两根轴,这两根车轴及其包括电机、轴箱、齿轮箱的关联结构是对称分布的,每根轴对应有9个测点,如图1中标号
①‑⑨
所示:
[0055]
①
:齿轮箱附近车轴测点
②
:车轮侧大齿轮箱测点
③
:车轮侧小齿轮箱测点
[0056]
④
:电机侧大齿轮箱测点
⑤
:电机侧小齿轮箱测点
⑥
:电机驱动端测点
[0057]
⑦
:电机定子测点
⑧
:电机非驱动端测点
⑨
:电机附近车轴测点
[0058]
即每个转向架共装有18个温度传感器。下面结合附图对本发明予以进一步说明。本发明方法包括以下步骤(如图7所示):
[0059]
步骤1、从高速列车的转向架上采集传感器数据,对传感器数据进行清洗、去噪处理,使用皮尔森相关系数对转向架上的传感器进行特征筛选,得到与轴温变化最相关的传感器数据;
[0060]
步骤2、构建轴温信息图结构;
[0061]
步骤3、获取步骤1的时间序列数据和步骤2的图结构,使用gru(门限循环单元)模型有效提取高速列车轴温的时序特征,使用gat(图注意力网络)模型有效提取列车转向架图结构的空间特征;结合gru模型和gat模型,使用gat单元代替gru内部原有的线性连接层,从而构建可以融合列车轴温的时空信息的grgat单元;
[0062]
步骤4、基于生成对抗网络构建生成器和判别器,其中生成器和判别器都包括了编码操作和解码操作;
[0063]
步骤5、基于生产对抗网络和grgat单元构建高速列车轴温长时预测ga-grgat模型;并基于pytorch深度学习框架融合列车轴温的时空信息的grgat单元的ga-grgat模型训练;
[0064]
步骤6:使用高速列车真实在途运行数据带入ga-grgat模型,得到轴温的长 时预测值。
[0065]
具体说明如下:
[0066]
(1)构建轴温信息图结构
[0067]
图1展示了高速列车动力型车厢底部转向架的基本结构以及对应的温度传 感器安装布置情况。
[0068]
本发明规定车辆数据检测点表示为高速列车图结构的顶点(如图1中标号
①ꢀ‑⑨
所示),检测点之间的关系为图的边,检测点之间的相关系数为图结构边的权 重。另外,检测点之间的因果关系是图结构的边的方向。高速列车图结构定义如 下所示:
[0069][0070]
其中graph代表一个网络,v是网络中的一组顶点,e是graph中的一组边, 并且e
ij
表示从节点vi到vj的方向。此外,w是graph中的一组权重,w
ij
表示从节 点vi到vj的权重。
[0071]
由于列车转向架各个测点的空间相关性,可以根据转向架各个测点的实际结 构构造二维网络,作为后续的输入。我们将每个测点看作网络的顶点,将转向架 上各测点的实际连接关系抽象成网络的边,按照灰-格兰杰构造(gray
–ꢀ
granger causality,即ggc)方法构造传感器数据网络。构造流程如图2所示。
[0072]
(2)gat模型架构
[0073]
定义t时刻输入gat模型的列车轴温数据为列车转向架图结构的邻 接矩阵a∈rn×n,n为列车转向架图结构的顶点数量,p为输入列车轴温属性的维 度,为可学习参数,q为输出的列车轴温的特征维度,节点i的重构向量 如下所示:
[0074][0075]
本发明选择gru模型(门限循环单元),有效提取高速列车轴温的时序特征, 使用gat模型有效提取列车转向架图结构的空间特征。结合gru模型和gat模型, 使用gat单元代替gru内部原有的线性连接层,从而构建可以融合列车轴温的时 空信息的grgat框架。规定grgat框架中的重置门r
t
表示为gat
rk
,更新门z
t
表示 为gat
zk
,与横向x拼接后的线性单元gat
xk
,同时隐藏层单元数量为c。grgat 单元结构如图3所示。
[0076]
grgat单元的计算过程如下所示:
[0077]
步骤3-1:将t时刻的轴温数据x
t
输入和t-1时刻的隐藏层h
t-1
为输出,横向拼 接得到z
t
=[h
t-1
||x
t
],将gru模型原有的线性重置门r
t
和更新门z
t
使用两个不同的k层gat网络替代,具体公式如下所示:
[0078]rt
=σ(gat
rk
(z
t
))
[0079]zt
=σ(gat
zk
(z
t
))
[0080]
其中σ(i)为sigmoid激活函数。
[0081]
步骤3-2:将t-1时刻的隐藏层输出h
t-1
与t时刻的重置门r
t
相乘,然后和t时 刻的
输入x
t
横向拼接得到z
′
t
=[r
t
*h
t-1
||x
t
],将gru模型原有的线性单元gat
xk
使用 一个k层gat网络替代,从而计算t时刻的输出h
t
,公式如下所示:
[0082]ht
=(1-z
t
)
⊙ht-1
+z
t
⊙
(tanh(σ(gat
x
k(z
′
t
))))
[0083]
(3)生成对抗网络构建
[0084]
gan主要由生成器和判别器组成。本发明生成器和判别器的构建,为后续 ga-grgat模型奠定了基础。生成器和判别器都包括了编码器(encoder)和解码 器(decoder),具体过程如下所示:
[0085]
步骤一:生成器构建
[0086]
步骤1-1:编码器输入阶段
[0087]
在该阶段首先将t时刻输入的c
t
(列车转向架时序特征)通过f
mlp
映射为 c
′
t
∈rn×1,然后将列车轴温数据x
t
和c
′
t
进行拼接,拼接的结果作为grgat单元的 输入,具体公式如下所示:
[0088]
(z,he)=grgat
(l)
(x
t
||f
mlp
(c
t
);a)
[0089]
其中grgat
(l)
表示将grgat单元循环迭代了l次,z为隐藏矩阵,he为隐藏 序列。
[0090]
步骤1-2:解码器生成阶段
[0091]
首先将c
t
按照step 1的方法通过f
mlp
映射为c
′
t
∈rn×1,然后将t-1时刻由step 1输出的数据和c
′
t
进行拼接,拼接的结果作为grgat单元的输入,经过循环收 敛之后得到隐藏矩阵h
t
和输出矩阵y
t
。其中,需要在解码器阶段使用注意力机制, 使用注意力单元att将y
t
映射为具体的计算公式如下所示:
[0092][0093][0094]
步骤二:判别器构建
[0095]
在该模型中,高速列车转向架时序特征c=(c1,c2,...,c
l+r
)和状态序列 x=(x1,x2,...,x
l
)是g的输入数据;高速列车轴温预测序列是g的输 出数据。生成序列定义为xg,真实序列定义为xr,对应的时序特征为c,没有 对应关系的时序特征为则xg与xr的定义如下所示:
[0096]
xr=(x1,x2,
…
,x
l
,x
l+1
,
…
,x
l+r
)
[0097][0098]
样本分为两类真实样本x
real
和假样本x
fake
。xr和c作为x
real
的输入特征,若 标签是1,则x
real
为真。x
real
的定义如下所示:
[0099]
x
real
={x=xr&c;y=1}
[0100]
假样本可以进一步划分为两类,第一类的输入特征是xg和c,第二类的输 入特征是xr和两类假样本的输出结果(标签)均为0。假样本x
fake
的定义如 下所示:
[0101][0102]
温度时空数据xr与xg,时序特征c与作为判别器m的输入序列数据, 能够使用
grgat框架捕捉序列时空特征。为了进一步加强时空序列的特征融合能 力,在判别器中加入了self-attention模块。
[0103]
综上,判别器m的计算过程如下所示:
[0104]
step 1:t时刻输入的时序特征c
t
,通过f
mlp1
映射为c
′
t
∈rn×1。映射向量c
′
t
与 温度信息x
t
进行拼接,输入grgat单元进行循环。迭代之后得到隐藏矩阵 h=(h1,h2,...,h
l+r
)和输出矩阵y=(y1,y2,...,y
l+r
),计算公式如下所示:
[0105]
(h,y)=grgat
(l+r)
(x
t
||f
mlp1
(c
t
);a)
[0106]
step 2:self-attention将y
t
映射为具体如下所示:
[0107][0108]
其中表示在t时刻带有自注意力机制的映射向量,h表示计算注意力系数。
[0109]
step 3:f
mlp2
将映射为真实数据的概率p,如下所示:
[0110][0111]
(4)ga-grgat长时预测模型
[0112]
ga-grgat模型分为生成器g和判别器m两个部分,具体计算步骤如下所示:
[0113]
步骤一:生成器生成序列
[0114]
在t时刻译码器(encoder)的输入数据为x
t
和c
t
,经过l步循环迭代之后, 得到z和he。z的作用是使解码器初始化隐藏状态。在t时刻m的输入数据为上 一时刻的和c
t
,引入att(注意力机制),计算得到再经过r步循环迭代之 后得到
[0115]
步骤二:判别器判别真伪
[0116]
样本数据包含两个部分,分别是序列数据和标签数据。前者的长度为l+r, 包括x
t
和c
t
;后者为0或者1。在t时刻,判别器m的输入数据x
t
和c
t
,经过l+r 次循环之后,结合self-attention和mlp计算,得到判别数据p∈[0,1]。
[0117]
步骤三:对抗训练
[0118]
对生成器g和判别器d进行初始化得到g0和d
0,
具体步骤如下所示:
[0119]
1)g0不变,优化d0得到d1,优化方法为梯度下降算法;
[0120]
2)d1不变,优化g0得到g1,优化方法与第一步相似;
[0121]
3)在模型收敛之前重复上述两个步骤对g和d进行优化,最终得到最佳的g
*
和d
*
,其中,g
*
即为预测阶段使用的生成器。
[0122]
ga-grgat模型总体架构如图4所示。ga-grgat模型的构建和训练基于 pytorch深度学习框架。则ga-grgat模型的训练算法伪代码如下所示:
[0123][0124][0125]
(5)进一步说明本发明的有效性,本发明实验中使用的数据均来自高 速列车实际运行产生的状态监测数据,为了考虑外界温度对列车轴温序列 的影响,选择春天(日平均温度15℃)和夏天(日平均温度30℃)两个数 据集,数据集的时间范围分别为2019年3月15日至2019年4月15日和2019 年7月15日至2019年8月15日,具体划分日期和数据集大小如表
1所示。
[0126]
表1 ga-grgat数据集说明
[0127][0128]
如表1所示,将每个数据集按照训练集、测试集和验证集进行划分,划 分比例约为4:1:1(训练集22天,测试集5天,验证集5天)。规定输入序 列长度为l,输出序列长度为r,传感器数量为18,t时刻条件特征c
t
是由5 个one-hot向量拼接而成的37维向量。
[0129]
此外,考虑到长时列车轴温预测的实时性要求较低,ga-grgat模型训 练速度慢,本发明对列车轴温序列进行整时刻切分,采样的时间间隔为 5min,将样本集大小缩减到原来的1/12。数据示例如表2所示。
[0130]
表2数据示例
[0131][0132]
1)评价标准
[0133]
ga-grgat模型使用四种评价指标,分别是平均绝对误差(meanabsoluteerror,mae)、均方根误差(rootmeansquareerror,rmse)、平均绝对百分比误差(meanabsolutepercentageerror,mape)和需求预测准确度(forecastaccuracy,accuracy)作为评价指标。其中mae直接表示绝对误差大小;rmse反映偏差分布的离散情况;mape为无量纲评价指标,反映模型预测值的偏离程度和可信度;accuracy指的是预测准确率(forecastaccuracy),一般使用1-mape的值表示。具体公式如下所示:
[0134][0135][0136][0137][0138]
式中,s表示样本集内的样本个数,n表示轴温网络中监测点数量,表示预测值,y
ij
表示真实值,表示预测值的平均值,表示真实值的平均值。
[0139]
2)实验环境
[0140]
ga-grgat模型及其对比方法进行高速列车轴温长时预测的实验环境如表3所示。
其中,ga-grgat模型及其对比方法均使用python语言实现,本 发明使用的深度学习架构均为pytorch库。ga-grgat模型的训练主要在gpu 上进行。
[0141]
表3实验环境说明
[0142][0143]
3)实验结果分析
[0144]
本发明采用gru、goamlp、dcnn、svr、ha五种经典的时序预测模型和 grgat、ga-grgat模型对比。所有模型均使用相同的训练集和测试集,本发 明使用春天数据集v1和夏天数据集v2进行预测,预测结果如表4所示。
[0145]
表4两个数据集在不同模型下的比较结果
[0146]
[0147]
[0148][0149][0150]
从表4可以看出,ga-grgat模型所有评价指标均为最优。基于grgat框 架的ga-grgat模型和grgat模型排在前两位,预测性能较好,说明grgat 单元可以有效融合温度时空信息。同时ga-grgat模型优于grgat模型,说 明gan的有效性。而在gru模型、goamlp模型、
dcnn模型、svr模型和ha 模型中,经典神经网络模型(gru模型、goamlp模型和dcnn模型)的效果 优于传统时序模型(svr模型和ha模型)。svr模型预测精度最低,甚至低 于ha模型。另外值得关注的是,ga-grgat模型的mae值为2.58时,rmse 值仅为3.91。而grgat模型的mae值为5.85,rmse值为8.8。从mae值可 以看出,ga-grgat预测结果的聚合性比较强,也就是说模型的误差不分 散,体现在轴温上来看,ga-grgat模型预测的结果可以体现整体的温度变 化趋势。
[0151]
本发明对ga-grgat模型、grgat模型和goamlp模型和gru模型不同步 长的准确率和消耗时间(cost time)进行统计。具体结果如表5所示。
[0152]
表5不同模型准确率和消耗时间的比较结果
[0153]
[0154]
[0155][0156][0157]
从表5可以看出,ga-grgat模型的准确率在相同步长和数据集的情况下 高于
grgat、gru、goamlp和dcnn模型,且在两个数据集上ga-grgat模型 的准确率均大于85%,其中在24th、36th和48th的情况下准确率大于90%, 说明使用ga-grgat模型预测未来一天的列车轴温变化情况有较高的精度。 此外,对每个模型不同步长的准确率进行对比可以看出,随着步长增大, 模型的输入和输出数据量增加,导致消耗时间变长,但是准确率也会随之 提高。ga-grgat模型的消耗时间在所有模型中只比goamlp模型稍低,比其 他模型的时间更长,在48th时消耗时间为129.90s,约2min,可以保证列 车长时预测实时性的需要。
[0158]
本发明选择grgat模型、gru模型和coamlp模型与ga-grgat模型进行 对比,直观观察每个模型的预测效果。分别从0时、6时、12时和18时开 始,输入序列长度l=12,预测后续24小时之内的列车轴温数据。本发明使 用春天数据集v1和夏天数据集v2的测试集进行预测,预测效果如图5和图6 所示。
[0159]
ga-grgat模型在图5(a)~(c)和图6(a)~(c)中明显优于grgat 模型、gru模型和coamlp模型。也就是说,ga-grgat模型从0:00、6:00 和12:00开始预测未来24小时内的轴温都有较为理想的效果。而比较四个 模型在18:00预测未来24小时内的轴温效果,可以看出ga-grgat模型和 coamlp模型要明显优于grgat模型和grgat模型。
[0160]
综上所述,本发明的轴温长时预测可以为列车日常维护和状态修提供 决策依据。本发明选取轴温作为轴承状态监测特征,将图结构引入到高速 列车轴温预测的场景中,形成轴温网络。基于轴温网络,使用嵌入式架构 融合图注意力网络(graph attention network,即gat)模型和门限循环单 元(gate recurrent unit,即gru)模型构建了grgat框架,其中gat模型 较图卷积神经网络(graph convolutional network,即gcn)模型而言使 用注意力机制针对不同的邻居学习不同的权重,有效解决了图中的动态卷 积操作;然后使用生成对抗网络(generative adversarial networks,gan) 模型构建时间时序特征对历史列车轴温信息进行融合,从而提高ga-grgat 模型的长时预测准确度和gcn模型。
技术特征:
1.一种基于图注意力模型的高速列车轴温长时预测方法,其特征在于,包括以下步骤:步骤1、从高速列车的转向架上采集传感器数据,对传感器数据进行清洗、去噪处理,使用皮尔森相关系数对转向架上的传感器进行特征筛选,得到与轴温变化最相关的传感器数据;步骤2、构建轴温信息图结构;步骤3、获取步骤1的时间序列数据和步骤2的图结构,使用gru(门限循环单元)模型有效提取高速列车轴温的时序特征,使用gat(图注意力网络)模型有效提取列车转向架图结构的空间特征;结合gru模型和gat模型,使用gat单元代替gru内部原有的线性连接层,从而构建可以融合列车轴温的时空信息的grgat单元;步骤4、基于生成对抗网络构建生成器和判别器,其中生成器和判别器都包括了编码操作和解码操作;步骤5、基于生产对抗网络和grgat单元构建高速列车轴温长时预测ga-grgat模型;并基于pytorch深度学习框架融合列车轴温的时空信息的grgat单元的ga-grgat模型训练;步骤6:使用高速列车真实在途运行数据带入ga-grgat模型,得到轴温的长时预测值。2.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法,其特征在于,所述步骤2中图结构定义如下,:其中d代表一个网络,v是网络中的一组顶点,e是网络d中的一组边,并且e
ij
表示从节点v
i
到v
j
的方向;此外,w是网络d中的一组权重,w
ij
表示从节点v
i
到v
j
的权重。3.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法,其特征在于,所述步骤3具体按以下步骤实施:步骤31,将t时刻的轴温数据输入x
t
和t-1时刻的隐藏层输出h
t-1
横向拼接得到更新门z
t
=[h
t-1
||x
t
],将gru模型原有的线性重置门r
t
和更新门z
t
使用两个不同的k层gat网络替代;具体公式如下所示:具体公式如下所示:其中σ(
·
)为sigmoid激活函数;步骤,32:将t-1时刻的隐藏层输出h
t-1
与t时刻的重置门r
t
相乘,然后和t时刻的轴温数据x
t
输入,横向拼接得到z
′
t
=[r
t
*h
t-1
||x
t
],将gru模型原有的线性单元使用一个k层gat网络替代,从而计算t时刻的隐藏层h
t
输出;公式如下所示:4.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法,其特征在
于,所述步骤3中gat模型,定义t时刻输入gat模型的列车轴温数据为列车转向架图结构的邻接矩阵a∈r
n
×
n
,n为列车转向架图结构的顶点数量,p为输入列车轴温属性的维度,为可学习参数,q为输出的列车轴温的特征维度,节点i的重构向量如下所示其中,leakyrelu(w
t
[wx
i
||wx
j
])为激活函数,exp(leakyrelu(w
t
[wx
i
||wx
j
]))为指数操作,时刻i和时刻j的轴温为x
i
和x
j
,节点i和节点j的一阶领域为和学习参数为w,训练参数为w。5.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法,其特征在于,所述步骤4具体按以下步骤实施:步骤41,生成器构建(1)编码器输入阶段,在该阶段首先将t时刻输入的列车转向架时序特征c
t
,通过f
mlp
映射为c
′
t
∈r
n
×1,然后将列车轴温数据x
t
和时序特征c
′
t
进行拼接,拼接的结果作为grgat单元的输入;(2)解码器生成阶段,首先将c
t
按照step 1的方法通过f
mlp
映射为c
′
t
∈r
n
×1,然后将t-1时刻由step 1输出的数据和c
′
t
进行拼接,拼接的结果作为grgat单元的输入,经过循环收敛之后得到隐藏矩阵h
t
和输出矩阵y
t
。其中,需要在解码器阶段使用注意力机制,使用注意力单元att将y
t
映射为步骤42,判别器构建(1)t时刻输入的时序特征c
t
,通过f
mlp1
映射为c
′
t
∈r
n
×1。映射向量c
′
t
与温度信息x
t
进行拼接,输入grgat单元进行循环,迭代之后得到隐藏矩阵h=(h1,h2,...,h
l+r
)和输出矩阵y=(y1,y2,...,y
l+r
);(2)将y
t
映射为t时刻带有自注意力机制的映射向量;(3)f
mlp2
将映射为真实数据的概率p。6.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法,其特征在于,所述步骤6具体按以下步骤实施:步骤61,生成器生成序列在t时刻编码器(encoder)的轴温数据x
t
为输入和时序特征c
t
,经过l步循环迭代之后,得到z和h
e
,在解码器(decoder)的输入数据为上一时刻的和c
t
,计算得到再经过r步循环迭代之后得到步骤62,判别器判别真伪样本数据包含两个部分,分别是序列数据和标签数据。前者的长度为l+r,包括x
t
和c
t
;后者为0或者1;步骤63,对抗训练
对生成器g和判别器m进行初始化得到g0和m0,具体步骤如下所示:(1)g0不变,优化m0得到m1,优化方法为梯度下降算法;(2)m1不变,优化g0得到g1,优化方法与第一步相似;(3)在模型收敛之前重复上述两个步骤对g和m进行优化,最终得到最佳的g
*
和m
′
,其中,g
*
即为预测阶段使用的生成器。7.根据权利要求1所述的基于图注意力模型的高速列车轴温长时预测方法,其特征在于,所述步骤5基于pytorch深度学习框架融合列车轴温的时空信息的grgat单元的ga-grgat模型训练;ga-grgat模型的训练算法伪代码如下所示:grgat模型的训练算法伪代码如下所示:。
技术总结
本发明公开了属于数据挖掘技术领域的一种基于图注意力模型的高速列车轴温长时预测方法,该方法首先从高速列车的转向架上采集传感器数据,使用嵌入式架构融合GAT模型和门限循环GRU模型构建GRGAT框架,用于对时空预测进行聚合;使用图注意力网络GAT模型和生成对抗网络GA模型,分析列车运行周期性变化的特点,使用GA网络构建时间条件序列对历史轴温信息进行融合,得到高速列车轴温长时预测的GA-GRGAT模型,实验结果显示,本发明在进行长时预测时,在两个数据集上的准确度均高于80%以上,可以满足高精度、长时间的轴温预测需求。长时间的轴温预测需求。长时间的轴温预测需求。
