一种基于LSTM自编码器的数据中心异常状态检测方法与流程
一种基于lstm自编码器的数据中心异常状态检测方法
技术领域
1.本发明涉及异常检测技术领域,具体地涉及一种基于lstm自编码器的数据中心异常状态检测方法。
背景技术:
2.随着数据中心的规模不断扩大,数据中心的运维管理将面临更多的挑战。在运行过程中,数据中心出现异常情况后能否被及时检测到直接关系到数据中心的正常运行。在传统的运维管理模式中,运维人员需要检查设备,查看运行日志,分析设备是否出现异常的运行状况,存在时效性差,人工工作量大的问题。因此,更高效的数据中心异常检测方法就显得尤为重要。
3.通过查阅相关资料发现,已存在的异常检测专利少有针对数据中心状态的异常检测技术。本发明根据重构数据与实时数据的差异来实时检测数据中心是否存在异常状态,从而为数据中心运维管理提供重要的依据。并且,本方法采用无监督方法训练神经网络模型,无需人工标记的样本训练模型,效率更高,可以处理高维时序数据。
技术实现要素:
4.本发明的目的在于克服现有技术存在的缺点,提出设计一种基于lstm自编码器的数据中心异常状态检测方法,通过深度学习的方式,能够定时地根据数据中心的当前状态参数来更新数据中心正常状态参数,并根据当前状态参数与正常状态参数的差异来检测数据中心是否存在异常情况。
5.本发明解决其技术问题所采取的技术方案是:
6.一种基于lstm自编码器的数据中心异常状态检测方法,包括:
7.(1)数据预处理
8.由传感器采集的数据中心状态数据具有不同的尺度,采用z-score对数据进行标准化处理,从而将不同尺度的数据变换到同一尺度,
9.在数据标准化处理的基础上,采用滑动时间窗对时间序列进行分割;
10.(2)重构模型的构建
11.模型采用编码器-解码器结构,编码器和解码器均由lstm网络构成。模型的输入为原始样本,输出为重构样本。模型使用编码器对原始样本进行编码,将输入映射到低维隐空间,学习样本的特征信息,再使用解码器来解码,重构样本;
12.(3)异常检测
13.基于已经训练的重构模型,输入数据中心实时状态参数,重构数据中心的状态参数。
14.进一步的,步骤(1)中,不同尺度的数据变换到同一尺度的计算公式如下:
15.16.其中,x是由数据中心状态数据组成的时间序列样本,是样本的平均值,σ(
·
)是样本的标准差。
17.进一步的,步骤(1)中,首先确定窗口宽度w和滑动步长s,对于样本x
′
∈r
l
×n,l表示时间序列的长度,n表示向量的维度,根据窗口宽度和滑动步长将样本x
′
划分成多个样本组成的样本集x
″
∈ri×w×n,i表示样本的个数。
18.进一步的,步骤(2)中,将原始样本和重构样本误差的平方和作为损失函数,采用随机梯度下降方法来优化模型。模型训练时,选取数据中心正常工况下的状态数据作为训练样本,通过反复训练来学习正常工作条件下隐藏的特征信息。
19.进一步的,步骤(3)中,计算重构样本与原始输入样本之间的误差向量其中表示t时刻第i个状态参数,的计算公式如下:
[0020][0021]
式中,表示重构样本中t时刻第i个状态参数,表示输入样本中t时刻第i个状态参数,将误差向量与预先设置的阈值向量作比较,若误差向量中某一元素的值大于阈值向量中对应位置元素的值,则判定该时刻出现异常工况。
[0022]
本发明的技术效果:
[0023]
与现有技术相比,本发明的一种基于lstm自编码器的数据中心异常状态检测方法,结合自编码器和lstm网络,lstm网络提取数据中的时序特征。编码器将大量的正常样本映射到低维隐空间,从而学习正常工况样本的主要特征。解码器利用这些主要特征进行重构样本,以重构样本和正常样本的误差来优化模型。在此基础上,输入数据中心运行状况的原始样本,运用该模型重构样本,通过分析重构样本和原始样本之间的差异实现异常检测。
附图说明
[0024]
图1为本发明方法流程图;
[0025]
图2为本发明网络结构图。
具体实施方式
[0026]
为使本发明实施例的目的、技术方案和优点更加清楚,下面结合说明书附图,对本发明实施例中的技术方案进行清楚、完整地描述。
[0027]
实施例1:
[0028]
如图1所示,本实施例涉及的一种基于lstm自编码器的数据中心异常状态检测方法,包括:
[0029]
(1)数据预处理
[0030]
由传感器采集的数据中心状态数据通常具有不同的尺度,本方法采用z-score对数据进行标准化处理,从而将不同尺度的数据变换到同一尺度,计算公式如下:
[0031][0032]
其中,x是由数据中心状态数据组成的时间序列样本,是样本的平均值,σ(
·
)是
样本的标准差。
[0033]
在数据标准化处理的基础上,采用滑动时间窗对时间序列进行分割。首先确定窗口宽度w和滑动步长s,对于样本x
′
∈r
l
×n,l表示时间序列的长度,n表示向量的维度,根据窗口宽度和滑动步长将样本x
′
划分成多个样本组成的样本集x
″
∈ri×w×n,i表示样本的个数。
[0034]
(2)重构模型的构建
[0035]
模型采用编码器-解码器结构,编码器和解码器均由lstm网络构成。模型的输入为原始样本,输出为重构样本。模型使用编码器对原始样本进行编码,将输入映射到低维隐空间,学习样本的特征信息,再使用解码器来解码,重构样本。将原始样本和重构样本误差的平方和作为损失函数,采用随机梯度下降方法来优化模型。模型训练时,选取数据中心正常工况下的状态数据作为训练样本,通过反复训练来学习正常工作条件下隐藏的特征信息。网络结构图如图2所示。
[0036]
(3)异常检测
[0037]
基于已经训练的重构模型,输入数据中心实时状态参数,重构数据中心的状态参数。
[0038]
计算重构样本与原始输入样本之间的误差向量其中表示t时刻第i个状态参数,的计算公式如下:
[0039][0040]
式中,表示重构样本中t时刻第i个状态参数,表示输入样本中t时刻第i个状态参数。之后,将误差向量与预先设置的阈值向量作比较,若误差向量中某一元素的值大于阈值向量中对应位置元素的值,则判定该时刻出现异常工况。
[0041]
本发明通过lstm自编码器网络学习数据中心正常工况下的状态参数,建立状态重构模型,使用状态重构模型定时地根据数据中心的当前状态参数来更新正常状态参数,并根据当前状态与正常状态的差异来检测数据中心是否存在异常情况。
[0042]
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明权利要求书且任何所属技术领域的普通技术人员对其所做的适当变化或修饰,皆应落入本发明的专利保护范围。
