本文作者:kaifamei

一种IT系统运行指标动态阈值上限分析方法与流程

更新时间:2025-12-19 19:46:41 0条评论

一种IT系统运行指标动态阈值上限分析方法与流程


一种it系统运行指标动态阈值上限分析方法
技术领域
1.本发明涉及自动化运维领域,主要是一种it系统运行指标动态阈值上限分析方法。


背景技术:



2.it分析系统中通常可以根据各类运行指标的历史情况,实现对当前运行状态是否正常的自动判断。目前大多数方法的判定步骤如下:(1)、查询运行指标历史变化情况和当前运行情况;(2)、基于正态分布的原理计算当前时间粒度下的指标正常值区间r,其上限标记为ru,下限标记为rd(注意,本专利不分析下限);(3)、将各时间粒度的ru连接可作为动态阈值上基线(即上限),rd连接可作为动态阈值下基线;(4)、判断当前时间粒度下新采集到的运行指标,如于》ru则为值过高异常,如《rd则为值过低异常。
3.现有方法在运行时不考虑当前的运行情况,超过历史高值就认为不正常,缺点在于死板地基于历史数据设定阈值上限;对系统稳定运行,各类指标缓慢稳定增长的情况容易误判。实际上,系统只要是稳定运行,缓慢增长,那么超过历史上限不能判定其为异常,为此,本专利提出it系统运行指标动态阈值上限分析方法,对动态阈值上限进行修订。


技术实现要素:



4.针对现有方法只根据it运维系统历史数据设定阈值上限的问题,本发明提供了一种it系统运行指标动态阈值上限分析方法,根据当前运行情况,对动态阈值上基线进行调整及更新。
5.本发明的目的是通过如下技术方案来完成的。一种it系统运行指标动态阈值上限分析方法,该方法包括以下步骤:
6.(1)、查询运行指标p的历史数据,获得运行指标p的查询值p(t);
7.(2)、针对当天的每一个小时,都在开始运行前,根据运行指标p的历史数据,得到当前小时正常值区间上限阈值ru;
8.(3)、采样当前时刻开始向前t时间内的运行指标数据,判断运行指标是否稳定增长,动态调整上限阈值ru;
9.(4)、系统运行时,如果p(t)>ru,则为超上限阈值异常。
10.更进一步的,所述的步骤(1)中,运行指标p包括磁盘空间、带宽或内存,具体步骤如下:
11.(2.1)、采样点前一小时平均值pmh与标准差psdh;
12.(2.2)、采样点前一天同小时平均值pmd与标准差psdd;
13.(2.3)、采样点过去8周同一天同小时平均值pm
w1
~pm
w8
与标准差psd
w1
~psd
w8

14.更进一步的,所述的步骤(2)中,具体步骤如下:
15.(3.1)、计算平均值参数rm:
16.17.其中,n表示采样点过去第几周,pm
wn
表示采样点过去n周同一天同小时平均值;
18.(3.2)、计算标准差参数rsd:
[0019][0020]
其中,spd
wn
表示采样点过去n周同一天同小时标准差;
[0021]
(3.3)、当前小时正常值区间上限阈值ru:ru=rm+rsd
×
3;
[0022]
(3.4)、计算当天动态基线,将当天生成的所有小时ru作为上基线。
[0023]
更进一步的,所述的步骤(3)中,具体步骤如下:
[0024]
(4.1)、观察当前时刻t开始,向前的t时间内的运行指标数据;
[0025]
(4.2)、采样:从t-t时刻开始采样,采样到当前时刻t,采样点依次是t-t,t-t+(t/2),
……
,m为采样时间点;
[0026]
(4.3)、若则更改否则,ru不变。
[0027]
本发明的有益效果为:本发明根据当前系统运行情况对动态阈值上基线做出及时地调整和更新,由于本发明无需大量人为操作,计算量小,且分析准确,因此可大量减少运维人力成本,提高监测覆盖面与准确率。
附图说明
[0028]
图1为本发明的动态调整阈值分析流程示意图;
[0029]
图2为本发明所涉及的指标正态分布规律示意图;
[0030]
图3为本发明的阈值计算流程示意图;
[0031]
图4为本发明生成的动态阈值上基线示意图。
具体实施方式
[0032]
下面将结合附图和实施例对本发明做详细的介绍:
[0033]
如图1所示,一种it系统运行指标动态阈值上限分析方法,该方法包括以下步骤:
[0034]
(1)、查询运行指标p的历史数据,获得运行指标p的查询值p(t);运行指标p包括磁盘空间、带宽或内存,每个运行指标需分别进行计算,具体步骤如下:
[0035]
(1.1)、采样点(当前采样时刻)前一小时平均值pmh与标准差psdh,每小时查询次数不低于30次,通常会取30次或60次;
[0036]
(1.2)、采样点前一天同小时平均值pmd与标准差psdd;
[0037]
(1.3)、采样点过去8周同一天同小时平均值pm
w1
~pm
w8
与标准差psd
w1
~psd
w8

[0038]
(2)、针对当天的每一个小时,都在开始运行前,根据运行指标p的历史数据,得到当前小时正常值区间上限阈值ru并生成上基线;具体步骤如下:
[0039]
(2.1)、计算平均值参数rm:
[0040][0041]
其中,n表示采样点过去第几周,pm
wn
表示采样点过去n周同一天同小时平均值;
[0042]
(2.2)、计算标准差参数rsd:
[0043][0044]
其中,psd
wn
表示采样点过去n周同一天同小时标准差;
[0045]
(2.3)、当前小时正常值区间上限阈值ru:ru=rm+rsd
×
3;
[0046]
(2.4)、计算当天动态基线,将当天生成的所有小时ru作为上基线。
[0047]
(3)、如图1、3所示,采样当前时刻开始向前t时间内的运行指标数据,判断运行指标是否稳定增长,动态调整上限阈值ru;具体步骤如下:
[0048]
(3.1)、观察当前时刻t开始,向前的t时间内的运行指标数据;
[0049]
(3.2)、采样:从t-t时刻开始采样,采样到当前时刻t,采样点依次是t-t,m为采样时间点;
[0050]
假设采样m个时间点(实际应用中,m可以由工作人员根据经验设定);实际上,m=4到10都可以取得较好效果。
[0051]
本实施例中,m=5,采样的时间点分别为t-t,(t-t+(t/2)),(t-t+(3t/4),(t-t+(7t/8)),(t-t+(15t/16));
[0052]
(3.3)、若(系统只要是稳定运行,缓慢增长),则更改否则,ru不变。
[0053]
本实施例中,当m=5时,
[0054]
若p(t-t)《p(t-t+(t/2))《p(t-t+(3t/4))《p(t-t+(7t/8))《(t-t+(15t/16))《p(t),则更改ru=ru+p(t)-p(t-t+(7t/8)),即可以调高ru。
[0055]
(4)、系统运行时,如果运行指标p>ru,则为超上限阈值异常,如果指标p<rd,则为超下限阈值异常,rd为下限阈值(本发明不分析下限,按常规方式计算判断就行),其它则为正常情况。
[0056]
本发明所述的it系统运行指标动态阈值上限分析方法,共涉及3个模块:指标接收模块、动态阈值分析模块、输出模块。
[0057]

指标接收模块提供标准的数据接口,完成对各it系统最新上报运行指标的接收预处理,并保存为历史数据;
[0058]

动态阈值分析模块,即本发明算法模块。一方面根据指标历史情况计算和设置动态阈值;另一方面结合当前时间内的各类采样指标数据,调整和更新系统指标的上限阈值;最终形成基于上限阈值更新的系统正常运行指标基线数据。
[0059]

输出模块包含告警通知和监测展现。告警通知模块根据指标运行状态变更,给用户发送告警;监测展现模块通过趋势图实现运行指标变化轨迹以及动态基线的显示,提供对比分析;
[0060]
图2为it运行指标的正态分布示意图,由于it运行指标往往与具体信息系统业务吞吐量有关,而用户的业务吞吐量则具备峰谷特征,因此从某个同周期的历史时间段来看,其指标实际值总是处于某个特定的区间范围,体现出正态分布的特征。
[0061]
图4为本发明最后生成的动态基线示意图,从中可以看出用户的运行指标在工作日上班时间段体现出峰值,非工作时间段体现为谷值,而计算出的动态基线则更为平缓的呈现在指标变化趋势上下。
[0062]
可以理解的是,对本领域技术人员来说,对本发明的技术方案及发明构思加以等同替换或改变都应属于本发明所附的权利要求的保护范围。

技术特征:


1.一种it系统运行指标动态阈值上限分析方法,其特征在于:该方法包括以下步骤:(1)、查询运行指标p的历史数据,获得运行指标p的查询值p(t);(2)、针对当天的每一个小时,都在开始运行前,根据运行指标p的历史数据,得到当前小时正常值区间上限阈值ru;(3)、采样当前时刻开始向前t时间内的运行指标数据,判断运行指标是否稳定增长,动态调整上限阈值ru;(4)、系统运行时,如果p(t)>ru,则为超上限阈值异常。2.根据权利要求1所述的it系统运行指标动态阈值上限分析方法,其特征在于:所述的步骤(1)中,运行指标p包括磁盘空间、带宽或内存,具体步骤如下:(2.1)、采样点前一小时平均值pm
h
与标准差psd
h
;(2.2)、采样点前一天同小时平均值pm
d
与标准差psd
d
;(2.3)、采样点过去8周同一天同小时平均值pm
w1
~pm
w8
与标准差psd
w1
~psd
w8
。3.根据权利要求2所述的it系统运行指标动态阈值上限分析方法,其特征在于:所述的步骤(2)中,具体步骤如下:(3.1)、计算平均值参数rm:其中,n表示采样点过去第几周,pm
wn
表示采样点过去n周同一天同小时平均值;(3.2)、计算标准差参数rsd:其中,psd
wn
表示采样点过去n周同一天同小时标准差;(3.3)、当前小时正常值区间上限阈值ru:ru=rm+rsd
×
3;(3.4)、计算当天动态基线,将当天生成的所有小时ru作为上基线。4.根据权利要求3所述的it系统运行指标动态阈值上限分析方法,其特征在于:所述的步骤(3)中,具体步骤如下:(4.1)、观察当前时刻t开始,向前的t时间内的运行指标数据;(4.2)、采样:从t-t时刻开始采样,采样到当前时刻t,采样点依次是m为采样时间点;(4.3)、若则更改否则,ru不变。

技术总结


本发明提供了一种IT系统运行指标动态阈值上限分析方法,包括以下步骤:(1)、查询运行指标P的历史数据,获得运行指标P的查询值P(t);(2)、针对当天的每一个小时,都在开始运行前,根据运行指标P的历史数据,得到当前小时正常值区间上限阈值Ru并生成上基线;(3)、采样当前时刻开始向前T时间内的运行指标数据,判断运行指标是否稳定增长,动态调整上限阈值Ru;(4)、系统运行时,如果P(t)>Ru,则为超上限阈值异常。本发明的有益效果为:根据当前系统运行情况对动态阈值上基线做出及时地调整和更新,本发明无需大量人为操作,计算量小,且分析准确,因此可大量减少运维人力成本,提高监测覆盖面与准确率。覆盖面与准确率。覆盖面与准确率。


技术研发人员:

刘东海 徐育毅 庞辉富

受保护的技术使用者:

杭州优云软件有限公司

技术研发日:

2022.10.17

技术公布日:

2023/1/19


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-1-79035-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2023-01-26 06:48:27

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论