基于大数据的风险预测系统及其预测方法与流程
1.本技术涉及风险预测的领域,且更为具体地,涉及一种基于大数据的风险预测系统及其预测方法。
背景技术:
2.地球地质环境的变化导致滑坡的发生,人类对地质结构影响使得滑坡发生频率增大,给社会、国家和个人带来严重的危害。滑坡是一种普遍的全球性的自然地质灾害,给人类的生命财产安全带来了严重危害。
3.滑坡地质灾害发生频繁造成的危害严重,归结其原因在于滑坡发生具有很强的隐蔽性和突发性,导致人们不易察觉,从而造成严重的影响。如何有效地进行预测预警监测滑坡,减少其带来的危害,是亟需解决的技术问题。
4.因此,期望一种基于大数据的风险预测系统以对山体滑坡灾害进行准确地预测,进而减小其带来的危害。
技术实现要素:
5.为了解决上述技术问题,提出了本技术。本技术的实施例提供了一种基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
6.根据本技术的一个方面,提供了一种基于大数据的风险预测系统,其包括:
7.训练模块,包括:
8.训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
9.特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
10.高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的
特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
11.高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;
12.高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;
13.分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;
14.系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;
15.训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及
16.推断模块,包括:
17.原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;
18.特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;
19.高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;
20.高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;
21.分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及
22.分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
23.与现有技术相比,本技术提供的基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来
平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
附图说明
24.通过结合附图对本技术实施例进行更详细的描述,本技术的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本技术实施例的进一步理解,并且构成说明书的一部分,与本技术实施例一起用于解释本技术,并不构成对本技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
25.图1为根据本技术实施例的基于大数据的风险预测系统的场景示意图。
26.图2为根据本技术实施例的基于大数据的风险预测系统的框图。
27.图3a为根据本技术实施例的基于大数据的风险预测系统的预测方法中训练阶段的流程图。
28.图3b为根据本技术实施例的基于大数据的风险预测系统的预测方法中推断阶段的流程图。
29.图4为根据本技术实施例的基于大数据的风险预测系统的预测方法中训练阶段的架构示意图。
30.图5为根据本技术实施例的基于大数据的风险预测系统的预测方法中推断阶段的架构示意图。
具体实施方式
31.下面,将参考附图详细地描述根据本技术的示例实施例。显然,所描述的实施例仅仅是本技术的一部分实施例,而不是本技术的全部实施例,应理解,本技术不受这里描述的示例实施例的限制。
32.场景概述
33.如前所述,地球地质环境的变化导致滑坡的发生,人类对地质结构影响使得滑坡发生频率增大,给社会、国家和个人带来严重的危害。滑坡是一种普遍的全球性的自然地质灾害,给人类的生命财产安全带来了严重危害。
34.滑坡地质灾害发生频繁造成的危害严重,归结其原因在于滑坡发生具有很强的隐蔽性和突发性,导致人们不易察觉,从而造成严重的影响。如何有效地进行预测预警监测滑坡,减少其带来的危害,是亟需解决的技术问题。
35.因此,期望一种基于大数据的风险预测系统以对山体滑坡灾害进行准确地预测,进而减小其带来的危害。
36.引发滑坡的自然因素主要是地震和降雨。在自然环境下,地球剧烈的地质运动,改变了地貌的同时伴随着滑坡的出现。其中较为剧烈的地质运动主要是地震的作用,引发滑坡其表现的形式主要通过地震能量的传递,由于山体顶部重心较高,易受到地震能量的影响,较为陡的坡体山体更易出现滑坡,坡体主要表现的特征为坡度、山体出现滑移。滑坡坡度与滑坡发生总体上呈正态分布的特点。大多数滑坡发生概率在10
°
到60
°
发生概率较大,在10
°
和60
°
中间的概率最大,所以有必要对滑坡坡度角度进行监测,并通过角度坡度进行量化和权重的确定,对滑坡灾害预测提供参考信息。
37.滑坡中土壤中含水率会引起土壤内聚力的改变。随着含水率增加,土壤内聚力减小,从而导致坡体的移动。表明滑坡发生与土壤含水率存在正相关关系。当含水率增大时,其内聚力减小。
38.因此,在本技术的技术方案中,首先获取观测时间段内的多个时间点的角度数据,并通过包含嵌入层的基于上下文的编码器模型获得多个角度特征向量,然后构造第一高斯密度图:
[0039][0040]
其中μ1为多个角度特征向量的均值向量,且∑1是每两个角度特征向量之间的向量间均方误差的协方差矩阵。
[0041]
同样地,对于阻抗,位移和温度,得到第二到第四高斯密度图,然后对第一高斯密度图到第四高斯密度图构造高斯混合模型
[0042][0043][0044]
因此,将求和符号移到括号内,则高斯混合模型可以表示为混合高斯密度图:
[0045][0046]
也就是,均值向量为μ1到μ4乘以系数后进行点加,且协方差矩阵也为∑1到∑4乘以系数后进行点加。
[0047]
然后,再将混合高斯密度图进行高斯离散化以得到分类矩阵,并通过分类器获得分类结果。
[0048]
这里,高斯混合模型的系数πk作为超参数,且引入系数损失函数来平衡不同高斯密度图之间的概率密度分布的个体差异,表示为:
[0049][0050]
基于此,本技术提出了一种基于大数据的风险预测系统,其包括训练模块和推断模块。其中,训练模块,包括:训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差
矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。其中,推断模块,包括:原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及,分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
[0051]
图1图示了根据本技术实施例的基于大数据的风险预测系统的场景示意图。如图1所示,在该应用场景的训练阶段中,首先,通过布置于滑坡(例如,如图1中所示意的h)的阵列传感器(例如,如图1中所示意的t)来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。然后,将获得的所述多个时间点的角度数据、阻抗数据、位移数据和温度数据输入至部署有基于大数据的风险预测算法的服务器(例如,如图1中所示意的s)中,其中,所述服务器能够基于基于大数据的风险预测算法以所述多个时间点的角度数据、阻抗数据、位移数据和温度数据对基于大数据的风险预测系统的所述编码器模型进行训练。
[0052]
在训练完成后,在推断阶段中,首先,通过布置于滑坡(例如,如图1中所示意的h)的阵列传感器(例如,如图1中所示意的t)来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。然后,将所述多个时间点的角度数据、阻抗数据、位移
数据和温度数据输入至部署有基于大数据的风险预测算法的服务器(例如,如图1中所示意的s)中,其中,所述服务器能够以基于大数据的风险预测算法对所述多个时间点的角度数据、阻抗数据、位移数据和温度数据进行处理,以生成用于表示是否有山体滑坡的风险的分类结果。进而,基于所述分类结果能够对山体滑坡的风险性进行准确地预测,以减小其带来的危害。
[0053]
在介绍了本技术的基本原理之后,下面将参考附图来具体介绍本技术的各种非限制性实施例。
[0054]
示例性系统
[0055]
图2图示了根据本技术实施例的基于大数据的风险预测系统的框图。如图2所示,根据本技术实施例的基于大数据的风险预测系统200,包括:训练模块210和推断模块220。其中,训练模块210,包括:训练数据单元2101,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征编码单元2102,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯融合单元2103,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合单元2104,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;高斯离散化单元2105,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;分类损失函数值计算单元2106,用于将所述分类矩阵通过分类器以获得分类损失函数值;系数损失函数值单元2107,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;训练单元2108,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。其中,推断模块220,包括:原始数据获取单元221,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征向量生成单元222,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯密度图生成单元223,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为
所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合模型生成单元224,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;分类矩阵生成单元225,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及,分类结果生成单元226,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
[0056]
具体地,在本技术实施例中,在训练模块210中,所述训练数据单元2101和特征编码单元2102,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据,并将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量。如前所述,本技术是通过阵列传感器来对坡度变化进行过程分析,对坡度形变量和环境相关因素进行监控以进行滑坡风险预测及预警。因此,在本技术的技术方案中,首先通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。然后,将获取的所述多个时间点的各个参数数据分别通过包含嵌入层的基于上下文的编码器模型中进行编码处理,以提取出所述各个参数全局性的关联信息,从而获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量。
[0057]
更具体地,在本技术实施例中,所述特征编码单元,包括:首先,使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列。然后,使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。应可以理解,由于基于转换器的编码器模型能够基于上下文对所述输入向量进行编码,因此所获得的角度特征向量、所述阻抗特征向量、所述位移特征向量和所述温度特征向量具有全局性的角度关联信息、阻抗关联信息、位移关联信息、温度关联信息和角度-阻抗-位移-温度关联信息。
[0058]
具体地,在本技术实施例中,在训练模块210中,所述高斯融合单元2103,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成。应可以理解,考虑到所述各个参数的多个特征向量在高维特征空间中分别对
应着一个特征分布流形,而这些特征分布流形由于本身的不规则形状和散布位置,如果仅通过将所述各个参数特征向量级联来获得分类特征向量,将相当于简单地将这些特征分布流形按原位置和形状来进行叠加,使得新获得的特征分布流形的边界变得非常不规则和复杂,在通过梯度下降来寻最优点时,非常容易陷入局部极值点中而无法获得全局最优点。因此,需要进一步地对这些所述参数特征向量进行适当的融合,使得各个特征分布能够相对于彼此在型面上收敛,从而提高后续分类的准确性。
[0059]
也就是,在本技术的技术方案中,在得到所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量后,进一步使用高斯密度图来融合所述各个参数的多个特征向量,从而得到第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图。相应地,在一个具体示例中,使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;其中,所述公式为其中,μi为所述第一至第四高斯密度图的均值向量,且∑i是所述第一至第四高斯密度图的协方差矩阵。
[0060]
具体地,在本技术实施例中,在训练模块210中,所述高斯混合单元2104,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1。也就是,为了有效地对所述各个特征信息进行融合,在本技术的技术方案中,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型。应可以理解,高斯混合模型可以通过加权系数来对各个高斯分布之间实现了响应均一化,从而实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异。
[0061]
更具体地,在本技术实施例中,所述高斯混合单元,进一步用于:基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;其中,所述公式为:所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。
[0062]
具体地,在本技术实施例中,在训练模块210中,所述高斯离散化单元2105和所述分类损失函数值计算单元2106,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵,并将所述分类矩阵通过分类器以获得分类损失函数值。也就是,在本技术的技术方案中,接着再将所述高斯混合模型进行高斯离散化以获得分类矩阵。应可以理解,对所述高斯混合模型进行高斯离散化可以使得特征信息在融合时不产生信息损失,进而提高分类的准确性。然后,将所述分类矩阵通过分类器以获得分类损失函数值。
[0063]
更具体地,在本技术实施例中,所述分类损失函数值计算单元,进一步用于:首先,使用所述分类器以如下公式对所述分类矩阵进行处理以获得分类结果;其中,所述公式为:softmax{(wn,bn):
…
:w1,b1project(f)},其中project(f)表示将所述分类矩阵投影为向量,w1至wn为各层全连接层的权重矩阵,b1至bn表示各层全连接层的偏置矩阵。然后,计算所
述分类结果和真实值之间的交叉熵值作为所述分类损失函数值。
[0064]
具体地,在本技术实施例中,在训练模块210中,所述系数损失函数值单元2107和所述训练单元2108,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异,以及基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。应可以理解,在本技术的技术方案中,所述高斯混合模型的系数πk作为超参数,且引入系数损失函数来平衡不同高斯密度图之间的概率密度分布的个体差异。也就是,具体地,基于所述预定系数构造用于表示所述第一至第四高斯密度图之间的概率密度分布之间差异的系数损失函数值,以提高分类的准确性。
[0065]
更具体地,在本技术实施例中,所述系数损失函数值单元,进一步用于:基于所述预定系数以如下公式来构造所述系数损失函数值;
[0066]
其中,所述公式为:
[0067]
在完成对所述编码器模型的训练之后,就可以按照上述方法得到用于表示是否有山体滑坡的风险的分类结果。
[0068]
具体地,在本技术实施例中,在推断模块220中,首先,通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据。接着,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量。然后,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成。接着,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型。然后,将所述高斯混合模型进行高斯离散化以获得分类矩阵。最后,将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
[0069]
综上,基于本技术实施例的所述基于大数据的风险预测系统200被阐明,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
[0070]
如上所述,根据本技术实施例的基于大数据的风险预测系统200可以实现在各种
终端设备中,例如基于大数据的风险预测的服务器等。在一个示例中,根据本技术实施例的基于大数据的风险预测系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于大数据的风险预测系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于大数据的风险预测系统200同样可以是该终端设备的众多硬件模块之一。
[0071]
替换地,在另一示例中,该基于大数据的风险预测系统200与该终端设备也可以是分立的设备,并且该基于大数据的风险预测系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
[0072]
示例性方法
[0073]
图3a图示了根据本技术实施例的基于大数据的风险预测系统的预测方法中训练阶段的流程图。如图3a所示,根据本技术实施例的基于大数据的风险预测系统的预测方法,包括:训练阶段,包括步骤:s110,通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;s120,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;s130,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;s140,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;s150,将所述高斯混合模型进行高斯离散化以获得分类矩阵;s160,将所述分类矩阵通过分类器以获得分类损失函数值;s170,基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;s180,基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。
[0074]
图3b图示了根据本技术实施例的基于大数据的风险预测系统的预测方法中推断阶段的流程图。图3b所示,根据本技术实施例的基于大数据的风险预测系统的预测方法,包括:推断阶段,包括步骤:s210,通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;s220,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;s230,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二
高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;s240,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;s250,将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及,s260,将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
[0075]
图4图示了根据本技术实施例的基于大数据的风险预测系统的预测方法中训练阶段的架构示意图。如图4所示,在训练阶段中,在该网络架构中,首先,将获取的所述多个时间点的角度数据(例如,如图4中所示意的p1)、阻抗数据(例如,如图4中所示意的p2)、位移数据(例如,如图4中所示意的p3)和温度数据(例如,如图4中所示意的p4)分别通过包含嵌入层的基于上下文的编码器模型(例如,如图4中所示意的e1)以获得多个角度特征向量(例如,如图4中所示意的vf1)、多个阻抗特征向量(例如,如图4中所示意的vf2)、多个位移特征向量(例如,如图4中所示意的vf3)和多个温度特征向量(例如,如图4中所示意的vf4);接着,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图(例如,如图4中所示意的gd1)、第二高斯密度图(例如,如图4中所示意的gd2)、第三高斯密度图(例如,如图4中所示意的gd3)和第四高斯密度图(例如,如图4中所示意的gd4);然后,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型(例如,如图4中所示意的gmm);接着,将所述高斯混合模型进行高斯离散化以获得分类矩阵(例如,如图4中所示意的mf);然后,将所述分类矩阵通过分类器(例如,如图4中所示意的分类器)以获得分类损失函数值(例如,如图4中所示意的clv);接着,基于所述预定系数构造系数损失函数值(例如,如图4中所示意的cfv);最后,基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型。
[0076]
图5图示了根据本技术实施例的基于大数据的风险预测系统的预测方法中推断阶段的架构示意图。如图5所示,在推断阶段中,在该网络架构中,首先,将所述多个时间点的角度数据(例如,如图5中所示意的p1)、阻抗数据(例如,如图5中所示意的p2)、位移数据(例如,如图5中所示意的p3)和温度数据(例如,如图5中所示意的p4)分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型(例如,如图5中所示意的e2)以获得多个角度特征向量(例如,如图5中所示意的vf1)、多个阻抗特征向量(例如,如图5中所示意的vf2)、多个位移特征向量(例如,如图5中所示意的vf3)和多个温度特征向量(例如,如图5中所示意的vf4);接着,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图(例如,如图5中所示意的gd1)、第二高斯密度图(例如,如图5中所示意的gd2)、第三高斯密度图(例如,如图5中所示意的gd3)和第四高斯密度图(例如,如图5中所示意的gd4);然后,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型(例如,如图5中所示意的gmm);接着,将所述高斯混合模型进行高斯离散化以获得
分类矩阵(例如,如图5中所示意的mf);以及,最后,将所述分类矩阵通过分类器(例如,如图5中所示意的分类器)以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。
[0077]
综上,基于本技术实施例的所述基于大数据的风险预测系统的预测方法被阐明,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。
[0078]
以上结合具体实施例描述了本技术的基本原理,但是,需要指出的是,在本技术中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本技术的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本技术为必须采用上述具体的细节来实现。
[0079]
本技术中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
[0080]
还需要指出的是,在本技术的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本技术的等效方案。
[0081]
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本技术。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本技术的范围。因此,本技术不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
技术特征:
1.一种基于大数据的风险预测系统,其特征在于,包括:训练模块,包括:训练数据单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征编码单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯融合单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;高斯混合单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;高斯离散化单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;分类损失函数值计算单元,用于将所述分类矩阵通过分类器以获得分类损失函数值;系数损失函数值单元,用于基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;训练单元,用于基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及推断模块,包括:原始数据获取单元,用于通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;特征向量生成单元,用于将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;高斯密度图生成单元,用于使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度
特征向量中各个位置的特征值间的方差构成;高斯混合模型生成单元,用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型;分类矩阵生成单元,用于将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及分类结果生成单元,用于将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。2.根据权利要求1所述的基于大数据的风险预测系统,其中,所述特征编码单元,进一步用于使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列;以及,使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。3.根据权利要求2所述的基于大数据的风险预测系统,其中,所述高斯融合单元,用于使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;其中,所述公式为其中,μ
i
为所述第一至第四高斯密度图的均值向量,且∑
i
是所述第一至第四高斯密度图的协方差矩阵。4.根据权利要求3所述的基于大数据的风险预测系统,其中,所述高斯混合单元,进一步用于基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;其中,所述公式为:所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。5.根据权利要求4所述的基于大数据的风险预测系统,其中,所述分类损失函数值计算单元,进一步用于使用所述分类器以如下公式对所述分类矩阵进行处理以获得分类结果;其中,所述公式为:softmax{(w
n
,b
n
):
…
:(w1,b1)|project(f)},其中project(f)表示将所述分类矩阵投影为向量,w1至w
n
为各层全连接层的权重矩阵,b1至b
n
表示各层全连接层的偏置矩阵;以及计算所述分类结果和真实值之间的交叉熵值作为所述分类损失函数值。6.根据权利要求5所述的基于大数据的风险预测系统,其中,所述系数损失函数值单元,进一步用于基于所述预定系数以如下公式来构造所述系数损失函数值;其中,所述公式为:7.一种基于大数据的风险预测系统的预测方法,其特征在于,包括:
训练阶段,包括:通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,其中,所述高斯混合模型的均值向量为所述第一至第四高斯密度图的均值向量乘以预定系数后的点加值、所述高斯混合模型的协方差矩阵为所述第一至第四高斯密度图的协方差矩阵乘以所述预定系数后的点加值,所述预定系数之和为1;将所述高斯混合模型进行高斯离散化以获得分类矩阵;将所述分类矩阵通过分类器以获得分类损失函数值;基于所述预定系数构造系数损失函数值,其中,所述系数损失函数值用于表示所述第一至第四高斯密度图之间的概率密度分布之间的差异;基于所述分类损失函数值和所述系数损失函数值之间的加权和来训练所述编码器模型;以及推断阶段,包括:通过布置于滑坡的阵列传感器来获得在观测时间段内的多个时间点的角度数据、阻抗数据、位移数据和温度数据;将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过经训练单元训练而成的所述包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量;使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,其中,所述第一至第四高斯密度图的均值向量分别为所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量的均值向量,所述第一至第四高斯密度图的协方差矩阵分别基于所述多个角度特征向量中各个位置的特征值间的方差、所述多个阻抗特征向量中各个位置的特征值间的方差、所述多个位移特征向量中各个位置的特征值间的方差和所述多个温度特征向量中各个位置的特征值间的方差构成;基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高
斯密度图构造高斯混合模型;将所述高斯混合模型进行高斯离散化以获得分类矩阵;以及将所述分类矩阵通过分类器以获得分类结果,所述分类结果用于表示是否有山体滑坡的风险。8.根据权利要求7所述的基于大数据的风险预测系统的预测方法,其中,将所述多个时间点的角度数据、阻抗数据、位移数据和温度数据分别通过包含嵌入层的基于上下文的编码器模型以获得多个角度特征向量、多个阻抗特征向量、多个位移特征向量和多个温度特征向量,包括:使用所述编码器模型的嵌入层分别将各个所述角度数据、各个所述阻抗数据、各个所述位移数据和各个所述温度数据转化为角度输入向量、阻抗输入向量、位移输入向量和温度输入向量以获得角度输入向量的序列、阻抗输入向量的序列、位移输入向量的序列和温度输入向量的序列;以及使用所述编码器模型的转换器从所述角度输入向量的序列、所述阻抗输入向量的序列、所述位移输入向量的序列和所述温度输入向量的序列获得所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量。9.根据权利要求7所述的基于大数据的风险预测系统的预测方法,其中,使用高斯密度图来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得第一高斯密度图、第二高斯密度图、第三高斯密度图和第四高斯密度图,包括:使用高斯密度图以如下公式来融合所述多个角度特征向量、所述多个阻抗特征向量、所述多个位移特征向量和所述多个温度特征向量以获得所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图;其中,所述公式为其中,μ
i
为所述第一至第四高斯密度图的均值向量,且∑
i
是所述第一至第四高斯密度图的协方差矩阵。10.根据权利要求7所述的基于大数据的风险预测系统的预测方法,其中,基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图构造高斯混合模型,包括:基于所述第一高斯密度图、所述第二高斯密度图、所述第三高斯密度图和所述第四高斯密度图以如下公式来构造所述高斯混合模型;其中,所述公式为:所述高斯混合模型的均值向量为μ1到μ4乘以系数后进行点加,且所述高斯混合模型的协方差矩阵为∑1到∑4乘以系数后进行点加。
技术总结
本申请涉及风险预测的领域,其具体地公开了一种基于大数据的风险预测系统及其预测方法,其通过基于上下文的编码器模型分别对观测时间段内的多个时间点的角度、阻抗、位移和温度数据进行高维关联特征提取,并使用高斯密度图来融合所述各个参数的多个特征向量,进一步再构造高斯混合模型,以实现高斯分布之间的响应均一化,从而也就实现了对特征尺度的鲁棒性,能够有效地消除特征尺度之间的差异,并且在此过程中引入系数损失函数来平衡所述不同高斯密度图之间的概率密度分布的个体差异,进而使得分类的结果更为准确。这样,就可以对山体滑坡灾害进行准确地预测,以减小其带来的危害。害。害。
