基于量子分类器的数据分类方法及数据安全风险评估方法与流程
1.本发明属于量子技术领域,具体涉及一种基于量子分类器的数据分类方法及数据安全风险评估方法。
背景技术:
2.数据分类是经典机器学习和量子机器学习中重要的研究方向。数据分类是指根据组织数据的属性或特性,将其按照一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序,以便更好的管理和使用组织数据的过程。数据分类是数据保护工作中的一个关键部分,是建立统一、准确、完整的数据架构的基础,是实现集中化、专业化、标准化数据管理的基础,在数据安全风险评估中有重要的应用价值。
3.数据分类的过程通常是用构建数据分类器来进行实现的。因此,构建的数据分类器就直接关系到数据分类的可靠性和精确性。传统的数据分类器及对应的数据分类方法,随着数据规模的日益增大,已经开始不再适用于现有的海量数据分类要求。
技术实现要素:
4.本发明的目的之一在于提供一种适用于大规模数据分类,且可靠性高、精确性好的基于量子分类器的数据分类方法。
5.本发明的目的之二在于提供一种包括了所述基于量子分类器的数据分类方法的数据安全风险评估方法。
6.本发明提供的这种基于量子分类器的数据分类方法,包括如下步骤:
7.s1.获取现有的、带有分类标签的分类数据集;
8.s2.构建量子角度编码,并将步骤s1获取的分类数据集通过量子角度编码转换为量子态,作为量子分类器的输入;
9.s3.基于量子系统的哈密顿量,构建原始量子分类器;
10.s4.采用步骤s2得到的量子态对步骤s3构建的原始量子分类器进行训练,得到量子分类器;
11.s5.采用步骤s2构建的量子角度编码,将实际待分类的目标数据集转换为量子态;
12.s6.将步骤s5得到的量子态输入到步骤s4得到的量子分类器,输出最终的结果,完成实际数据的数据分类。
13.步骤s1所述的获取现有的、带有分类标签的分类数据集,具体为获取现有的、带有分类标签的分类数据集d={(xk,yk)};其中d为分类数据集,x为分类数据集内的数据,y为分类数据集内的数据标签,k为分类数据集内数据的个数。
14.步骤s2所述的构建量子角度编码,并将步骤s1获取的分类数据集通过量子角度编码转换为量子态,作为量子分类器的输入,具体包括如下步骤:
15.a.确定采用的量子比特数量;
16.b.确定初始量子态为|0k》;
17.c.将分类数据集中的第k个数据xk编码成一系列量子门u(xk),并作用在步骤b确定的初始量子态|0k》上,得到一系列量子态|ψ
in
>为式中为內积符号,k=1,2,...,k,k为分类数据集内数据的个数。
18.步骤c所述的量子门u(xk),具体为量子门u(xk)由量子旋转门rz(θ)和ry(θ)组合,u(xk)=rz(xk)ry(xk)。
19.步骤s3所述的基于量子系统的哈密顿量,构建原始量子分类器,具体包括如下步骤:
20.设定量子系统的哈密顿量h为其中为泡利z算子,为泡利y算子,为泡利x算子,n为粒子的个数;
21.采用哈密顿量的酉算子描述量子分类器中用到的量子门,有:
[0022][0023]
式中θ
β
初始为随机变量,后续会根据损失函数变化而更新;h为哈密顿量;t为量子线路的深度;
[0024]
则在原始量子分类器中设计的量子门为
[0025]
原始量子分类器的具体组建的门为量子旋转rz(θ)、ry(θ)和r
x
(θ)的组合,因此存在:
[0026][0027]
式中t为量子线路的深度;
[0028]
在量子线路中,在量子线路开始时采用hadamard门和泡利x门用于稳定初始量子态,在量子线路中间采用由cnot门和泡利x门组合得到的cnot-x门用于搭建纠缠层。
[0029]
步骤s4所述的采用步骤s2得到的量子态对步骤s3构建的原始量子分类器进行训练,得到量子分类器,具体包括如下步骤:
[0030]
将步骤s2得到的量子态,输入到步骤s3构建的原始量子分类器,经过量子线路后完成系统的演化过程,生成输出量子态|ψ
out
>;
[0031]
然后,将得到的输出量子态|ψ
out
》进行量子测量,得到经典分类信息;所述经典分
类信息包括量子分类器分类得到的标签
[0032]
对步骤s3构建的原始量子分类器的参数进行训练,训练时采用梯度下降的方式进行参数优化,设定损失函数为其中w为样本个数,为更新后的标签,yk为初始标签;
[0033]
训练完成后,得到最优的参数,从而得到量子分类器。
[0034]
本发明还提供了一种包括了所述基于量子分类器的数据分类方法的数据安全风险评估方法,包括如下步骤:
[0035]
(1)获取待进行风险评估的经典数据集;
[0036]
(2)采用所述的基于量子分类器的数据分类方法,对步骤(1)获取的待进行风险评估的经典数据集进行分类,得到分类结果;
[0037]
(3)对分类结果进行分级;
[0038]
(4)根据得到的分级结果,对待进行风险评估的经典数据集进行风险评估。
[0039]
本发明提供的这种基于量子分类器的数据分类方法及数据安全风险评估方法,基于量子计算设计了一种量子分类器,并通过设计的量子分类器实现了大规模数据的快速分类,而且本发明的可靠性高,精确性好。
附图说明
[0040]
图1为本发明的分类方法的方法流程示意图。
[0041]
图2为本发明的分类方法中的量子线路示意图。
[0042]
图3为本发明的评估方法的方法流程示意图。
具体实施方式
[0043]
如图1所示为本发明的分类方法的方法流程示意图:本发明提供的这种基于量子分类器的数据分类方法,包括如下步骤:
[0044]
s1.获取现有的、带有分类标签的分类数据集;具体为获取现有的、带有分类标签的分类数据集d={(xk,yk)};其中d为分类数据集,x为分类数据集内的数据,y为分类数据集内的数据标签,k为分类数据集内数据的个数;
[0045]
s2.构建量子角度编码,并将步骤s1获取的分类数据集通过量子角度编码转换为量子态,作为量子分类器的输入;
[0046]
如果想要运用量子计算机处理经典数据,必须考虑如何在量子系统中表示经典数据赋有的特征,此外,还需要设计一种合适的模式将数据从经典存储器“加载”到量子计算机中;这种将经典数据映射到量子计算机中,构造出初始状态作为量子机器学习算法的输入的过程,被称为量子态制备问题,而量子态制备中所使用的具体映射模式叫做量子态编码;常见的量子态编码的种类大体上可以有基态编码、振幅编码、角度编码等;
[0047]
本发明设计的量子线路的量子分类器中所使用的编码方式为量子角度编码,具体包括如下步骤:
[0048]
a.确定采用的量子比特数量;
[0049]
b.确定初始量子态为|0k》;
[0050]
c.将分类数据集中的第k个数据xk编码成一系列量子门u(xk),并作用在步骤b确定的初始量子态|0k》上,得到一系列量子态|ψ
in
》为式中为內积符号,k=1,2,...,k,k为分类数据集内数据的个数;所述的量子门u(xk),具体为量子门u(xk)由量子旋转门rz(θ)和ry(θ)组合,u(xk)=rz(xk)ry(xk);
[0051]
具体实施时,假设给定的数据点x=(x0,x1)=(0,1),则这个数据点对应的量子比特量子门u(x)为:
[0052][0053]
将rz(θ)和ry(θ)的矩阵形式带入量子比特量子门u(x)的算式,得到
[0054][0055]
式中
[0056]
简化后,得到编码后得到的输入量子态为:
[0057][0058]
s3.基于量子系统的哈密顿量,构建原始量子分类器;
[0059]
本发明的量子分类器的量子线路的设计方式是源于对设定的孤立量子系统的哈密顿量进行分解得到的量子线路;
[0060]
量子态经量子线路后状态变化的过程,可以视为量子系统系统演化的过程,由于量子分类器在进行运算处理时和外界无能量和物质的转化,故量子分类器所处的量子系统为孤立量子系统,故该量子系统的哈密顿量是恒定的,因此设定量子系统的哈密顿量h为其中为泡利z算子,为泡利y算子,为泡利x算子,n为粒子的个数;
[0061]
采用哈密顿量的酉算子描述量子分类器中用到的量子门,有:
[0062][0063]
式中θ
β
初始为随机变量,后续会根据损失函数变化而更新;h为哈密顿量;t为量子线路的深度;
[0064]
则在原始量子分类器中设计的量子门为
[0065]
原始量子分类器的具体组建的门为量子旋转rz(θ)、ry(θ)和r
x
(θ)的组合,因此存在:
[0066][0067]
式中t为量子线路的深度;
[0068]
在量子线路中,在量子线路开始时采用hadamard门和泡利x门用于稳定初始量子态,在量子线路中间采用由cnot门和泡利x门组合得到的cnot-x门用于搭建纠缠层;
[0069]
若量子线路的深度t=1,则使用4个量子比特n=4,则构建的量子电路如图2所示;
[0070]
s4.采用步骤s2得到的量子态对步骤s3构建的原始量子分类器进行训练,得到量子分类器;具体包括如下步骤:
[0071]
将步骤s2得到的量子态,输入到步骤s3构建的原始量子分类器,经过量子线路后完成系统的演化过程,生成输出量子态|ψ
out
》;
[0072]
然后,将得到的输出量子态|ψ
out
》进行量子测量,得到经典分类信息;所述经典分类信息包括量子分类器分类得到的标签量子态是随着时间不断演化的,对于孤立量子系统,它的演化是幺正的。在量子系统演化中,通过量子测量可以得到系统处在什么样的状态;一般来说,量子测量是不可逆的;对量子系统进行测量时候,通过引入测量设备,被测量的量子系统会于其产生相互作用;此时,对于原来的幺正演化的孤立系统而言,其哈密顿量不再是厄米的,演化也不再是幺正的,系统亦不再是可逆的;
[0073]
对步骤s3构建的原始量子分类器的参数进行训练,训练时采用梯度下降的方式进行参数优化,设定损失函数为其中w为样本个数,为更新后的标签,yk为初始标签;
[0074]
训练完成后,得到最优的参数,从而得到量子分类器;
[0075]
s5.采用步骤s2构建的量子角度编码,将实际待分类的目标数据集转换为量子态;
[0076]
s6.将步骤s5得到的量子态输入到步骤s4得到的量子分类器,输出最终的结果,完成实际数据的数据分类。
[0077]
如图3所示为本发明的评估方法的方法流程示意图:本发明提供的这种包括了所述基于量子分类器的数据分类方法的数据安全风险评估方法,包括如下步骤:
[0078]
(1)获取待进行风险评估的经典数据集;
[0079]
(2)采用所述的基于量子分类器的数据分类方法,对步骤(1)获取的待进行风险评估的经典数据集进行分类,得到分类结果;
[0080]
(3)对分类结果进行分级;
[0081]
(4)根据得到的分级结果,对待进行风险评估的经典数据集进行风险评估。
[0082]
本发明所提供的基于量子分类器的数据分类方法,还可以应用于新闻内容的情感分类分析和车辆生产过程中的正常数据和异常数据分类。
[0083]
应用场景1:新闻内容的情感分类分析,具体如下:
[0084]
应用背景:新闻情感信息是附着于新闻事实信息之上的,随着事实信息的流动而流动的、相异于新闻事实信息的另类信息。本技术所设计的量子分类器,可被应用于准确捕捉新闻事实中产生的情感信息,并将其分类鉴定为消极信息与积极信息两个方面,为后续的舆情工作提供便利的分类基础。
[0085]
应用步骤具体为:
[0086]
s1:获取新闻文本内容,得到新闻事实信息;
[0087]
s2:将新闻信息通过角度编码,编写成可被量子分类器识别的初始状态;
[0088]
s3:将编码完成后的新闻信息,采用本发明所述的基于量子分类器的数据分类方法进行分类,提炼出该信息中蕴含的情感结果;
[0089]
s4:将输出的分类结果,与新闻事实信息相匹配。
[0090]
应用场景2:车辆生产过程中的正常数据和异常数据分类方法
[0091]
应用背景:实际汽车生产与应用中产生的数据有许多质量问题,常常存在与数据模型或者数据规律不符合的数据对象,本次设计的量子分类器可被用于在实际汽车生产过程中,准确分类与识别正常数据与异常数据,以方便汽车的实际应用与生产。
[0092]
应用步骤具体为:
[0093]
s1:获取车辆在生产与使用过程中得到的数据,得到相关的车辆数据信息;
[0094]
s2:将汽车在生产与使用过程中产生的数据通过角度编码,编写成可被量子分类器识别的初始状态;
[0095]
s3:将编码完成后的数据采用本发明所述的基于量子分类器的数据分类方法进行分类,该过程中产生的数据为正常数据或者异常数据(该数据判定的标准与量子分类器中孤立量子系统的哈密顿量设置有关,在本次设计的量子分类器中,哈密顿量设置为:
[0096]
s4:得到分类结果,并与车辆产生的数据相匹配。
技术特征:
1.一种基于量子分类器的数据分类方法,包括如下步骤:s1.获取现有的、带有分类标签的分类数据集;s2.构建量子角度编码,并将步骤s1获取的分类数据集通过量子角度编码转换为量子态,作为量子分类器的输入;s3.基于量子系统的哈密顿量,构建原始量子分类器;s4.采用步骤s2得到的量子态对步骤s3构建的原始量子分类器进行训练,得到量子分类器;s5.采用步骤s2构建的量子角度编码,将实际待分类的目标数据集转换为量子态;s6.将步骤s5得到的量子态输入到步骤s4得到的量子分类器,输出最终的结果,完成实际数据的数据分类。2.根据权利要求1所述的基于量子分类器的数据分类方法,其特征在于步骤s1所述的获取现有的、带有分类标签的分类数据集,具体为获取现有的、带有分类标签的分类数据集d={(x
k
,y
k
)};其中d为分类数据集,x为分类数据集内的数据,y为分类数据集内的数据标签,k为分类数据集内数据的个数。3.根据权利要求2所述的基于量子分类器的数据分类方法,其特征在于步骤s2所述的构建量子角度编码,并将步骤s1获取的分类数据集通过量子角度编码转换为量子态,作为量子分类器的输入,具体包括如下步骤:a.确定采用的量子比特数量;b.确定初始量子态为|0
k
>;c.将分类数据集中的第k个数据x
k
编码成一系列量子门u(x
k
),并作用在步骤b确定的初始量子态|0
k
>上,得到一系列量子态|ψ
in
>为式中为內积符号,k=1,2,...,k,k为分类数据集内数据的个数。4.根据权利要求3所述的基于量子分类器的数据分类方法,其特征在于步骤c所述的量子门u(x
k
),具体为量子门u(x
k
)由量子旋转门r
z
(θ)和r
y
(θ)组合,u(x
k
)=r
z
(x
k
)r
y
(x
k
)。5.根据权利要求4所述的基于量子分类器的数据分类方法,其特征在于步骤s3所述的基于量子系统的哈密顿量,构建原始量子分类器,具体包括如下步骤:设定量子系统的哈密顿量h为其中为泡利z算子,为泡利y算子,为泡利x算子,n为粒子的个数;采用哈密顿量的酉算子描述量子分类器中用到的量子门,有:式中θ
β
初始为随机变量;h为哈密顿量;t为量子线路的深度;则在原始量子分类器中设计的量子门为
原始量子分类器的具体组建的门为量子旋转r
z
(θ)、r
y
(θ)和r
x
(θ)的组合,因此存在:式中t为量子线路的深度;在量子线路中,在量子线路开始时采用hadamard门和泡利x门用于稳定初始量子态,在量子线路中间采用由cnot门和泡利x门组合得到的cnot-x门用于搭建纠缠层。6.根据权利要求5所述的基于量子分类器的数据分类方法,其特征在于步骤s4所述的采用步骤s2得到的量子态对步骤s3构建的原始量子分类器进行训练,得到量子分类器,具体包括如下步骤:将步骤s2得到的量子态,输入到步骤s3构建的原始量子分类器,经过量子线路后完成系统的演化过程,生成输出量子态|ψ
out
>;然后,将得到的输出量子态|ψ
out
>进行量子测量,得到经典分类信息;所述经典分类信息包括量子分类器分类得到的标签对步骤s3构建的原始量子分类器的参数进行训练,训练时采用梯度下降的方式进行参数优化,设定损失函数为其中w为样本个数,为更新后的标签,y
k
为初始标签;训练完成后,得到最优的参数,从而得到量子分类器。7.一种包括了权利要求1~6之一所述的基于量子分类器的数据分类方法的数据安全风险评估方法,其特征在于包括如下步骤:(1)获取待进行风险评估的经典数据集;(2)采用所述的基于量子分类器的数据分类方法,对步骤(1)获取的待进行风险评估的经典数据集进行分类,得到分类结果;(3)对分类结果进行分级;(4)根据得到的分级结果,对待进行风险评估的经典数据集进行风险评估。
技术总结
本发明公开了一种基于量子分类器的数据分类方法,包括获取现有的带有分类标签的分类数据集;构建量子角度编码并将分类数据集转换为量子态作为量子分类器的输入;构建原始量子分类器;采用量子态对原始量子分类器进行训练得到量子分类器;将实际待分类的目标数据集转换为量子态并输入到量子分类器输出最终的结果,完成实际数据的数据分类。本发明还公开了一种包括所述基于量子分类器的数据分类方法的数据安全风险评估方法。本发明提供的这种基于量子分类器的数据分类方法及数据安全风险评估方法,基于量子计算设计了一种量子分类器,并通过设计的量子分类器实现了大规模数据的快速分类,而且本发明的可靠性高,精确性好。精确性好。精确性好。
