一种无人集系统目标融合拣选方法及装置
1.本发明涉及无人系统集目标搜索与监视领域,尤其涉及一种无人集系统目标融合拣选方法及装置。
背景技术:
2.无人集系统在勘察搜救、协同作业、环境侦察等诸多领域,已成为补充或替代有人系统的重要手段。尽管无人机的应用在集表演、物流装配等领域已初具成效,但在实际应用中还存在着大量亟待解决的实际问题,如小型化带来的载荷能力限制与日益增长的集化自主作业能力需求。
3.因此,无人集系统在实际作业过程中,及其自主协同关系稳定运行的过程中,应重点考虑信息交互行为中存在哪些具体问题。通过场景问题剖析,到全局性信息掌握困难、通信连接带宽低且不甚稳定、通信连接存在中断可能等现实问题,并抽象成为面向弱连接条件的局部交互场景,构建回流甄别、采信融合与目标决策的具体方法,细化信息交互与节点状态控制的通用化策略,优化无人平台模型设计,支撑无人平台作业能力的保持。
技术实现要素:
4.本发明公开了一种无人集系统目标融合拣选方法及装置,其提供给无人平台相对独立的决策机制,降低任务目标多轮次分配过程的通信资源消耗,进而提高集中单个个体平台的目标信息自我解算决策的效率,同时提升了拓扑连接不稳定时无人系统集协同行为涌现的鲁棒性,将博弈的环境反馈和策略调整从无人平台个体决策上升至宏观控制和调控效应上,使得系统处在个体与个体行为的快速优化和制约循环里。
5.为实现所述发明目的,本发明采用的技术方案为:一种无人集系统目标融合拣选方法,其中,无人集系统包括多个无人平台节点,具体包括以下过程:无人平台节点通过平台感知设备观测环境内第一目标信息,并向信息融合模块发送观测到的第一目标信息;通过平台通信设备接收1跳邻域及2跳邻域无人平台节点集合发送的第二目标序列信息,并将汇集的第二目标序列信息发送给邻域剪裁模块;通过邻域剪裁模块对第二目标序列信息进行1跳邻域及2跳邻域计算及剪裁,筛选出待融合的第二目标序列信息,并将待融合的第二目标序列信息发送给信息融合模块;通过信息融合模块对平台感知设备发送的第一目标信息和邻域剪裁模块发送的待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,将可观测目标序列发送给评估决策模块;通过评估决策模块对可观测目标序列进行基于信息交互评价的收益-代价评估,根据评估结果拣选观测目标,基于拣选的观测目标对无人平台进行状态与行为的控制。
6.进一步的,所述1跳邻域为时刻t某一无人平台节点有直接通信连接的无人平台
节点的无人节点平台集合;2跳邻域为与无人平台节点平台集合中的每一无人平台节点有通信连接的无人平台节点集合。
7.进一步的,裁剪的过程为:剪裁 中有回流的无人平台节点得到集合,集合中的元素记为;剪裁集合 中有回流的无人平台节点得到集合,集合中的元素记为。
8.进一步的,对平台感知设备发送的第一目标信息和邻域剪裁模块发送的待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,具体包括以下过程:4.1计算无人平台节点与集合内节点的综合信息聚集能力评估值:式中,,表示节点的度;式中,用于调节扩展邻域度中心性评估对级联评估的影响;为集合中的节点的度;4.2计算无人平台节点与集合内节点基于拓扑与交互行为的密切度评估 :式中,为与之间的拓扑关系密切度,为与之间的交互频次密切度,与为调节系数;式中,为与之间在当前时刻t前的信息交互总次数,为第次信息交互时的时间; 为第-1次信息交互时的时间;4.3计算无人平台节点与集合内节点的级联拓扑关联度评估:式中,和为调节系数;4.4对待融合的第二目标序列信息进行融合,生成待拣选可观测目标序列:
式中,表示邻居节点传递的目标序列信息;4.5根据结果进行第一目标信息遍历修订,若第一目标序列和第二目标序列融合结果存在相同目标,且目标在两个序列中信息差处于预设的误差阈值范围内,则以第一目标序列观测值更新修订该目标的目标序列信息融合结果,否则不进行修订操作;4.6根据遍历修订后的的排序得到个目标的可观测目标序列,即为待拣选的可观测目标序列。
9.进一步的,对可观测目标序列进行基于信息交互评价的收益-代价评估,具体包括以下过程:根据下式计算可观测目标序列中各目标距无人平台节点的距离代价:式中,为可观测目标序列中任一目标在t时刻距离节点的距离,为可观测目标序列中所有目标在时刻t距离节点的距离之和;根据下式计算级联邻域内当前时刻t获取的信息,可观测目标序列中各目标在1跳和2跳邻域的交互传播密度:式中,为计数函数,为1跳邻域传播信息中目标出现的计数次数,为2跳邻域传播信息中目标出现的计数次数,为1跳邻域传播信息中各目标出现的总计数次数,为2跳邻域传播信息中各目标出现的总计数次数,和分别为1跳邻域与2跳邻域的权重;根据下式计算可观测目标序列中各目标在时刻t信息持久度:式中,为求和函数,表示基于历史交互记录的目标的目标信息存续度,即从首次出现时间到当前时刻t的总时长,为基于历史交互记录的目标的目标信息
新鲜度,即从上次出现时间到当前时刻的时长,为可观测目标序列中所有目标存续度之和,为可观测目标序列中所有目标新鲜度之和,为目标信息存续度调节系数,为目标信息新鲜度调节系数;根据下式计算任务匹配收益度:式中,为求和函数,为目标序列中目标的目标优先级值;为目标序列中目标的目标偏好值;为可观测目标序列中所有目标优先级值之和,为可观测目标序列中所有目标偏好值之和,为目标信息优先级调节系数,为目标信息偏好调节系数;根据下式计算目标更替抑制因子:式中,表示可观测目标序列中的一个目标,为按设定策略设计的抑制因子的策略函数,当目标已为关注目标,即为1时,则抑制因子失效;根据下式计算收益-代价评估值:式中、、和均为可调权重值;节点对s个待拣选目标序列生成相应的收益-代价评估结果序列:,则拣选结果为,即收益-代价评估后最优目标。
10.一种无人集系统目标融合拣选装置,其中,无人集系统包括多个无人平台节点,每个无人平台节点包括:平台感知设备,用于观测环境内第一目标信息,并将观测到的第一目标序列信息发送给信息融合模块;平台通信设备,用于接收邻居无人平台节点发送的第二目标序列信息,并将汇集的第二目标序列信息发送给邻域剪裁模块;邻域剪裁模块,用于对第二目标序列信息进行直接邻域及级联邻域计算及剪裁,筛选出待融合的第二目标序列信息,并将待融合的第二目标序列信息发送给信息融合模块;信息融合模块,用于对平台感知设备发送的第一目标序列信息和邻域剪裁模块发送的待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,并将可观测目标序列发送给评估决策模块;评估决策模块,用于对可观测目标序列进行基于信息交互评价的收益-代价评估,根据评估结果拣选观测目标,基于拣选的观测目标对无人平台的节进行状态与行为的控制。
11.与现有技术相比,本发明可以提供目标信息感知与交互控制方法,根据所述对平台通信设备接收汇集的目标信息,并基于拣选完成后的目标观测决策,确定所述无人平台的状态与行为控制策略。并且,本发明提供继而基于汇集信息的生成待拣选可观测目标序列,通过基于剪裁级联邻域计算和目标信息级联拓扑关联度评估的所有目标信息,明确所述无人平台所处无人系统集的待拣选可观测目标序列。同时,本发明提供基于收益-代价评估的目标拣选方法,将目标拣选择优过程等价于目标对无人平台观测资源的竞争过程,基于信息交互内容及其行为特征,明确相应的收益-代价评估基本指标,针对待拣选目标序列,计算生成拣选结果。本发明所述方法设计了结构特性和信息交互特性相融合的信息表征与度量方法,相较于传统方法,本发明在增强了无人集系统鲁棒性的同时,提升了其方法面向弱联通条件的效率,实现面向决策级传播效应的个体级、自主协同式信息交互控制。
附图说明
12.图1为本发明实施例提供的无人平台系统的结构示意图;图2为本发明实施例提供的目标融合拣选方法流程图;图3为本发明实施例提供的级联邻域回流剪裁示意图。
具体实施方式
13.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
14.图1为本发明实施例提供的无人集系统目标融合拣选装置的结构示意图,如图1所示,无人集系统包括多个无人平台节点,每个无人平台节点包括:平台感知设备,其被配置为观测的环境内第一目标信息,并向信息融合模块发送观测到的第一目标序列信息;平台通信设备,其被配置为接收邻居无人平台节点发送的第二目标序列信息,并将汇集的第二目标序列信息发送给邻域剪裁模块处理;邻域剪裁模块,其被配置为对第二目标序列信息进行直接邻域及级联邻域计算及剪裁,筛选出待融合的第二目标序列信息,并将待融合的第二目标序列信息发送给信息融合模块;信息融合模块,其被配置为对平台感知设备发送的第一目标序列信息和邻域剪裁模块发送来的待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,而后将可观测目标序列发送给评估决策模块,以及评估决策模块,其被配置为对可观测目标序列进行基于信息交互评价的收益-代价评估,根据评估结果拣选观测目标,基于拣选的观测目标对无人平台的节进行状态与行为的控制。
15.图2为本发明实施例提供的无人集系统目标融合拣选方法,其中,无人集系统包括多个无人平台节点,所述方法包括:无人平台节点通过平台感知设备观测环境内第一目标信息,并向信息融合模块发送观测到的第一目标信息;通过平台通信设备接收1跳邻域及2跳邻域无人平台节点集合发送的第二目标序列信息,并将汇集的第二目标序列信息发送给邻域剪裁模块;
通过邻域剪裁模块对第二目标序列信息进行1跳邻域及2跳邻域计算及剪裁,筛选出待融合的第二目标序列信息,并将待融合的第二目标序列信息发送给信息融合模块;通过信息融合模块对平台感知设备发送的第一目标信息和邻域剪裁模块发送的待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,将可观测目标序列发送给评估决策模块;通过评估决策模块对可观测目标序列进行基于信息交互评价的收益-代价评估,根据评估结果拣选观测目标,基于拣选的观测目标对无人平台进行状态与行为的控制。
16.本发明中,所述1跳邻域为时刻t某一无人平台节点有直接通信连接的无人平台节点的无人节点平台集合;2跳邻域为与无人平台节点平台集合中的每一无人平台节点有通信连接的无人平台节点集合。
17.本发明中,如图3所示,剪裁中有回流的无人平台节点得到集合,集合中的元素记为;剪裁集合中有回流的无人平台节点得到集合,集合中的元素记为。
18.本发明中,对平台感知设备发送的第一目标序列信息和邻域剪裁模块发送来的待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列具体包括:4.1计算无人平台节点与集合内节点的综合信息聚集能力评估值:式中,,表示节点的度;式中,用于调节扩展邻域度中心性评估对级联评估的影响;为集合中的节点的度;本发明中,若直接邻域中的1跳邻域内的节点的未被剪裁,则综合信息聚集能力评估值的级联计算是1跳邻域节点与其相应2跳邻域的各节点信息聚集能力评估值,将1跳邻域与其2跳邻域的信息聚集能力评估值相乘,如1跳邻居节点的2跳邻域不存在,则仅计算1跳邻域的度中心性评估值。若1跳邻域中的邻居节点被剪裁,即该节点信息回流风险度高,则以2跳邻域内被剪裁节点的信息聚集能力评估值作为其相连 1跳邻域内节点的信息聚集能力评估值,且对其相连的1跳邻居节点做信息融合处理。
19.4.2计算无人平台节点与集合内节点基于拓扑与交互行为的密切度评估 :式中,为与之间的拓扑关系密切度,为与之间的交互频次密切
度,与为调节系数;式中,为与之间在当前时刻t前的信息交互总次数,为第次信息交互时的时间; 为第-1次信息交互时的时间;本发明中仅计算了节点与其1跳邻域内各节点之间基于拓扑关系和单位时间内交互频次等方面的亲密度。
20.4.3计算无人平台节点与集合内节点的级联拓扑关联度评估:式中,和为调节系数;4.4对待融合的第二目标序列信息进行融合,生成待拣选可观测目标序列:式中,表示邻居节点传递的目标序列信息;4.5根据结果进行第一目标信息遍历修订,若第一目标序列和第二目标序列融合结果存在相同目标,且目标在两个序列中信息差处于预设的误差阈值范围内,则以第一目标序列观测值更新修订该目标的目标序列信息融合结果,否则不进行修订操作;4.6根据遍历修订后的的排序得到个目标的可观测目标序列,即为待拣选的可观测目标序列。
21.本发明中对可观测目标序列进行基于信息交互评价的收益-代价评估,具体包括以下过程:根据下式计算可观测目标序列中各目标距无人平台节点的距离代价:式中,为可观测目标序列中任一目标在t时刻距离节点的距离,为可观测目标序列中所有目标在时刻t距离节点的距离之和;根据下式计算级联邻域内当前时刻t获取的信息,可观测目标序列中各目标在1跳和2跳邻域的交互传播密度:
式中,为计数函数,为1跳邻域传播信息中目标出现的计数次数,为2跳邻域传播信息中目标出现的计数次数,为1跳邻域传播信息中各目标出现的总计数次数,为2跳邻域传播信息中各目标出现的总计数次数,和分别为1跳邻域与2跳邻域的权重;根据下式计算可观测目标序列中各目标在时刻t信息持久度:式中,为求和函数,表示基于历史交互记录的目标的目标信息存续度,即从首次出现时间到当前时刻t的总时长,为基于历史交互记录的目标的目标信息新鲜度,即从上次出现时间到当前时刻的时长,为可观测目标序列中所有目标存续度之和,为可观测目标序列中所有目标新鲜度之和,为目标信息存续度调节系数,为目标信息新鲜度调节系数;根据下式计算任务匹配收益度:式中,为求和函数,为目标序列中目标的目标优先级值;为目标序列中目标的目标偏好值;为可观测目标序列中所有目标优先级值之和,为可观测目标序列中所有目标偏好值之和,为目标信息优先级调节系数,为目标信息偏好调节系数;根据下式计算目标更替抑制因子:式中,表示可观测目标序列中的一个目标,为按设定策略设计的抑制因子的策略函数,当目标已为关注目标,即为1时,则抑制因子失效;根据下式计算收益-代价评估值:式中、、和均为可调权重值;
节点对s个待拣选目标序列生成相应的收益-代价评估结果序列:,则拣选结果为,即收益-代价评估后最优目标。
22.在收益-代价评估的过程中,不采用多个无人平台节点进行中心式分配或分布式收益均衡等方式进行目标拣选,并简化考虑目标所需的感知资源的种类与数量匹配过程。在收益-代价评估方面主要考虑同样在信息交互的视角上,如何仅通过无人平台自身掌握信息内容、信息交互特征等做出自评估,从而在潜在目标中拣选关注目标。这样做的优势在于,一方面提高了信息的自我解算决策的效率,一方面降低了任务目标的多轮次分配过程可能带来的通信资源消耗,同时还能够提供给无人平台相对独立的决策机制。从而将博弈的环境反馈和策略调整从无人平台个体决策上升至宏观的控制和调控效应上,使得系统处在个体与个体行为的快速优化和制约循环里。
23.基于上述考虑,收益-代价评估中策略函数的调用仅在受到多个适宜的可观测目标时才会调用。即若无可匹配观测的目标,收益-代价评估方法不会被无人平台调用。同时,考虑信息传播的不均匀,为每个已有关注目标的无人平台设立一个定长时间窗口,用于关注决策后,信息滞后导致的频繁目标切换。
24.示例性的,无人平台节点根据时刻收到的1跳和2跳邻域内所有目标信息,按目标标识进行信息中心性评估后,融合生成对时刻所有集传入的目标信息的感知值,依据目标关注列表,去除冗余感知目标后,根据收益-代价联合评估函数进行所有感知目标的目标观测收益估计,进行收益优先排序。完成解算后,根据当前自身认知状态进行相应控制流,通知平台通信设备和平台观测设备。
25.上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
技术特征:
1.一种无人集系统目标融合拣选方法,其中,无人集系统包括多个无人平台节点,其特征在于,具体包括以下过程:无人平台节点通过平台感知设备观测环境内第一目标信息,并向信息融合模块发送观测到的第一目标信息;通过平台通信设备接收1跳邻域及2跳邻域无人平台节点集合发送的第二目标序列信息,并将汇集的第二目标序列信息发送给邻域剪裁模块;通过邻域剪裁模块对第二目标序列信息进行1跳邻域及2跳邻域计算及剪裁,筛选出待融合的第二目标序列信息,并将待融合的第二目标序列信息发送给信息融合模块;通过信息融合模块对平台感知设备发送的第一目标信息和邻域剪裁模块发送的待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,将可观测目标序列发送给评估决策模块;通过评估决策模块对可观测目标序列进行基于信息交互评价的收益-代价评估,根据评估结果拣选观测目标,基于拣选的观测目标对无人平台进行状态与行为的控制。2.根据权利要求1所述的一种无人集系统目标融合拣选方法,其特征在于,所述1跳邻域为时刻t某一无人平台节点有直接通信连接的无人平台节点的无人节点平台集合;2跳邻域为与无人平台节点平台集合中的每一无人平台节点有通信连接的无人平台节点集合。3.根据权利要求2所述的一种无人集系统目标融合拣选方法,其特征在于,裁剪的过程为:剪裁中有回流的无人平台节点得到集合,集合中的元素记为;剪裁集合中有回流的无人平台节点得到集合,集合中的元素记为。4.根据权利要求3所述的一种无人集系统目标融合拣选方法,其特征在于,对平台感知设备发送的第一目标信息和邻域剪裁模块发送的待融合的目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,具体包括以下过程:s1计算无人平台节点与集合内节点的综合信息聚集能力评估值:式中,, 表示节点的度;式中,用于调节扩展邻域度中心性评估对级联评估的影响;为集合中的节点的度;s2计算无人平台节点与集合内节点基于拓扑与交互行为的密切度评估 :
式中,为与之间的拓扑关系密切度,为与之间的交互频次密切度,与为调节系数;式中,为与之间在当前时刻t前的信息交互总次数,为第次信息交互时的时间; 为第-1次信息交互时的时间;s3计算无人平台节点与集合内节点的级联拓扑关联度评估:式中,和为调节系数;s4对待融合的第二目标序列信息进行融合,生成待拣选可观测目标序列:式中,表示邻居节点传递的目标序列信息;s5根据结果进行第一目标信息遍历修订,若第一目标序列和第二目标序列融合结果存在相同目标,且目标在两个序列中信息差处于预设的误差阈值范围内,则以第一目标序列观测值更新修订该目标的目标序列信息融合结果,否则不进行修订操作;s6根据遍历修订后的的排序得到个目标的可观测目标序列,即为待拣选的可观测目标序列。5.根据权利要求4所述的一种无人集系统目标融合拣选方法,其特征在于,对可观测目标序列进行基于信息交互评价的收益-代价评估,具体包括以下过程:根据下式计算可观测目标序列中各目标距无人平台节点的距离代价:式中,为可观测目标序列中任一目标在t时刻距离节点的距离,为可观测目标序列中所有目标在时刻t距离节点的距离之和;根据下式计算级联邻域内当前时刻t获取的信息,可观测目标序列中各目标在1跳和2跳邻域的交互传播密度:
式中,为计数函数,为1跳邻域传播信息中目标出现的计数次数,为2跳邻域传播信息中目标出现的计数次数,为1跳邻域传播信息中各目标出现的总计数次数,为2跳邻域传播信息中各目标出现的总计数次数,和分别为1跳邻域与2跳邻域的权重;根据下式计算可观测目标序列中各目标在时刻t信息持久度:式中,为求和函数,表示基于历史交互记录的目标的目标信息存续度,即从首次出现时间到当前时刻t的总时长,为基于历史交互记录的目标的目标信息新鲜度,即从上次出现时间到当前时刻的时长,为可观测目标序列中所有目标存续度之和,为可观测目标序列中所有目标新鲜度之和,为目标信息存续度调节系数,为目标信息新鲜度调节系数;根据下式计算任务匹配收益度:式中,为求和函数,为目标序列中目标的目标优先级值;为目标序列中目标的目标偏好值;为可观测目标序列中所有目标优先级值之和,为可观测目标序列中所有目标偏好值之和,为目标信息优先级调节系数,为目标信息偏好调节系数;根据下式计算目标更替抑制因子:式中,表示可观测目标序列中的一个目标,为按设定策略设计的抑制因子的策略函数,当目标已为关注目标,即为1时,则抑制因子失效;根据下式计算收益-代价评估值:式中、、和均为可调权重值;节点对s个待拣选目标序列生成相应的收益-代价评估结果序列:,则拣选结果为,即收益-代价评估后最优目
标。6.一种无人集系统目标融合拣选装置,其中,无人集系统包括多个无人平台节点,其特征在于,每个无人平台节点包括:平台感知设备,用于观测环境内第一目标信息,并将观测到的第一目标序列信息发送给信息融合模块;平台通信设备,用于接收邻居无人平台节点发送的第二目标序列信息,并将汇集的第二目标序列信息发送给邻域剪裁模块;邻域剪裁模块,用于对第二目标序列信息进行直接邻域及级联邻域计算及剪裁,筛选出待融合的第二目标序列信息,并将待融合的第二目标序列信息发送给信息融合模块;信息融合模块,用于对平台感知设备发送的第一目标序列信息和邻域剪裁模块发送的待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列,并将可观测目标序列发送给评估决策模块;评估决策模块,用于对可观测目标序列进行基于信息交互评价的收益-代价评估,根据评估结果拣选观测目标,基于拣选的观测目标对无人平台的节进行状态与行为的控制。
技术总结
本发明涉及无人系统集目标搜索与监视领域,具体涉及一种无人集系统目标融合拣选方法及装置。包括:观测环境内第一目标信息;接收邻居无人平台节点的第二目标序列信息;对第二目标序列信息进行直接邻域及级联邻域计算及剪裁,筛选出待融合的第二目标序列信息;对第一目标序列信息和待融合的第二目标序列信息进行各目标信息级联拓扑关联度评估,生成待拣选的可观测目标序列;对可观测目标序列进行基于信息交互评价的收益-代价评估,拣选观测目标,基于拣选的观测目标对无人平台的节进行状态与行为控制。本发明在增强了无人集系统鲁棒性的同时,提升了其方法面向弱联通条件的效率,实现面向决策级传播效应的个体级、自主协同式信息交互控制。协同式信息交互控制。协同式信息交互控制。
