控制与决策  2018, Vol. 33 Issue (10): 1747-1756  
0

引用本文 [复制中英文]

刘重, 高晓光, 符小卫. 基于通信与观测联合优化的多无人机协同目标跟踪控制[J]. 控制与决策, 2018, 33(10): 1747-1756.
[复制中文]
LIU Zhong, GAO Xiao-guang, FU Xiao-wei. Co-optimization of communication and observation for multiple UAVs in cooperative target tracking[J]. Control and Decision, 2018, 33(10): 1747-1756. DOI: 10.13195/j.kzyjc.2017.0727.
[复制英文]

基金项目

航空科学基金项目(20155553041);中央高校基本科研业务费专项资金项目(3102015ZY092)

作者简介

刘重(1985-), 男, 博士生, 从事多无人机协同控制与优化的研究;
高晓光(1957-), 女, 教授, 从事贝叶斯网络及人工智能等研究。

通讯作者

刘重, E-mail:15829732829@163.com

文章历史

收稿日期:2017-06-10
修回日期:2017-07-17
基于通信与观测联合优化的多无人机协同目标跟踪控制
刘重, 高晓光, 符小卫    
西北工业大学 电子信息学院,西安 710072
摘要:为了提高目标跟踪任务的执行效能, 提出一种基于通信与观测联合优化的多无人机协同运动目标跟踪控制方法.建立以信息成功传递概率描述的通信链路模型, 采用扩展信息滤波实现目标状态融合估计与预测, 使用Fisher信息矩阵对无人机观测所获取的信息进行表征.通过将信息成功传输概率引入到优化指标函数中, 建立多无人机协同目标跟踪运动控制的滚动时域优化模型, 实现通信与观测的联合优化, 而这种联合优化体现在提高无人机与地面站之间信息成功传输概率与降低目标状态估计不确定性之间的折中.与不考虑通信优化的跟踪控制对比表明, 所提方法可以提高跟踪过程中各架无人机与地面站之间的信息传输概率, 使目标状态的全局融合估计结果更精确、更有效.
关键词多无人机    协同目标跟踪    信息滤波    无线通信    Fisher信息矩阵    滚动时域优化    
Co-optimization of communication and observation for multiple UAVs in cooperative target tracking
LIU Zhong, GAO Xiao-guang, FU Xiao-wei    
School of Electronics and Information, Northwestern Polytechnical University, Xi'an 710072, China
Abstract: To improve the effectiveness of multiple unmanned aerial vehicles(UAVs) cooperative target tracking, a multi-UAVs cooperative target tracking algorithm based on co-optimization of communication and observation is presented. In the packet-erasure channel model, the probability of the successful information transmission is modeled as a function of the signal-to-noise ratio. The extended information filter is build for the estimation fusion and prediction of target states. The Fisher information matrix is applied to express the amount of information obtained from the measurements. The basis for co-optimization of communication and observation is the derivation of a scalar quantity which is a function of the expected information gain and the probability of the successful information transmission. The co-optimization of communication and observation is reflected in the tradeoffs between communication performance and sensing utility to improve overall information content delivered to the base station. Informative trajectories that maximize this metric are generated in the frame of receding horizon optimizing. Simulations demonstrate that the proposed algorithm can effectively improve the estimation performance relative to the approach that does not consider communication reliability.
Keywords: multi-UAVs    cooperative target tracking    information filter    radio frequency communication    Fisher information matrix    receding horizon optimizing    
0 引言

在无人机的众多应用场景中, 目标跟踪是一种非常典型的任务.在目标跟踪过程中, 无人机利用其搭载的传感器对被跟踪目标进行持续观测, 可以获取大量关于目标的情报信息, 进而实现目标的识别与精确定位.因此, 无人机目标跟踪在战场侦察、对地打击、城市反恐、海上搜救等方面有很大的应用价值, 并得到了越来越多的关注.

受无人机运动约束、传感器观测范围以及复杂环境条件等因素的影响, 单架无人机通常不足以实现对目标的精确持续跟踪, 因此需要多架无人机协同以维持目标跟踪任务的鲁棒性, 并获得更高的目标定位精度[1].相比于单机目标跟踪, 多无人机协同目标跟踪存在两个关键问题: 1)目标状态协同融合估计, 即如何有效地融合来自不同无人机对目标的观测, 以获得目标状态最优估计; 2)多无人机协同目标跟踪观测航迹优化决策, 即如何对这些无人机进行运动协调以获得对目标更好的观测(使得对目标状态的估计性能最优).因此, 目前国内外学者针对多无人机协同目标跟踪中的这两个关键问题展开了大量的研究.

在目标状态协同融合估计方面, 常规状态估计方法(例如卡尔曼滤波)通常难以捕获来自不同观测组合产生的不同估计之间的统计关系[2].如果考虑观测更新之间的交叉相关[3], 则问题会更加复杂.信息滤波[4](Information filter, IF)是通过对卡尔曼滤波中的状态变量的变换和方差矩阵的变换得到信息的状态和信息的方差矩阵, 从每个节点的每次观测中提取出独立于其他节点的信息, 从而消除交叉相关性的影响.因此, IF利用Fisher信息描述传感器测量的似然函数中包含的信息, 可通过简单的Fisher信息求和运算得到融合估计结果, 具有较好的可扩展性、异构性和动态可重构性等特点, 在多无人机协同目标跟踪问题中得到了广泛的应用, 例如文献[5-7].这些研究成果均表明IF可有效地解决来自不同传感器的测量融合问题.

在多无人机协同目标跟踪观测航迹优化决策方面, 主要方法包括梯度法[8]、李亚普诺夫向量场(Lyapunov vector fields, LVF)[9]、跟踪制导律[10]和滚动时域优化(Receding horizon control, RHC)[11]等.梯度法较少考虑传感器平台的运动学约束, 且容易陷入局部最优; LVF方法虽然简单易实现, 但没有将目标状态估计性能考虑进来; 跟踪制导律方法也没有考虑目标状态估计性能.一方面, 准确估计目标状态是跟踪任务的最终目的, 而目标状态估计性能依赖于传感器的观测路径; 另一方面, 无人机目标跟踪过程与滚动时域优化思想十分相似.将这两个方面结合起来, 即为面向最优目标状态估计的观测航迹滚动时域优化方法, 其本质是提出一些合理的传感器跟踪精度度量标准对目标跟踪性能进行滚动时域优化.

总体而言, 虽然国内外学者在多无人机协同目标跟踪方面作出了卓有成效的研究, 但是普遍存在着未将通信因素考虑进来的问题.通信是多无人机之间实现协同的基础, 也是实现目标状态融合估计的必要条件.受限于所携带通信设备的性能, 无人机平台的高速运动以及动态多变的任务环境, 给多无人机之间的有效通信带来了影响, 这使得多无人机之间通信是受限制的.受限的通信导致无人机不能可靠地将各自的局部滤波估计结果或者观测结果传输到诸如地面站这样的融合中心进行融合, 从而降低了整个系统对目标状态的估计性能, 最终导致目标跟踪效能的降低.文献[12]研究了多架无人机对一个WiFi辐射信号源的位置进行协同定位问题, 以极大化无人机观测信息为效能函数, 规划多架无人机的飞行轨迹, 每架无人机需要将自身的观测定位滤波估计结果发送到地面站上进行融合.为了使得离地面站较远处的无人机能够与地面站进行可靠的通信, 使用其他无人机作为通信中继实现消息的转发, 从而形成多机链式通信拓扑构型.然而, 该通信拓扑构型是固定不变的, 虽然可以用于静止目标定位这样的静态场景, 但对于运动目标跟踪这样的动态场景而言是不适用的.因此, 在研究多无人机协同运动目标跟踪问题时, 有必要将通信和观测联合起来进行动态优化, 既使得无人机能够获得对目标更好的观测, 又保证了各架无人机可以将各自的局部滤波估计结果可靠地传输到融合中心进行全局融合估计, 两者结合起来共同提高对目标状态的全局融合估计性能, 最终提高目标跟踪任务的执行效能.

1 多无人机协同目标跟踪问题建模

图 1所示, 使用N架无人机(每架无人机有唯一的编号Ai, i=1, 2, …, N)对地面上单个运动目标执行跟踪观测任务.每架无人机可利用机载传感器对目标的位置、速度等状态信息进行测量, 并据此进行局部滤波, 得到目标位置、速度等状态信息的局部滤波估计结果.由于单架无人机的测量精度与可靠性有限, 无人机需要将各自的局部滤波估计结果作为输出, 并经过无线通信链路传输到地面站上.地面站融合接收到的所有局部滤波估计结果, 以获得更好的目标状态信息的全局滤波估计.当无人机跟踪地面运动目标时, 由于通信距离受限, 需要其他无人机作为通信中继在无人机与地面站之间建立可靠的通信连接.

图 1 多无人机协同目标跟踪场景

综上, 多无人机协同目标跟踪问题的关键在于如何建立一种基于观测和通信联合优化的多无人机协同目标跟踪控制方法, 从而保证地面站获得更加精确、更为有效的目标状态信息的全局滤波估计结果.这里观测和通信的联合优化是指同时考虑如下两个问题: 1)如何对无人机的观测航迹进行协调优化, 以获得对目标更好的观测; 2)如何保证无人机能够以较大的信息成功传输概率将各自的局部滤波估计结果可靠地传输到地面站.

1.1 目标运动模型

将目标的位置(xT, yT)和速度作为状态变量, 即假设目标作匀速直线运动, 加速度方向上有过程噪声, 则目标的运动方程为

(1)

其中: xT(k)为k时刻的目标状态向量; F(k)为k-1时刻到k时刻的目标状态转移矩阵, G(k)为k时刻过程噪声输入矩阵, F(k)和G(k)的表达式分别为

Ts为采样时间间隔; w(k)=[wx2, wy2]T~N(0, Q(k))为零均值的过程高斯白噪声, 其方差为Q(k)=diag(δx2(k), δy2(k)).

1.2 传感器观测模型

假定无人机的飞行高度保持不变, 且传感器能够自动指向目标.为了简化问题, 可将无人机与目标投影到同一平面内进行分析, 此时无人机Ai对目标的观测方程为

(2)

其中: k时刻无人机Ai的观测向量; υi(k)~N(0, Ri(k))为零均值的观测高斯白噪声, 其方差为Ri(k)=diag(δr2(k), δθ2(k)).

假设所有无人机都装备“测向+测距”的传感器, 则hi(k, xi(k), xT(k))为无人机Ai机载传感器的非线性观测函数, 其表达式为

(3)

其中: ri(k)表示无人机Ai的观测距离; θi(k)∈[0, 2π)表示观测方位角, 东向为零, 逆时针为正.将非线性函数hi(k, xi(k), xT(k))线性化, 得到其Jacobian矩阵为

(4)

则观测方程式(2)可近似改写成如下线性形式:

(5)
1.3 无人机运动模型

由于本文的研究重点是目标跟踪过程中的多无人机协同策略, 而非平台底层飞行控制, 假定无人机平台装有自主飞行控制系统, 可以为飞机提供滚转、俯仰和偏航的控制输入, 且具有速度和高度的保持功能.因此, 可以将无人机视作二维平面内运动的质点, 其运动模型可以表示为

(6)

其中: (xi(k), yi(k))、viψi为无人机Ai的位置、速度和航向角, ψic为期望航向角指令, αψ为自主飞行控制系统的航向角控制通道增益.无人机保持速度大小不变, 通过改变航向角来控制无人机的飞行, 其航向角速率满足飞行性能约束

(7)
1.4 通信链路模型

多架无人机与地面站组成无线多跳通信网络以实现信息共享, 无人机和地面站可视作通信节点.从节点i传输数据到节点j时, 两节点之间的无线通信链路可由节点j处的接收信号信噪比(Signal noise ratio, SNR) γij来表征, 有

(8)

其中: Pi表示节点i的发射功率; Nj表示接收端节点j处的噪声功率; 信道增益Gij可以表示为

(9)

Cij表示与天线增益有关的常数, hij描述了多径衰落, dij表示从节点i到节点j的距离, α表示传播衰减因子.为了使节点j以较小的丢包概率成功地接收到节点i所发送的信息, 要求节点j处信噪比大于门限值γ.因此对于瑞利衰落模型[13]而言, 节点j成功接收到由节点i发送信息的概率为

(10)

式(10)即为通信链路模型, 它描述了当节点i与节点j直接通信时, 两节点之间的无线通信链路上信息成功传输概率Prij与它们相对距离dij之间的关系, 如图 2所示, 相关参数的取值如表 1所示.

图 2 通信链路模型
表 1 通信链路模型相关参数取值

在多跳通信网络中, 源节点与宿节点之间可能存在多条信息传输路由.假设信息在各跳(Hop)之间的传递过程相互独立, 则信息经某一多跳路由routek, 由源节点成功传输到宿节点的概率为

(11)
2 基于扩展信息滤波的目标状态融合估计及其性能评价指标 2.1 扩展信息滤波

将信息状态向量和Fisher信息矩阵Y代替扩展卡尔曼滤波器中的状态估计向量和滤波估计协方差P, 可以得到扩展卡尔曼滤波的信息形式, 通常称为扩展信息滤波.其中:

对于如式(1)所示的目标运动模型和式(2)所示的传感器观测模型, 无人机Ai上扩展信息滤波的一步预测和量测更新过程如下:

1) 一步预测

(12)
(13)
(14)

2) 量测更新

(15)
(16)
(17)

对于无人机Aik时刻的观测zi, k, 其对信息状态的贡献ii, k以及对Fisher信息Y的贡献Ii, k

(18)
(19)
2.2 目标状态的融合估计

结合传感器观测条件不相关这一假设, 地面站上全局目标状态融合估计的信息状态和Fisher信息矩阵Y的计算公式为

(20)
(21)

其中di, k是取值为0或1的随机变量, 服从二项分布

(22)

βi, k表示无人机Aik时刻向地面站成功传递信息的概率, 按照式(10)或(11)进行计算.目标状态的后验融合估计结果即可通过下式获得:

(23)
2.3 目标状态融合估计性能评价指标

测量数据本身的“好”或“坏”是决定目标状态估计性能的基础.测量数据与无人机相对目标的观测位置密切相关, 不同的相对观测位置得到的测量数据所能提供的信息是不同的.因此, 多无人机协同目标跟踪控制的关键在于对无人机观测航迹进行优化, 以获得更好的目标状态估计.

既然目标状态估计性能依赖于特定的传感器观测路径, 则对目标状态估计性能的评价等价于对无人机跟踪航迹质量的评价.在上述扩展信息滤波融合估计过程中, 目标状态估计的性能可用Fisher信息矩阵(Fisher information matrix, FIM)来度量. FIM的数学定义为克拉美罗下界(Cramer-Rao lower bound, CRLB)的逆[14-15], 而CRLB定义了目标状态估计误差协方差所能达到的下界, 有

(24)

其中: xk表示待估计向量; 表示给定测量数据zkxk的估计值; Pk表示估计误差的协方差矩阵; Ck表示估计误差协方差的下界, 即CRLB. CRLB描述了特定系统中指定测量集所能获得的最小目标不确定性.它的逆为Fisher信息矩阵Yk, 描述了估计过程中指定测量集包含的信息量.信息量越大, 目标状态估计的不确定性越低.

文献[14]指出, 在目标可预测条件下, 候选观测航迹的FIM有意义且可计算, 并给出了如下所示的FIM预测递推计算公式:

(25)

其中表示k+l时刻通过观测所带来的期望信息收益, 按照如下公式进行计算:

(26)

这里: βi, k+1表示无人机Aik+l时刻向地面站成功传递信息的概率; 表示无人机Ai的观测方程的Jacobian矩阵, 其计算公式为

(27)

xi, k+l|kAik+l时刻的飞行状态, 它构成了Ai的候选目标跟踪观测航迹; 为目标在k+l时刻的状态预测值, 可以利用目标运动模型进行预测, 即

(28)

因为FIM为矩阵, 所以需要选取相应的标量函数作为优化问题的指标函数.由于FIM的迹在计算上较为容易, 且能够较全面地反映无人机与目标的相对位置对目标状态估计精度的影响, 就物理意义而言, 最大化FIM的迹相当于最小化平均估计方差, 故以FIM的迹作为目标状态估计性能指标函数.

3 基于通信与观测联合优化的多无人机协同目标跟踪运动控制 3.1 滚动时域优化模型

k时刻多无人机协同目标跟踪运动控制问题的滚动时域优化模型为

(29)
(30)
(31)
(32)
(33)

其中u[k+1:k+Tp]={u1[k+1:k+Tp], u2[k+1:k+Tp], …, uN[k+1:k+Tp]}表示所有无人机在滚动时域[k+1:k+Tp]内的控制输入向量, 由1.3节无人机的运动模型可知, 控制量uiAi的航向角ψi.优化目标是使整个滚动时域[k+1:k+Tp]内每个时刻上的预测Fisher信息矩阵的迹的加权之和最大(l=1, 2, …, Tp).式(30)~(32)分别为目标运动模型、无人机运动模型和传感器观测模型, 式(33)为各无人机间防撞约束条件, dsafe为防撞最小安全距离.

对最大化整个滚动时域[k+1:k+Tp]内每个时刻处的预测Fisher信息矩阵迹的加权之和的一个直观近似求解方法是, 使得每个k+l时刻的预测Fisher信息矩阵的迹最大化, 即

(34)

k+l时刻的预测Fisher信息矩阵由两项相加得到:第一项表示利用目标运动模型所预测出的先验信息; 第二项表示在k+l时刻所有传感器的观测所带来的信息.由于u*(k+l)与无关, 可将这一项忽略, 则有

(35)

从式(35)可以看出, k+l时刻的指标函数Jk+l中包含着两个方面的优化:通信优化项Jk+lcomm和观测优化项Jk+lobser.因此, 通过将无人机与地面站之间的信息成功传输概率引入到优化指标函数中而建立的多机协同目标跟踪运动控制的滚动时域优化模型, 可实现通信与观测的联合优化, 而这种联合优化则体现在提高无人机与地面站之间的信息成功传输概率与降低目标状态估计的不确定性之间的折中.

对于式(29)~(33)所示的集中式滚动时域优化模型而言, 虽然能够得到各架无人机的全局最优决策序列, 但是随着无人机数量增多, 其优化问题的规模迅速增大, 求解时间随之增大, 而导致无法进行在线实时优化.因此, 需要采用分布式策略将一个大规模的优化问题分解成多个小规模的优化子问题.每架无人机具有一个本地滚动时域优化决策器, 用于求解一个小规模局部有限时域优化决策问题.多架无人机可按照某种顺序依次进行本地优化计算.当某架无人机完成本地优化计算, 并将其优化决策结果发送给其他无人机后, 下一架无人机接收到其他无人机所发送的优化决策结果, 再开始计算, 依次类推, 直到所有无人机完成优化决策.无人机Ai的本地滚动时域优化模型为

(36)
(37)

s.t.式(30)~(33).

3.2 基于加权最小生成树的通信拓扑优化

根据1.4节所建立的通信链路模型, 如式(11)所示, 无人机Ai与地面站之间的信息成功传输概率取决于多跳信息传输路由routek.若令每条链路(m, n)上的权重Wm, n是该链路上信息成功传输概率Prm, n的函数, 其函数形式如下所示:

(38)

则对于无人机Ai而言, 寻找它与地面站之间信息成功传输概率最大的信息传输路由问题可以转化为典型的加权最小路径问题

(39)

上述加权最小路径问题可用Dijkstra算法求解.

对于整体无人机而言, 所有无人机与地面站的最优信息传输路由构成了以地面站为根节点的树状通信拓扑结构.该树的所有连接边上的权重之和最小, 即加权最小生成树(Minimum spanning tree, MST)的通信拓扑结构.因此, 在每一优化决策时刻, 以地面站为根节点, 采用加权最小生成树的策略对无人机与地面站所形成的通信网络拓扑进行优化, 形成如图 3所示的拓扑结构.

图 3 基于最小生成树的通信网络拓扑结构

在最小生成树的通信拓扑结构的基础上, 利用Dijkstra算法求解各架无人机到地面站的最优信息传输路由, 从而保证各架无人机尽可能以最大的信息成功传输概率将各自的局部滤波估计结果传输到地面站上.典型的加权最小生成树求解方法有Prim和Kruskal算法等.

基于最小生成树的通信网络拓扑结构决定了多架无人机进行本地优化计算的先后顺序, 即多无人机分布式优化决策顺序.所有无人机根据自身在通信网络拓扑结构中的位置, 按照各自与地面站之间的最优信息传输路由的总跳数进行升序排列, 若总跳数相同, 则按照编号升序排列.这种排列顺序体现了各架无人机与地面站“由近及远”的顺序.多架无人机按照该排序结果的先后顺序依次进行本地优化计算, 例如, 在图 3所示的基于最小生成树的通信网络拓扑结构中, A1充当A2的通信中继, 实现A2与地面站的通信.因此A2在求解本地优化问题时, 它与地面站之间的信息成功传输概率β2, k+1按照下式计算:

(40)

其中: β1, k+l表示A1与地面站之间的信息成功传输概率; β2→1, k+l表示A2A1之间的信息成功传输概率.可见, A2在求解本地优化问题时, 需要参考A1的优化结果.因此, A1先进行本地优化计算, 完成计算后, 将计算结果发送给A2, 供求解优化问题时使用.

3.3 基于通信与观测联合优化的多无人机协同目标跟踪控制算法

基于通信与观测联合优化的多无人机协同目标跟踪控制算法的原理如图 4所示.

图 4 基于通信与观测联合优化的多无人机协同目标跟踪控制算法原理

在每一优化决策时刻k, 首先, 地面站根据各架无人机的位置分布, 以地面站为根节点, 采用最小生成树的策略对通信网络拓扑进行优化, 形成基于最小生成树的通信网络拓扑结构, 在最小生成树的通信拓扑结构的基础上, 利用Dijkstra算法求解各架无人机到地面站的最优信息传输路由.其次, 所有无人机根据自身与地面站之间的最优信息传输路由的总跳数进行升序排列, 若总跳数相同, 则按照编号升序排列.无人机按照该排序结果的先后顺序依次进行本地优化计算.再次, 每架无人机Ai根据对目标的测量zi, k, 利用扩展信息滤波获取目标状态估计结果, 并在此基础上预测目标未来的状态, 该目标预测状态将作为本地优化决策器的输入. Ai在进行本地优化决策时, 参考其通信中继的优化决策结果, 在保证自身飞行安全的前提下, 应用基于滚动时域优化的跟踪航迹规划模型, 在提高无人机与地面站之间的信息成功传输概率与降低目标状态估计的不确定性之间进行折中, 决策出未来Tp个时刻的最优控制序列ui, k*和相应的最优跟踪观测航迹, 并将其优化决策结果发送给其他无人机.最后, Ai执行最优决策序列中的第一项, 改变其飞行状态xi, k+1, 获取新的观测zi, k+1, 进入下一轮循环.

4 仿真结果与分析 4.1 考虑通信优化与未考虑通信优化的对比仿真

仿真1  采用两架无人机A1A2对单个运动目标T进行持续跟踪, 并将各自对目标状态的局部滤波估计结果传输给地面站B, 供地面站融合得到目标状态的全局融合滤波估计结果.其中:

1) 无人机飞行速度固定为50 m/s, 最大偏航角速度ωmax=30°/s, A1的初始位置为(-400, -700) m, 初始航向为-45°, A2的初始位置为(-800, 200) m, 初始航向为0°;

2) 目标做匀速直线运动, 但在加速度方向上有零均值的过程噪声, 其均方差为δx=δy=0.1 m/s2, 目标的初始位置为(-800, 0) m, 初始运动方向为-20°;

3) 传感器的平均测距均方差为δr=2 m, 平均测向均方差δθ=0.05 rad;

4) 地面站位于(-500, -800) m;

5) 通信链路模型如图 2所示;

6) 仿真总时长为100 s, 时间步长为Ts=1 s, 滚动时域长度为Tp=3 s, 防撞安全距离dsafe=200 m.

为了验证本文方法的有效性, 设置考虑通信优化(A组)与不考虑通信优化(B组)进行对比分析.

4.1.1 考虑通信优化

图 5给出了30 s、64 s和100 s时的无人机协同目标跟踪航迹.从图 5可以看出, 在仿真开始时(t=30 s), 由于A1离地面站较近, A2离地面站较远, A1在地面站附近盘旋, 以充当A2的通信中继; 而A2则在目标周围运动, 对目标进行跟踪观测, 并将其局部滤波估计结果通过A1发送给地面站, 进行信息融合.随着目标的运动, 目标与地面站之间的距离逐渐减小, 由于A1在地面站附近盘旋, 相应地, 目标与A1之间的距离也逐渐减小, 这时候A1开始飞向目标, 以便对目标进行更好地跟踪观测.当t=64 s时, 通信网络的拓扑结构变为由A2充当A1的通信中继, 并且随着目标逐渐远离地面站, A2在地面站附近运动, 继续充当A1通信中继, 而A1则在目标周围运动, 对目标进行跟踪观测, 直至仿真结束(t=100 s).

图 5 考虑通信优化的跟踪航迹

A1A2与地面站之间的信息成功传输概率变化曲线如图 6(a)所示.为了便于对比分析, 图 6(a)还给出了A1A2直接与地面站通信而不借助于任何中继实现信息转发时的信息成功传输概率, 该概率值可根据每一仿真时刻A1A2与地面站的位置信息, 利用1.4节所建立的通信链路模型计算得到. A1A2以及地面站的FIM的迹随时间的变化曲线如图 6(b)所示.

图 6 考虑通信优化的信息成功传输概率与FIM的迹

图 6(a)可以看出, 在[0, 64) s的时间段内, 由A1充当A2通信中继; 而在[64, 100] s的时间段内, 由A2充当A1通信中继.除此之外, 还可以看出, 当考虑通信优化时, A1A2与地面站之间的平均信息成功传输概率分别约为0.91和0.85.

由于基于通信和观测联合优化策略使得A1A2与地面站之间的信息成功传输概率基本上维持在0.8以上, 从而保证了A1A2可以将各自的局部滤波估计结果可靠地传输到地面站.地面站有效地融合来自A1A2对被跟踪目标的观测结果, 能够显著增加目标信息, 降低目标状态估计的不确定性, 因此获得了更好的目标状态全局滤波融合估计结果.

4.1.2 不考虑通信优化

不考虑通信优化时, 无人机协同目标跟踪航迹如图 7(a)所示, 可以看出A1A2均保持在目标周围运动. A1A2与地面站之间的信息成功传输概率的变化曲线如图 7(b)所示, A1A2的平均信息成功传输概率分别为0.671 7和0.627 6.可以看出, 由于没有考虑通信因素, 无人机与地面站之间的信息成功传输概率较低, 无法保证无人机与地面站之间信息的可靠传输. A1A2以及地面站的FIM的迹随时间的变化曲线如图 7(c)所示.当没有考虑通信因素时, 无人机与地面站之间的信息成功传输概率较低, 从而导致了地面站不能接收到A1A2局部滤波估计结果, 影响了地面站对目标状态的融合估计. 图 7(c)中地面站的FIM的迹在较长的一段时间内保持不变且有下降的趋势, 该仿真结果验证了上述结论.

图 7 不考虑通信优化的仿真结果

为了进一步分析两种情况下目标状态融合滤波估计性能, 消除单次仿真的偶然性, 更客观全面地评估基于通信和观测联合优化策略对目标跟踪性能的影响, 对上述仿真算例进行10次重复实验, 统计10次蒙特卡洛仿真中目标状态的估计误差、信息成功传输概率、FIM的迹等数据的平均值, 统计结果见表 2.

表 2 A、B两组关键数据的统计结果(仿真1)

表 2可以看出: 1) A组中地面站对目标位置、速度、运动方向的融合滤波估计结果的平均误差均小于B组, 并且A组中地面站的FIM的迹的平均值要大于B组.这说明, 当考虑通信优化时, 目标状态的全局融合估计结果更为精确, 并且更为有效.产生上述现象的原因在于, 基于通信和观测联合优化的多无人机协同目标跟踪控制方法, 能够在目标跟踪过程中尽量提高各架无人机与地面站之间的信息传输概率, 从而保证各架无人机可以将各自的局部滤波估计结果可靠地传输到地面站.因此, 上述仿真结果验证了本文所提出方法具有更好的跟踪性能. 2)对比A组中A1A2对目标的跟踪滤波估计情况可知, 无论是目标状态的估计误差还是FIM的迹, A2均要优于A1.原因在于, A1在较长的一段时间内需要充当A2的通信中继, 以保证A2与地面站之间信息的可靠传输, 为此A1只能在地面站附近运动, 从而影响了A1对目标的观测, 这体现了通信优化与观测优化之间的折中.

4.2 不同的通信网络拓扑优化策略下的对比仿真

仿真2  采用两架无人机A1A2对单个静止目标T进行协同定位. A1的初始位置为(-800, 200) m, 初始航向为45°, A2的初始位置为(-400, -700) m, 初始航向为180°.静止目标T位于(-800, 0) m, 地面站B位于(-500, -800) m, 其他条件同仿真1.将本文方法与文献[12]的方法进行对比, 设置基于最小生成树的拓扑优化策略(A组)与固定的通信拓扑策略(B组)两组实验来分析不同的通信拓扑优化策略对目标跟踪效果的影响.

4.2.1 基于最小生成树的拓扑优化策略

图 8的仿真结果可以看出, 由于A2离地面站较近, 而A1较远, 以地面站为根节点的最小生成树的拓扑结构为{A1A2→地面站}, 即A2充当A1的中继.故A2在通信优化与观测优化之间进行折中, 决策出的通信与观测联合最优位置为O2(-524.7, -559.1) m.由于动力学约束, A2O2为中心进行盘旋机动, 而A1则对目标进行跟踪观测定位.

图 8 采用基于最小生成拓扑优化策略的仿真结果
4.2.2 固定的通信拓扑策略

在文献[12]中, 多架无人机按照固定的编号顺序依次进行本地优化计算, 这种固定的优化决策顺序说明了在文献[12]中多无人机通信网络拓扑结构是按照无人机的编号由小到大的排列而形成的一种“链式”结构.那么, 在B组中, 这种固定的通信拓扑结构为{A2A1→地面站}, 然而A2离地面站较近, 而A1较远, 很显然这种通信拓扑结构并不是最优的.为了形成并保持这种按编号升序排列的“链式”通信拓扑结构, A1朝着地面站飞行, A2朝着目标飞行, 如图 9(a)所示.可见, 由于预先设置的固定通信拓扑结构并不合理, 导致A1A2进行了一段不必要的机动飞行.另外, 从图 9(b)可以看出, 在机动飞行阶段, 由于不合理的通信拓扑结构, 使得A1A2与地面站之间的信息成功传输概率较低, 从而影响了地面站对目标位置的融合估计.

图 9 采用固定通信拓扑策略

关键数据的统计结果(10次重复实验)如表 3所示.可以看出, 相较于固定通信拓扑策略, 当采用基于最小生成树的拓扑优化策略时, 目标状态的全局融合滤波估计结果更精确、更有效.

表 3 A、B两组关键数据的统计结果(仿真2)
5 结论

目标状态的全局融合估计性能的好坏不仅取决于无人机对目标观测结果中所包含信息量的大小, 还取决于无人机能否可靠地将自身的观测结果传输到融合中心地面站上.为此, 本文提出了一种基于通信与观测联合优化的多无人机协同运动目标跟踪控制方法.通信与观测联合优化体现在提高无人机与地面站之间的信息成功传输概率与降低目标状态估计的不确定性之间的折中.仿真实验的结果验证了本文方法能够有效地实现目标跟踪, 并且目标状态的全局融合估计结果更精确、更有效.

参考文献
[1]
Wang Y, Cao Y. Coordinated target tracking via a hybrid optimization approach[J]. Sensors, 2017, 17(3): 472-489.
[2]
Zhou Z, Fang H, Hong Y. Distributed estimation for moving target based on state-consensus strategy[J]. IEEE Trans on Automatic Control, 2013, 58(8): 2096-2101. DOI:10.1109/TAC.2013.2246476
[3]
Hu J, Xie L, Zhang C. Diffusion Kalman filtering based on covariance Intersection[J]. IEEE Trans on Signal Processing, 2012, 60(2): 891-902. DOI:10.1109/TSP.2011.2175386
[4]
Wang Y, Zheng W, Sun S, et al. Robust information filter based on maximum correntropy criterion[J]. J of Guidance Control & Dynamics, 2016, 39(5): 1126-1131.
[5]
Zhang M, Liu H H T. Cooperative tracking a moving target using multiple fixed-wing UAVs[J]. J of Intelligent & Robotic Systems, 2016, 81(3/4): 505-529.
[6]
Lu K L, Zhou R, Li H. Event-triggered cooperative target tracking in wireless sensor networks[J]. Chinese J of Aeronautics, 2016, 29(5): 1326-1334. DOI:10.1016/j.cja.2016.08.010
[7]
Kwon H, Pack D J. A robust mobile target localization method for cooperative unmanned aerial vehicles using sensor fusion quality[J]. J of Intelligent & Robotic Systems, 2012, 65(1): 479-493.
[8]
Hu J, Xie L, Zhang C. Energy-based multiple target localization and pursuit in mobile sensor networks[J]. IEEE Trans on Instrumentation & Measurement, 2011, 61(1): 212-220.
[9]
Oh H, Kim S, Shin H S, et al. Coordinated standoff tracking of moving target groups using multiple UAVs[J]. IEEE Trans on Aerospace & Electronic Systems, 2015, 51(2): 1501-1514.
[10]
Oh H, Kim S, Shin H S, et al. Rendezvous and standoff target tracking guidance using differential geometry[J]. J of Intelligent & Robotic Systems, 2013, 69(1/4): 389405.
[11]
Andreev K V, Rubinovich E Y. Moving observer trajectory control by angular measurements in tracking problem[J]. Automation & Remote Control, 2016, 77(1): 106-129.
[12]
Stachura M, Frew E W. Cooperative target localization with a communication-aware unmanned aircraft system[J]. J of Guidance Control & Dynamics, 2011, 34(5): 1352-1362.
[13]
Zhu H, Swindlehurst A, Liu K. Optimization of MANET connectivity via smart deployment/movement of unmanned air vehicles[J]. IEEE Trans on Vehicular Technology, 2009, 58(7): 3533-3546. DOI:10.1109/TVT.2009.2015953
[14]
王林.多无人机协同目标跟踪问题建模与优化技术研究[D].长沙: 国防科学技术大学机电工程与自动化学院, 2011.
(Wang L. Modeling and optimization for multi-UAVs cooperative target tracking[D]. Changsha: College of Mechatronic Engineering and Automation, National University of Defense Technology, 2011.) http://cdmd.cnki.com.cn/Article/CDMD-90002-1012020829.htm
[15]
Ponda S S, Kolacinski R M, Frazzoli E. Trajectory optimization for target localization using small unmanned aerial vehicles[C]. Conf on Guidance, Navigation and Control. Chicago: AIAA, 2009: 1-25.