控制与决策  2019, Vol. 34 Issue (11): 2317-2322  
0

引用本文 [复制中英文]

李丽, 王夕娟. 拒绝服务攻击下领导-跟随多智能体系统的均方一致性研究[J]. 控制与决策, 2019, 34(11): 2317-2322.
[复制中文]
LI Li, WANG Xi-juan. Mean square consensus for leader-following multi-agent systems under denial-Mean square consensus for leader-following multi-agent systems under denial-of-service attacks[J]. Control and Decision, 2019, 34(11): 2317-2322. DOI: 10.13195/j.kzyjc.2019.0588.
[复制英文]

基金项目

国家自然科学基金面上项目(61773334)

作者简介

李丽(1983—), 女, 副教授, 博士, 从事非线性滤波、分布式估计与控制等研究, E-mail: lili@ysu.edu.cn;
王夕娟(1992—), 女, 硕士生, 从事多智能体协同控制、分布式估计与控制的研究, E-mail: xijuanw02@163.com

通讯作者

李丽, E-mail: lili@ysu.edu.cn

文章历史

收稿日期:2019-04-30
修回日期:2019-08-23
拒绝服务攻击下领导-跟随多智能体系统的均方一致性研究
李丽 , 王夕娟     
燕山大学 电气工程学院,河北 秦皇岛 066004
摘要:针对带有过程噪声和测量噪声的领导-跟随多智能体系统, 研究拒绝服务攻击下多智能体系统的一致性问题.首先, 设计基于卡尔曼滤波的状态观测器, 对智能体状态进行有效准确的估计; 然后, 基于预测控制理论提出一种基于状态估计信息的分布式预测控制算法, 从而实现领导-跟随多智能体系统的均方一致性控制, 并给出拒绝服务攻击环境下实现领导-跟随多智能体系统均方一致性的充分必要条件; 最后, 通过数值仿真验证所提出方法的正确性和有效性.
关键词多智能体系统    拒绝服务攻击    卡尔曼滤波    预测控制    均方一致性    过程噪声    测量噪声    
Mean square consensus for leader-following multi-agent systems under denial-Mean square consensus for leader-following multi-agent systems under denial-of-service attacks
LI Li , WANG Xi-juan     
School of Electrical Engineering, Yanshan University, Qinhuangdao 066004, China
Abstract: This paper addresses the mean square consensus problems for leader-following multi-agent systems under denial-of-service (DoS) attacks, process noise and measurement noise. Firstly, a state observer is presented to estimate the state of each agent effectively and accurately. Then, based on the predictive control theory, a distributed predictive control protocol based on the state estimation information of each agent is proposed for the leader-following multi-agent systems to achieve mean square consensus. Sufficient and necessary conditions of consensus for the leader-following multi-agent systems under DoS attacks are derived. Finally, a numerical example is provided to verify the correctness and effectiveness of the proposed methods.
Keywords: multi-agent systems    denial-of-service attacks    Kalman filtering    predictive control    mean square consensus    process noise    measurement noise    
0 引言

近年来, 由于多智能体系统在卫星通信、机器人编队和生物系统等众多领域的广泛应用, 多智能体系统的一致性控制问题逐渐成为研究的热点[1-2].随着传感、计算和网络通信的发展, 越来越多的多智能体系统利用网络进行信息交互.通过运用互联网技术, 多智能体系统能够进行远距离数据传输, 但由于互联网协议的开放性, 不可避免地带来一系列的信息安全问题[3-4].恶意攻击者通过攻击多智能体间的通信网络, 使通信信息不能正常传输, 严重破坏了多智能体系统的稳定性.因此, 关于多智能体系统在网络攻击下的安全一致性研究越来越受到人们的关注.

常见的网络攻击的方式有拒绝服务攻击和欺骗攻击, 其中拒绝服务攻击能够使网络或系统资源耗尽, 暂时中断或停止系统的网络服务, 阻碍数据的正常传输, 使数据无法到达目的地.目前, 关于多智能体系统的安全一致性研究已取得了一些成果.在拒绝服务攻击下, 文献[5]采用一种基于输入的事件触发方式, 研究了多智能体系统的分布式一致性控制.文献[6]研究了在网络攻击下, 存在通信时延的网络化多智能体系统的一致性控制问题.文献[7]提出了一种基于中间状态值的多智能体系统的安全一致性算法.考虑不同的攻击强度, 文献[8]引入切换系统模型对拒绝服务攻击进行建模, 并研究了领导-跟随多智能体系统的鲁棒一致性控制.当拒绝服务攻击的攻击频率和持续攻击时间小于某个值时, 文献[9]提出了一种分布式安全控制策略, 实现了多智能体的一致性控制.

注意到, 在实际环境中, 多智能体系统经常会受到随机噪声的影响, 往往不能准确获取智能体的真实状态.如果直接用测得的带有噪声干扰的数据信息进行控制, 多智能体系统的一致性控制将难以保证.文献[10-12]分别研究了在过程噪声、测量噪声和通信噪声干扰下, 如何实现多智能体系统的均方一致性控制.对于同时带有过程噪声和测量噪声的多智能体系统, 文献[13-14]研究了系统的一致性误差问题.然而, 目前对于网络攻击下, 带有噪声的多智能体系统的一致性研究还不充分.

鉴于此, 本文针对一类带有过程噪声和测量噪声的领导-跟随多智能体系统, 考虑智能体信息交互网络中存在拒绝服务攻击的情况, 通过运用卡尔曼滤波理论和预测控制理论[15-17], 提出一种基于状态估计信息的分布式预测控制算法, 实现了对系统状态信息的准确有效获取, 从而保证领导-跟随多智能体系统能够实现较好的一致性控制.

1 预备知识

假设领导-跟随多智能体系统中有一个领导者和N个智能体, G=(V, E, )表示各个智能体之间进行信息交换的网络拓扑结构.节点集V={v1, v2, ..., vN}为有限的非空集, 边集EV×V, 图的边eij=(vi, vj)∈ E表示智能体i与智能体j之间可以传递信息.邻接矩阵=[aij]∈Rn× n, 若(vi, vj)∈ E, 则有aij>0, 否则aij=0.度矩阵D=diag{deg1, deg2, ..., degN}, 其中.定义拉普拉斯矩阵L=D- =[lij], 且有

定义矩阵G=diag{b1, b2, ..., bN}, bi∈ {0, 1}表示智能体i是否能收到领导者的信息, bi=1表示智能体i能收到领导者的信息, 否则表示不能.

2 问题描述

考虑1个由1个领导者和N个多智能体个体组成的离散时间领导-跟随多智能体系统, 第i个智能体的动态模型如下:

(1)

其中: k为离散采样时间, 编号为0的智能体为领导者, 其他为跟随者; 变量xi(k)∈Rniyi(k)∈Rlui(k)∈Rmi分别为第i个智能体的状态、输出和控制输入; ARni× niBRni× miCRl× ni为第i个智能体的参数矩阵; wi(k)∈Rnivi(k)∈Rl分别为第i个智能体的过程噪声和测量噪声, wi(k)和vi(k)为均值为零方差分别为Qi(k)和Ri(k)的不相关高斯白噪声; 初始状态xi(0)与噪声wi(k)和vi(k)无关.这里假设系统(1)是一致完全可控和一致完全可观测的.

拒绝服务攻击是最常见的网络攻击方式之一, 它能够阻断智能体间的信息交互, 使邻居信息无法正常传输到第i个智能体, 严重影响多智能体系统的一致性控制.本文假设攻击者能量有限, 只能对系统进行有限次的连续攻击, 并且连续攻击时间上界为dk.假设DoS攻击者能量有限更符合实际情况.例如, 许多数字设备通常使用电池供电, 当他们被用作DoS攻击的工具时, DoS攻击者的能量也是有限的.此外, 关于DoS攻击者的能量约束问题在文献[18]中有更详细的讨论.若DoS攻击连续攻击时间无穷大, 一旦攻击发生, 则智能体间通讯将有可能一直处于中断状态, 那么整个系统将是不可控的.

与文献[19-20]类似, 定义一个服从伯努利分布的二进制变量αi(k), 当拒绝服务攻击发生时, 变量αi(k)=1, 否则αi(k)=0.拒绝服务攻击发生和不发生的概率分别为

定义1  若领导-跟随多智能体系统能够满足

则领导-跟随多智能体系统能实现均方一致性控制.

3 主要结果 3.1 观测器设计

在领导-跟随多智能体系统(1)中, 由于过程噪声和测量噪声影响, 往往不能直接得到状态变量的真实值, 如何对智能体的信息进行有效、准确的处理极其关键.本文基于卡尔曼滤波理论, 对多智能体的状态进行有效准确的估计, 从而降低噪声对系统的不利影响.领导-跟随多智能体系统(1)的观测器设计如下:

1) 预测

2) 更新

(2)

其中Ki(k+1)为观测器增益, 能够保证估计误差协方差(k+1|k+1)最小.

3.2 控制器设计

由于过程噪声和测量噪声的存在以及拒绝服务攻击的不利影响, 如何实现领导-跟随多智能体系统(1)的一致性成为极具挑战性的问题.基于卡尔曼滤波理论, 对带有噪声的多智能体状态信息进行估计, 从而实现数据信息的准确、有效获取, 为领导-跟随多智能体系统的一致性控制提供根本保证.当拒绝服务攻击发生时, 智能体间的通信网络阻塞, 信息交互过程无法正常进行, 且不能接收到领导者发来的信息.本部分运用预测控制理论, 提出一种基于多智能体状态估计信息的分布式预测控制算法, 进而保证多智能体系统在最大持续攻击时间下仍能实现一致性.

以第i个智能体为例, 当攻击发生时, 智能体i利用k时刻之前收到的邻居智能体j的状态估计信息, 预测k-dk+1步~ k步智能体j的状态, 具体如下:

(3)
(4)

为了实现领导-跟随多智能体系统(1)的一致性控制, 设计如下基于多智能体状态估计信息的分布式预测控制器:

(5)

其中Fi为控制器增益.

3.3 一致性分析

在多智能体系统的研究中, 一致性问题是一个基本的研究内容.当系统存在过程噪声和测量噪声时, 即使对于单个多智能体个体也很难达到稳定.同时智能体间的信息交互过程中遭受到拒绝服务攻击, 更加加大了多智能体系统一致性控制的难度.

定理1 在拒绝服务攻击下, 对于带有过程噪声和测量噪声的领导-跟随多智能体系统(1), 如果满足条件:矩阵Ax和矩阵A-Ki(k)CA(∀iN)是舒尔稳定的, 则领导-跟随多智能体系统(1)能够实现均方一致性控制.其中

证明  定义状态估计误差变量

(6)

结合式(1)和(2), 可以得到

(7)

对式(7)求均值可得

(8)

对式(3)进行迭代计算可得

(9)

对于第j个智能体, 利用式(1)进行迭代计算可得

(10)

式(10)可以重新写为

(11)

结合式(7)、(9)和(11)可以得到

(12)

同理可得

(13)

结合式(12)和(13), 预测控制器设计(5)可以重新写为

(14)

结合式(1)和(14), 可以得出

(15)

定义误差变量

(16)

则有

(17)

对式(17)求均值, 可得

(18)

其中

由式(8)可以得到

(19)

其中

结合式(18)和(19), 误差系统可以写为如下形式:

(20)

其中

显然, 当误差系统(20)渐近稳定时, 领导-跟随多智能体系统(1)能够实现均方一致性控制.根据舒尔稳定性定理可知, 当且仅当矩阵AxA-Ki(k)CA舒尔稳定时, 有

进而可得

即领导-跟随多智能体系统(1)能够实现均方一致性控制.

4 仿真分析

本节通过数值仿真验证上述所提理论的准确性和有效性.考虑由1个领导者和3个跟随者组成的同构多智能体系统, 系统拓扑结构如图 1所示.其中:智能体0为领导者, 其他3个为跟随者, 智能体1可接受领导者的信息.矩阵G=diag{1, 0, 0}.相关参数矩阵设置如下:

图 1 有向网络拓扑图

拒绝服务攻击发生的概率α = 0.3, 连续攻击时间上界设定为dk = 4.所有智能体的初始状态设定为x0(0) =[0  1]T, x1(0)=[0  3]T, x2(0)=[0  5]T, x3(0)=[0  -3]T.领导者的控制输入信号设置为u0(k)=0.2.选择一组控制增益F1=[-0.154 7  0.366 6], F2=[-0.275 9  0.034 5], F3=[-0.153 5  0.578 0], 可以验证矩阵Ax和矩阵A-Ki(k)CA(∀iN)是舒尔稳定的.

领导-跟随多智能体系统的状态估计误差曲线如图 2所示.由图 2可见, 在60 s左右, 多智能体系统的状态估计误差趋近于零, 表明所设计的观测器能够准确、有效地估计智能体状态信息, 且有效降低了过程噪声和测量噪声的影响.多智能体系统的一致性状态误差跟踪曲线如图 3所示.由图 3可见, 在130 s左右, 系统的状态跟踪误差趋近于零, 表明在拒绝服务攻击下, 所设计的基于状态估计信息的分布式预测控制器能够有效抵御恶意的网络攻击, 实现多智能体系统的均方一致性控制.拒绝服务攻击导致的通信中断时刻图如图 4所示, αi(k)=1表示发生攻击, 攻击发生时智能体i接收不到其他智能体传来的信息.

图 2 状态估计误差曲线
图 3 一致性状态跟踪误差曲线
图 4 拒绝服务攻击导致的通信中断时刻图
5 结论

本文研究了在拒绝服务攻击下, 带有过程噪声和测量噪声的领导-跟随多智能体系统的安全一致性控制问题.设计了基于卡尔曼滤波的状态观测器, 实现了智能体状态信息的有效准确获取, 降低了噪声对系统的不利影响.考虑在多智能体系统信息交互网络中存在拒绝服务攻击, 提出了一种基于状态估计信息的分布式预测控制算法, 实现了领导-跟随多智能体系统的均方一致性控制, 并给出了实现均方一致性控制的充分必要条件.最后通过仿真实例验证了所提出方法的正确性和有效性.

参考文献
[1]
Desai J P, Ostrowski J P, Kumar V. Modeling and control of formations of nonholonomic mobile robots[J]. IEEE Transactions Robot Automatic, 2001, 17(6): 905-908. DOI:10.1109/70.976023
[2]
Sunberg Z, Chakravorty S, Erwin R S. Information space receding horizon control for multisensor tasking problems[J]. IEEE Transactions on Cybernetics, 2016, 46(6): 1325-1336. DOI:10.1109/TCYB.2015.2445744
[3]
张恒.信息物理系统安全理论研究[D].杭州: 浙江大学控制科学与工程学院, 2015.
(Zhang H. Research on security theory for cyber-physical systems[D]. Hangzhou: College of Control Science and Engineering, Zhejiang University, 2015.)
[4]
Sun Y C, Yang G H. Event-triggered resilient control for cyber-physical systems under asynchronous DoS attacks[J]. Information Sciences, 2018, 465: 340-352. DOI:10.1016/j.ins.2018.07.030
[5]
Xu Y, Fang M, Wu Z G, et al. Input-based event-triggering consensus of multiagent systems under denial-of-service attacks[J]. IEEE Transactions on Systems, Man, and Cybernetics, 2018. DOI:10.1109/TSMC.2018.2875250
[6]
Wu Y M, He X X. Secure consensus control for multi-agent systems with attacks and communication delays[J]. IEEE/CAA Journal of Automatica Sinica, 2017, 4(1): 136-142. DOI:10.1109/JAS.2016.7510010
[7]
张霓, 杜伟, 何熊熊, 等. 基于中间状态值的多智能体系统安全一致性控制[J]. 控制与决策, 2019, 34(3): 567-571.
(Zhang N, Du W, He X X, et al. Secure consensus control of multi-agent systems based on median state strategy[J]. Control and Decision, 2019, 34(3): 567-571.)
[8]
Zhang D, Feng G. A new switched system approach to leader-follower consensus of heterogeneous linear multiagent systems with DoS attack[J]. IEEE Transactions on Systems, Man, and Cybernetics, 2019. DOI:10.1109/TSMC.2019.2895097
[9]
Feng Z, Wen G H, Hu G Q. Distributed secure coordinated control for multiagent systems under strategic attacks[J]. IEEE Transactions on Cybernetics, 2017, 47(5): 1273-1284. DOI:10.1109/TCYB.2016.2544062
[10]
Shi G, Johansson K. Robust consensus for continuous-time multiagent dynamics[J]. SIAM Journal Control Optimation, 2013, 51(5): 3673-3691. DOI:10.1137/110841308
[11]
Huang M, Manton J H. Coordination and consensus of networked agents with noisy measurements: Stochastic algorithms and asymptotic behavior[J]. SIAM Journal Control Optimation, 2009, 48(1): 134-161. DOI:10.1137/06067359X
[12]
Li T, Zhang J-F. Consensus conditions of multiagent systems with time-varying topologies and stochastic communication noises[J]. IEEE Transactions Automatic Control, 2010, 55(9): 2043-2057. DOI:10.1109/TAC.2010.2042982
[13]
Wang Z, Zhang H. Consensus error calculation for multi-agent systems with both system and measurement noises[J]. IEEE Transaction Control Network System, 2019, 5(3): 1457-1466.
[14]
Wang Z, Zhang H. Observer-based robust consensus control for multi-agent systems with noises[J]. Neurocomputing, 2016, 207: 408-415. DOI:10.1016/j.neucom.2016.05.029
[15]
Xia Y, Liu G P, Fu M, et al. Predictive control of networked systems with random delay and data dropout[J]. IET Control Theory and Applications, 2009, 3(11): 1476-1486. DOI:10.1049/iet-cta.2008.0242
[16]
Liu G P. Predictive control of networked multiagent systems via cloud computing[J]. IEEE Transactions on Cybernetics, 2017, 47(8): 1852-1859. DOI:10.1109/TCYB.2017.2647820
[17]
Liu G P. Consensus and stability analysis of networked multiagent predictive control systems[J]. IEEE Transactions on Cybernetics, 2017, 47(4): 1114-1119. DOI:10.1109/TCYB.2016.2535126
[18]
Zhang H, Cheng P, Shi L, et al. Optimal denial-of-service attack scheduling with energy constraint[J]. IEEE Transactions Automatic Control, 2015, 60(11): 3023-3028. DOI:10.1109/TAC.2015.2409905
[19]
Zhang D, Liu L, Feng G. Consensus of heterogeneous linear multiagent systems subject to aperiodic sampled-data and DoS attack[J]. IEEE Transactions on Cybernetics, 2019, 49(4): 1501-1511. DOI:10.1109/TCYB.2018.2806387
[20]
Yang H, Li Y, Dai L, et al. MPC-based defense strategy for distributed networked control systems under DoS attacks[J]. Systems and Control Letters, 2019, 128: 9-18. DOI:10.1016/j.sysconle.2019.04.001