脉冲控制下多智能体系统的保性能双向编队控制
王未 1, 王莉 1, 黄迟 2     
1. 太原理工大学 大数据学院,太原 030024;
2. 西南财经大学 经济信息工程学院,成都 610074
摘要:研究混杂脉冲控制下二阶非线性多智能体系统的双向编队控制问题, 以及保性能双向编队控制问题.根据领导智能体、目标编队以及邻居智能体的状态对每个智能体设计双向编队控制的状态反馈控制器及脉冲控制器.基于双向编队的目标, 定义适当的误差系统, 将双向编队问题转化为误差系统的稳定性问题.利用平均脉冲强度以及平均脉冲区间的定义, 给出在混杂的脉冲控制下二阶非线性多智能体系统实现双向编队的充分条件, 并分析连续的状态反馈控制器和离散的脉冲控制器对双向编队控制的作用.对于给定的性能函数, 给出多智能体系统实现保速度性能双向编队的充分条件.最后, 通过两个数值模拟实验验证所得到的理论结果的有效性.
关键词双向编队    脉冲控制    平均脉冲区间    平均脉冲强度    保性能    多智能体系统    
Guaranteed cost bipartite formation problem of multi-agent systems with impulse control
WANG Wei 1, WANG Li 1, HUANG Chi 2     
1. College of Data Science, Taiyuan University of Technology, Taiyuan 030024, China;
2. School of Economic Information and Engineering, Southwestern University of Finance and Economics, Chengdu 610074, China
Abstract: Bipartite formation and guaranteed bipartite formation of second-order nonlinear multi-agent systems with hybrid impulses are investigated. According to the states of the leader agent, the target formation and neighbor agents, a feedback controller and impulse controller for bipartite formation are designed. Based on the target of bipartite formation, an appropriate error system is defined to transform the bipartite formation problem into the stability of error systems. Based on the definitions of average impulsive interval and average impulsive gain, a sufficient condition is given to solve the bipartite formation problem for second-order nonlinear multi-agent systems with the hybrid impulse controller. The effects of the continuous state feedback controller and the discrete impulse controller on bipartite formation control are analyzed. Then, for a given performance function, a sufficient condition is given for the multi-agent systems to realize bipartite formation with the guaranteed velocity performance. Finally, the effectiveness of the theoretical results is illustrated by two numerical simulations
Keywords: bipartite formation    impulsive control    average impulsive interval    average impulsive gain    guaranteed cost    multi-agent systems    
0 引言

由于多智能体系统在工程、社会科学、经济等领域的广泛应用, 关于多智能体系统的协同控制的研究吸引了越来越多的关注.编队控制是一个重要的多智能体系统协同控制研究课题, 目的是设计合适的控制器, 使系统中的智能体实现给定的一个代数形状.近年来, 研究者们对多智能体系统的各类编队控制作了研究, 如包含编队[1]、圈编队[2]、聚类编队[3]、最优编队控制[4]等.

需要指出的是, 之前关于编队控制问题的研究只考虑系统中只有合作的相互作用.然而, 现实系统中, 通常是既有合作关系, 又有竞争关系[5-6].文献[7]构造出了同时包含合作和竞争关系的多智能体系统模型, 并且给出了双向一致的概念.基于这个结果, 关于双向一致性问题的研究也取得了较好的成果[8-9].但是, 对于此类多智能体系统的编队问题只有很少的研究成果[10-11], 文献[10]和文献[11]分别研究了一阶线性以及二阶线性多智能体系统的编队问题, 且关于二阶系统的编队问题中并未涉及速度的特性.基于这样的研究背景, 本文将对二阶非线性系统的双向编队问题进行讨论.

为了使系统实现自身达不到的状态, 研究者们提出了各种各样的控制策略, 例如事件驱动[12]、牵制控制[13]、脉冲控制[14-15]等.脉冲控制只在特定时刻施加控制, 这样就使控制器更简单.脉冲控制通常包括两种, 一种利于同步, 一种不利于同步.文献[14]通过提出平均脉冲区间的概念找到了适用于两种脉冲的控制规则, 而现有的很多文献采用的脉冲控制器仅仅包含一种脉冲, 这显然不能更好地接近现实的系统.基于文献[14]的成果, 文献[15]通过给出平均脉冲强度的定义以及改进平均脉冲间隔的定义, 研究了混杂脉冲控制下网络的同步问题.这为两种脉冲共存时的脉冲控制器的设计打开了新的视角.

在实际应用中, 实现目标的同时, 往往还需要满足一些约束, 例如网络结构约束[16], 最大速度和加速度的约束[17], 以及最大位置误差约束[18]等.定义适当的性能函数, 这些约束问题即可解决.

本文研究在脉冲控制下, 二阶非线性多智能体系统的保性能双向编队控制.首先, 给出二阶系统的双边编队的定义, 该问题在之前的研究中几乎没有被考虑过.基于领导智能体、目标编队的状态以及邻接智能体的状态设计状态反馈以及脉冲控制器, 并给出对应目标的误差系统.其次, 利用平均脉冲强度和平均脉冲区间的定义得到混杂脉冲控制下多智能体系统实现双向编队的充分条件.之前基于平均脉冲强度和平均脉冲区间的研究大多针对一阶线性的系统, 并没有用于二阶非线性系统的控制中.本文给出的双边编队条件同时反映了连续的状态反馈控制器和脉冲控制器对目标实现的影响.之后, 对于给定的性能函数, 得到了二阶多智能体系统在实现双向编队的情况下满足性能约束的充分条件.最后, 给出两个数值实例来证明结果的有效性.

1 问题描述和预备知识

本文使用标准符号.文中R表示实数集, N表示自然数集; ||·||表示向量的欧几里得范数; 对于实对称矩阵X, X < 0(X≤ 0)意味着矩阵X是负定(半负定)的; diag{…}表示对角矩阵; λmax(A)表示矩阵A的最大特征值; ⊗表示克罗内克积.如果没有明确说明, 矩阵都假设具有合适的维数.

1.1 图论知识

用一个三元组描述带符号的无向图, 其中是节点的集合, 是边的集合, A=[aij]∈ RN× N是图的邻接矩阵, 如果节点与节点之间有连接, 则aij=aji≠ 0, 反之, aij=0.本文考虑无自环的图, 即aii=0, ∀ i=1, 2, …, N.对于无向图中的任意一对节点, 都能找到一条可以连通这两个节点的路径, 称这个图为连通图.图的拉普拉斯矩阵定义为.如果一个带符号的无向图的节点可以分为无交集的两个分组, 即, 且有q(p, q ∈ {1, 2}), 则称图为结构平衡图.对∀ i, j = 1, 2, …, N, 定义aij+= |aij|, 对应的图记为, 拉普拉斯矩阵为L+= (lij+)N × N.如果无向图是连通的, 则也连通且L+不可约.注意到L+是行和为零且非对角元非正, 则L+≥ 0, 而且零特征值的重数为1.

1.2 模型构造

考虑由N+1个智能体构成的多智能体系统, 将其中的一个智能体下标记为“0”并称为领导智能体, 其余N个智能体为跟随智能体.领导智能体不受其他智能体的影响, 跟随智能体受领导智能体以及其他智能体的作用, 每个跟随智能体的动力学行为由如下的二阶微分方程描述:

(1)

其中: xi(t)∈ Rnvi(t)∈ Rn分别是第i个智能体的位置和速度状态, ui(t)∈ Rn是第i个智能体的控制输入, f : Rn× RRn是连续的非线性向量值函数.领导智能体的动力学行为如下:

(2)

其中x0(t)∈ Rnv0(t)∈ Rn分别是领导智能体的位置和速度状态.

假设1 对于非线性函数f(v(t))= [f1(v1(t)), …, fn(vn(t))]和σi ∈ {1, - 1}, i = 1, 2, 有正常数ρk, 使得下面不等式对k = 1, 2, …, n成立:

(3)

注1  本文研究的双向编队问题要求跟随智能体的两个分组的智能体的速度状态分别实现同步且大小相等方向相反.所以, 相对于一般的稳定性问题, 本文要多考虑一种研究目标, 这使研究的问题更加复杂化.此外, 本文考虑两个分组的智能体的非线性项是一致的, 这就要求本文对非线性项的假设要强于一般的Lipschitz假设.且满足Lipschitz条件的奇函数适用于本假设, 本假设是必要且可行的.

定义1 如果智能体的位置和速度满足

(4)

则称多智能体系统实现了双向编队.其中

x* = [x1*, x2*, …, xN*]T是目标编队形式.

考虑无向图是连通的结构平衡图, 根据文献[1]有D=diag{σ1, σ2, …, σN}, σi=±1使DAD的每个元素都非负.为使跟随智能体(1)实现双向编队, 设计如下控制器:

(5)

其中: γ>0; b1i, b2i ≥ 0是反馈控制增益.设计如下的脉冲控制器:

(6)

脉冲时间序列ζ={t1, t2, …}满足0≤ t0 < t1 < ... < tk < tk+1 < ..., , 脉冲强度ηkR.本文假设xi(tk)=xi(tk-), vi(tk)=vi(tk-), i=1, 2, …, N, x0(tk+)=x0(tk-), v0(tk+)=v0(tk-).

δxi(t)=σi(xi(t)-xi*)-x0(t), δvi(t)=σivi(t) - v0(t), b1 = diag{b11, …, b1N}, b2 = diag{b21, …, b2N}.考虑到σi2=1, i=1, 2, …, N, 如果aij≠0, σi sign(aij)σj=1, 则可得到如下的误差系统:

(7)

μk= 1+ ηk, δx(t)=[δx1T(t), δx2T(t), …, δxNT(t)]T, δv(t)=[δv1T(t), δv2T(t), …, δvNT(t)]T, , B1=b1In, B2 = b2In, , Δ f(v(t), t)=f(v0(t), t), f(v(t), t) =[fT(v1(t), t), fT(v2(t), t), …, fT(vN(t), t)]T, 从而, 误差系统可以写成如下的压缩形式:

(8)

定义2(平均脉冲强度[15])  脉冲序列ζ={t1, t2, …}的平均脉冲强度μ定义为

其中Nζ(t, t0)表示脉冲序列ζ在时间段(t0, t)内产生的脉冲次数.

定义3 (平均脉冲区间[15])  脉冲序列ζ={t1, t2, …}的平均脉冲区间定义为

注2 因为平均脉冲强度考虑的是脉冲序列中所有脉冲强度的平均值, 不会体现每次脉冲的强度, 所以, 好的脉冲(|μk| < 1)和坏的脉冲(|μk|>1)可以共存.而定义3相比文献[14]中给出的平均脉冲区间更直观, 可以用于更广泛的脉冲序列中.

2 主要结论

在这一部分, 将给出二阶非线性多智能体系统在混杂脉冲控制下实现双向编队的充分条件以及在实现双向编队情况下满足给定性能约束的充分条件.

定理1  考虑带符号的无向连通图, 如果非线性函数满足假设1, 且图是结构平衡的, 则在控制器(5)和(6)的作用下, 跟随智能体(1)能实现双向编队, 如果下面的条件成立:

(9)

其中

证明 当t∈(tk, tk+1], kN, 由L+≥ 0和B1≥ 0, 可定义李雅普诺夫函数V(t)=δxT(t)(+B1)δx(t)+δvT(t)δv(t).根据误差系统(8)对V(t)求导得

由假设1, 有

(10)

其中: .有

(11)

从而.另一方面, 由脉冲控制(8), 不难得到

从而, 对于t ∈ (tk, tk + 1], 有

因此, 当t ∈ (t0, t], 有

根据均值不等式

可以推出

基于μTa的定义, 对于任意的β < β' < 0, 有

因为β = 2lnμ/Ta + θ < 0, β' < 0, 所以=0.从而, 即跟随智能体实现了双向编队.

注3 根据定理1的证明过程, 如果, b1i>0, 则由式(11)可知, 可保证跟随智能体实现双向编队.但这要求领导智能体连续不断地对跟随智能体施加控制, 且对控制增益有一定的要求.为了减少领导智能体的控制次数, 通过设计脉冲控制器得到以上结果.不难知道θ≥ 0, 结合定理1的条件(9), 需要平均脉冲强度μ < 1保证目标的实现.在有脉冲控制的情况下, 控制增益B1可以为零, 且B2用来缓和对邻接矩阵以及脉冲控制强度的要求.如果脉冲控制器足够满足编队条件, 则B2也可以为零.从而, 脉冲控制器可以减少跟随智能体的编队控制对领导智能体状态的需求.

推论1  考虑带符号的无向连通且结构平衡的图, 非线性函数满足假设1, 在控制器(5)和(6)的作用下, 其中B1=B2=0, 多智能体系统(1)能实现双向编队, 如果下面的条件成立:

(12)

其中.

对于正定矩阵Q, 设计指标函数为

(13)

如果多智能体系统在实现双向编队的同时保证性能函数J有上界, 即JJ*, 则称多智能体系统实现了保速度性能双向编队.

定理2 考虑无向连通且结构平衡的图, 且假设1成立, 在控制器(5)和(6)的作用下, 多智能体系统(1)能实现保性能双向编队, 如果

(14)
(15)

同时

证明 由条件(14)和(15)可以得到(9), 也就是多智能体系统可以实现双向编队.下面, 只要证明性能函数有上界.对性能函数做如下等价变换:

根据牛顿-莱布尼茨公式, 有

因为-V(tm+1-)≤ 0, 有, 从而

(16)

其中

(17)

由定理1的证明过程可知V(tk+) = μk2V(tk), 从而

(18)

综合式(16) ~ (18), 可以得到JV(0), 则J*= V(0).

注4 根据式(8), μk为误差系统的脉冲控制强度, 条件|μk| < 1要求每次脉冲控制都是有利于误差系统稳定的.

3 数值仿真

本文利用6个飞行器的数值实例来验证所给出的编队控制器的有效性.为了简单化, 所有飞行器在X-Y平面上运动, 即n=2. 6个飞行器的通信关系由一个无向网络拓扑给出, 如图 1所示.可以看出, 飞行器直接的连接关系有正有负, 如果连接为正, 则认为他们属于同一个集团, 连接为负的两个飞行器属于不同的集团.不难发现, 飞行器1、2、3和飞行器4、5、6分别构成两个集团.本文的目标就是让两个集团的飞行器分别实现编队, 且方向相反.

图 1 6个飞行器的通信拓扑

飞行器的动力学行为由如下方程描述:

控制器uxuv根据式(5)给出, 其中反馈增益γ=0.9, b1=I6, b2=diag{4, 3, 2, 1, 3, 1}.为了对比方便, 将两个分组的目标形状设为一致, 有x1*=x4*=[-20, -20]T, x2*=x5*=[20,-20]T, x3*=x6*= , 即目标形状是两个正三角形.

例1 此例验证飞行器能在定理1条件下实现双向编队.对飞行器施加脉冲控制, 平均脉冲和平均脉冲区间分别为μ=0.95, Ta=0.2, 则β=-0.512 9.在控制器作用下, 位置误差系统和速度误差系统的轨迹见图 2.

图 2 位置误差系统和速度误差系统的轨迹

图 3给出了飞行器在时间0到10内的轨迹, 并且图中标出了t=0, t=4, t=7和t=10时刻的位置, 星号和小圆圈分别表示两个集团的飞行器.可以发现, 随着时间的推移飞行器渐渐形成并保持了目标形状. 图 4是飞行器的速度轨迹, 不难看出两个集团的飞行器的速度实现了不同的同步, 且大小相等方向相反.

图 3 飞行器的位置运动轨迹
图 4 飞行器的速度轨迹

例2 此例验证在定理2条件下飞行器实现保性能双向编队.设计脉冲控制使平均脉冲强度μ=0.95, Ta=0.2.目标编队设为0.004x*, 通过Matlab中的LMI工具箱, 找到满足条件(15)的Q, 即

初值设为

这个情况下, 可以算得J* = 216.022 8.指标函数值的轨迹和J*的值在图 5中给出, 可以发现指标函数以J*为上界.

图 5 指标函数JJ*
4 结论

本文对混杂脉冲控制下二阶非线性多智能体系统的双向编队控制问题进行了研究.通过对平均脉冲强度以及平均脉冲区间的定义, 给出了多智能体系统实现双向编队的充分条件.此外, 对于给定的性能函数, 得到了多智能体系统在实现双边编队的同时可以保证性能指标要求的充分条件.仿真和实验结果表明, 所设计的控制器可以保证多智能体系统实现双边编队.

参考文献
[1]
Dong X W, Li Q D, Ren Z, et al. Output formation-containment analysis and design for general linear time-invariant multi-agent systems[J]. Journal of the Franklin Institute, 2016, 353(2): 322-344. DOI:10.1016/j.jfranklin.2015.11.004
[2]
Wen J Y, Wang C, Xie G M. Asynchronous distributed event-triggered circle formation of multi-agent systems[J]. Neurocomputing, 2018, 295: 118-126. DOI:10.1016/j.neucom.2018.03.018
[3]
Wang W, Huang C, Cao J D, et al. Event-triggered control for sampled-data cluster formation of multi-agent systems[J]. Neurocomputing, 2017, 267: 25-35. DOI:10.1016/j.neucom.2017.04.028
[4]
Su H, Tang G Y. Rolling optimization formation control for multi-agent systems under unknown prior desired shapes[J]. Information Sciences, 2018, 459: 255-264. DOI:10.1016/j.ins.2018.04.023
[5]
Martin C S, Padmanabhan M. Pressure pulse propagation in two-component slug flow[J]. Journal of Fluids Engineering, 1979, 101(1): 44-52. DOI:10.1115/1.3448733
[6]
刘竹溪, 刘光临. 泵站水锤及其防护[M]. 北京: 水利电力出版社, 1988: 201-244.
(Liu Z X, Liu G L. Pump station water hammer and its protection[M]. Beijing: Water Resources and Electric Power Press, 1988: 201-244.)
[7]
Altafini C. Consensus problems on networks with antagonistic interactions[J]. IEEE Transactions on Automatic Control, 2013, 58(4): 935-946. DOI:10.1109/TAC.2012.2224251
[8]
Wu J, Deng Q, Han T, et al. Bipartite tracking consensus for multi-agent systems with lipschitz-type nonlinear dynamics[J]. Physica A: Statistical Mechanics and Its Applications, 2019, 525: 1360-1369. DOI:10.1016/j.physa.2019.03.105
[9]
Shi X C, Lu J Q, Liu Y. A new class of fixed-time bipartite consensus protocols for multi-agent systems with antagonistic interactions[J]. Journal of The Franklin Institute, 2018, 355(12): 5256-5271. DOI:10.1016/j.jfranklin.2018.05.006
[10]
Hu J P, Xiao Z H, Zhou Y L, et al. Formation control over antagonistic networks[C]. Proc of the 32nd Chinese Control Conferen. Xi'an: IEEE, 2013: 6879-6884.
[11]
Zou W L, Li G. Formation behaviors of networks with antagonistic interactions of agents[J]. International Journal of Distributed Sensor Networks, 2017, 13(8): 1550147717726296.
[12]
Huang C, Wang W, Cao J D, et al. Synchronization-based passivity of partially coupled neural networks with event-triggered communication[J]. Neurocomputing, 2018, 319: 134-143. DOI:10.1016/j.neucom.2018.08.060
[13]
Li L L, Cao J D. Cluster synchronization in an array of coupled stochastic delayed neural networks via pinning control[J]. Neurocomputing, 2011, 74(5): 846-856. DOI:10.1016/j.neucom.2010.11.006
[14]
Lu J Q, Ho W C D, Cao J D. A unified synchronization criterion for impulsive dynamical networks[J]. Automatica, 2010, 46(7): 1215-1221. DOI:10.1016/j.automatica.2010.04.005
[15]
Wang N, Li X C, Lu J Q, et al. Unified synchronization criteria in an array of coupled neural networks with hybrid impulses[J]. Neural Networks, 2018, 101: 25-32. DOI:10.1016/j.neunet.2018.01.017
[16]
Johansson B, Speranzon A, Johansson M, et al. On decentralized negotiation of optimal consensus[J]. Automatica, 2008, 44(4): 1175-1179. DOI:10.1016/j.automatica.2007.09.003
[17]
Qiu Z R, Liu S, Xie L H. Distributed constrained optimal consensus of multi-agent systems[J]. Automatica, 2016, 68(2): 209-215.
[18]
Guan Z H, Hu B, Chi M, et al. Guaranteed performance consensus in second-order multi-agent systems with hybrid impulsive control[J]. Automatica, 2014, 50(9): 2415-2418. DOI:10.1016/j.automatica.2014.07.008