多智能体系统应用广泛, 如多机器人编队系统、智能交通系统、微电网分布式控制与优化调度等[1-5], 因此围绕多智能体系统的分布式协调控制与决策问题受到越来越多研究者的广泛关注与研究[6].一致性问题是分布式控制与决策问题中的一个基础研究问题, 其目标是使得一智能群体仅通过各自与自己邻居之间的局部信息交换实现整体系统的一致性.当进一步考虑到多智能体系统代价或成本函数时, 分布式优化问题也得到了广泛的关注.
分布式优化问题的目标是用分布式算法实现系统目标函数的最小化或者最大化, 例如微电网中的优化调度问题、优化投资问题和资源的优化分配问题.系统的目标函数通常是系统中每个智能体的目标函数之和.在多智能体协调算法的启发下, 分布式优化方法得到了广泛的研究和应用[7-19].分布式优化算法大致可分为两类:连续算法[10-11, 16-18]和离散迭代算法[7-9, 12-15].文献[19]给出了两种分布式混杂算法以解决无线网络中的优化聚类问题.上述文献中的方法需要智能体连续地或者快速周期性地更新控制并进行相邻节点间的通信.在实际多智能体系统中, 每个智能体通常采用嵌入式数字微控制器, 其能量存储、计算能力和通信能力均有限, 因此高速的运行和通信对实际系统依然是一种挑战.然而, 事件驱动算法可以在很大程度上减少计算负担和通信负担, 并且能有效降低系统的功耗[20].受文献[20]启发, 文献[21-22]将事件驱动机制应用于求解多智能体一阶系统一致性问题, 有效减少了控制器的更新次数, 然而邻居节点之间仍需连续通信; 文献[23]针对多智能体系统的聚合问题, 利用联合测量方法设计了事件触发条件并有效避免了对邻居状态的连续检测, 进而避免了邻居间的连续通信; 文献[24]提出了一种自适应一致性算法, 并采用事件触发的通信策略有效解决了连续通信的问题.
凸优化问题分布式算法的设计本身就是一个复杂的问题, 现有的成果多是分布式连续算法或者周期迭代离散算法.结合事件驱动方法来设计凸优化问题的分布式事件驱动算法, 既要解决凸优化问题, 又要最大程度地降低控制器输出的更新频率以减少控制器的功耗, 同时还要减少智能体系统对通信网络带宽的要求, 即降低智能体之间的数据通信量.在多个控制目标下, 凸优化问题的分布式事件驱动算法设计相较于分布式连续算法或者周期迭代离散算法的设计更加困难.目前, 基于事件驱动机制的分布式优化算法的相关成果还很有限[25-27], 文献[25-27]研究了无约束下的优化问题.
受文献[23-24]启发, 本文针对含有等式约束的二次凸优化问题, 给出一种分布式事件驱动算法, 采用李雅普诺夫函数方法设计两种不同的事件触发条件.不同于连续优化算法以及离散迭代算法, 本文的算法可有效地降低控制器的更新次数以及邻居间的通信次数.从理论上证明算法渐近收敛于优化解, 且保证每个智能体相邻事件触发时刻的时间间隔大于0, 不会持续事件触发.
1 预备知识及问题描述 1.1 代数图论多智能体系统可以由图G=(V, E, A)来描述.其中: V={v1, v2, ..., vn}为智能体节点集合; E∈{V× V}为边的集合, (vi, vj)∈ E表示节点j可以接收到节点i的信息; 矩阵A∈ Rn× n为图G的邻接矩阵.如果(vi, vj)∈ E, 则A的元素aij=1, 否则aij=0.本文不考虑存在自环的情况, 因此aii=0.图的入度矩阵D定义为diag{d1, d2, ..., dn}, 其中
对于无向图G, (vi, vj)∈ E代表(vj, vi)∈ E也成立, 同时aij=aji=1.因此, 无向图的邻接矩阵A和拉普拉斯矩阵L均为对称矩阵.无向图中, 如果两个不同节点间存在一条路径相连, 则称两个节点是连通的.如果任意两个不同节点均是连通的, 则称图是连通图.如果图G是连通的, 则0是拉普拉斯矩阵L的简单特征根.矩阵L的最大特征根λn(L)满足λn(L) < 2dmax, 其中dmax=max{di, i=1, 2, ..., n}且dmax≤ n-1.
1.2 问题描述与分析本文研究如下等式约束下的二次凸优化问题:
(1) |
(2) |
其中: fi(zi)为智能体i的成本函数, zi为智能体i成本函数fi(zi)的自变量; 式(2)为等式约束,
假设1 多智能体系统中, 智能体i仅可获取其自身私有信息fi(xi(t))和Di.
假设2 假设fi(zi)为二次凸函数, 即
(3) |
其中αi, βi, γi为智能体i的成本参数且均为正常数.
对于优化问题(1)和(2), 存在很多种传统集中式求解方法.然而, 集中式控制需要一个中央控制器控制整个系统, 同时需要更加复杂的通信网络来获取系统的全局信息.中央控制器一旦出现故障会导致整个系统崩溃, 也不利于系统的扩展.相较于集中式控制, 分布式控制就有较好的可靠性和可扩展性.由于分布式系统中每个智能体都装备了一个控制器, 系统不再需要中央控制器, 使得系统不会因为个别智能体故障影响到整个系统, 具有更好的可靠性; 同时智能体之间只需与邻居间进行局部信息交换就可以实现整体的控制目标, 不再需要系统的全局信息, 因此系统避免了复杂通信网络, 同时也增强了系统的可扩展性.因此, 本文的目标是通过设计分布式事件驱动一致性算法求解优化问题(1)和(2).
基于拉格朗日乘子法可以得到问题(1)和(2)的一个等价解集, 即
(4) |
其中η*为对应于优化解集的正常数.由式(3)可进一步得到
(5) |
由式(2)和(5)可得
(6) |
对应的优化值zi*为
(7) |
本文的目标是设计分布式事件驱动算法求解出问题(1)和(2)的优化解zi*.
2 主要结果定义变量xi(t)和变量ξi(t), 其中xi(t)是对问题(1)和(2)的优化解zi*的估计变量, 且满足xi(0)=Di.变量ξi(t)定义为
(8) |
由式(8)可知, 问题(1)和(2)可以转化为关于ξi(t)的一致性问题.
2.1 控制算法对于每个智能体定义一个事件触发函数φi(t),事件触发时刻tki(k=1, 2, ...)为φi(t)>0对应的时刻.因此, 每个智能体事件触发时刻为一个单调递增的时间点列, 即t0i, t1i, ..., tki, ..., k∈N.
本文设计的优化算法如下:
(9) |
(10) |
其中:
令
(11) |
设计事件触发函数为
(12) |
其中
(13) |
(14) |
这里ψi为待设计的正参数.
事件触发条件为
(15) |
智能体i检测事件触发条件(15)是否成立, 若不成立, 则没有进一步动作, 反之智能体i触发事件, 此刻智能体i更新触发时刻状态值并发送给其邻居节点, 同时更新自己的控制律并将ei(t)设置成0, 智能体i的邻居节点接收到智能体i最新触发时刻状态值并更新自己的控制律.因此, 每个智能体只在自己及其邻居事件触发时刻更新控制律并进行通信.
定理1 假设图G为无向连通图.如果参数ψi满足
证明 定义变量δi(t)=ξi(t)-η*, 构造李雅普诺夫函数
(16) |
显然V(t)≥0.当且仅当ξi(t)=η*时V(t)=0.
对V(t)求导可得
(17) |
由
(18) |
进而有
(19) |
由于图G为无向连通图, 由L矩阵的对阵性可得
(20) |
由式(20)可知, (19)可转化为
(21) |
将式(21)写成向量形式
(22) |
由式(13)可知, (22)可表示为
(23) |
其中e(t)=[e1(t), e2(t), ..., en(t)]T.进而可得
(24) |
由于
(25) |
其中a为正常数, 可以得到
(26) |
选择a=λn(L), 可得
(27) |
由
(28) |
当事件触发条件(15)不满足(即φi(t)≤0)时, 可得
(29) |
将式(29)代入(28), 可得
(30) |
其中
(31) |
其中c为未知常数.由式(13)和(31), 可得
(32) |
由式(14)和(31)可知
(33) |
由式(12)以及条件φi(t)≤0可得ei(t)=0.由式(31)可知, 当时间t→∞时, 有
(34) |
由式(9)可得
(35) |
对式(35)两边求和可得
(36) |
由矩阵L的对称性可得
(37) |
由式(36)和(37)可得
(38) |
由式(38)可得
(39) |
由式(10)可得
(40) |
由式(34)和(40)可得
(41) |
进一步可得
(42) |
由
(43) |
定理1证明完毕.
注1 由式(39)和
(44) |
即算法可以保证系统实时满足等式约束.
注2 从上述证明分析过程中可以看出, 本文算法需要利用拉普拉斯矩阵L的对称性, 因此本文算法(9)和(10)仅适用于通信网络为无向连通图的情况.
定理2 假设图G是无向连通图, 对于智能体i(i=1, 2, ..., n), 事件触发条件(15)可以保证其任意两个连续的事件触发时刻tk+1i-tki>0, 即智能体i不会持续事件触发.
证明 分两种情况进行讨论.
1) 在[tki, tk+1i)时间内, 智能体i的邻居节点没有事件触发, 即
(45) |
恒成立.当t=tki时, |ei(tki)|=0.当t=tk+1i时, 有
(46) |
由式(9)和(13)可得
(47) |
当
(48) |
因此有
(49) |
即
(50) |
当
(51) |
因此, 智能体i不会触发事件.
2) 在[tki, tk+1i)时间内, 智能体i的邻居节点有事件触发.例如智能体j的事件触发时刻为tk'j, 则有
(52) |
然后可得
(53) |
在第1)种情况下, 智能体i的相邻触发时刻的下界为
假设智能体i受邻居触发状态影响持续事件触发, 触发时刻为t=tki(k=0, 1, ...).在触发时刻t=tki可能存在两种情形: ⅰ) ωi(tki)=0; ⅱ) ωi(tki)≠ 0.
ⅰ)当ωi(tki)=0时, 可知当t∈[tki, tk+1i)时, 有
ⅱ)当ωi(tki)≠0时, 可知当t∈[tki, tk+1i)时, 有
(54) |
为保证式(54)成立, 必存在一个严格正的常数εi使得tk+1i-tki≥εi>0.然而, 存在严格正的常数εi与假设存在智能体i持续事件触发矛盾.在下一触发时刻t=tk+1i, 当ωi(tk+1i)=0时, 即与ωi(tki)=0时的情况一致, 可得出t=tk+2i时刻智能体i不会出现智能体i持续事件触发, 因此与假设智能体i持续事件触发矛盾.
综合上述分析, 智能体i(i=1, 2, ..., n)任意两个连续的事件触发时刻tk+1i-tki>0, 智能体i不会持续事件触发.
注3 由定理1可知, 参数ψi的上界与矩阵L的最大特征根λn(L)有关.由拉普拉斯矩阵的性质可知λn(L)满足λn(L)≤ 2dmax≤2(n-1), 因此可以得到
定义一个新的事件触发函数以避免智能体对全局信息的需要.新的事件触发函数如下:
(55) |
其中
(56) |
这里ψ'i为待设计的正参数.
触发条件为
(57) |
定理3 假设图G为无向连通图.如果参数ψ'i满足
证明 构造与定理1相同的李雅普诺夫函数.由式(24)可得
(58) |
其中b为满足b < 1的正常数.进一步可得
(59) |
由触发函数(55)和触发条件(57)可得
(60) |
其中
由于0 < b < 1, 容易得到当b=0.5时, b(1-b)取最大值0.25.因此可得
(61) |
后续的证明过程类似于定理1的证明过程.
定理4 假设图G是无向连通图.对于智能体i(i=1, 2, ..., n), 事件触发条件(57)可以保证其任意两个连续的事件触发时刻满足tk+1i-tki>0, 即智能体i不会持续事件触发.
证明 下面同样分两种情况进行讨论.
1) 在[tki, tk+1i)时间内, 智能体i的邻居节点没有事件触发, 即
(62) |
恒成立.当t=tki时, |ei(tki)|=0.当t=tk+1i时, 有
(63) |
由式(62)可得
(64) |
由式(9)和(13)可得
(65) |
当
(66) |
由式(65)可得
(67) |
进一步, 由触发条件(57)可得
(68) |
由
(69) |
可得
(70) |
即
(71) |
当
(72) |
(73) |
因此, 智能体i不会触发事件.
2) 在[tki, tk+1i)时间内, 智能体i的邻居节点有触发事件, 例如智能体j事件触发时刻为tk'j, 则有
(74) |
进而可得
(75) |
接下来的证明过程与定理2相同, 此处省略.同样可以得出, 智能体i(i=1, 2, ..., n)任意两个连续的事件触发时刻tk+1i-tki>0, 智能体i不会持续事件触发.
3 仿真实验通过Matlab仿真来验证本文算法以及两种事件触发条件的有效性.
考虑由4个智能体组成的多智能体系统, 智能体之间的通信拓扑图如图 1所示.
每个智能体成本函数fi(zi)为二次凸函数, 其对应的参数如表 1所示.
令初始值x1(0)=D1=130, x2(0)=D2=90, x3(0)=D3=80, x4(0)=D4=100, D=
由图 1可知, 系统对应的拉普拉斯矩阵的最大特征根λn(L)=4, 由定理1可以得到ψi需满足ψi < 0.25, 因此设置ψ1=ψ2=ψ3=ψ4=0.24.仿真结果如图 2 ~图 9所示.
图 2展示了ξi(t)的收敛过程, 由图 2可以看出, ξi(t)渐近收敛于优化值η*=20.275 9.
图 3 ~图 6分别展示了|ei(t)|和wi(t)的轨迹.以图 3为例, |e1(t)|一旦大于w1(t), 立即被置为0, 因此可保证|e1(t)|≤ w1(t).
图 7展示了各个智能体的事件触发时刻分布情况, 可以看出各个智能体的事件触发时刻非常稀疏, 同时表明各个智能体控制输入更新次数和通信次数较少.
图 8和图 9分别给出了xi(t)的收敛曲线以及
针对第2种事件触发条件(事件触发条件2), 根据定理3设置参数ψ'1=ψ'2=ψ'3=ψ'4=0.12.仿真结果如图 10 ~图 17所示.同样可以看出, 算法在该事件触发条件下也同样解决了文中的分布式优化问题.由于空间问题, 在此不再具体说明.
表 2中分别列出了算法(9)和(10)在事件触发条件1和事件触发条件2下的触发次数.
从表 2中可以看出, 在本文仿真示例中, 事件触发条件2的事件驱动性能优于事件触发条件1.需要指出的是, 事件触发条件2的优势是参数的设置不需要系统的全局信息, 即通信拓扑图拉普拉斯矩阵的最大特征根信息.本示例中事件触发条件2的事件驱动性能优于事件触发条件1, 原因是相同的事件触发状态值下, 事件触发条件2中状态测量误差的绝对值|ei(t)|的上限值ωi(t)大于其在事件触发条件1中的上限值
本文研究了多智能体系统中含有等式约束的二次凸优化问题, 给出了一种新的分布式事件驱动优化算法, 并针对算法给出了两种不同的事件触发条件, 保证了算法在事件触发条件下实现系统状态渐近收敛到各自对应的优化解.每个智能体只需在其自身及其邻居事件触发时刻更新控制输入并进行邻居间的通信, 因此不再需要连续地或者周期性地更新控制输入和通信, 有效地降低了系统的功耗和通信负担.仿真结果验证了算法和事件触发条件的有效性.在未来的研究中, 将尝试基于分布式事件驱动算法解决同时含有等式、不等式约束的二次凸优化问题以及有向图下的二次凸优化问题.
[1] |
罗小元, 李旭, 李绍宝, 等. 分布式离散多智能体系统在固定和切换拓扑下的编队控制[J]. 控制与决策, 2013, 28(12): 1869-1873. (Luo X Y, Li X, Li S B, et al. Distributed discrete-time formation control of multi-agent systems under fixed and switching topologies[J]. Control and Decision, 2013, 28(12): 1869-1873.) |
[2] |
Zhixin Liu, Lin Wang, Jinhuan Wang. Distributed sampled-data control of nonholonomic multi-robot systems with proximity networks[J]. Automatica, 2016, 77(3): 170-179. |
[3] |
徐勇, 赵蕊, 荣自兴, 等. 基于相对位置信息的多智能体系统自适应跟踪控制[J]. 控制与决策, 2017, 32(6): 989-994. (Xu Y, Zhao R, Rong Z X, et al. Adaptive tracking control for multi-agent systems with relative position measurement[J]. Control and Decision, 2017, 32(6): 989-994.) |
[4] |
谢俊, 陈凯旋, 岳东, 等. 基于多智能体系统一致性算法的电力系统分布式经济调度策略[J]. 电力自动化设备, 2016, 36(2): 112-117. (Xie J, Chen K X, Yue D, et al. Distributed economic dispatch based on consensus alforithm of multi agent system for power system[J]. Electric Power Automation Equipment, 2016, 36(2): 112-117.) |
[5] |
Chen G, Ren J, Feng E N. Distributed finite-time economic dispatch of a network of energy resources[J]. IEEE Trans on Smart Grid, 2017, 8(2): 822-832. |
[6] |
Qin J, Ma Q, Shi Y, et al. Recent advances in consensus of multi-agent systems: A brief survey[J]. IEEE Trans on Industrial Electronics, 2017, 64(6): 4972-4983. DOI:10.1109/TIE.2016.2636810 |
[7] |
Nedic A, Ozdaglar A. Distributed subgradient methods for multi-agent optimization[J]. IEEE Trans on Automatic Control, 2009, 54(1): 48-61. DOI:10.1109/TAC.2008.2009515 |
[8] |
Jakovetic D, Xavier J, Moura J M F. Cooperative convex optimization in networked systems: Augmented lagrangian algorithms with directed gossip communication[J]. IEEE Trans on Signal Processing, 2011, 59(8): 3889-3902. DOI:10.1109/TSP.2011.2146776 |
[9] |
Ram S S, Nedić A, Veeravalli V V. Distributed stochastic subgradient projection algorithms for convex optimization[J]. J of Optimization Theory and Applications, 2010, 147(3): 516-545. DOI:10.1007/s10957-010-9737-7 |
[10] |
Lu J, Tang C Y. Zero-gradient-sum algorithms for distributed convex optimization: The continuous-time case[J]. IEEE Trans on Automatic Control, 2012, 57(9): 2348-2354. DOI:10.1109/TAC.2012.2184199 |
[11] |
Gharesifard B, Cortes J. Distributed continuous-time convex optimization on weight-balanced digraphs[J]. IEEE Trans on Automatic Control, 2012, 59(3): 781-786. |
[12] |
Zhu M, Martinez S. On distributed convex optimization under inequality and equality constraints[J]. IEEE Trans on Automatic Control, 2012, 57(1): 151-164. DOI:10.1109/TAC.2011.2167817 |
[13] |
Duchi J C, Agarwal A, Wainwright M J Wainwright. Dual averaging for distributed optimization: Convergence analysis and network scaling[J]. IEEE Trans on Automatic Control, 2012, 57(3): 592-606. DOI:10.1109/TAC.2011.2161027 |
[14] |
Ram S S, Nedic A, Veeravalli V V. Distributed random projection algorithm for convex optimization[J]. IEEE J of Selected Topics in Signal Processing, 2013, 7(2): 221-229. DOI:10.1109/JSTSP.2013.2247023 |
[15] |
Yuan D, Xu S, Zhang B, et al. Distributed primal-dual stochastic subgradient algorithms for multi-agent optimization under inequality constraints[J]. Int J of Robust and Nonlinear Control, 2013, 23(16): 1846-1868. |
[16] |
Kia S S, Cortés J, Martínez S. Distributed convex optimization via continuous-time coordination algorithms with discrete-time communication[J]. Automatica, 2015, 55(5): 254-264. |
[17] |
Song Y, Chen W. Finite-time convergent distributed consensus optimisation over networks[J]. IET Control Theory & Applications, 2016, 10(11): 1314-1318. |
[18] |
Rahili S, Ren W. Distributed continuous-time convex optimization with time-varying cost functions[J]. IEEE Trans on Automatic Control. DOI:10.1109/TAC.2016.2593899 |
[19] |
Qin J, Fu W, Gao H, et al. Distributed k-means algorithm and fuzzy c-means algorithm for sensor networks based on multiagent consensus theory[J]. IEEE Trans on Cybernetics, 2017, 47(3): 772-783. DOI:10.1109/TCYB.2016.2526683 |
[20] |
Tabuada P. Event-triggered real-time scheduling of stabilizing control tasks[J]. IEEE Trans on Automatic Control, 2007, 52(9): 1680-1685. DOI:10.1109/TAC.2007.904277 |
[21] |
Dimarogonas D V, Frazzoli E, Johansson K H Johansson. Distributed event-triggered control for multi-agent systems[J]. IEEE Trans on Automatic Control, 2012, 57(5): 1291-1297. DOI:10.1109/TAC.2011.2174666 |
[22] |
Seyboth G S, Dimarogonas D V, Johansson K H Johansson. Event-based broadcasting for multi-agent average consensus[J]. Automatica, 2013, 49(1): 245-252. DOI:10.1016/j.automatica.2012.08.042 |
[23] |
Fan Y, Feng G, Wang Y, et al. Distributed event-triggered control of multi-agent systems with combinational measurements[J]. Automatica, 2013, 49(2): 671-675. DOI:10.1016/j.automatica.2012.11.010 |
[24] |
Xie D, Xu S, Zhang B, et al. Consensus for multi-agent systems with distributed adaptive control and an event-triggered communication strategy[J]. IET Control Theory & Applications, 2016, 10(13): 1547-1555. |
[25] |
Deng Z, Hong Y. Distributed event-triggered optimization for multi-agent systems with disturbance rejection[C]. The 12th IEEE Int Conf on Control and Automation. Kathmandu: IEEE, 2016: 13-18.
|
[26] |
Chen W, Ren W. Event-triggered zero-gradient-sum distributed consensus optimization over directed networks[J]. Automatica, 2016, 65(3): 90-97. |
[27] |
Lü Q, Li H, Xia D. Distributed optimization of first-order discrete-time multi-agent systems with event-triggered communication[J]. Neurocomputing, 2017, 235(4): 255-263. |