多智能体系统的事件触发无模型迭代学习双向一致性

引用本文 [复制中英文]

赵华荣, 彭力, 谢林柏, 吴培良, 陈宇昊. 多智能体系统的事件触发无模型迭代学习双向一致性[J]. 控制与决策, 2022, 37(10): 2552-2558.

ZHAO Hua-rong, PENG Li, XIE Lin-bo, WU Pei-liang, CHEN Yu-hao. Event-triggered model-free adaptive iterative learning bipartite consensus control for multi-agent systems[J]. Control and Decision, 2022, 37(10): 2552-2558. DOI: 10.13195/j.kzyjc.2021.0401.

[复制英文]

基金项目

国家重点研发计划项目(2018YFD0400902)；国家自然科学基金项目(61873112, U20A20167)；江苏省高等学校自然科学研究面上项目(18KJB413009)

作者简介

赵华荣(1991−), 男, 博士生, 从事数据驱动多智能体系统协同控制的研究, E-mail: zhaohuarong@stu.jiangnan.edu.cn;
彭力(1967−), 男, 教授, 博士生导师, 从事智能控制、复杂系统控制与优化、视觉物联网等研究, E-mail: jnpengli@outlook.com;
谢林柏(1973−), 男, 教授, 博士生导师, 从事智能检测与系统安全等研究, E-mail: xie_linbo@jiangnan.edu.cn;
吴培良(1981−), 男, 教授, 博士生导师, 从事竞技机器人多智能体协同控制、工业机器人优化调度等研究, E-mail: peiliangwu@ysu.edu.cn;
陈宇昊(1998−), 男, 硕士生, 从事强化学习、图像处理的研究, E-mail: 6201905016@stu.jiangnan.edu.cn。

通讯作者

彭力, E-mail: jnpengli@outlook.com。

文章历史

收稿日期：2021-03-10
修回日期：2021-07-19

Contents Abstract Full text Figures/Tables PDF

多智能体系统的事件触发无模型迭代学习双向一致性

赵华荣 ¹, 彭力 ¹, 谢林柏 ¹, 吴培良 ², 陈宇昊 ¹

1. 江南大学物联网应用技术教育部工程中心, 江苏无锡 214122;
2. 燕山大学信息科学与工程学院, 河北秦皇岛 066004

收稿日期：2021-03-10；修回日期：2021-07-19

基金项目：国家重点研发计划项目(2018YFD0400902)；国家自然科学基金项目(61873112, U20A20167)；江苏省高等学校自然科学研究面上项目(18KJB413009)。

作者简介：赵华荣(1991−), 男, 博士生, 从事数据驱动多智能体系统协同控制的研究, E-mail: zhaohuarong@stu.jiangnan.edu.cn;
彭力(1967−), 男, 教授, 博士生导师, 从事智能控制、复杂系统控制与优化、视觉物联网等研究, E-mail: jnpengli@outlook.com;
谢林柏(1973−), 男, 教授, 博士生导师, 从事智能检测与系统安全等研究, E-mail: xie_linbo@jiangnan.edu.cn;
吴培良(1981−), 男, 教授, 博士生导师, 从事竞技机器人多智能体协同控制、工业机器人优化调度等研究, E-mail: peiliangwu@ysu.edu.cn;
陈宇昊(1998−), 男, 硕士生, 从事强化学习、图像处理的研究, E-mail: 6201905016@stu.jiangnan.edu.cn。

通讯作者：彭力, E-mail: jnpengli@outlook.com。

责任编委：关治洪.

摘要：针对未知模型的非线性离散时间多智能体系统, 研究基于事件触发迭代学习双向一致性问题. 首先, 利用紧凑形式动态线性化方法, 建立多智能体系统的动态线性化数据模型, 提出一种该数据模型的参数估计算法; 其次, 基于该数据模型设计输出观测器和死区控制器, 并结合信号图论, 构建一种事件触发分布式无模型迭代学习双向一致性控制策略; 然后, 通过设计李雅普诺夫函数对该控制策略的收敛性进行严格的证明; 最后, 通过数值仿真进一步验证该控制协议的正确性和有效性.

关键词：多智能体系统事件触发双向一致性无模型自适应迭代学习控制

Event-triggered model-free adaptive iterative learning bipartite consensus control for multi-agent systems

ZHAO Hua-rong ¹, PENG Li ¹, XIE Lin-bo ¹, WU Pei-liang ², CHEN Yu-hao ¹

1. Research Center of Engineering Applications for IoT of Ministry of Education, Jiangnan University, Wuxi 214122, China;
2. School of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, China

Abstract: This paper investigates the event-triggered distributed model-free iterative learning bipartite consensus (ETDMFILBC) problem for unknown nonlinear discrete-time multi-agent systems. A dynamics linearization data model is first established by employing a compact form dynamics linearization approach, and the estimation algorithm of its parameters is also formulated. After that, the output observer and dead-zone operator are designed. Meanwhile, applying the signed graph theory, an ETDMFILBC scheme is proposed. Moreover, the convergence property of the proposed algorithm is strictly proved using the constructed Lyapunov function. Finally, the results of the simulation further verify the correctness and effectiveness of the designed scheme.

Keywords: multi-agent systems event-triggered bipartite consensus model-free adaptive iterative learning control

0 引言

学习控制(leaning control)是指通过算法自身的学习能力来了解被控对象和外部环境, 从而提高自身控制性能, 是实现智能自主控制的基础^[1]. 在已有的多智能体系统一致性学习控制算法^[2-7]中, 自适应迭代学习控制算法主要针对执行重复任务的系统, 并且要求其起始时刻误差已收敛, 例如集成电路焊接和晶圆制造^[5]. 自适应迭代学习控制算法, 根据算法研究过程中是否依赖被控对象的动力学模型, 可分为基于模型控制算法^[6-7]和数据驱动控制算法^[8-9].

随着科学技术的发展, 实际工业过程变得越来越复杂. 直接通过系统辨识的方法来建立被控对象的系统模型正面临着巨大的挑战^[9]. 众多学者开始关注于数据驱动控制算法的研究. 无模型自适应迭代学习控制方法(model-free adaptive iterative learning control, MFAILC)是一种典型的数据驱动控制算法^[10]. 该方法通过在每个工作点利用紧凑形式动态线性化方法(compact form dynamics linearization, CFDL), 沿迭代轴方向建立与非线性系统等价的动态线性化数据模型, 并利用被控系统的输入输出数据在线估计该模型中的参数, 从而实现未知非线性系统的无模型自适应迭代学习控制^[9-11].

在工业应用中, 由于工控机的处理速度、内存容量和通讯带宽受限, 学者们提出了事件触发控制机制^[12]. 在该机制中, 只有在触发时刻才进行运算和信息传递, 从而有效地减少了控制次数和通信负担. Dong等^[13]研究了三阶离散时间多智能体系统一致性问题, 提出一种事件触发控制机制, 避免了触发器的类Zeno现象. Li等^[14]针对线性多智能体系统提出了一种自适应的事件触发控制算法. Hu等^[15]针对线性多智能体系统提出了一种动态事件触发控制机制. Ding等^[16]针对非线多智能体系统提出了一种基于神经网络的事件触发控制算法. 在已有的事件触发控制算法中, 对于系统模型已知的研究较为成熟; 但是对于系统模型未知, 特别是基于MFAILC框架来实现事件触发控制, 目前主要是针对单个系统进行研究^[17-19]; 而从事未知模型多智能体系统的事件触发方面的研究则较少.

双向一致性概念是由Altafini^[20]提出的, 主要研究多智能体之间合作与竞争关系. 合作与竞争现象在自然界中是共存的, 因而在研究多智能体系统时, 若仅考虑一种关系, 则研究是不充分的. 学者们在研究多智能体系统之间的合作与竞争关系时, 通常将所有智能体分成两组, 其输出或状态最终分别达到一致, 但其目标值符号相异. Wang等^[21]针对二阶非线性多智能体系统, 提出了一种保性双向编队控制算法. Zhang等^[22]针对异构线性多智能体系统, 提出了一种自适应事件触发输出双向一致性控制算法. Peng等^[23]针对未知模型多智能体系统, 利用强化学习算法提出了一种双向一致性控制算法.

本文研究未知模型非线性离散时间多智能体系统的事件触发迭代学习双向一致问题, 主要贡献是:

1) 利用CFDL技术为智能体沿迭代轴方向建立动态线性化数据模型, 设计一种事件触发无模型迭代学习双向一致性控制算法. 相比于基于模型的事件驱动控制算法^[13-15], 该算法的设计过程中无需系统的动力学模型信息. 相比于基于MFAILC的事件驱动控制算法^[17-19], 该算法可以控制多个未知模型的智能体系统.

2) 所设计的控制算法是在线学习算法, 相比于基于神经网络控制算法^[16], 无需训练数据和测试数据, 并且考虑了智能体之间的合作与竞争关系.

3) 设计观测器和死区控制器, 可以实现事件触发控制, 避免触发器的类Zeno行为, 并构建李雅普诺夫函数, 对该算法的收敛性进行严格证明.

1 预备知识 1.1 代数图论

本文多智能体系统的通讯拓扑可表示为$ {{\bar {\cal G}}} = (\bar {\cal V}, {{\bar {\cal E}}}, {{{\cal A}}}) $. 其中: $ {{\bar {\cal V}}} = {{{\cal V}}} \bigcup \{ 0\} , {{\bar {\cal E}}} \subseteq {{\bar {\cal V}}} \times {{\bar {\cal V}}}, {{{\cal A}}} = [ {{a_{ij}}} ] \in {R^{N \times N}}, {{{\cal V}}} = \{ {1, 2, \ldots}, N \}, {{{\cal E}}} \subseteq \{ { ( {i, j} )}{ | {i, j \in {{{\cal V}}}} } \} \subseteq {{{\cal V}}} \times {{{\cal V}}} $, 它们分别代表图$ {{\bar {\cal G}}} $的邻接矩阵、顶点集和边集. $ {a_{ij}} \in \{ { - 1, 0, 1} \} $为权重值. $ {{{\cal E}}} $中的元素$ ( {i, j} ) $表示智能体$ i $、$ j $之间的一条边, 信号可以从智能体$ i $传到智能体$ j $. 此时, 若智能体$ i $、$ j $之间的关系为合作关系, 则$ {a_{ij}}=1 $; 若是竞争关系, 则$ {a_{ij}}=- 1 $. 此外, 当$ ( {i, j} ) \notin {{{\cal E}}} $时, $ {a_{ij}}=0 $. 智能体$ i $的邻接智能体集合为$ {N_i} = \{ {j \in {\cal V}|(j, i) \in {{{\cal E}}}} \} $, 其入度为$ {d_i} = \sum\limits_{j = 1}^N |{{a_{ij}}}| $, 而每个智能体的入度构成图$ {{\bar {\cal G}}} $的度矩阵$ {{{\cal D}}} ={\rm diag}({d_1}, {d_2}, \ldots , {d_N}) $. 图$ {{\bar {\cal G}}} $的拉普拉斯矩阵表示为$ {{{\cal L}}} = {{{\cal D}}} - {{{\cal A}}} $. 本文中将所有节点分成集合$ {{{{\cal V}}}_1} $和$ {{{{\cal V}}}_2} $, 其中$ {{{\cal V}}} = {{{{\cal V}}}_1} \bigcup {{{{\cal V}}}_2} $且$ {{{{\cal V}}}_1} \bigcap {{{{\cal V}}}_2} =\varnothing $. 若智能体$ i $和$ j $属于同一个集合, 则相互为合作关系; 否则为竞争关系. 此外, 利用矩阵$ {{{\cal B}}} ={\rm diag}({b_1}, {b_2}, \ldots , {b_N}) $来表示虚拟领导者与所有跟随者之间的连接关系. 若智能体$ i $与虚拟领导者直接相连, 则$ {b_i}= 1 $; 否则$ {b_i}=0 $.

1.2 模型描述

考虑一类具有1个虚拟领导者和$ N $个跟随者的SISO (单输入单输出)非线性离散时间多智能体系统, 智能体$ i $的动力学模型满足下式:

$ \begin{align} {y_i}(l, k + 1)=\;& {f_i}({y_i}(l, k), \ldots, {y_i}(l, k - {n_y}), \\ &{u_i}(l, k), \ldots, {u_i}(l, k - {n_{{u}}})). \end{align} $

(1)

其中: $ {u_i}(l, k) \in R, {y_i}(l, k) \in R $分别代表智能体$ i\, (i= 1, 2, \ldots , N) $的输入与输出; $ l = 1, 2, \ldots $为迭代步数; $ {{k}} \in \{ {0, 1, \ldots, {{T}}} \} $为时间间隔; $ {n_y} \in R $和$ {n_u} \in R $是未知正整数; $ {f_i}( \cdot ) $是未知非线性函数. 此外, 定义$ {y_0}(l, k) $为虚拟领导的输出, 由拓扑图$ {{\bar {\cal G}}} $中的顶点0表示.

假设1^[1-2] $ {f_i}( \cdot) $是关于$ {u_i}(l, k) $的偏导存在且连续的非线性函数.

假设2^[5-8] 式(1)沿迭代轴方向满足广义Lipschitz连续条件, 即存在一个常数$ r $使得$ | \Delta {{{y}}_{{i}}}({{l , k }} + 1) | \leqslant{{r}} | {\Delta {{{u}}_{{{ i}}}}({{l , k }})} |{{ }} $. 其中: $ \Delta {y_i}(l, k + 1) = {y_i}(l, k + 1) - {y_i}(l - 1, k+ 1);\Delta {u_i}(l, k) = {u_i}(l, k) - {u_i}(l - 1, k);|\Delta {u_i}(l, k){{| < a}} $, $ {{a}} $是一个正常数.

引理1 ^[5] 若式(1)满足假设1和假设2, 则式(1)可用以下紧凑形式的动态线性化模型表示:

$ \begin{align} \Delta {y_i}(l, k + 1) = {\varGamma _i}(l, k)\Delta {u_i}(l, k). \end{align} $

(2)

其中: $ | {{\varGamma _i}(l, k)} |\leqslant r, r $是一个正常数, $ {\varGamma_i}(l, k) $被称作伪偏导数, 且是时变的.

假设3 式(2)中$ {\varGamma _i}(l, k) > 0 $或$ {\varGamma _i}(l, k) < 0 $. 本文如文献[5], 假定$ {\varGamma _i}(l, k) > 0 $.

定义分布式双向一致性局部误差为

$ \begin{align} {\zeta _{{i}}}(l, k)=\;& \sum\limits_{j \in N_i}{|{a_{ij}}}|({\rm sign}({a_{ij}}){{\hat y}_j}(l, k) - {{\hat y}_i}(l, k))+\\ &\; {b_i}({s_i}{y_0}(l, k) - {{\hat y}_i}(l, k)). \end{align} $

(3)

其中: 若智能体$ i $可以直接从虚拟领导者0处得到目标轨迹信息, 即$ \{0, i \} \in \overline {{{\cal E}}} $, 则$ {b_i} = 1 $; 否则, $ {b_i} = 0 $. 此外, $ {\hat y_i}(l, k) $是$ {y_i}(l, k) $的估计. 令$ {e_i}(l, k) = {s_i}{y_0}(l, k) - {y_i}(l, k) $表示跟踪误差, 定义$ {\hat e_i}(l, k) = {s_i}{y_0}(l, k) - {\hat y_i}(l, k) $为估计误差. 其中: 当$ i \in {{{{\cal V}}}_1} $时, $ {s_i} = 1 $; 当$ i \in {\cal V}_2 $时, $ {s_i} = - 1 $.

假设4 图$ {\bar {\cal G}} $存在一颗有向生成树, 且虚拟领导者为此有向生成树的根节点. 即虚拟领导者的轨迹信息可以直接或间接地传递给所有跟随者.

定义1 当且仅当智能体$ i $与虚拟领导者的输出满足以下条件时, 称该多智能体系统达到双向(有界)一致:

$ \begin{align} \mathop {\lim }\limits_{{{l}} \to \infty } ( {{{{y}}_{{i}}} ( {{{l}}, {{k}}} ) - {{{s}}_{{i}}}{{{y}}_0} ( {{{l}}, {{k}}} )} ) = \iota. \end{align} $

(4)

其中: $ \iota $是非常小的正常数, $ i = 1, 2, \ldots , N $.

2 事件触发双向一致性结果 2.1 事件触发的伪偏导数更新

定义$ {\hat \varGamma _{{i}}} ( {{{l}}, {{k}}} ) $是伪偏导数$ {\varGamma _{{i}}} ( {{{l}}, {{k}}} ) $的估计, 并定义如下性能指标函数, 利用最优条件$ \partial {{J}}({{{\hat \varGamma}_{{i}}}({{{l}}, {{k}}})})/\partial{\hat\varGamma_{{i}}}({{{l}}, {{k}}} ) = 0 $, 有

$ \begin{align} &{{\hat \varGamma }_i} ( {l, k} ) =\\ &{{\hat \varGamma }_i} ( {l - 1, k} ) + \frac{{\rho \Delta {u_i} ( {l - 1, k} )}}{{\delta + {{ | {\Delta {u_i} ( {l - 1, k} )} |}^2}}}\times\\ &( {\Delta {y_i} ( {l - 1, k + 1} ) - {{\hat \varGamma }_i} ( {l - 1, k})\Delta {u_i} ( {l - 1, k} )} ). \end{align} $

(5)

其中: $ \delta > 0 $是权重因子; $ \rho $是步长因子以提高灵活性, 并且$ 0 < \rho < 1 $. 根据式(5), 可设计事件触发伪偏导数更新法则如下:

$ \begin{align} &{{\hat \varGamma }_i} ( {l, k} )=\\ &Q{_i} ( {l - 1, k} )\frac{{\rho \Delta {u_i} ( {l - 1, k} )}}{{\delta + {{ | {\Delta {u_i} ( {l - 1, k} )} |}^2}}}\times\\ & ( {\Delta {y_i} ( {l - 1, k + 1} ) - {{\hat \varGamma }_i} ( {l - 1, k})\Delta {u_i} ( {l - 1, k} )} )+\\ &{{\hat \varGamma }_i} ( {l - 1, k} ). \end{align} $

(6)

其中

$ \begin{align} Q_i( {l - 1, k} )= \begin{cases} 1, \; \text{触发}, \; k = k_i;\\ 0, \; \text{不触发}, \; k_{i - 1}< k <k_i. \end{cases} \end{align} $

(7)

$ {k_i} $是第$ i $次触发时刻, $ {k_{i-1}} $是第$ i-1 $次触发时刻. 为了提高双向一致性跟踪性能, 定义如下重置法则:

$ \begin{align} &{\hat \varGamma _i}(l, k)={\hat \varGamma _i}(1, k), \; | {\Delta {u_i} ( {l - 1, k} )} |\leqslant\sigma;\; {\rm or}\\ &{\rm sign}( {{{\hat \varGamma }_i} ( {l, k} )} ) \ne {\rm sign}( {{{\hat \varGamma }_i} ( {1, k} )} ). \end{align} $

(8)

其中: $ {\hat \varGamma _{{i}}}(1, k) $是$ {\hat \varGamma _{{i}}}(l, k) $的初值, $ \sigma \in {{\{ 1}}{{{0}}^{{{ - }}4}}, {{1}}{{{0}}^{{{ - 5}}}}{{\} }} $.

定理1 当$ {\varGamma _i} ( k ) $满足假设3, 利用式(6)~(8)更新$ {\varGamma _i} ( k ) $的估计值$ {\hat \varGamma _i} ( k ) $时, $ {\hat \varGamma _i} ( k ) $是有界的.

证明可分为触发时刻和非触发时刻分别证明.

1) 触发时刻.

$ Q{_i} ( {l - 1, k} ) = 1 $, 定义$ {\tilde \varGamma _i}(l, k) = {\hat \varGamma _i}(l, k) - {\varGamma _i}(l, k) $, 再根据式(6)可得

$ \begin{align} {\tilde \varGamma _i}(l, k)=\;&\Big(1 - \frac{{\rho {{ | {\Delta {u_i}(l - 1, k)} |}^2}}}{{\delta + {{ | {\Delta {u_i}(l - 1, k)} |}^2}}}\Big){\tilde \varGamma _i}(l - 1, k)-\\ &\Delta {\varGamma _i}(l, k). \end{align} $

(9)

因为$ | {\Delta {u_i} ( {l - 1, k} )} | \ne 0, 0 < \rho < 1 $, 以及$ \delta > 0 $, 显然$ {{\rho {{ | {\Delta {u_i} ( {l - 1, k} )} |}^2}}/ (\delta + {{ | {\Delta {u_i} ( {l - 1, k} )} |}^2} )} < 1 $. 因此, 必然存在一个常数$ {q_1} $使得

$ \begin{align} 0 < \Big| {1 - \frac{{\rho \Delta {u_i}(l - 1, k)}}{{\delta + |\Delta {u_i}(l - 1, k){|^2}}}}\Big| < {q_1} < 1. \end{align} $

(10)

根据引理1可知$ | {{\varGamma _i} ( {l, k} )} |\leqslant r $. 再由假设3可得

$ \begin{align} | {\Delta {\varGamma _i} ( {l, k} )} |\leqslant | {{\varGamma _i} ( {l, k} )} |\leqslant r. \end{align} $

(11)

因此, 根据式(9)~(11), 可得

$ \begin{align} |{{\tilde \varGamma }_i}(l, k)|\leqslant\;& {q_1}|{{\tilde \varGamma }_i}(l - 1, k)| + |\Delta {\varGamma _i}(l, k)|\leqslant\\ &{q_1}^{l - 1}|{{\tilde \varGamma }_i}(1, k)| + \frac{{r(1 - {q_1}^{l - 1})}}{{1 - {q_1}}}. \end{align} $

(12)

进一步可得$ \mathop {\lim }\limits_{l \to \infty } |{\tilde \varGamma _i}(1, k)| = r/(1 - {q_1}) $. 由引理1可知$ {\varGamma _i}(l, k) $是有界的, 所以$ {\hat \varGamma _i}(l, k) $必然是有界的. 为了方便后续分析, 不仿设$ | {{{\hat \varGamma }_i} ( {l, k} )} | < \hat r $.

2) 非触发时刻.

$ Q{_i} ( {l - 1, k} ) =0 $, 由式(6)可得$ {\hat \varGamma _i} ( {l, k} ) = {\hat \varGamma _i} ( l - 1, k ) $, 再由式(8)可得$ {\hat \varGamma _i} ( {l, k} ) ={\hat \varGamma _i} ( {1, k} ) $有界.

2.2 事件触发策略

首先, 输出观测器设计如下:

$ \begin{align} {{\hat y}_i}(l, k + 1)=\;&{{\hat y}_i}(l - 1, k + 1) + {{\hat \varGamma }_i}(l, k)\Delta {{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over u } }_i}(l, k)+\\ &\chi {{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over \varepsilon } }_{{e_i}}}(l - 1, k + 1). \end{align} $

(13)

其中: $ {\hat y_i}(l, k + 1) $为观测器的输出, $\Delta \mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over u} _i(l, k)$为相应的输入, $ \chi $为反馈增益, 其具体定义将在定理2中分析.

$ \begin{align} \Delta {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over u}_i} ( {l, k} ) =\Delta {u_i} ( {l, {k_i}} ), \; {k_i}\leqslant k < {k_{i + 1}}, \end{align} $

(14)

其中$ {k_{i+1}} $是第$ i+1 $次触发时刻.

$ \begin{align} &{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over \varepsilon } _{{e_i}}} ( {l - 1, k + 1} ) =\\ &{\hat y_i}(l - 1, k + 1)-{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over y } _i}(l - 1, k + 1), \end{align} $

(15)

$ \begin{align} &{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over y} _i}(l - 1, k + 1)={y_i}(l - 1, {k_i} + 1), \end{align} $

(16)

其中$ {k_i} \leqslant k < {k_{i{{ + }}1}} $.

根据式(14)和(16)可得, 当处于非触发时刻, 观测器的输入和输出将维持上一次触发时刻的值.

输出增益误差定义为

$ \begin{align} {\varepsilon _i}(l, k) = \Delta {u_i} ( {l, k} ) - \Delta {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over U } _i} ( {l, k} ); \end{align} $

(17)

观测器的输出估计误差定义为

$ \begin{align} {\varepsilon _{{e_i}}}(l, k + 1) = {\hat y_i}(l, k + 1) - {y_i}(l, k + 1); \end{align} $

(18)

事件触发控制条件定义为

$ \begin{align} \eta ( { | {{\varepsilon _i}(l, k)} |} ) > \sqrt {\frac{{u(1 - 4{{(1 + \chi )}^2})}}{{4{{\hat r}^2}}}} | {{\varepsilon _{{e_i}}}(l - 1, k + 1)} |. \end{align} $

(19)

其中: $ 0 < u < 1, \hat r $是$ {\hat\varGamma_i}(l, k) $的上界. $ \eta(\cdot ) $是死区控制器, 即

$ \begin{align} \eta ( { | {{\varepsilon _i}(l, k)} |} ) = \begin{cases} | {{\varepsilon _i}(l, k)} |, \; | {{\varepsilon _{{e_i}}}(l, k)} | > \tau;\\ 0, \; |{{\varepsilon _{{e_i}}}(l, k)}|\leqslant\tau. \end{cases} \end{align} $

(20)

其中$ \tau $将在定理2中分析.

定理2 若式(2)满足假设1~假设3, 并利用事件触发法则(6)更新伪偏导数$ {\varGamma _{{i}}} ( {{{l}}, {{k}}} ) $, 其触发条件如式(19)所示, 则$ {\varepsilon _{{e_i}}}(l, k) $有界.

证明将式(2)、(13)和(15)代入(18)中, 可得

$ \begin{align} &{\varepsilon _{{{{e}}_i}}}(l, k + 1)=\\ &(1 + \chi ){\varepsilon _{{e_i}}}(l - 1, k + 1) + \chi {E_i}(l - 1, k + 1)-\\ &{\varepsilon _i}(l, k){{\hat \varGamma }_i}(l, k) + {{\tilde \varGamma }_i}(l, k)\Delta {u_i}(l, k), \end{align} $

(21)

其中$ {E_i}(l - 1, k + 1)={y_i}(l - 1, k + 1) - {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over y } _i}(l - 1, k + 1) $. 因为$ \Delta {y_i}(l, k + 1) = {\varGamma _i}(l, k)\Delta {u_i}(l, k), 0 < {\varGamma _i}(l, k) < r $, 以及$ {{|}}\Delta {u_i}(l, k){{|}} < a $, 从而可知$ \Delta {y_i}(l, k) $有界. 进一步可知, 必然存在一个常数$ \alpha $使得$ {E_i}(l - 1, k + 1) < \alpha $.

接下来, 从以下两方面来分析$ {\varepsilon _{{{{e}}_i}}}(l, k + 1) $的有界性.

1) 触发时刻.

根据式(14)和(16)可得, 在触发时$ {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over y } _i}(l - 1, k + 1) = {y_i}(l - 1, k + 1) $, $ \Delta {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over u } _i}(l, k) =\Delta {u_i}(l, k) $, 可得$ {E_i}(l - 1, k + 1) = 0, {\varepsilon _i}(l, k)= 0 $. 因此式(21)可重写为

$ \begin{align} &{\varepsilon _{{{{e}}_i}}}(l, k + 1)=\\ &(1 + \chi ){\varepsilon _{{e_i}}}(l - 1, k + 1)+ {\tilde \varGamma _i}(l, k)\Delta {u_i}(l, k). \end{align} $

(22)

进一步, 定义如下李雅普诺夫方程:

$ \begin{align} {V_i}(l, k + 1) = \varepsilon^2 _{{e_i}}(l, k + 1). \end{align} $

(23)

将式(22)代入(23), 可得

$ \begin{align} &\Delta {V_i}(l, k + 1)\leqslant\\ &-(1 - 2{(1 + \chi )^2})\varepsilon^2 _{e_i}(l - 1, k + 1) + \varphi, \end{align} $

(24)

其中$ \varphi {{ = 2(r/(}}1 - {q_1}{{)}}{{{)}}^2}{a^2} $. 显然, 当下式成立时:

$ \begin{align} |{\varepsilon _{ei}}(l - 1, k + 1)| > \sqrt {\frac{\varphi }{{1 - 2{{(1 + \chi )}^2}}}} = \tau, \end{align} $

(25)

有$ \Delta {V_i}(l, k + 1) < 0 $, 进一步可得$ {\varepsilon _{{e_i}}}(l, k) $有界.

2) 非触发时刻.

根据式(14)和(16), (24)可改写为

$ \begin{align} &\Delta {V_i}(l, k + 1)\leqslant\\ &- (1 - 4{(1 + \chi )^2}){\varepsilon _{ei}}^2(l - 1, k + 1)+\\ &4{\chi ^2}{\alpha ^2} + 4{{\hat r}^2}{\varepsilon _i}^2(l, k) + 4{{\tilde r}^2}{a^2}, \end{align} $

(26)

其中$ \tilde r = \dfrac{r}{{1 - {q_1}}} $. 再根据式(19), 可得

$ \begin{align} \Delta {V_i}(l, k + 1)\leqslant\;&- (1 - u)(1 - 4{(1 + \chi )^2})\times\\ &\; \varepsilon^2 _{ei}(l - 1, k + 1) + \theta. \end{align} $

(27)

其中: $ \theta\geqslant4{\chi ^2}{\alpha ^2} + 4{\hat r^2}{a^2}, 0 < u < 1 $. 此外, 根据式(23)和(26), 可得

$ \begin{align*} &{V_i}(l, k + 1)\leqslant\notag\\ &{(1 - (1 - u)(1 - 4{(1 + \chi )^2}){{)}}^{l{{ - }}1}}{V_i}(1, k + 1)+\notag\\ &\frac{{\theta (1 - {{(1 - (1 - u)(1 - 4{{(1 + \chi )}^2}))}^{l{{ - }}1}})}}{{1 - (1 - (1 - u)(1 - 4{{(1 + \chi )}^2}))}}. \end{align*} $

其中, 若$ 0 < 1 - (1 - u)(1 - 4{(1 + \chi )^2}) < 1 $, 则可以得到

$ \begin{align} &\mathop {\lim }\limits_{l \to \infty } |{V_i}(l, k + 1)| =\\ &\frac{\theta }{{1 - (1 - (1 - u)(1 - 4(1 + {\chi ^2})))}}. \end{align} $

(28)

此外, 易证得$ - 1.5 < \chi < - 0.5 $为式(27)的充分条件. 根据式(23)和(27), 可得$ {\varepsilon _{{e_i}}}(l, k) $是有界的.

注1 从式(14)、(17)、(19)、(20)和(25)可以发现, 当$ |{\varepsilon _{{e_i}}}(l, k)| < \tau $和连续多次触发时, 式(19)的左端将为0, 这将导致触发条件(19)无法成立, 从而无法继续触发, 有效地避免了类Zeno现象的发生.

2.3 事件触发分布式双向一致性

设计事件触发分布式控制协议如下:

$ \begin{align} {u_i}(l, k)=\;&{u_i}(l - 1, k) + Q{_i}(l - 1, k)\times\\ &\frac{{\beta {{\hat \varGamma }_i}(l, k)}}{{\lambda + {{ | {{{\hat \varGamma }_i}(l, k)} |}^2}}}{\zeta _{{i}}}(l - 1, k + 1). \end{align} $

(29)

其中: $ {\zeta_{{i}}}(l-1, k+1) $为分布式双向一致性局部误差, 其表述如式(3)所示; $ Q{_i}(l - 1, k) $为索引操作器, 其表述如式(7)所示; $ {\hat \varGamma _i}(l, k) $是$ {\varGamma _i}(l, k) $的估计; $ \lambda > 0;\beta $是稳定性权重, 其具体取值范围将在定理3中给出.

引理2^{[8, 10]} 若$ {{M}} ( {{i}} ) $代表一个迭代变化的亚随机矩阵, 其对角元素均为正数, 则利用$ M $代表所有可能的亚随机矩阵$ M ( {{i}} ) $, 可得

$ \begin{align*} \| {M(P)M(P - 1)\ldots M(1)} \|\leqslant {\rm{\rlap{-} \lambda }} \end{align*} $

其中: $ 0 < {\rm{\rlap{-} \lambda }} < 1, {{P}} $可任意从集合$ M $中选取.

定理3 若式(2)满足假设1~假设3, 多智能体系统的通讯拓扑满足假设4, 伪偏导数可根据法则(6)~(8)来更新, 并利用事件触发条件(19), 以及双向一致性控制法则(28), 则当$ \lambda > {\lambda _{\min }} > {r^2}/4 $, $ \beta $满足

$ \begin{align} \beta<\frac{1}{\max\limits_{i=1, \ldots, N} \sum\limits^N_{j=1}|a_{ij}|+b_i} \end{align} $

时, 可得多智能体系统双向一致性估计误差$ {\hat e_i}(l, k) $有界, 以及双向一致性跟踪误差$ {e_i}(l, k) $有界.

证明根据$ {\hat e_i}(l, k) = {s_i}{y_0}(l, k) - {\hat y_i}(l, k) $, 式(3)可以改写成

$ \begin{align} &{\zeta _{{i}}}(l, k)=\\ & \sum\limits_{j \in N_i} { ( {{a_{ij}}{{\hat e}_i}(l, k) - | {{a_{ij}}} |{{\hat e}_j}(l, k)} )} + {b_i}{\hat e_i}(l, k). \end{align} $

(30)

为了方便分析, 定义如下向量组:

$ \begin{align*} &{{\hat y}} ( {{{l}}, {{k}}} ) = { [ {{{{{\hat y}}}_1} ( {{{l}}, {{k}}} ), {{{{\hat y}}}_2} ( {{{l}}, {{k}}} ), \ldots, {{{{\hat y}}}_{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{{u}} ( {{{l}}, {{k}}} ) = { [ {{{{u}}_1} ( {{{l}}, {{k}}} ), {{{u}}_2} ( {{{l}}, {{k}}} ), \ldots, {{{u}}_{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &\zeta ( {{{l}}, {{k}}} ) = { [ {{\zeta _1} ( {{{l}}, {{k}}} ), {\zeta _2} ( {{{l}}, {{k}}} ), \ldots, {\zeta _{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{{{{\bar y}}}_{{0}}} ( {{{l}}, {{k}}} ) = { [ {{{{y}}_0} ( {{{l}}, {{k}}} ), {{{y}}_0} ( {{{l}}, {{k}}} ), \ldots, {{{y}}_0} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{{\hat e}} ( {{{l}}, {{k}}} ) = { [ {{{{{\hat e}}}_1} ( {{{l}}, {{k}}} ), {{{{\hat e}}}_2} ( {{{l}}, {{k}}} ), \ldots, {{{{\hat e}}}_{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{\varepsilon _e} ( {{{l}}, {{k}}} ) = { [ {{\varepsilon _e}_1 ( {{{l}}, {{k}}} ), {\varepsilon _e}_2 ( {{{l}}, {{k}}} ), \ldots, {\varepsilon _e}_{{N}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}. \end{align*} $

从而, 式(29)可改写为如下形式:

$ \begin{align} \zeta ( {l - 1, k + 1} ) = ( {\cal L + \cal B} )\hat e ( {l - 1, k + 1} ). \end{align} $

(31)

其跟踪误差的收敛性可通过以下两方面进行分析.

1) 非触发时刻.

$ Q{_i}(l - 1, k)=0 $, 控制输入将保持上次触发时刻值, 从而导致系统跟踪误差增大, 以及条件(19)被打破, 系统进入事件触发状态.

2) 触发时刻.

$ Q{_i}(l - 1, k)=1 $, 根据$ {\hat e_i}(l, k) = {s_i}{y_0}(l, k) - {\hat y_i}(l, k) $可得

$ \begin{align} &\hat e(l - 1, k + 1)=\\ &s{\bar y_0}(l - 1, k + 1)- \hat y(l - 1, k + 1), \end{align} $

(32)

其中$ s ={\rm diag}{(s_1, \ldots, s_N)} $. 又因为$ {\bar y_0}(l - 1, k + 1) = {\bar y_0}(l, k + 1) $是常数, 从而可得

$ \begin{align} \hat e(l, k + 1)=\;& ( I - \beta \psi (l, k))\hat e(l - 1, k + 1)-\\ &\chi {\varepsilon _e}(l - 1, k + 1). \end{align} $

(33)

其中: $ \psi (l, k) = \varOmega (l, k){(\cal L + \cal B)}, \varOmega (l, k) ={\rm diag}({\vartheta _1}, \ldots, {\vartheta _N}) $, 并且有

$ \begin{align} 0 < {\vartheta _i} = \frac{{{\varGamma _i}(l, k){{\hat \varGamma }_i}(l, k)}}{{\lambda + {{ | {{{\hat \varGamma }_i}(l, k)} |}^2}}} < \frac{r}{{2\sqrt {{\lambda _{\min }}} }} < 1 . \end{align} $

(34)

因此, 根据定理3中$ \beta $的取值范围以及式(32), 可得矩阵$ {{I}} - \beta \psi (l, k) $的行和必然小于1, 如同文献[5]中的分析, 矩阵$ {{I}} - \beta \psi (l, k) $是亚随机矩阵. 进一步可得

$ \begin{align} &\| {\hat e(l, k + 1)} \|\leqslant\\ &\| {({{I}} - \beta \psi (l, k))} \| \| {\hat e(l - 1, k + 1)} \|+\\ &\| {\chi {\varepsilon _e}(l - 1, k + 1)} \|\leqslant\\ &\| {{{I}} - \beta \psi (l, k)} \| \| {{{I}} - \beta \psi (l - 1, k)} \|\ldots\\ &\| {{{I}} - \beta \psi (2, k)} \| \| {\hat e(1, k + 1)} \|+w + \\ &\| {{{I}} - \beta \psi (l, k)} \|w +\ldots+\\ &\| {{{I}} - \beta \psi (l - 1, k)} \| \| {{{I}} - \beta \psi (l - 2, k)} \|\ldots\\ &\| {{{I}} - \beta \psi (3, k)} \|w. \end{align} $

(35)

因为$ \chi $和$ {\varepsilon _e}(l - 1, k + 1) $是有界的, 所以必然存在一个常数$ w $使得$ w > \| {\chi {\varepsilon _e}(l - 1, k + 1)} \| $.

进一步, 根据引理2和式(33)可得

$ \begin{align*} \| {\hat e(l, k + 1)} \|\leqslant\;&({{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{l - 2}}{P}} \rfloor }} + {{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{l - 3}}{P}} \rfloor }} +\ldots+ {{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{0}{P}} \rfloor }})w+\notag\\ &\, {{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{l - 1}}{P}} \rfloor }} \| {\hat e(l, k + 1)} \|. \end{align*} $

定义$ { O}(l) = { {\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{lP}}{P}} \rfloor }} + { {\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{lP + 1}}{P}} \rfloor }} +\ldots+ { {\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{(l + 1)P - 1}}{P}} \rfloor }} $, 因此, 有$ { O}(l) = P{ {\rm{\rlap{--} \lambda }} ^l} $, 从而可得

$ \begin{align*} &\mathop {\lim }\limits_{l \to \infty } \| {\hat e(l, k + 1)} \|=\notag\\ &\mathop {\lim }\limits_{l \to \infty } ({ O}(l) + { O}(l - 1) +\ldots+ { O}(0))w=\frac{P}{{1 - {\rm{\rlap{--} \lambda }} }}w. \end{align*} $

综上可知，双向一致性跟踪估计误差有界. 进一步, 根据定理2和式(18)可知, 双向一致性跟踪误差$ {e_i}(l, k) $有界.

注2 从跟踪误差上界的表达式可以得出, 该上界受参数$ a $、$ r $以及$ \chi $的影响. 虽然$ a $和$ r $是被控对象的固有属性, 但可以通过调节$ \chi $来调节误差上界, 从而进一步减小触发次数.

3 数值仿真与分析

本仿真实验主要针对无菌灌装生产线上清洗区和灌装区比例阀喷射方向相反的应用背景, 进行事件触发无模型迭代学习双向一致性仿真实验.

高速无菌饮料灌装现场如图 1(a)所示, 其中比例阀的阀嘴如图 1(b)所示, 该类比例阀的自回归模型^[24-25]识别如下:

$ \begin{align} \frac{{y_i ( {l, k + 1} )}}{{u_i (l, k )}} = \frac{{ ( {1.24{z^{ - 1}} - 0.93{z^{ - 2}}} )}}{{ ( {1 - 1.6{z^{ - 1}} + 0.6{z^{ - 2}}} )}}. \end{align} $

(36)

图 1 高速无菌饮料灌装现场和喷嘴

其中: $ y_i (l, k ) $是喷嘴处压力, $ u_i (l, k ) $是比例阀开度.

目标压力值定义为$ {y_0} ( {{{l, k}}} ) = 0.5\sin ( {k\pi /20} ) + 0.3\cos ( {k\pi /10} ) $. 其中: $ k\in{[0, 100]} $, $ l\in{[0, 400]} $.

此实验为由7个比例阀控制系统组成的多智能体系统, 其中智能体被分为$ {{{{\cal V}}}_1}(1, 2, 7) $和$ {{{{\cal V}}}_2}(3, 4, 5, 6) $两组. 其通讯拓扑如图 2所示. 其中: 0代表虚拟领导者, 黑色箭头代表合作关系, 红色箭头代表竞争关系. 由图论可知, $ \cal L + \cal B $中对角元素的最大值是2, 所以可设置$ \beta =0.24 $, 其余参数值设置为$ \lambda = 1, \chi = - 1.4, u= 0.55, \delta =0.5, \rho =0.5, \sigma {{ = }}{10^{{{ - }}4}} $. 初始值设定为$ {\hat \varGamma _i} ( {1, k} )=2, {u_i}(0, 0) ={\rm rand}( - 0.005, 0.005), {y_i}(0, 0) ={\rm rand}( - 0.005, 0.005), i = 1, 2, 3, 4, 5, 6, 7 $.

图 2 喷嘴压力控制系统的通讯拓扑图

实验结果如图 3~图 5所示. 从图 3和图 4中可以看出, 在开始的瞬间误差较大, 但随后跟随者的跟踪误差随着迭代步数的增加而迅速地收敛到0附近. 从图 5中可知, 其触发时刻是间断的, 从而验证了所设计的死区控制器有效避免了触发器的类Zeno现象^[13], 其中各个智能体的触发次数分别是30、37、27、40、44、43、28, 平均触发次数为35.57. 相比于文献[5, 8-10]中的算法, 不但实现了双向一致性跟踪, 还可以减少64.43 %的通讯资源, 由此可知, 本文所设计的控制协议具有较好的节能效果和控制性能.

图 3 喷嘴压力控制系统双向一致性跟踪效果

图 4 喷嘴压力控制系统双向一致性跟踪误差

图 5 第355次迭代时事件触发时刻

4 结论

本文针对一类未知动力学模型的周期性运行的多智能体系统, 设计了一种事件触发无模型迭代学习双向一致性控制策略. 该控制策略考虑了被控系统的合作与竞争关系, 并仅利用其输入输出数据构建了动态线性化数据模型, 设计了事件触发控制条件和死区控制器, 避免了类Zeno行为. 同时, 对该控制策略的收敛性进行了严格证明. 仿真结果也进一步验证了该控制策略的正确性. 在未来研究中将该控制策略扩展到未知模型多输入多输出多智能体系统是一个具有挑战性的课题.

参考文献

[1]	Hui Y, Chi R H, Huang B, et al. 3-D learning-enhanced adaptive ILC for iteration-varying formation tasks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(1): 89-99. DOI:10.1109/TNNLS.2019.2899632
[2]	Jin S T, Li C, Ren Y, et al. Model-free adaptive formation control for unknown heterogeneous nonlinear multi-agent systems[J]. Control and Decision, 2020, 35(6): 1519-1524.
[3]	Jiang H, He H B. Data-driven distributed output consensus control for partially observable multiagent systems[J]. IEEE Transactions on Cybernetics, 2019, 49(3): 848-858. DOI:10.1109/TCYB.2017.2788819
[4]	Wang S Y, Duan J J, Shi D, et al. A data-driven multi-agent autonomous voltage control framework using deep reinforcement learning[J]. IEEE Transactions on Power Systems, 2020, 35(6): 4644-4654. DOI:10.1109/TPWRS.2020.2990179
[5]	Bu X H, Yu Q X, Hou Z S, et al. Model free adaptive iterative learning consensus tracking control for a class of nonlinear multiagent systems[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(4): 677-686. DOI:10.1109/TSMC.2017.2734799
[6]	Dai X S, Wang C, Tian S P, et al. Consensus control via iterative learning for distributed parameter models multi-agent systems with time-delay[J]. Journal of the Franklin Institute, 2019, 356(10): 5240-5259. DOI:10.1016/j.jfranklin.2019.05.015
[7]	Hock A, Schoellig A P. Distributed iterative learning control for multi-agent systems[J]. Autonomous Robots, 2019, 43(8): 1989-2010. DOI:10.1007/s10514-019-09845-4
[8]	Wang Y C, Li H F, Qiu X J, et al. Consensus tracking for nonlinear multi-agent systems with unknown disturbance by using model free adaptive iterative learning control[J]. Applied Mathematics and Computation, 2020, 365: 124701. DOI:10.1016/j.amc.2019.124701
[9]	Li C J, Liu G P. Data-driven consensus for non-linear networked multi-agent systems with switching topology and time-varying delays[J]. IET Control Theory & Applications, 2018, 12(12): 1773-1779.
[10]	Ren Y, Hou Z S. Robust model-free adaptive iterative learning formation for unknown heterogeneous non-linear multi-agent systems[J]. IET Control Theory & Applications, 2020, 14(4): 654-663.
[11]	Chi R H, Hou Z S, Huang B. Optimal iterative learning control of batch processes: From model-based to data-driven[J]. Acta Automatica Sinica, 2017, 43(6): 917-932.
[12]	Ding L, Han Q L, Ge X H, et al. An overview of recent advances in event-triggered consensus of multiagent systems[J]. IEEE Transactions on Cybernetics, 2018, 48(4): 1110-1123. DOI:10.1109/TCYB.2017.2771560
[13]	Dong T, Li X L, Zhao D D. Event-triggered consensus of third-order discrete-time multi-agent systems[J]. Acta Automatica Sinica, 2019, 45(7): 1366-1372.
[14]	Li X W, Tang Y, Karimi H R. Consensus of multi-agent systems via fully distributed event-triggered control[J]. Automatica, 2020, 116: 108898. DOI:10.1016/j.automatica.2020.108898
[15]	Hu W F, Yang C H, Huang T W, et al. A distributed dynamic event-triggered control approach to consensus of linear multiagent systems with directed networks[J]. IEEE Transactions on Cybernetics, 2020, 50(2): 869-874. DOI:10.1109/TCYB.2018.2868778
[16]	Ding D R, Wang Z D, Han Q L. Neural-network-based consensus control for multiagent systems with input constraints: The event-triggered case[J]. IEEE Transactions on Cybernetics, 2020, 50(8): 3719-3730. DOI:10.1109/TCYB.2019.2927471
[17]	Li H F, Wang Y C, Zhang H G. Data-driven-based event-triggered tracking control for non-linear systems with unknown disturbance[J]. IET Control Theory & Applications, 2019, 13(14): 2197-2206.
[18]	Lin N, Chi R H, Huang B, et al. Event-triggered nonlinear iterative learning control[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(11): 5118-5128. DOI:10.1109/TNNLS.2020.3027000
[19]	Chen J N, Hua C C, Guan X P. Fast data-driven iterative event-triggered control for nonlinear networked discrete systems with data dropouts and sensor saturation[J]. Journal of the Franklin Institute, 2020, 357(13): 8364-8382. DOI:10.1016/j.jfranklin.2020.03.020
[20]	Altafini C. Consensus problems on networks with antagonistic interactions[J]. IEEE Transactions on Automatic Control, 2013, 58(4): 935-946. DOI:10.1109/TAC.2012.2224251
[21]	Wang W, Wang L, Huang C. Guaranteed cost bipartite formation problem of multi-agent systems with impulse control[J]. Control and Decision, 2021, 36(1): 180-186.
[22]	Zhang H G, Cai Y L, Wang Y C, et al. Adaptive bipartite event-triggered output consensus of heterogeneous linear multiagent systems under fixed and switching topologies[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(11): 4816-4830. DOI:10.1109/TNNLS.2019.2958107
[23]	Peng Z N, Hu J P, Shi K B, et al. A novel optimal bipartite consensus control scheme for unknown multi-agent systems via model-free reinforcement learning[J]. Applied Mathematics and Computation, 2020, 369: 124821. DOI:10.1016/j.amc.2019.124821
[24]	Bu X H, Wang Q F, Hou Z S, et al. Data driven control for a class of nonlinear systems with output saturation[J]. ISA Transactions, 2018, 81: 1-7. DOI:10.1016/j.isatra.2018.07.009
[25]	Shi J, Gao F R, Wu T J. Integrated design and structure analysis of robust iterative learning control system based on a two-dimensional model[J]. Industrial & Engineering Chemistry Research, 2005, 44(21): 8095-8105.