2. 燕山大学 信息科学与工程学院, 河北 秦皇岛 066004
2. School of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, China
学习控制(leaning control)是指通过算法自身的学习能力来了解被控对象和外部环境, 从而提高自身控制性能, 是实现智能自主控制的基础[1]. 在已有的多智能体系统一致性学习控制算法[2-7]中, 自适应迭代学习控制算法主要针对执行重复任务的系统, 并且要求其起始时刻误差已收敛, 例如集成电路焊接和晶圆制造[5]. 自适应迭代学习控制算法, 根据算法研究过程中是否依赖被控对象的动力学模型, 可分为基于模型控制算法[6-7]和数据驱动控制算法[8-9].
随着科学技术的发展, 实际工业过程变得越来越复杂. 直接通过系统辨识的方法来建立被控对象的系统模型正面临着巨大的挑战[9]. 众多学者开始关注于数据驱动控制算法的研究. 无模型自适应迭代学习控制方法(model-free adaptive iterative learning control, MFAILC)是一种典型的数据驱动控制算法[10]. 该方法通过在每个工作点利用紧凑形式动态线性化方法(compact form dynamics linearization, CFDL), 沿迭代轴方向建立与非线性系统等价的动态线性化数据模型, 并利用被控系统的输入输出数据在线估计该模型中的参数, 从而实现未知非线性系统的无模型自适应迭代学习控制[9-11].
在工业应用中, 由于工控机的处理速度、内存容量和通讯带宽受限, 学者们提出了事件触发控制机制[12]. 在该机制中, 只有在触发时刻才进行运算和信息传递, 从而有效地减少了控制次数和通信负担. Dong等[13]研究了三阶离散时间多智能体系统一致性问题, 提出一种事件触发控制机制, 避免了触发器的类Zeno现象. Li等[14]针对线性多智能体系统提出了一种自适应的事件触发控制算法. Hu等[15]针对线性多智能体系统提出了一种动态事件触发控制机制. Ding等[16]针对非线多智能体系统提出了一种基于神经网络的事件触发控制算法. 在已有的事件触发控制算法中, 对于系统模型已知的研究较为成熟; 但是对于系统模型未知, 特别是基于MFAILC框架来实现事件触发控制, 目前主要是针对单个系统进行研究[17-19]; 而从事未知模型多智能体系统的事件触发方面的研究则较少.
双向一致性概念是由Altafini[20]提出的, 主要研究多智能体之间合作与竞争关系. 合作与竞争现象在自然界中是共存的, 因而在研究多智能体系统时, 若仅考虑一种关系, 则研究是不充分的. 学者们在研究多智能体系统之间的合作与竞争关系时, 通常将所有智能体分成两组, 其输出或状态最终分别达到一致, 但其目标值符号相异. Wang等[21]针对二阶非线性多智能体系统, 提出了一种保性双向编队控制算法. Zhang等[22]针对异构线性多智能体系统, 提出了一种自适应事件触发输出双向一致性控制算法. Peng等[23]针对未知模型多智能体系统, 利用强化学习算法提出了一种双向一致性控制算法.
本文研究未知模型非线性离散时间多智能体系统的事件触发迭代学习双向一致问题, 主要贡献是:
1) 利用CFDL技术为智能体沿迭代轴方向建立动态线性化数据模型, 设计一种事件触发无模型迭代学习双向一致性控制算法. 相比于基于模型的事件驱动控制算法[13-15], 该算法的设计过程中无需系统的动力学模型信息. 相比于基于MFAILC的事件驱动控制算法[17-19], 该算法可以控制多个未知模型的智能体系统.
2) 所设计的控制算法是在线学习算法, 相比于基于神经网络控制算法[16], 无需训练数据和测试数据, 并且考虑了智能体之间的合作与竞争关系.
3) 设计观测器和死区控制器, 可以实现事件触发控制, 避免触发器的类Zeno行为, 并构建李雅普诺夫函数, 对该算法的收敛性进行严格证明.
1 预备知识 1.1 代数图论本文多智能体系统的通讯拓扑可表示为
考虑一类具有1个虚拟领导者和
| $ \begin{align} {y_i}(l, k + 1)=\;& {f_i}({y_i}(l, k), \ldots, {y_i}(l, k - {n_y}), \\ &{u_i}(l, k), \ldots, {u_i}(l, k - {n_{{u}}})). \end{align} $ | (1) |
其中:
假设1[1-2]
假设2[5-8] 式(1)沿迭代轴方向满足广义Lipschitz连续条件, 即存在一个常数
引理1 [5] 若式(1)满足假设1和假设2, 则式(1)可用以下紧凑形式的动态线性化模型表示:
| $ \begin{align} \Delta {y_i}(l, k + 1) = {\varGamma _i}(l, k)\Delta {u_i}(l, k). \end{align} $ | (2) |
其中:
假设3 式(2)中
定义分布式双向一致性局部误差为
| $ \begin{align} {\zeta _{{i}}}(l, k)=\;& \sum\limits_{j \in N_i}{|{a_{ij}}}|({\rm sign}({a_{ij}}){{\hat y}_j}(l, k) - {{\hat y}_i}(l, k))+\\ &\; {b_i}({s_i}{y_0}(l, k) - {{\hat y}_i}(l, k)). \end{align} $ | (3) |
其中: 若智能体
假设4 图
定义1 当且仅当智能体
| $ \begin{align} \mathop {\lim }\limits_{{{l}} \to \infty } ( {{{{y}}_{{i}}} ( {{{l}}, {{k}}} ) - {{{s}}_{{i}}}{{{y}}_0} ( {{{l}}, {{k}}} )} ) = \iota. \end{align} $ | (4) |
其中:
定义
| $ \begin{align} &{{\hat \varGamma }_i} ( {l, k} ) =\\ &{{\hat \varGamma }_i} ( {l - 1, k} ) + \frac{{\rho \Delta {u_i} ( {l - 1, k} )}}{{\delta + {{ | {\Delta {u_i} ( {l - 1, k} )} |}^2}}}\times\\ &( {\Delta {y_i} ( {l - 1, k + 1} ) - {{\hat \varGamma }_i} ( {l - 1, k})\Delta {u_i} ( {l - 1, k} )} ). \end{align} $ | (5) |
其中:
| $ \begin{align} &{{\hat \varGamma }_i} ( {l, k} )=\\ &Q{_i} ( {l - 1, k} )\frac{{\rho \Delta {u_i} ( {l - 1, k} )}}{{\delta + {{ | {\Delta {u_i} ( {l - 1, k} )} |}^2}}}\times\\ & ( {\Delta {y_i} ( {l - 1, k + 1} ) - {{\hat \varGamma }_i} ( {l - 1, k})\Delta {u_i} ( {l - 1, k} )} )+\\ &{{\hat \varGamma }_i} ( {l - 1, k} ). \end{align} $ | (6) |
其中
| $ \begin{align} Q_i( {l - 1, k} )= \begin{cases} 1, \; \text{触发}, \; k = k_i;\\ 0, \; \text{不触发}, \; k_{i - 1}< k <k_i. \end{cases} \end{align} $ | (7) |
| $ \begin{align} &{\hat \varGamma _i}(l, k)={\hat \varGamma _i}(1, k), \; | {\Delta {u_i} ( {l - 1, k} )} |\leqslant\sigma;\; {\rm or}\\ &{\rm sign}( {{{\hat \varGamma }_i} ( {l, k} )} ) \ne {\rm sign}( {{{\hat \varGamma }_i} ( {1, k} )} ). \end{align} $ | (8) |
其中:
定理1 当
证明 可分为触发时刻和非触发时刻分别证明.
1) 触发时刻.
| $ \begin{align} {\tilde \varGamma _i}(l, k)=\;&\Big(1 - \frac{{\rho {{ | {\Delta {u_i}(l - 1, k)} |}^2}}}{{\delta + {{ | {\Delta {u_i}(l - 1, k)} |}^2}}}\Big){\tilde \varGamma _i}(l - 1, k)-\\ &\Delta {\varGamma _i}(l, k). \end{align} $ | (9) |
因为
| $ \begin{align} 0 < \Big| {1 - \frac{{\rho \Delta {u_i}(l - 1, k)}}{{\delta + |\Delta {u_i}(l - 1, k){|^2}}}}\Big| < {q_1} < 1. \end{align} $ | (10) |
根据引理1可知
| $ \begin{align} | {\Delta {\varGamma _i} ( {l, k} )} |\leqslant | {{\varGamma _i} ( {l, k} )} |\leqslant r. \end{align} $ | (11) |
因此, 根据式(9)~(11), 可得
| $ \begin{align} |{{\tilde \varGamma }_i}(l, k)|\leqslant\;& {q_1}|{{\tilde \varGamma }_i}(l - 1, k)| + |\Delta {\varGamma _i}(l, k)|\leqslant\\ &{q_1}^{l - 1}|{{\tilde \varGamma }_i}(1, k)| + \frac{{r(1 - {q_1}^{l - 1})}}{{1 - {q_1}}}. \end{align} $ | (12) |
进一步可得
2) 非触发时刻.
首先, 输出观测器设计如下:
| $ \begin{align} {{\hat y}_i}(l, k + 1)=\;&{{\hat y}_i}(l - 1, k + 1) + {{\hat \varGamma }_i}(l, k)\Delta {{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over u } }_i}(l, k)+\\ &\chi {{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over \varepsilon } }_{{e_i}}}(l - 1, k + 1). \end{align} $ | (13) |
其中:
| $ \begin{align} \Delta {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over u}_i} ( {l, k} ) =\Delta {u_i} ( {l, {k_i}} ), \; {k_i}\leqslant k < {k_{i + 1}}, \end{align} $ | (14) |
其中
| $ \begin{align} &{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over \varepsilon } _{{e_i}}} ( {l - 1, k + 1} ) =\\ &{\hat y_i}(l - 1, k + 1)-{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over y } _i}(l - 1, k + 1), \end{align} $ | (15) |
| $ \begin{align} &{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over y} _i}(l - 1, k + 1)={y_i}(l - 1, {k_i} + 1), \end{align} $ | (16) |
其中
根据式(14)和(16)可得, 当处于非触发时刻, 观测器的输入和输出将维持上一次触发时刻的值.
输出增益误差定义为
| $ \begin{align} {\varepsilon _i}(l, k) = \Delta {u_i} ( {l, k} ) - \Delta {\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\smile$}} \over U } _i} ( {l, k} ); \end{align} $ | (17) |
观测器的输出估计误差定义为
| $ \begin{align} {\varepsilon _{{e_i}}}(l, k + 1) = {\hat y_i}(l, k + 1) - {y_i}(l, k + 1); \end{align} $ | (18) |
事件触发控制条件定义为
| $ \begin{align} \eta ( { | {{\varepsilon _i}(l, k)} |} ) > \sqrt {\frac{{u(1 - 4{{(1 + \chi )}^2})}}{{4{{\hat r}^2}}}} | {{\varepsilon _{{e_i}}}(l - 1, k + 1)} |. \end{align} $ | (19) |
其中:
| $ \begin{align} \eta ( { | {{\varepsilon _i}(l, k)} |} ) = \begin{cases} | {{\varepsilon _i}(l, k)} |, \; | {{\varepsilon _{{e_i}}}(l, k)} | > \tau;\\ 0, \; |{{\varepsilon _{{e_i}}}(l, k)}|\leqslant\tau. \end{cases} \end{align} $ | (20) |
其中
定理2 若式(2)满足假设1~假设3, 并利用事件触发法则(6)更新伪偏导数
证明 将式(2)、(13)和(15)代入(18)中, 可得
| $ \begin{align} &{\varepsilon _{{{{e}}_i}}}(l, k + 1)=\\ &(1 + \chi ){\varepsilon _{{e_i}}}(l - 1, k + 1) + \chi {E_i}(l - 1, k + 1)-\\ &{\varepsilon _i}(l, k){{\hat \varGamma }_i}(l, k) + {{\tilde \varGamma }_i}(l, k)\Delta {u_i}(l, k), \end{align} $ | (21) |
其中
接下来, 从以下两方面来分析
1) 触发时刻.
根据式(14)和(16)可得, 在触发时
| $ \begin{align} &{\varepsilon _{{{{e}}_i}}}(l, k + 1)=\\ &(1 + \chi ){\varepsilon _{{e_i}}}(l - 1, k + 1)+ {\tilde \varGamma _i}(l, k)\Delta {u_i}(l, k). \end{align} $ | (22) |
进一步, 定义如下李雅普诺夫方程:
| $ \begin{align} {V_i}(l, k + 1) = \varepsilon^2 _{{e_i}}(l, k + 1). \end{align} $ | (23) |
将式(22)代入(23), 可得
| $ \begin{align} &\Delta {V_i}(l, k + 1)\leqslant\\ &-(1 - 2{(1 + \chi )^2})\varepsilon^2 _{e_i}(l - 1, k + 1) + \varphi, \end{align} $ | (24) |
其中
| $ \begin{align} |{\varepsilon _{ei}}(l - 1, k + 1)| > \sqrt {\frac{\varphi }{{1 - 2{{(1 + \chi )}^2}}}} = \tau, \end{align} $ | (25) |
有
2) 非触发时刻.
根据式(14)和(16), (24)可改写为
| $ \begin{align} &\Delta {V_i}(l, k + 1)\leqslant\\ &- (1 - 4{(1 + \chi )^2}){\varepsilon _{ei}}^2(l - 1, k + 1)+\\ &4{\chi ^2}{\alpha ^2} + 4{{\hat r}^2}{\varepsilon _i}^2(l, k) + 4{{\tilde r}^2}{a^2}, \end{align} $ | (26) |
其中
| $ \begin{align} \Delta {V_i}(l, k + 1)\leqslant\;&- (1 - u)(1 - 4{(1 + \chi )^2})\times\\ &\; \varepsilon^2 _{ei}(l - 1, k + 1) + \theta. \end{align} $ | (27) |
其中:
| $ \begin{align*} &{V_i}(l, k + 1)\leqslant\notag\\ &{(1 - (1 - u)(1 - 4{(1 + \chi )^2}){{)}}^{l{{ - }}1}}{V_i}(1, k + 1)+\notag\\ &\frac{{\theta (1 - {{(1 - (1 - u)(1 - 4{{(1 + \chi )}^2}))}^{l{{ - }}1}})}}{{1 - (1 - (1 - u)(1 - 4{{(1 + \chi )}^2}))}}. \end{align*} $ |
其中, 若
| $ \begin{align} &\mathop {\lim }\limits_{l \to \infty } |{V_i}(l, k + 1)| =\\ &\frac{\theta }{{1 - (1 - (1 - u)(1 - 4(1 + {\chi ^2})))}}. \end{align} $ | (28) |
此外, 易证得
注1 从式(14)、(17)、(19)、(20)和(25)可以发现, 当
设计事件触发分布式控制协议如下:
| $ \begin{align} {u_i}(l, k)=\;&{u_i}(l - 1, k) + Q{_i}(l - 1, k)\times\\ &\frac{{\beta {{\hat \varGamma }_i}(l, k)}}{{\lambda + {{ | {{{\hat \varGamma }_i}(l, k)} |}^2}}}{\zeta _{{i}}}(l - 1, k + 1). \end{align} $ | (29) |
其中:
引理2[8, 10] 若
| $ \begin{align*} \| {M(P)M(P - 1)\ldots M(1)} \|\leqslant {\rm{\rlap{-} \lambda }} \end{align*} $ |
其中:
定理3 若式(2)满足假设1~假设3, 多智能体系统的通讯拓扑满足假设4, 伪偏导数可根据法则(6)~(8)来更新, 并利用事件触发条件(19), 以及双向一致性控制法则(28), 则当
| $ \begin{align} \beta<\frac{1}{\max\limits_{i=1, \ldots, N} \sum\limits^N_{j=1}|a_{ij}|+b_i} \end{align} $ |
时, 可得多智能体系统双向一致性估计误差
证明 根据
| $ \begin{align} &{\zeta _{{i}}}(l, k)=\\ & \sum\limits_{j \in N_i} { ( {{a_{ij}}{{\hat e}_i}(l, k) - | {{a_{ij}}} |{{\hat e}_j}(l, k)} )} + {b_i}{\hat e_i}(l, k). \end{align} $ | (30) |
为了方便分析, 定义如下向量组:
| $ \begin{align*} &{{\hat y}} ( {{{l}}, {{k}}} ) = { [ {{{{{\hat y}}}_1} ( {{{l}}, {{k}}} ), {{{{\hat y}}}_2} ( {{{l}}, {{k}}} ), \ldots, {{{{\hat y}}}_{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{{u}} ( {{{l}}, {{k}}} ) = { [ {{{{u}}_1} ( {{{l}}, {{k}}} ), {{{u}}_2} ( {{{l}}, {{k}}} ), \ldots, {{{u}}_{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &\zeta ( {{{l}}, {{k}}} ) = { [ {{\zeta _1} ( {{{l}}, {{k}}} ), {\zeta _2} ( {{{l}}, {{k}}} ), \ldots, {\zeta _{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{{{{\bar y}}}_{{0}}} ( {{{l}}, {{k}}} ) = { [ {{{{y}}_0} ( {{{l}}, {{k}}} ), {{{y}}_0} ( {{{l}}, {{k}}} ), \ldots, {{{y}}_0} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{{\hat e}} ( {{{l}}, {{k}}} ) = { [ {{{{{\hat e}}}_1} ( {{{l}}, {{k}}} ), {{{{\hat e}}}_2} ( {{{l}}, {{k}}} ), \ldots, {{{{\hat e}}}_{{N}}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}, \\ &{\varepsilon _e} ( {{{l}}, {{k}}} ) = { [ {{\varepsilon _e}_1 ( {{{l}}, {{k}}} ), {\varepsilon _e}_2 ( {{{l}}, {{k}}} ), \ldots, {\varepsilon _e}_{{N}} ( {{{l}}, {{k}}} )} ]^{{\rm T}}}. \end{align*} $ |
从而, 式(29)可改写为如下形式:
| $ \begin{align} \zeta ( {l - 1, k + 1} ) = ( {\cal L + \cal B} )\hat e ( {l - 1, k + 1} ). \end{align} $ | (31) |
其跟踪误差的收敛性可通过以下两方面进行分析.
1) 非触发时刻.
2) 触发时刻.
| $ \begin{align} &\hat e(l - 1, k + 1)=\\ &s{\bar y_0}(l - 1, k + 1)- \hat y(l - 1, k + 1), \end{align} $ | (32) |
其中
| $ \begin{align} \hat e(l, k + 1)=\;& ( I - \beta \psi (l, k))\hat e(l - 1, k + 1)-\\ &\chi {\varepsilon _e}(l - 1, k + 1). \end{align} $ | (33) |
其中:
| $ \begin{align} 0 < {\vartheta _i} = \frac{{{\varGamma _i}(l, k){{\hat \varGamma }_i}(l, k)}}{{\lambda + {{ | {{{\hat \varGamma }_i}(l, k)} |}^2}}} < \frac{r}{{2\sqrt {{\lambda _{\min }}} }} < 1 . \end{align} $ | (34) |
因此, 根据定理3中
| $ \begin{align} &\| {\hat e(l, k + 1)} \|\leqslant\\ &\| {({{I}} - \beta \psi (l, k))} \| \| {\hat e(l - 1, k + 1)} \|+\\ &\| {\chi {\varepsilon _e}(l - 1, k + 1)} \|\leqslant\\ &\| {{{I}} - \beta \psi (l, k)} \| \| {{{I}} - \beta \psi (l - 1, k)} \|\ldots\\ &\| {{{I}} - \beta \psi (2, k)} \| \| {\hat e(1, k + 1)} \|+w + \\ &\| {{{I}} - \beta \psi (l, k)} \|w +\ldots+\\ &\| {{{I}} - \beta \psi (l - 1, k)} \| \| {{{I}} - \beta \psi (l - 2, k)} \|\ldots\\ &\| {{{I}} - \beta \psi (3, k)} \|w. \end{align} $ | (35) |
因为
进一步, 根据引理2和式(33)可得
| $ \begin{align*} \| {\hat e(l, k + 1)} \|\leqslant\;&({{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{l - 2}}{P}} \rfloor }} + {{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{l - 3}}{P}} \rfloor }} +\ldots+ {{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{0}{P}} \rfloor }})w+\notag\\ &\, {{\rm{\rlap{--} \lambda }} ^{ \lfloor {\frac{{l - 1}}{P}} \rfloor }} \| {\hat e(l, k + 1)} \|. \end{align*} $ |
定义
| $ \begin{align*} &\mathop {\lim }\limits_{l \to \infty } \| {\hat e(l, k + 1)} \|=\notag\\ &\mathop {\lim }\limits_{l \to \infty } ({ O}(l) + { O}(l - 1) +\ldots+ { O}(0))w=\frac{P}{{1 - {\rm{\rlap{--} \lambda }} }}w. \end{align*} $ |
综上可知,双向一致性跟踪估计误差有界. 进一步, 根据定理2和式(18)可知, 双向一致性跟踪误差
注2 从跟踪误差上界的表达式可以得出, 该上界受参数
本仿真实验主要针对无菌灌装生产线上清洗区和灌装区比例阀喷射方向相反的应用背景, 进行事件触发无模型迭代学习双向一致性仿真实验.
高速无菌饮料灌装现场如图 1(a)所示, 其中比例阀的阀嘴如图 1(b)所示, 该类比例阀的自回归模型[24-25]识别如下:
| $ \begin{align} \frac{{y_i ( {l, k + 1} )}}{{u_i (l, k )}} = \frac{{ ( {1.24{z^{ - 1}} - 0.93{z^{ - 2}}} )}}{{ ( {1 - 1.6{z^{ - 1}} + 0.6{z^{ - 2}}} )}}. \end{align} $ | (36) |
|
图 1 高速无菌饮料灌装现场和喷嘴 |
其中:
目标压力值定义为
此实验为由7个比例阀控制系统组成的多智能体系统, 其中智能体被分为
|
图 2 喷嘴压力控制系统的通讯拓扑图 |
实验结果如图 3~图 5所示. 从图 3和图 4中可以看出, 在开始的瞬间误差较大, 但随后跟随者的跟踪误差随着迭代步数的增加而迅速地收敛到0附近. 从图 5中可知, 其触发时刻是间断的, 从而验证了所设计的死区控制器有效避免了触发器的类Zeno现象[13], 其中各个智能体的触发次数分别是30、37、27、40、44、43、28, 平均触发次数为35.57. 相比于文献[5, 8-10]中的算法, 不但实现了双向一致性跟踪, 还可以减少64.43 %的通讯资源, 由此可知, 本文所设计的控制协议具有较好的节能效果和控制性能.
|
图 3 喷嘴压力控制系统双向一致性跟踪效果 |
|
图 4 喷嘴压力控制系统双向一致性跟踪误差 |
|
图 5 第355次迭代时事件触发时刻 |
本文针对一类未知动力学模型的周期性运行的多智能体系统, 设计了一种事件触发无模型迭代学习双向一致性控制策略. 该控制策略考虑了被控系统的合作与竞争关系, 并仅利用其输入输出数据构建了动态线性化数据模型, 设计了事件触发控制条件和死区控制器, 避免了类Zeno行为. 同时, 对该控制策略的收敛性进行了严格证明. 仿真结果也进一步验证了该控制策略的正确性. 在未来研究中将该控制策略扩展到未知模型多输入多输出多智能体系统是一个具有挑战性的课题.
| [1] |
Hui Y, Chi R H, Huang B, et al. 3-D learning-enhanced adaptive ILC for iteration-varying formation tasks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(1): 89-99. DOI:10.1109/TNNLS.2019.2899632 |
| [2] |
Jin S T, Li C, Ren Y, et al. Model-free adaptive formation control for unknown heterogeneous nonlinear multi-agent systems[J]. Control and Decision, 2020, 35(6): 1519-1524. |
| [3] |
Jiang H, He H B. Data-driven distributed output consensus control for partially observable multiagent systems[J]. IEEE Transactions on Cybernetics, 2019, 49(3): 848-858. DOI:10.1109/TCYB.2017.2788819 |
| [4] |
Wang S Y, Duan J J, Shi D, et al. A data-driven multi-agent autonomous voltage control framework using deep reinforcement learning[J]. IEEE Transactions on Power Systems, 2020, 35(6): 4644-4654. DOI:10.1109/TPWRS.2020.2990179 |
| [5] |
Bu X H, Yu Q X, Hou Z S, et al. Model free adaptive iterative learning consensus tracking control for a class of nonlinear multiagent systems[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(4): 677-686. DOI:10.1109/TSMC.2017.2734799 |
| [6] |
Dai X S, Wang C, Tian S P, et al. Consensus control via iterative learning for distributed parameter models multi-agent systems with time-delay[J]. Journal of the Franklin Institute, 2019, 356(10): 5240-5259. DOI:10.1016/j.jfranklin.2019.05.015 |
| [7] |
Hock A, Schoellig A P. Distributed iterative learning control for multi-agent systems[J]. Autonomous Robots, 2019, 43(8): 1989-2010. DOI:10.1007/s10514-019-09845-4 |
| [8] |
Wang Y C, Li H F, Qiu X J, et al. Consensus tracking for nonlinear multi-agent systems with unknown disturbance by using model free adaptive iterative learning control[J]. Applied Mathematics and Computation, 2020, 365: 124701. DOI:10.1016/j.amc.2019.124701 |
| [9] |
Li C J, Liu G P. Data-driven consensus for non-linear networked multi-agent systems with switching topology and time-varying delays[J]. IET Control Theory & Applications, 2018, 12(12): 1773-1779. |
| [10] |
Ren Y, Hou Z S. Robust model-free adaptive iterative learning formation for unknown heterogeneous non-linear multi-agent systems[J]. IET Control Theory & Applications, 2020, 14(4): 654-663. |
| [11] |
Chi R H, Hou Z S, Huang B. Optimal iterative learning control of batch processes: From model-based to data-driven[J]. Acta Automatica Sinica, 2017, 43(6): 917-932. |
| [12] |
Ding L, Han Q L, Ge X H, et al. An overview of recent advances in event-triggered consensus of multiagent systems[J]. IEEE Transactions on Cybernetics, 2018, 48(4): 1110-1123. DOI:10.1109/TCYB.2017.2771560 |
| [13] |
Dong T, Li X L, Zhao D D. Event-triggered consensus of third-order discrete-time multi-agent systems[J]. Acta Automatica Sinica, 2019, 45(7): 1366-1372. |
| [14] |
Li X W, Tang Y, Karimi H R. Consensus of multi-agent systems via fully distributed event-triggered control[J]. Automatica, 2020, 116: 108898. DOI:10.1016/j.automatica.2020.108898 |
| [15] |
Hu W F, Yang C H, Huang T W, et al. A distributed dynamic event-triggered control approach to consensus of linear multiagent systems with directed networks[J]. IEEE Transactions on Cybernetics, 2020, 50(2): 869-874. DOI:10.1109/TCYB.2018.2868778 |
| [16] |
Ding D R, Wang Z D, Han Q L. Neural-network-based consensus control for multiagent systems with input constraints: The event-triggered case[J]. IEEE Transactions on Cybernetics, 2020, 50(8): 3719-3730. DOI:10.1109/TCYB.2019.2927471 |
| [17] |
Li H F, Wang Y C, Zhang H G. Data-driven-based event-triggered tracking control for non-linear systems with unknown disturbance[J]. IET Control Theory & Applications, 2019, 13(14): 2197-2206. |
| [18] |
Lin N, Chi R H, Huang B, et al. Event-triggered nonlinear iterative learning control[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(11): 5118-5128. DOI:10.1109/TNNLS.2020.3027000 |
| [19] |
Chen J N, Hua C C, Guan X P. Fast data-driven iterative event-triggered control for nonlinear networked discrete systems with data dropouts and sensor saturation[J]. Journal of the Franklin Institute, 2020, 357(13): 8364-8382. DOI:10.1016/j.jfranklin.2020.03.020 |
| [20] |
Altafini C. Consensus problems on networks with antagonistic interactions[J]. IEEE Transactions on Automatic Control, 2013, 58(4): 935-946. DOI:10.1109/TAC.2012.2224251 |
| [21] |
Wang W, Wang L, Huang C. Guaranteed cost bipartite formation problem of multi-agent systems with impulse control[J]. Control and Decision, 2021, 36(1): 180-186. |
| [22] |
Zhang H G, Cai Y L, Wang Y C, et al. Adaptive bipartite event-triggered output consensus of heterogeneous linear multiagent systems under fixed and switching topologies[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(11): 4816-4830. DOI:10.1109/TNNLS.2019.2958107 |
| [23] |
Peng Z N, Hu J P, Shi K B, et al. A novel optimal bipartite consensus control scheme for unknown multi-agent systems via model-free reinforcement learning[J]. Applied Mathematics and Computation, 2020, 369: 124821. DOI:10.1016/j.amc.2019.124821 |
| [24] |
Bu X H, Wang Q F, Hou Z S, et al. Data driven control for a class of nonlinear systems with output saturation[J]. ISA Transactions, 2018, 81: 1-7. DOI:10.1016/j.isatra.2018.07.009 |
| [25] |
Shi J, Gao F R, Wu T J. Integrated design and structure analysis of robust iterative learning control system based on a two-dimensional model[J]. Industrial & Engineering Chemistry Research, 2005, 44(21): 8095-8105. |
2022, Vol. 37
