控制与决策  2019, Vol. 34 Issue (10): 2085-2094  
0

引用本文 [复制中英文]

张超, 严洪森. 永磁同步电机调速系统的多维泰勒网逆控制[J]. 控制与决策, 2019, 34(10): 2085-2094.
[复制中文]
ZHANG Chao, YAN Hong-sen. Multi-dimensional Taylor network inverse control of speed variable system for permanent magnet synchronous motor[J]. Control and Decision, 2019, 34(10): 2085-2094. DOI: 10.13195/j.kzyjc.2018.0182.
[复制英文]

基金项目

国家自然科学基金项目(61673112, 60934008);中央高校基本科研业务费专项资金项目(2242017K10003, 2242014K10031);江苏省高校优势学科建设工程项目;河南省重点研发与推广专项项目(182102210257);河南省高等学校重点科研项目(16A120011);河南工学院高层次人才科研启动基金项目

作者简介

张超(1983-), 男, 讲师, 博士生, 从事系统辨识、自适应控制的研究, E-mail: zhangchao915@foxmail.com;
严洪森(1957-), 男, 教授, 博士生导师, 从事知识化制造、多维泰勒网优化控制等研究, E-mail: hsyan@seu.edu.cn

通讯作者

张超, E-mail: zhangchao915@foxmail.com

文章历史

收稿日期:2018-02-07
修回日期:2018-07-13
永磁同步电机调速系统的多维泰勒网逆控制
张超 1,2,3, 严洪森 1,3     
1. 东南大学 自动化学院,南京 210096;
2. 河南工学院 计算机科学与技术系,河南 新乡 453003;
3. 东南大学 复杂工程系统测量与控制教育部重点实验室,南京 210096
摘要:针对永磁同步电机(PMSM)的高性能控制问题, 在充分考虑时变特性、不确定性以及测量噪声等随机因素的基础上, 通过PMSM的逆系统将被控对象补偿成为具有线性传递关系的系统, 提出一种基于改进自适应逆控制的控制方案.采用矢量控制的双闭环控制结构, 将多维泰勒网逆控制方法引入速度环.首先, 对PMSM数学模型的可逆性进行证明以解决非线性系统逆建模的存在性问题; 然后, 建立新颖的动态网络化控制器——多维泰勒网(MTN), 其具有结构简单、计算复杂度低的优点; 最后, 为了实现高精度的速度控制, 将3个MTN分别作为实现系统建模的自适应模型辨识器、逆建模的自适应逆控制器和噪声干扰消除的非线性自适应滤波器, 并将PMSM的动态响应控制和消除干扰的控制分为相对独立的过程进行, 同时实现最优控制.仿真结果表明, 所提出控制方案能够实现PMSM伺服系统精确的速度控制, 具有良好的跟踪性能和较强的抗干扰能力.
关键词多维泰勒网    永磁同步电机    系统辨识    自适应逆控制    非线性滤波器    
Multi-dimensional Taylor network inverse control of speed variable system for permanent magnet synchronous motor
ZHANG Chao 1,2,3, YAN Hong-sen 1,3     
1. School of Automation, Southeast University, Nanjing 210096, China;
2. Department of Computer Science and Technology, Henan Institute of Technology, Xinxiang 453003, China;
3. MOE Key Laboratory of Measurement and Control of Complex Systems of Engineering, Southeast University, Nanjing 210096, China
Abstract: Aiming at the high performance control problem of the permanent magnet synchronous motor (PMSM), with the full consideration of its uncertainty, time-varying characteristics, measurement noise and other stochastic factors, a control scheme based on improved adaptive inverse control is proposed to compensate the controlled object to be a system with linear transfer relation by using the inverse system of the PMSM. A double closed-loop control structure under vector control is adopted to introduce the inverse control method of the multidimensional Taylor network (MTN) into the velocity loop. Firstly, the invertibility of the PMSM mathematical model is proved to solve the existence problem of the inverse model of the nonlinear system. A novel and dynamic network controller, called the MTN, is then established with the advantages of simple structure and low computational complexity. After that, in order to achieve the high precision of speed control, three MTNs are used respectively as an adaptive model identifier for system modeling, an adaptive inverse controller for inverse modeling and a nonlinear adaptive filter for eliminating the noise disturbance to separate the control of the object dynamic response and disturbance cancellation into relatively independent processes. An optimal control can be realized at no cost of the other. Finally, the simulation results show that the proposed control scheme can realize accurate speed control of the PMSM servo system, with good tracking performance and strong anti-interference ability.
Keywords: multi-dimensional Taylor network    permanent magnet synchronous motor    system identification    adaptive inverse control    nonlinear filter    
0 引言

由于具有高精度、高可靠性和宽调速范围的优良性能, 永磁同步电机(PMSM)广泛应用于航空航天、航海领域中的伺服控制.传统的PMSM矢量控制是一种较为常见的方法, 它高度依赖于电机的参数.但是, 在实际应用中电机参数是随着时间而变化的.此外, 还需要克服包括PMSM及其负载在内的广义控制对象的不确定性、随机性和非线性等因素的影响[1].因此, 现有方法的实际控制效果无法达到理论分析的“完美”结果.经典控制策略, 如PID控制[2], 具有简单方便、易于实现的优点, 然而, 其控制策略仍由线性模型设计得到, 因此难以实现高精度的控制.现代控制策略是在控制对象模型和扰动模型已知的情况下设计的, 如自适应控制[3]、变结构控制[4]和反步法[5]等, 其缺点是抗参数摄动性能不能满足要求, 所设计的控制器往往较为复杂.微分几何[6]是非线性系统分析和设计的有效工具, 但有关讨论必须在几何领域进行, 所涉及的数学工具复杂而抽象.

自适应逆控制[7]作为非线性反馈线性化方法中一种更直观、易理解的方法, 在具有扰动的线性复杂系统的控制中起着重要作用.其基本思想是利用被控对象的逆系统将被控对象补偿成一个具有线性传递关系的系统.随着模糊控制和神经网络等非线性建模方法的发展, Plett[8]利用NARX回归神经网络作为辨识器和控制器, 又将自适应逆控制扩展到非线性对象的控制中.但其缺点是: 1)网络的输入/输出延迟阶数和隐层神经元个数必须事先确定; 2)处理随机干扰时效果并不理想.

本文在综合考虑PMSM的不确定性、时变特性以及量测噪声等随机因素的基础上, 提出一种基于多维泰勒网(MTN)的改进自适应逆控制方案, 它可以在不影响被控对象动态特性的情况下消除噪声干扰, 也就是说, 最优的噪声干扰控制不会牺牲动态控制的最优.同时, 由严洪森教授提出的MTN能够很好地替代传统神经网络对动态系统进行建模[9-10]和控制[11-13]. MTN本质上是一个多项式类型的非线性自回归滑动平均模型. MTN的多项式函数由一些线性项和非线性项组成, 因此, 其模型可以表示一般意义下的状态动力学特性, 从而获得系统行为的显性描述.此外, MTN还具有结构简单、计算速度快的优点.

MTN逆控制方法充分考虑了PMSM的特殊性, 具体表现在以下3个方面.

1) 针对其模型未知的动力学特性和时变特性, 采用高阶累积量[14]的变遗忘因子递推最小二乘(HOC-VFF-RLS)算法来提高MTN辨识器的辨识能力.将变遗忘因子递推最小二乘(VFF-RLS)算法用于电机模型的时变参数辨识, 可加强当前数据的影响及减少历史数据的影响, 实现增强辨识器跟踪能力的目标, 解决直接使用RLS会出现的“数据饱和”现象.但该算法存在“取舍”问题, 即遗忘因子越小, 系统的跟踪能力越强, 同时受到噪声的影响也越大; 遗忘因子越大, 系统跟踪能力越弱, 受到噪声的影响也越小.鉴于此, 利用高阶累积量的盲高斯性质, 使得算法对噪声信号具有免疫功能, 故本文利用HOC-VFF-RLS算法进行权值更新, 以提高模型的准确度和削弱噪声的影响.另外, 为了降低所提出方法的计算复杂度, 利用权衰减算法[15]来剪除MTN辨识器和逆控制器的冗余回归项.

2) 为了满足PMSM的实时控制要求, 设计线性强化的自适应变步长(LR-AVS)算法来实现学习步长的自动选择, 加快收敛速度, 减少迭代次数.梯度下降法是常见的学习算法, 但固定步长的梯度法存在收敛速度慢、易陷入局部极小值的缺点.鉴于此, 本文利用强化学习的思想设计LR-AVS算法, 产生施加于系统的“奖”、“罚”信号来寻求自适应变步长算法, 实现步长自动选择.该算法实际上是利用并记忆了梯度方向的符号变化信息, 即方向相反时对其罚, 方向相同时对其奖.同时, 由于可从MTN辨识器得到被控对象精确的灵敏度信息, MTN逆控制器的权值调整将变得更加平滑.

3) 为了减小量测噪声等随机因素的影响, 引入自适应滤波器的预测原理来消除噪声干扰, 利用有用信号之间的相关性和噪声信号之间的不相关性来设计MTN滤波器.通过集员归一化LMS(SM-NLMS)算法[16]进行权值训练以实现精确控制.由于鲁棒性和计算复杂性较低, 最小均方(LMS)算法得到了广泛的应用, 其主要缺点是收敛速度过度依赖输入信号相关矩阵的自相关函数, 因此, 收敛速度更快且计算复杂度更低的归一化LMS(NLMS)算法成为新的选择.但由于NLMS算法对数据并不选择, 虽然其收敛速度较快, 但却以更高失调为代价, 这不满足PMSM高控制精度的要求.鉴于此, 为了平衡快速收敛与最小失调之间的矛盾, 集员归一化(SM-NLMS)算法采用数据选择性更新方法, 规定了估计误差的界. SM-NLMS算法的形式与常规NLMS算法类似, 但推导更新方程时两者的思想是不相同的, 即需对NLMS算法中的固定步长进行合理选择, 以便满足期望的集员更新.

综上所述, 本文提出的MTN逆控制方法实用灵活, 同时, 基于MTN的控制方案对于实时性要求较高的应用也是很有前景的.

本文首先推导出状态方程形式的PMSM数学模型, 并对其模型的可逆性进行证明; 其次, 介绍新型动态网络化控制器多维泰勒网, 并强调由于其结构简单而带来出色的实时性能; 再次, 将重点转移到非线性时变系统的建模以及确定网络结构和初始权值的方法, 讨论对象动态特性的自适应逆控制和自适应噪声干扰消除; 最后形成整体的MTN逆控制方案.仿真结果表明了本文方法的有效性.

1 系统分析 1.1 永磁同步电机的数学模型

PMSM的数学模型[17]由电压方程、转矩方程和运动方程组成.为了便于研究, 将电压方程和运动方程转化成状态方程的形式, 即

(1)

其中: uduq是对应于d轴和q轴的定子电压分量; idiq是定子电流分量; Rs是定子电阻; L是电机的交直轴电感, 本文选用表贴式PMSM, 故电机的直、交轴电感Ld=Lq=L; ωr是转子角频率; ψf是转子在定子上的耦合磁链; pn是电机极对数; J是转动惯量; TL是负载转矩; B是与转速成正比的粘滞系数.

需要注意的是, 在通常情况下, LdLq与磁链是线性相关的.但考虑到磁饱和效应, 所以不能忽视它们与d轴和q轴磁链的非线性关系, 可定义为

(2)

显然, 要得到电感LdLq, 就必须知道直轴和交轴的磁链随电流的非线性变化特性.在实际电机运行过程中, 电机的d轴和q轴电感根据运行工作点的不同会有所改变, 而参数变化对电机的控制效果也会产生影响.当前, 电机参数通常采用有限元方法进行计算[18].所以, 本文在已通过有限元法计算得到的交、直轴电感数据中, 利用分段线性化方法计算对应的d轴和q轴电感.

本文设计的控制方案采用电流、速度双闭环矢量控制模式, 电流环采用经典的PID控制方法, 速度环采用MTN逆控制方法.为了实现转矩控制的线性化和解耦控制, 采用id =0的控制策略[17], 即把定子电流矢量始终控制在d轴上, 定子电流无q轴分量.根据PMSM的电磁转矩公式, 电磁转矩只与定子电流的幅值成正比.

1.2 永磁同步电机逆系统的存在性证明

定义1[19]  设给定系统Σ: uy, 若存在一个对应的系统Π: rz, 在系统Π的初值满足系统Σ的初值条件下, 当u(k)=z(k)时, 如果有等式y(k)=r(k)成立, 则称系统Π为系统Σ的右逆系统, 进而称系统Σ为右可逆的.

引理1[19]  对于一般的非线性系统

(3)

在邻域(x0, u0)内可逆的充分必要条件是在此邻域内存在相对阶α.其中: x=[x1, x2, ..., xn]TRn表示系统的状态变量; n是状态变量的维数, 也是状态方程的个数; uy分别表示系统的输入和输出; f(·)和h(·)表示局部解析的非线性函数.

定理1  由式(1)构成的PMSM系统, 其逆系统存在.

证明  对于式(1)表示的状态方程, 输入变量为u=iq, 输出变量为y=ωr, 状态变量为x=[x1, x2, x3]T=[id, iq, ωr]T.

根据相对阶的定义, 对输出函数y=ωr求导, 使其显含系统的输入iq, 即

y/u≠0, 故系统的相对阶是存在的, 且α=1.

根据引理1可得, 由式(1)构成的PMSM系统, 其逆系统存在.

2 控制方案设计 2.1 新型动态网络化控制器

网络化控制器是自适应逆控制的基础, 它应当适用于对象建模、逆建模和自适应滤波.此外, PMSM是一个高度耦合、复杂的非线性对象, 因此需要非线性的网络化控制器, 而且它还必须满足控制精度和实时性的要求.

本文建立了适合未知机理的一般非线性系统建模的MTN模型, 如图 1所示, 该模型具有结构简单、计算速度快的优点. MTN本质上是一个多项式类型的非线性自回归滑动平均模型.根据多元泰勒公式的原理, 如果某函数在某点邻域处处m+1阶可导, 则该函数在该点展开式为变量幂级数不大于m次的形式.因此, 基于单输入单输出的MTN模型, 可以将n维系统的一般动力学方程表示为

(4)
图 1 多维泰勒网模型

其中: f(·)表示用MTN模型描述的非线性函数, 其基本思想是用简单函数逼近复杂函数; wt是第t个变量乘积项之前的权值; N(n, m)是该展开式的总项数; λt, i是第t个变量乘积项中变量xi的幂次.

引理2[20]  任何定义于一个闭区间的连续函数可以用多项式函数任意准确地逼近.

引理3[21]  对于定义于一个闭区间的连续函数f(x1, x2, ..., xn), 可以用逼近.其中: N(n, m)为逼近展开式中乘积项的总项数, wt为逼近展开式中第t个乘积项之前的权值, λt, i为展开式中第t个乘积项中变量xi的幂次.

正如所见, MTN采用前向单中间层结构, 包括输入层、中间层和输出层.只要N(n, m)充分大, 它便能以足够的精度逼近任意模型.其主要特征是尽管式(4)是系统输入输出的非线性函数, 但模型参数是线性关系的.同时, 通过抽头延迟将系统的动力学特性引入到网络输入端, 从而形成动态的网络化控制器.

表 1比较了MTN和多层感知神经网络(MLP)在一次迭代中的计算复杂度[22], 并强调了由于其结构简单而带来的出色的实时性能.

表 1 MLP和MTN的计算复杂度比较

n=3且m=1时, PID控制器是MTN的特殊形式[11].因此, 只有一次项的MTN可以直接在电流环中替代经典的PID控制器.

表 1中: nl表示MLP{n0, n1, ..., nL-1, nL}的第l层节点数, l=0, 1, ..., L; n0n1分别表示MLP和MTN输入和输出层的节点数; 而神经节点的激活函数采用f(·)=tan(·).

2.2 永磁同步电机的自适应逆控制系统

PMSM调速系统是一个不确定的非线性时变系统, 与电机参数变化、电磁转矩中包含的纹波转矩和齿槽转矩等脉动转矩及端部效应等多种因素相关.同时, 电机运行环境十分复杂, 存在各种噪声干扰, 包括电磁干扰、传感器的测量噪声等, 如何更好地处理噪声干扰下的模型辨识和实时控制是必须要解决的问题.

MTN逆控制的总体方案如图 2所示.在充分考虑PMSM特殊性的基础上, 设计由3个MTN组成的控制方案:一个是模型辨识器I, 它建立了非线性时变动力学模型, 将被控对象的灵敏度信息提供给逆控制器; 另外两个是自适应逆控制器C和非线性自适应滤波器X.控制方案的实现步骤分为以下3个阶段.

图 2 多维泰勒网逆控制结构

1) 自适应系统辨识阶段.

利用时变对象的离线/在线、输入/输出数据来训练模型辨识器I, 收敛后IP.离线数据对应离线调试阶段(确定辨识器和控制器的初始权值/网络结构), 分为输入数据和输出数据.离线实验需要大量的训练样本来覆盖整个工作范围, 这些训练样本取自于PMSM模型不同工况下的采样数据.同样, 在线数据对应实际运行阶段, 也分为输入数据和输出数据.

递推最小二乘法(RLS)适合于在线辨识, 但是局限于定常系统的参数辨识, 当系统为时变系统时, 直接使用RLS会出现“数据饱和”现象.考虑到PMSM的时变特性, 本文首先提出基于MTN的变遗忘因子递推最小二乘(VFF-RLS)算法[23], 用于电机模型的时变参数辨识, 加强当前数据影响, 减少历史数据的影响, 增强辨识器的跟踪能力; 然后将高阶累积量引入到变遗忘因子递推最小二乘(HOC-VFF-RLS)算法中进行权值更新, 以提高模型的准确度和削弱噪声的影响.

定义目标函数

(5)

其中β为用来估计“新”、“老”数据对RLS算法影响的遗忘因子, 其基本思想是靠近k+1时刻的数据设定较大的权重, 远离k+1时刻的数据给予较小的权重.大量仿真实验表明:遗忘因子β值越小, 系统的跟踪能力越强, 但同时受到噪声的影响也越大; β值越大, 系统跟踪能力越弱, 但受到噪声的影响也越小, 且收敛时估计误差也较小.综合考虑, 本文设定β的取值范围是0.9 < β < 1.

同时, 考虑到采集的电机转速数据往往是包含随机噪声和有色噪声的, 且高阶累积量具有盲高斯特性, 能够克服噪声对算法稳定性的影响, 因此, 本阶段将高阶累积量引入VFF-RLS算法, 得到HOC-VFF-RLS算法.

设定

以及

由式(4)有

JI/wI=0, 可得到基于MTN的HOC-VFF-RLS算法, 由如下算法1表示.

算法1  基于MTN的HOC-VFF-RLS算法.

Step 1:初始化. wI(τ)的初始权值设为wI(0)=0;P(τ)的初始值设为P(0)=δI, 其中: δ为较大的正常数, I为单位矩阵.

Step 2:计算辨识估计误差

Step 3:计算权值迭代参数

其中: K(τ)为增益向量, P(τ)为输入信号自相关矩阵的逆, β(τ)为遗忘因子.在HOC-VFF-RLS算法中, VFF-RLS算法的遗忘因子根据输入信号的四阶累积量进行即时调整, ξζ为调整常数.

Step 4:权值迭代

Step 5:重复Step 2~Step 4, 直到满足终止条件.

此外, 为了确保MTN辨识器I和逆控制器C具有最小的结构, 能够最大程度上满足实时性要求, 在离线训练阶段, 采用权衰减法消除它们中间层的冗余回归项.因此, 式(5)可改写为

(6)

其中:右边第1项用来衡量网络的性能, 在最简单的情况下, 其为k+1时刻所有训练样本集的误差平方和; 第2项用来衡量网络的规模, 其和扩展到所有连接权重.对于MTN, 由式(4)有NI=N(n, m). γI表示模型复杂性项的相对重要性; w0为固定值, 称之为基准权值.

本文设计的辨识和控制策略分为离线和在线两个阶段的初衷是: ①对于辨识策略, 在离线阶段, 因为没有实时性的要求, 所以可以多次重复地迭代训练, 即最小化由式(6)表示的目标函数. MTN辨识器在经过多次“充分地”训练后, 理论上所有冗余权值或中间节点都可被剪除, 从而实现最优结构(计算复杂度最低), 为满足在线辨识(最小化由式(5)表示的目标函数)的高实时性要求打下基础. ②对于控制策略, 首先要克服一般自适应控制在过渡阶段难以保证平稳的困难, 同时MTN逆控制中的反馈是局部反馈, 属于“开环控制”的范畴, 保证控制系统在初始状态下的稳定性是关键所在, 故离线逆建模是在线逆建模的前导且必不可少的阶段, 用来确定逆控制器初始权值, 以确保自适应初始过程的稳定性和快速响应; 并可引入剪枝方法来改善系统泛化能力, 确定逆控制器网络结构, 以确保控制系统满足实时性的要求.

经过一定次数的学习, MTN中间层的某些权值将逐步衰减到0附近.在离线训练结束后, 会对所有中间节点进行“审核”, 判断是否为冗余节点.如果一个中间节点的权值接近于零(满足剪枝条件), 则可以删除该冗余节点, 以此类推, 剩下的项即为有效回归项.通过多次“充分地”迭代训练, 最后, 即可得到精简的MTN, 这有助于硬件实现和工程应用.网络结构和初始权值可以一同确定.

2) 自适应逆建模阶段.

通过BPTM算法利用误差eC来训练自适应逆控制器C, 收敛后CI-1.对于自适应MTN逆控制器, 其权值随着误差函数的负梯度方向进行更新, 有

(7)

一般情况下M=1, 且权值的修正正比于负梯度, 即

(8)

其中ye/wC表示被控对象输出相对于其输入的灵敏度.

由于精确的数学模型在许多实际系统中常常是未知的, 灵敏度信息也就不能直接从非线性系统的实际输出计算得出.对于MTN逆控制方法, 既然MTN辨识器已经通过离线/在线数据辨识得到, 于是.因此, 式(8)可改写为

(9)

需要说明的是, 许多实际应用只是简单地忽略了这种灵敏度或者使用直接控制的方法, 而另一些应用则使用对象响应符号变化作为灵敏度的简单方法.然而, 在本文中由于可以通过MTN辨识器得到被控对象精确的灵敏度信息, MTN逆控制器的权值调整相对于无法得到系统灵敏度的情况就变得更加平滑.

此外, 考虑到PMSM的时变因素, 针对固定步长的梯度下降法会出现收敛速度慢、易陷入局部极小值的缺点, 本文对在线学习算法进行深入的研究和讨论, 即在本阶段通过设计线性强化的自适应变步长(LR-AVS)算法来解决这些问题.其基本思想是:利用强化学习的思想寻求自适应变步长算法, 以实现对步长进行自动选择, 加快算法的收敛速度, 减少收敛的迭代次数.

强化学习[24]是把学习看作试探评价过程, 系统选择一个动作作用于环境, 环境接受该动作后状态发生变化, 同时产生一个强化信号(奖或惩)反馈给系统, 系统再根据强化信号和环境当前状态选择下一动作信号.

具体表现为:如果连续两次迭代使得梯度方向ΔJC的符号相反, 则意味着下降过头, 步长太大, 应减小步长; 相反, 如果连续两次迭代使得梯度方向ΔJC的符号相同, 则意味着下降慢了, 还没有到达极小点, 应增加步长.

本文设计的LR-AVS算法为

(10)

其中κ为常数, 范围在[0.001~0.003]区间.该算法实际上是利用并记忆了梯度方向ΔJC的符号变化信息, 即方向相反时对其罚, 方向相同时对其奖.

3) 自适应噪声干扰消除阶段.

如果不作处理, 则对象噪声和随机干扰就会不受抑制地出现在逆控制器的输入端, 这将大大降低自适应过程的稳定性并严重影响控制精度.因此, 在本阶段引入集员归一化LMS(SM-NLMS)算法来实现精确控制, 即通过自适应滤波器的预测原理, 利用含有噪声信息的误差eX来消除控制干扰和量测噪声.换言之, 通过有用信号之间的相关性和噪声信号之间的不相关性, MTN滤波器能够实现噪声消除的目的.这是因为噪声在每个采样点都是不相关的, 自适应滤波器不能对白噪声进行估计, 所以MTN滤波器的输出是对有用信号最好的估计, 滤波输出信号中的噪声会大大减小, 从而达到消除噪声的目的.

非线性自适应MTN滤波器可以表示为

(11)

其中: y'vi(k)=yv(k-Γ-i-1), i=1, 2, ..., n; Γ表示延迟的个数; λt, i与式(4)中的定义一致.

常见的自适应滤波算法需在收敛速度与稳态误差之间进行折中, 且一般倾向于动态性能, 这种特性对于收敛后的平稳环境并不一定是优点, 也不满足PMSM高控制精度的需求. SM-NLMS算法的形式与常规归一化LMS(NLMS)算法相似, 为满足期望的集员更新, 使集合内的任意解都满足有界误差的规定, 需对下式表示的NLMS算法的μ(k)进行合理选择:

(12)

此外, 由于采用数据选择性更新方法, SM-NLMS算法还降低了自适应滤波的计算复杂度.

SM-NLMS算法的核心思想是:检验上一时刻的估计wX(k)是否位于约束集π(k)的外面, 即|yv (k)-wXT(k)y'v(k)|>φ.此时, 误差信号的模值大于给定的界, 新的估计wX(k+1)需以最短距离更新到π(k)的最近边界, 即SM-NLMS算法在||wX(k+1)- wX(k)||2条件下, 使wX(k+1)∈π(k)最小化.通过将wX(k)正交投影到π(k)的最近边界上完成更新.

具体表现为:当eX(k)=yv(k)-wXT(k)y'v(k)>φ或者eX(k)=yv(k)-wXT(k)y'v(k) < -φ时, 才更新MTN滤波器权值, 并且后验误差为

(13)

其中εX(k)=±φ, 使权值更新到π(k)中最近的边界.由于γ的唯一作用是进行调整, 而且它的值很小, 将其忽略以后, 式(13)可改写为

(14)

由此, 式(12)中的可变步长μ(k)应为

(15)

其中: φ应在附近取值(由仿真经验), σn2是加性噪声的方差.需要注意的是, 如果选择φ=0, 则NLMS算法是SM-NLMS算法的特例.

由式(11)、(12)和(15)表示的算法称为集员归一化LMS MTN算法.

综上所述, MTN逆控制方法采用被控系统的逆模型作为串联控制器, 以开环方式控制被控对象的动态特性, 即前馈控制器C表示被控对象的逆.在充分考虑时变特性、不确定性以及测量噪声等随机因素的基础上, 最终实现了PMSM调速伺服系统的自适应MTN逆控制方案, 如图 3所示.

图 3 永磁同步电机的多维泰勒网逆控制方案

需要强调的是, 本文所提出的方案适用于辨识和控制任何具有可逆、未知和非线性函数的电气、机械系统, 如航天器的绳系系统、柔性机械臂、磁控式并联电抗器和液压位置伺服系统等.

3 仿真算例

为了验证所提出控制方案的有效性, 建立基于MTN逆控制的PMSM调速伺服系统的仿真模型, 如图 3所示.所选PMSM的参数如表 2所示, 其中L0为电机额定工况下的交直轴电感值.

表 2 永磁同步电机参数

电流环和速度环的采样时间分别为100 μs和1.5 ms.该方案考虑了PMSM模型的非线性、不确定和随机等因素, 如电感的分段线性化计算以及测量环节的量测噪声消除.根据式(2), 考虑到电机电感L在不同工作点是变化的, 所以PMSM模型是非线性的和不确定的, 需要通过MTN辨识器来建立精确的电机模型.同时, 为了更好地模拟PMSM的实际工作状态, 在电机转速测量环节加入量测噪声(均值为0、标准差为0.03的高斯白噪声).除此之外, 还可用于解决难以建模的时变和非线性因素, 包括:母线电压波动(图 3中直流电源VDC的波动)、电机参数变化(电感随饱和程度的变化以及电阻随温度、工作频率而变化)和运动部件老化引起的摩擦系数变化(参数B随时间的变化).

图 4展示了MTN逆控制方案跟踪阶跃信号的速度响应和误差, 并与RBF-PID控制方法[25]进行性能比较.

图 4 不同控制方法下跟踪阶跃信号速度响应和误差比较

在RBF-PID控制方法中, 采用3层RBF神经网络建立神经网络辨识器, 该神经网络选取4-20-1结构, 即4个输入层神经元、20个隐层神经元和1个输出层神经元, 其输入为(wv (k), wv (k-1), iq (k), iq (k-1))T; 网络权值的初始值在区间(-1, 1)中随机选择; 采用梯度下降法训练RBF神经网络, 在训练过程中, 学习因子为0.2, 动量因子为0.4; PID控制器的初始参数分别为kp=12、ki=0.15和kd=0.15, 其对应的学习因子分别为ηkp=0.5、ηki =0.5和ηkd =0.1.

在MTN逆控制方案中, 需设置3个MTN的参数:

1) 自适应MTN辨识器I, 采用HOC-VFF-RLS算法和权衰减法训练辨识器, 剪枝后的结构为4-10-1, 辨识器输入为(wr(k), wr(k-1), iq(k), iq(k-1))T, ξ=0.65、ζ=0.95、γI=0.995和w0=0.1, 训练结束后用于剪枝冗余权值的阈值为0.05.

在学习中最小化由式(6)表示的目标函数, 于是多维泰勒网的冗余权值将随着学习的进行逐步衰减到零附近, 因而可以被“剪除”, 这一特性常被称为剪枝特性.因为权值衰减是一个逐步渐变的过程, 所以剪枝动作不会发生在每一次符号改变, 只会发生在离线训练结束后.具体实现如下:

在“充分地”学习后, 对MTN网络中所有中间节点进行“审核”, 判断是否为冗余节点;

满足剪枝条件的冗余节点(权值小于0.05)会被剪除, 网络在保持学习精度的前提下精简结构.

需要说明的是, β的调整体现在离线阶段的快速学习, 当辨识器收敛后, 其值基本无变化(维持在1), 详见表 3.

表 3 辨识参数β的变化

2) 自适应MTN逆控制器C, 剪枝后的结构为4-8-1, 采用LR-AVS算法在线训练逆控制器, 输入为(wr*(k), wr(k), wr(k-1), iq(k))T, 初始学习因子ηC=0.15, κ =0.002.

3) 自适应MTN滤波器X, 选取4-12-1结构, 采用SM-NLMS算法训练滤波器, 输入为(wv(k-4), wv(k-5), wv(k-6), wv(k-7))T, 即Γ=4, φ =0.35.需要说明的是, μ的调整体现在滤波初期的快速收敛, 稳定后其值变化不大, 详见表 4.

表 4 辨识参数μ的变化

图 5展示了MTN逆控制的PMSM定子电流分量, 包括idiq和它们的参考值.

图 5 MTN逆控制的PMSM定子电流分量

图 6比较了不同控制方法下跟踪正弦信号的速度响应.显见, 基于MTN逆控制的永磁同步电机伺服系统是快速且稳定的, 与RBF-PID方法相比, 对负载变化有更强的适应性, 而且在稳态运行时几乎无静态误差, 可以实现精确的速度控制.

图 6 不同控制方法下跟踪正弦信号速度响应比较

由于易于调整和结构简单, PID控制是一种特别常见的控制方法.尽管其有着悠久的历史和广泛的应用, PID调节仍是学术界和工程领域的研究热点之一.然而, 在工业应用中被控系统的参数往往是时变的, 因此, 经典的PID控制和类PID控制方法在处理存在不确定因素和随机因素的系统时显得十分僵化.此外, 神经网络存在学习速度慢、泛化能力差的缺点.同时, 神经网络的设计需要一定的先验知识, 并且没有一套系统的方法来确定神经网络的拓扑结构.

图 7比较了不含滤波器的原始反馈信号和自适应MTN滤波器输出.结果表明, 自适应MTN滤波器在MTN逆控制方案中起着重要作用.

图 7 不含滤波器的原始反馈信号和自适应MTN滤波器输出比较
4 结论

本文充分考虑了永磁同步电机的不确定性、时变特性以及量测噪声等随机因素, 基于逆系统理论, 提出了永磁同步电机的多维泰勒网逆控制方案.

1) 证明了PMSM调速伺服系统的可逆性, 即MTN逆控制方法的可行性.

2) 采用矢量控制策略, 电流环采用经典的PI控制方法, 速度环采用MTN逆控制方法来提高跟踪性能和改进抗干扰能力.

3) 该逆控制方法引入了新型的动态网络化控制器(MTN), 分别作为模型辨识器、逆控制器和非线性自适应滤波器, 把建立电流环精确模型、实现逆建模和消除量测噪声等随机干扰分开为相对独立的过程进行.

4) 仿真结果表明, 本文提出的基于MTN的PMSM伺服控制方案具有良好的动、静态控制性能, 能够快速准确地跟踪不同输入信号的速度响应, 具有较强的鲁棒性、稳定性以及抗扰动能力.

参考文献
[1]
Verez G, Barakat G, Amara Y, et al. Impact of pole and slot combination on vibrations and noise of electromagnetic origins in permanent magnet synchronous motors[J]. IEEE Trans on Magnetics, 2015, 51(2): 1-4.
[2]
Zhang J. Design of a new PID controller using predictive functional control optimization for chamber pressure in a coke furnace[J]. ISA Trans, 2017, 67: 208-214. DOI:10.1016/j.isatra.2016.11.006
[3]
王宁, 孙竞超, 董诺, 等. 基于变伸缩域模糊系统的直接自适应控制[J]. 控制与决策, 2016, 31(7): 1321-1324.
(Wang N, Sun J C, Dong N, et al. Direct adaptive control via fuzzy systems with variable contraction -expansion factors[J]. Control and Decision, 2016, 31(7): 1321-1324.)
[4]
周涛. 基于一种新型趋近律的自适应滑模控制[J]. 控制与决策, 2016, 31(7): 1335-1338.
(Zhou T. Adaptive sliding control based on a new reaching law[J]. Control and Decision, 2016, 31(7): 1335-1338.)
[5]
于金鹏, 于海生, 林崇. 考虑铁损的异步电动机模糊自适应命令滤波反步控制[J]. 控制与决策, 2016, 31(12): 2189-2194.
(Yu J P, Yu H S, Lin C. Fuzzy approximation-based adaptive command filtered backstepping control for induction motors with iron losses[J]. Control and Decision, 2016, 31(12): 2189-2194.)
[6]
Zawadzki A. Application of local coordinates rectification in linearization of selected parameters of dynamic nonlinear systems[J]. COMPEL——The Int J for Computation and Mathematics in Electrical and Electronic Engineering, 2014, 33(4): 1819-1830.
[7]
Plett G L. Adaptive inverse control of unmodeled stable SISO and MIMO linear systems[J]. Int J of Adaptive Control and Signal Processing, 2002, 16(3): 243-272.
[8]
Plett G L. Adaptive inverse control of linear and nonlinear systems using dynamic neural networks[J]. IEEE Trans on Neural Networks, 2003, 14(2): 360-376.
[9]
林屹, 严洪森. 多尺度正负反馈交替论模型及其应用[J]. 控制理论与应用, 2016, 33(6): 879-888.
(Lin Y, Yan H S. The model of multi-scale alternate positive negative feedbackics and its applications[J]. Control Theory & Applications, 2016, 33(6): 879-888.)
[10]
张超, 严洪森. 基于最优结构多维泰勒网的含噪声非线性时变系统辨识[J]. 东南大学学报:自然科学版, 2017, 47(5): 1086-1093.
(Zhang C, Yan H S. Identification of nonlinear time- varying system with noise based on multi-dimensional Taylor network with optimal structure[J]. J of Southeast University: Natural Science Edition, 2017, 47(5): 1086-1093.)
[11]
Yan H S, Kang A M. Asymptotic tracking and dynamic regulation of SISO non-linear system based on discrete multi-dimensional Taylor network[J]. IET Control Theory & Applications, 2017, 11(9): 1619-1626.
[12]
Kang A M, Yan H S. Stability analysis and dynamic regulation of multi-dimensional Taylor network controller for SISO nonlinear systems with time-varying delay[J]. ISA Trans, 2018, 73: 31-39. DOI:10.1016/j.isatra.2017.12.001
[13]
严洪森.多维泰勒网优化控制[EB/OL]. (2017-07-25).http://automation.seu.edu.cn/Articles.aspx?id=3487.
(Yan H S. Multi-dimensional Taylor network optimal control[EB/OL]. (2017-07-25). http://automation.seu.edu.cn/Articles.aspx?id=3487.)
[14]
Xu Y, Dai S, Wu S, et al. Vital sign detection method based on multiple higher order cumulant for ultrawideband radar[J]. IEEE Trans on Geoscience and Remote Sensing, 2012, 50(3): 1254-1265.
[15]
Kuo R J, Wu P, Wang C P. An intelligent sales forecasting system through integration of artificial neural networks and fuzzy neural networks with fuzzy weight elimination[J]. Neural Networks, 2002, 15(6): 909-925.
[16]
Li Y, Wang Y. Sparse SM-NLMS algorithm based on correntropy criterion[J]. Electronics Letters, 2016, 52(17): 1461-1463. DOI:10.1049/el.2016.1944
[17]
张兴华, 唐其太. 考虑参数和负载不确定性的内置式永磁同步电机自适应反步控制[J]. 控制与决策, 2016, 31(8): 1509-1512.
(Zhang X H, Tang Q T. Adaptive backstepping control of interior permanent magnet synchronous motors considering parameter and load uncertainties[J]. Control and Decision, 2016, 31(8): 1509-1512.)
[18]
Kazerooni M, Hamidifar S, Kar N C. Analytical modelling and parametric sensitivity analysis for the PMSM steady-state performance prediction[J]. IET Electric Power Applications, 2013, 7(6): 586-596.
[19]
Devasia S, Paden B. Stable inversion for nonlinear nonminimum-phase time-varying systems[J]. IEEE Trans on Automatic Control, 1998, 43(2): 283-288. DOI:10.1109/9.661082
[20]
Klambauer G. Mathematical analysis[M]. New York: Marcel Dekker INC, 1975: 236-237.
[21]
林屹, 严洪森, 周博. 基于多维泰勒网的非线性时间序列预测方法及其应用[J]. 控制与决策, 2014, 29(5): 795-801.
(Lin Y, Yan H S, Zhou B. Nonlinear time series prediction method based on multi-dimensional Taylor network and its applications[J]. Control and Decision, 2014, 29(4): 795-801.)
[22]
Patra J C, Kot A C. Nonlinear dynamic system identification using Chebyshev functional link artificial neural networks[J]. IEEE Trans on Systems, Man, and Cybernetics, Part B: Cybernetics, 2002, 32(3): 505-511.
[23]
Chu Y J, Chan S C. A new local polynomial modeling-based variable forgetting factor RLS algorithm and its acoustic applications[J]. IEEE/ACM Trans on Audio, Speech, and Language Processing, 2015, 23(10): 2059-2069.
[24]
Yasini S, Naghibi Sitani M B, Kirampor A. Reinforcement learning and neural networks for multi-agent nonzero-sum games of nonlinear constrained-input systems[J]. Int J of Machine Learning and Cybernetics, 2016, 7(5): 967-980.
[25]
Rezazadeh A, Sedighizadeh M. A modified adaptive wavelet PID control based on reinforcement learning for wind energy conversion system control[J]. Advances in Electrical and Computer Engineering, 2010, 10(2): 153-159. DOI:10.4316/aece.2010.02027