控制与决策  2020, Vol. 35 Issue (5): 1025-1038  
0

引用本文 [复制中英文]

徐正光, 王目树, 郭玲利. 基于模式运动的一类生产过程调节性能与聚类参数关系[J]. 控制与决策, 2020, 35(5): 1025-1038.
[复制中文]
XU Zheng-guang, WANG Mu-shu, GUO Ling-li. Relationship between clustering parameters and regulation performance of a class of production processes based on pattern moving[J]. Control and Decision, 2020, 35(5): 1025-1038. DOI: 10.13195/j.kzyjc.2018.1142.
[复制英文]

作者简介

徐正光(1959-), 男, 教授, 博士生导师, 从事复杂生产过程的建模与控制、模式识别、图像处理等研究, E-mail: xzg_1@263.net;
王目树(1981-), 男, 博士生, 从事复杂生产过程的建模与控制、模式识别的研究, E-mail: wangmushu@126.com;
郭玲利(1978-), 女, 博士生, 从事复杂生产过程建模与控制、数据挖掘的研究, E-mail: guolingliyw@aliyun.com

通讯作者

徐正光, E-mail: xzg_1@263.net

文章历史

收稿日期:2018-08-24
修回日期:2018-11-09
基于模式运动的一类生产过程调节性能与聚类参数关系
徐正光 , 王目树 , 郭玲利     
北京科技大学 自动化学院,北京 100083
摘要:为研究基于模式运动的系统动力学描述方法中聚类参数对生产过程调节性能的影响, 给出描述系统动态调节性能与产品质量调节性能的指标, 分析并建立了聚类参数与系统调节性能间的关系; 介绍了基于模式运动的一类复杂生产过程建模方法, 并利用LMI方法给出了状态反馈控制器设计方法; 提出了基于粒子群优化方法的最大熵聚类算法, 定义并提取了系统调节性能指标; 利用提出的新的覆盖分类神经网络, 建立最大熵聚类方法的参数与调节性能间的映射关系, 并分析了分类网络泛化能力; 采用实际烧结矿生产数据进行仿真, 结果表明所提方法可以分析与建立调节性能与聚类参数间的关系, 且可为实际生产中聚类参数的选择提供一定的依据.
关键词模式运动    调节性能    神经网络    模式聚类    模式识别    过程控制    
Relationship between clustering parameters and regulation performance of a class of production processes based on pattern moving
XU Zheng-guang , WANG Mu-shu , GUO Ling-li     
School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China
Abstract: In order to study the influence of clustering parameters on the regulation performance of production processes in the pattern-moving-based system dynamics description method, indexes describing dynamic regulation performance and product quality regulation performance are proposed, and the relationship between clustering parameters and regulation performance is analyzed and built. A pattern moving based modeling method of a class of production processes is introduced. A state feedback controller is designed by using the LMI method. A maximum-entropy clustering algorithm based on the particle swarm optimization (PSO) is proposed, and regulation performance of process control is defined and extracted. The relationship between clustering parameters and regulation performance is built by using a proposed classification neural network based on a covering algorithms, and generalization of the network is analyzed. Data of an actual sintering process is used for simulation experiments, and results demonstrate that the proposed method can be used to analyze and build the relationship between clustering parameters and regulation performance, which provides a basis for the selection of clustering parameters in actual production.
Keywords: pattern moving    regulation performance    neural network    pattern clustering    pattern recognition    process control    
0 引言

在冶金、钢铁、化工等生产流程中, 总存在一些耗能大、排污大、生产工艺复杂的大型设备, 例如炼铁高炉、水泥回转窑、烧结机等.此类生产过程的动力学特性具有如下一些特点[1-3]: 1)生产工艺极其复杂, 很难用准确的数学物理方程进行描述; 2)描述该类过程工况与质量的参数繁多, 且其运动方式呈现分布式、非线性、参数摄动等特性, 难以准确描述; 3)某些物理、化学过程符合统计学运动规律, 且过程的特征向量与产品质量间只存在统计意义上的对应关系, 难以用确定性的数学物理方程进行描述.该类系统的运动特性不受经典的牛顿力学规律的支配, 而是受统计规律的支配, 因此被称为非牛顿力学系统[1-2].

为了描述该类系统的动力学规律, 文献[4]给出了基于模式运动的系统动力学描述方法.该方法通过对过程的工况特征进行聚类, 采用一个统计性变量-----模式类别变量, 对上述系统的统计运动规律进行描述.在该系统动力学描述方法中, 为了解决模式运动“空间”内的不可运算性, 现有方法利用变量的最大变异值[4]、区间数[5-8]、模式类别中心[9-11]、输出类别后验概率[12-13]等方法对模式类别变量进行度量, 并在此基础上研究了相应的建模与控制方法[4-14].该方法通过提取生产过程中的统计属性, 从更大尺度层面描述系统运动特性, 达到调节系统动态性能与产品质量的目的; 而描述系统运动特性的尺度大小由聚类参数(类别划分)决定.因此, 在实际生产过程中, 特别是面向产品质量的生产过程中, 需研究类别划分对系统动态调节性能与产品质量区分性的影响, 以及如何选取合适的聚类参数才能达到较好的系统动态调节性能和产品质量的区分性, 但现有文献中尚未涉及.因此, 本文首先研究合适的聚类方法, 该方法不仅可以完成工况模式的类别划分, 而且划分结果在充分考虑样本分布情况下, 包含足够多的生产过程信息, 以确保有足够信息描述系统运动特性; 然后尝试分析聚类参数与系统调节性能间的关系, 并试图建立两者间的关系.

为了描述复杂生产过程的运行状态、分析控制器或其参数对控制性能的影响, 需针对所关注的系统调节性能给出描述指标.文献[15]对生产过程的控制性能指标及评价方法进行了综述, 并重点讨论了Harris指标[16].现有的描述系统调节性能的指标还包括过渡过程指标[17-18]、误差积分指标[19]、二次型积分指标[20], 以及在上述指标的基础上得到的一些改进指标[21-24].参考过渡过程指标, 文献[25]通过构造线性规范调节轨线, 定义了反振量、超调量、下降时间以及调节时间作为系统的一种新的调节性能指标, 但是其针对的是线性系统, 难以应用到基于模式运动的非线性动力学描述中.文献[26]通过估计生产过程中的最小输出方差、延时时间以及输入与输出间的静态关系, 表征系统的控制性能.文献[27]通过选择一段较为理想的输出曲线作为参照标准, 计算该标准与实测数据的协方差矩阵, 进而构造性能指标, 完成对火电厂负荷控制性能评估.但是, 参照标准的选择较为关键, 且易引入主观因素.文献[28]针对工况的多指标评价问题, 给出了每个工况类别的基于释然估计的指标, 利用传感器融合技术, 通过有序加权平均方法, 将多个指标融合成一个新的指标, 提出了新的调节性能评价标准.除此之外, 很多研究人员针对不同的研究对象提出了有针对性的控制系统调节性能指标[29-31].

一般情况下, 生产过程要求系统有较好的动态调节性能, 但是, 实际生产过程中最终关注的是产品质量.在基于模式运动的建模与控制方法中, 工况类别与产品质量间存在对应关系[9].因此, 工况类别变化能够反映并影响产品质量的变化, 即产品质量的调节.为了描述类别划分对产品质量区分度的影响, 应给出产品质量的调节性能指标.综上, 在基于模式运动系统动力学描述方法中, 系统的动态调节性能与产品质量调节性能共同构成了评价生产过程的调节性能优劣的指标.在给定控制方法的前提下, 影响系统调节性能的主要因素为模式运动“空间”的粒度分布, 而聚类参数直接决定“空间”粒度分布[5-14].因此, 研究聚类参数与调节性能间的关系对生产过程中节能与产品质量的控制有重大意义.

本文针对k-means等聚类方法中初始聚类中心与类别个数难以确定、聚类结果中所包含系统信息难以度量的问题, 基于改进粒子群搜索方法, 利用势函数方法[32]与最大熵原理[33]分别确定聚类方法的初始类别中心与类别个数, 提出一种新的聚类方法.该方法不仅可以减少聚类初始参数的个数, 避免采用最小方差准则带来的分类结果的滞后性, 且能保证聚类结果接近真实样本分布, 包含足够多的系统动态信息.通过该聚类方法将系统输出进行类别划分, 利用所得类别建立系统模式运动“空间”, 采用类别中心将模式类别变量度量到欧氏空间, 进而建立系统的初始控制模型[9-11].由于模式运动“空间”的改变, 得到具有不同参数的非线性系统初始控制模型.在该模型的基础上, 给出系统非线性状态方程[11], 设计系统状态反馈控制器.该方法可以通过LMI求解出状态反馈矩阵, 保证控制系统在给定的类别划分方法下渐近稳定.

为了描述系统的动态调节性能与产品质量调节性能, 给出描述生产过程调节性能的指标.不断改变最大熵聚类方法的参数, 在所提状态反馈控制律作用下可得到不同的系统响应.根据聚类结果与系统响应, 提取系统的调节性能, 得到聚类参数与系统调节性能样本集.基于覆盖算法的神经网络具有较好的收敛性、隐含层节点个数的确定性以及可克服过度学习等优点[34-39], 因此备受关注.但其主要被应用于模式样本的二类划分[36-39], 且构造过程易受噪声的影响, 不易于在线训练.本文对基于覆盖算法的分类神经网络进行改进, 给出一种新的可训练的构造型分类神经网络, 并以此建立两样本集间的映射关系, 为选取满足生产要求的聚类参数提供参考与依据.最后, 讨论影响神经网络泛化能力的因素.

本文的主要贡献如下: 1)提出基于PSO的最大熵聚类算法, 不仅可避免现有k-means等相似方法的缺陷, 完成工况模式的聚类, 而且还可保证聚类结果接近真实样本分布, 包含足够多的系统动态信息; 2)提出基于模式类别变量度量值描述的多维过渡过程指标与产品质量调节指标, 并给出基于模式运动的状态反馈控制器设计方法, 进而分析聚类参数对系统调节性能的影响; 3)提出基于覆盖算法的构造型分类神经网络, 以此建立聚类参数与调节性能间的关系, 并分析参数对网络泛化能力的影响.

1 基于模式运动的过程建模与控制 1.1 基于模式运动的动力学描述方法

对于一个确定的实际工业生产过程, 每个时刻都存在一个工况, 且该工况对应一个工况模式.工况随着时间的变化而变化, 其所对应的工况模式也同样按照生产过程的固有规律进行运动.因此, 系统的运动特性可以利用工况模式的运动进行描述[5-14].

在利用基于模式运动的方法描述系统运动特性时, 采集足够多的连续工况数据, 构造工况数据空间.采用特征提取方法, 从工况数据中提取工况特征变量(工况模式样本).应用聚类方法将所得工况模式样本集合进行类别划分(完成提取工况数据中蕴含的系统统计属性的过程).将该工况模式类别映射为一虚拟空间的刻度, 进而构造了模式刻度“空间”, 并在该“空间”上定义描述工况模式运动的变量-----模式类别变量.模式类别变量与模式刻度“空间”共同构成了模式运动“空间”.模式类别变量的定义如下.

定义  设sx(k)和mx(k)分别表示检测样本序列和模式样本序列.将模式样本(序列中的每一个模式样本)经分类器分类后, 将其所属类别的统一变量赋给该模式样本, 获得带有类别信息的模式变量, 定义为模式类别变量[4], 记为dx(k).则模式类别变量应满足如下变换过程:

(1)
(2)

其中T(·)和F(·)分别表示特征变量提取和模式分类过程.

显然, 模式类别变量具有以下两种属性:

1) 模式类别变量是时间的函数;

2) 模式类别变量具有类别属性.

利用模式类别变量描述系统运动特性的过程如图 1所示.由于模式(或模式类别)不具有运算属性, 在每一时刻利用类别中心对模式运动“空间”内的当前时刻模式类别变量dx(k)进行度量, 其在可计算空间内的度量值记为dx(k).在可计算空间内完成相应的计算后, 再通过分类映射将计算结果映射回模式运动“空间”, 在模式运动“空间”形成系统的下一时刻的运动轨迹点dx(k+1).随着时间的变化形成了系统在模式运动“空间”上的运动轨迹, 进而完成了系统的运动特性的描述.

图 1 模式运动“空间”与可计算空间映射

用模式类别变量描述的系统控制模型可表示为

(3)

其中: F为分类映射, 可由模式运动“空间”的构造过程获得; f为在可计算空间的初始控制模型; D为度量映射; mn分别为系统的输入、输出的阶数; dx(k)为定义在模式运动“空间”内的模式类别变量.

本文中模式类别变量采用模式类别中心进行度量, 可以在欧氏空间构造系统的离散时间初始控制模型(如下式).系统阶数确定与系统辨识方法可参考文献[4].

(4)

式(4)中, dx(k-i)为模式类别变量dx(k-i)在欧氏空间内的度量值, 即类别中心; 为初始控制模型的输出.将经过分类方法映射到模式运动“空间”, 对应的模式类别变量为dx(k), 在模式运动“空间”就形成了一个新的运动轨迹点, 完成系统动力学的描述.

1.2 状态反馈控制方法

在介绍基于模式运动的控制方法前, 先作如下假设.

假设1  所研究生产过程运动在有限区域Ω内, 该区域被划分为若干子类别Ωi, 且满足.

假设2  每个输出类别的半径ri有界, 即ri<∞.

为了得到系统的状态方程, 构造如下系统状态[11]:

(5)
(6)
(7)
(8)

X(k)=[X1(k)  X2(k)…Xn(k)]T.结合系统初始控制模型(4), 得到系统的非线性状态空间模型[11]

(9)

其中

h0=0, hi(i = 1, 2, …, n - 1)满足

分别简记为Γ(k)、τ(k).

由建模过程可知, D(F(f(X(k), u(k))))与f(X(k), u(k))属于同一类别.设其属于第i个输出类别, 其对应的类别半径为ri, 则有

其中||·||表示向量的2范数.

系统输出类别半径可由如下公式计算获得:

其中: yic为第i个类别的类别中心, yij为第i个类别的第j个样本.包含原点的输出类别的类别中心为0.

(10)

其中||yic||≠0. μ被称为输出类别的划分特征, 简称类别划分特征.

注1  由状态方程(9)的建立过程可知, 基于模式运动的系统动力学描述方法中的分类、度量映射包含在状态方程的非线性部分中, 且该非线性部分有界, 该界限与系统时刻的输出有关.

基于系统非线性状态方程(9)以及类别划分特征(10), 可得到使系统镇定的状态反馈矩阵, 见如下定理.

定理1  针对非线性系统(9), 若存在正定对称矩阵P与矩阵K满足

其中

则状态反馈控制律为

在该控制律下, 平衡状态渐近稳定.

证明  由模型(9)建立过程可得关于非线性部分的约束条件, 即

(11)

其中M=CTC.

令李雅普诺夫函数为

其中P为正定对称矩阵.为保证系统(9)渐近稳定, 则要求

(12)

根据非线性部分Γ的约束条件(11), 对不等式(12)分两种情况进行讨论, 即||dx (k + 1)|| ≠ 0与||dx (k + 1)|| = 0.

情况1  ||dx (k + 1)|| ≠ 0.

由S-Procedure方法可知, 不等式(12)在(11)的第一个条件约束下, 与如下不等式等价:

(13)

其中: P = P/ε为正定对称矩阵, ε>0.

由舒尔补引理可知, 不等式(13)与下面不等式等价:

(14)

不等式(14)两边同乘diag{P -1, I, I, I, I}, 并令A = A - BK, M = CTC, Q = {P -1}, K = KQ, 则可得如下等价不等式:

(15)

其中

情况2  || dx (k + 1)||=0.

此时, 只需将约束条件的第2个条件代入李雅普诺夫函数, 按照情况1时的推导过程即可得

(16)

其中Π6 = AQ - BK - MAQ + MBK.

当得到满足不等式(15)和(16)的QK时, 则可得系统状态反馈矩阵

(17)

由此, 定理1得证.□

2 聚类方法与系统调节性能关系

在实际生产过程的控制中, 希望在系统工作点附近有较好的产品质量的区分性能, 而在远离工作点时, 系统具有较快的动态调节性能.即, 工作点附近, 系统输出类别半径较小; 远离工作点, 输出类别半径较大.这也是定义输出类别划分特征的一个原因.

本节主要介绍基于PSO的最大熵聚类方法, 描述系统动态调节性能与产品质量调节性能的指标以及分析两者关系的方法.

2.1 基于粒子群优化的最大熵聚类方法

k-means、ISODATA等相似聚类方法中普遍存在聚类个数难以确定、聚类中心不易选取的问题, 且聚类的指标函数均采用误差平方和, 导致了聚类结果依赖于已有的历史数据, 使聚类结果产生一定的滞后性.另外, 基于模式运动的动力学描述方法要求聚类过程需充分考虑工况数据的分布特性, 而不能仅限于已采集到的数据, 以免因聚类后信息不足导致系统模型存在偏差.因此, 提出一种基于改进粒子群算法的最大熵聚类方法.

最大熵聚类算法采用势函数方法[32]确定聚类时的初始类别中心, 以信息熵作为聚类效果的评价指标, 采用PSO寻找最优的聚类中心(类别划分), 通过分析熵率的变化决定聚类过程是否结束.该方法解决了聚类个数难以确定、聚类中心不易选取的问题.另外, 最大熵模型对样本概率分布的估计具有无偏性, 是所有的可能概率分布中最好的分布模型, 能对未测得样本数据起到预测作用, 因此能够避免聚类结果的滞后性, 且能保证聚类结果接近真实样本分布, 包含足够多的系统动态信息.

最大熵聚类方法的聚类步骤如下.

step 1:利用势函数法获取一个初始聚类中心, 并令类别个数Nc=1, 此时Ξ(1)=0.计算每个样本的初始势以及更新每个样本势的函数分别为

(18)
(19)

其中: α为邻域半径, , Ns为样本集样本的总个数, xk*为第k个初始聚类中心, βα.

step 2:通过势函数方法中的式(19)更新每个样本的势, 更新后的最大势所对应的样本即为一个新的初始聚类中心, 令类别个数Nc=Nc+1.

step 3:为了提高聚类算法的收敛速度, 将得到的初始聚类中心赋给k-means聚类方法, 得到较优的聚类中心, 并以此作为所有粒子的初始位置, 给每个粒子一随机初始速度, 进而构成初始粒子群(每个粒子是一组聚类中心).

step 4:以样本集分类后的熵作为每个粒子的适应度, 通过PSO寻找熵最大的聚类中心. PSO优化完一次, 即可得到一组新的粒子位置.针对每个粒子位置(一组新的聚类中心), 利用最近邻分类方法, 将所有的样本分为Nc类.

step 5:针对每种类别划分(每个粒子), 计算每个类别的概率pi.利用下式计算出所有粒子(类别划分)的适应度, 即样本集分为Nc类后的熵Ξ(Nc):

(20)

从所有粒子中找到熵最大的粒子, 即熵最大的一组聚类中心.

step 6:当PSO达到最大迭代次数时, 样本集划分为Nc个类别的优化过程结束, 转入step 7, 否则转入step 4.

step 7:根据下式计算类别数为Nc时的熵率ΔΞ(Nc):

(21)

step 8:检验熵率是否小于给定阈值ε_Ξ, 若满足, 则聚类过程结束, 否则, 转入step 1.

在最大熵聚类算法中, 利用势函数方法从样本集选择新增的候选聚类中心; 在聚类中心(每个粒子)给定后, 采用最近邻分类方法, 将样本集内的样本进行分类; 粒子群算法以样本集分类后的熵作为每个粒子的适应度, 优化能够使样本集分类后的熵最大的聚类中心.其中, 关键部分为势函数方法与最大熵准则, 因为在聚类过程中不仅需考虑数据已有的分布信息对聚类结果的影响, 而且还需考虑聚类结果所包含的信息是否足够描述系统的动态特性.基于粒子群的最大熵聚类算法流程如图 2所示.

图 2 最大熵聚类方法流程

为了提高PSO的收敛速度, 文中采用随机梯度方法对第i个粒子的最优位置XiL与全局最优位置XG进行预测, 即

(22)
(23)

其中: c3c4为常数, giLgG分别为对位置XiLXG的第n次预测的随机梯度, 即

Ξ(·)为粒子位置所对应的模式样本集分类后的熵, Δj>0为服从均匀分布的有界随机数, ej为第j个单位向量, cn、ηn为正数序列, 且满足

将预测的XiLXG代入已有的粒子群算法中, 进而得到改进的粒子群算法.

2.2 生产过程调节性能描述

本文中生产过程调节性能不仅包括系统的动态调节性能, 还应该包括产品质量的调节性能, 用以描述类别划分对产品质量区分能力.动态调节性能采用过渡过程指标进行描述, 即上升时间、调节时间、超调量以及反振量.该指标可以更清晰、全面地反映出类别划分对系统响应的影响.若在工作点附近输出的类别较少, 则产品质量的区分度较差; 反之, 系统的动态性能区分度不够.生产过程动态性能指标定义如下.

上升时间

调节时间

超调量

反振量

上述指标考察的是系统每个输出分量从-1运动到0的响应过程, 动态调节性能指标(第个分量)如图 3所示.

图 3 动态调节性能示意图

为了衡量生产过程中产品质量的区分性能, 给出如下输出类别密度:

其中: rp为产品质量感兴趣(或合格)区域的半径, n为系统输出的维数, N(rp)为在该半径内的类别个数. cd越大, 输出空间划分越精细, 则在工作点附近产品质量区分性越好; 反之, 输出空间的划分越粗糙, 质量区分性越差.因此, 可以采用平均类别密度衡量产品质量的调节性能.

在给定聚类方法与调节性能指标的基础上, 通过不断改变聚类算法的聚类参数, 即可得到对应的生产过程调节性能指标, 进而可以得到聚类参数集合与调节性能指标集合.聚类参数与调节性能间的关系可由下节中分类神经网络建立.

3 构造型分类神经网络

由于基于模式运动的动力学描述方法适用于一类具有统计运动规律的复杂过程, 且采用聚类算法提取系统内在的统计属性建立系统控制模型, 因此, 其系统响应也具有统计属性.另外, 根据系统调节性能的定义可知, 调节性能也具有统计属性.所以, 本节中采用基于模式运动的思想, 通过对系统调节性能聚类, 然后利用模式分类的方法, 采用基于覆盖算法的构造型分类神经网络建立聚类参数与系统调节性能间的关系.

3.1 构造型分类神经网络

在建立分类神经网络时, 采用聚类参数作为网络的输入, 系统调节性能的类别作为网络的输出.采用聚类方法将得到的调节性能数据进行类别划分, 由最大熵聚类参数与调节性能间的对应关系, 得到一个带类别标签的聚类参数集合, 记为ΩΦ.

对于任意的聚类参数样本ΦΩΦ, 通过映射

(24)

将该样本映射到一个以R>0为半径的超球面上, 则新形成的样本集合记为ΩΨ.

具有相同类别标签的聚类参数样本即归为一类, 则集合ΩΨ被划分为不同的子类别, 记为{ΩΨi}.由于聚类参数类别与系统调节性能类别间具有对应关系, 可以通过对聚类参数样本的分类得到该样本所对应的调节性能, 即建立聚类参数与调节性能间的映射关系.对于球面上任意的子类别ΩΨi, 其构造覆盖的方法如下.

step 1:从第i个子类中任取一个未被覆盖的模式样本c.

step 2:找出距样本c最近的, 且不属于类别ΩΨi的样本, 设两样本间的距离为.在以为半径的邻域内, 找出距样本c最远的, 且属于类别ΩΨi的样本, 设其与c间的距离为, 则得到ΩΨi的一个覆盖δ=(c, r), 其中, 该覆盖半径的上限为r = , 为常数.

step 3:找出以c为圆心, 以r为半径的邻域内所有点, 并计算邻域内所有样本点在超球面上的中心c', 按照step 2求取新的覆盖半径r', 则得到一个新的邻域δ'= (c', r').

step 4:若邻域δ'覆盖的样本数多于δ, 则令c=c', r=r', 返回step 3;否则, 得到类别ΩΨi的一个新的覆盖邻域δij = (cij, rij).

step 5:若样本集中ΩΨi的样本全部被覆盖, 则结束构造ΩΨi的覆盖; 否则, 转入step 2.

对于ΩΨ中的任意子类ΩΨi, 在下式定义的距离下, 通过上述的步骤可以得到该子类的一系列的覆盖(如图 4中无填充的圆所代表的子类别), 记为{δ(cij, rij)}. δ(cij, rij)为第i子类ΩΨi的第j个覆盖, 其中cijrij分别为其中心与半径. δ(cij, rij)可以简写为δij.

图 4 覆盖示意图
(25)

利用得到的覆盖{δ(cij, rij)}建立构造型分类神经网络, 该神经网络采用三层结构.基于覆盖算法的构造型分类神经网络框架如图 5所示.

图 5 构造型分类神经网络结构

第1层为输入层, 输入为最大熵聚类参数样本, 节点的个数为聚类参数的维数3.

第2层为隐含层, 其可以利用所得的一系列覆盖{δ(cij, rij)}, 通过下式构造:

(26)

其中: γk > rk2/rk2称为扩展变量, 是网络训练时的一个变量, 常数rk为覆盖半径rij的上限.该节点简记为hkijhk, 指网络中第k个隐含节点由δij构造.隐含层节点的个数为所得覆盖的个数.令

第3层为输出层, 输出层节点的个数为调节性能类别的个数, 其第i个输出可以由如下公式计算获得:

(27)

其中:λ>0为常数; 为输出节点的输入, w为连接隐含层与输出层间的系数矩阵, 网络中的第i个输出节点对应的为第i个输出类别.令

hk为第k个隐含节点的输出, 且该节点由第i个子类的覆盖所构造, 则wki的符号为正, 否则wki的符号为负, 则系数矩阵w可以描述为

(28)

其中: |{wki}|∈(0, Cw), Cw为常数, 该约束可以避免系统的过度拟合; skiwwki的符号, skiw∈{-1, 1}.

对于任意的聚类参数样本Φk, 如果第i个输出为最大且为正时, 则可知ΨkΩΨi; 当没有任意一个输出为正数时, 则可以通过判断到覆盖的距离确定Φk的归属, 而网络的任意一个输出都为一个二类的分类器.

注2  虽然所提出的新的构造型覆盖神经网络与RBF神经网络[40-42]有一定的相似性, 但其与传统网络最大的区别为该分类网络的隐含层是对分类样本的“认识”过程[43], 而输出层为对隐含层输出的分类过程(寻找类别边界的过程).另外, 该网络不仅继承了覆盖神经网络的一些优点, 如较好的收敛性、隐含层节点个数的确定性、可以几何解释等[34-39], 而且更易训练, 可克服过度学习.

3.2 分类神经网络训练

对于任意的聚类参数样本Φp, 若ΦpΩ_Φj, 其对应的网络标准输出向量为Op*, 其中, Opi* = Co, Co>0为常数, 而其他元素为-Co.则网络的输出误差为

(29)

所有样本的输出误差为

(30)

由基于网络的构造过程可知, 隐含层、输出层间的矩阵w以及每个覆盖的扩展变量γ可以通过求解如下带约束的最优问题得到:

(31)

其中λw∈(0, 1).

为了去掉约束条件γk > γk, 作如下变换:

其中: ρ> 0, vi∈(-∞, +∞).令

另外, 为了去掉约束条件|{wki}|∈(0, Cw), 对wki作如下变换:

其中: κ> 0为一常数, ϖki∈(-∞, +∞).则上述的带约束的最优问题(31)可变成无约束的最优问题.由梯度下降法得到

wγ的学习规则如下:

(32)
(33)
(34)
(35)

其中: η为学习率, ς为动量因子,

ξ < ε(0 < ε≪1), 或者训练迭代次数t达到最大次数时, 网络的训练过程结束.

3.3 分类神经网络泛化能力分析

对于一个二分类线性分类器, 假设存在一系列超平面满足

则称这些平面为Δ-间隔分类平面, 其中Δ>0为样本到分类平面的最小距离.当采用VC维描述该分类方法泛化能力时, 则有如下引理.

引理1  若所有模式样本在半径为R的超球体内, 则满足上式的一系列分类超平面的VC维上界[44]

为了分析构造型分类神经网络的泛化能力, 假设所提神经网络为二分类神经网络, 且对于该分类器所有样本均可分.该网络的输出层可以认为是一个线性分类器, 该分类器输入为隐含层的输出H.对于该神经网络的输出层与隐含层连接矩阵w, 若分类平面满足

(36)

其中|{wk}| < Cw, 则有如下定理.

定理2  针对构造型神经网络, 对于任意模式样本X, 设Ps(X)在一个以半径为Rs的超球面上, 隐含层的输出为H ∈{Rn}, 其中n为隐含层节点个数.则对于满足式(36)的一系列分类平面, VC维dVC的上界为

其中.

证明  设H在以R为半径的超球面上, 并且所得的输出分类超平面满足

其中|wk| < Cw.因此有

由引理1有

(37)

由网络隐含层构造方法可知, 一定存在连续函数fIH满足

其中Y = Ps(X).由微分中值定理有

(38)

其中

ckrk分别是构造隐含节点hk的覆盖中心与半径.则由式(38)有

又由于

, 由于

则有

进而, 由式(37)可知

注3  由定理2可知:覆盖数目与Rs越小, 分类误差风险越小; 覆盖半径越大, 分类误差风险越小.如果构造网络的损失函数采用折页损失函数, 则有

4 仿真实验

本文采用安阳钢铁厂400烧结机烧结过程中的数据进行仿真.虽然在烧结过程中充满了各种的物理与化学变化, 影响因素繁多, 难以用精确的数学物理方程对其动力学特性进行描述, 但是在大量的生产工况数据中富含过程的统计运动规律.因此, 可以采用基于模式运动的方法描述其运动特性.采集了2年的生产工况与操作数据, 由于烧结机的烧结终点控制在倒数第2个风箱上, 因此选取最后3个风箱的温度(T20 ~ T22)作为过程的工况数据样本, 而点火温度作为该生产过程的输入样本, 如图 6所示.

图 6 输入输出原始数据

众所周知, 实际生产过程中所测数据带有大量的噪声, 因此采用FIR滤波器对所测数据进行滤波, 然后进行零均值归一化, 最后采用PCA方法从滤波后的工况数据中提取工况模式样本, 采用第一主元作为工况模式样本, 将系统变为单输入单输出系统.处理后的输入输出数据如图 7所示.

图 7 归一化后的单输入单输出
4.1 模式运动“空间”的构造

在本节中采用最大熵聚类方法对输出数据进行分类, 基于输出类别构造模式运动“空间”.最大熵聚类方法中参数分别为α = 0.01, β = 0.05, ε _Ξ =0.053;聚类过程中PSO的迭代次数为300, 粒子群个体数为10; PSO的学习因子c1 = c2 = 0.8, c3 = c4=0.5.分别取如下正数序列[45]:

当ΔΞ (Nc) < εΞ时, 聚类过程结束, 此时输出数据被划分为Nc = 125类.聚类后类别中心分布如图 8所示.

图 8 输出类别分布

将得到的输出类别映射到一虚拟的空间, 并将其作为该空间的刻度, 则构成了模式刻度“空间”.在模式刻度“空间”内定义描述模式类别变化的变量-模式类别变量, 则定义了模式类别变量的模式刻度“空间”就形成了模式运动“空间”.

在模式运动“空间”构造完成后, 系统的输出序列在模式运动“空间”内变成了模式类别变量的序列.当采用类别中心对模式类别进行度量时, 在欧氏空间内就得到了一个模式类别中心的序列, 如图 9所示.对比图 9中两条曲线, 属于任一类别的输出模式样本都统一采用同一个度量值进行表示(如图 9中的局部放大图k= 565附近, 其输出值采用同一个值度量).

图 9 实测输出与模式类别变量度量值

正是由于存在模式的分类、度量过程, 导致了由模式类别变量所描述系统的动态调节性能与产品质量调节性能易受聚类参数的影响, 这是本文研究的主要内容之一.

4.2 聚类参数对调节性能影响

本节中固定最大熵聚类方法中的两个聚类参数, 通过改变第3个参数, 得到对应的系统调节性能指标, 进而分析第3个参数对系统调节性能的影响.当计算产品质量调节性能指标时, rp = 0.2.

在得到系统动态调节性能前, 基于类别中心与输入时间序列利用最小二乘方法建立系统的初始控制模型, 并在此基础上得到系统非线性状态方程, 利用LMI方法设计状态反馈控制器.在给定聚类参数时, 即可得到对应的状态反馈控制器下的系统调节性能指标.

进行仿真实验时, 系统初始输出为-1, 控制目标为0.但是, 由于分类、度量映射的存在, 系统初始输出-1所在的类别对应的模式类别变量的度量值可能不是-1.

针对聚类参数αβεΞ, 给出如下3组实验参数, 研究聚类参数对系统调节性能的影响:

α= 0.005, β= 0.005时, εΞ在[0.001, 0.01]内均匀取20个值;

α= 0.005, εΞ=0.001时, β在[0.005, 0.1]内均匀取20个值;

β= 0.1, εΞ=0.001时, α在[0.005, 0.1]内均匀取20个值.

将仿真结果归一化到0-1间后, 结果如图 10所示(得到的反振量均为0, 未给出).通过对图 10的对比分析, 可以得到如下的结论:

图 10 系统调节性能对比

1) trσ%随着聚类参数的改变无显著变化, 而tscd随着εΞβ逐渐增大呈现出逐渐减小的趋势(见图 10(a)图 10(b)).主要是由于在最大熵聚类方法中, β决定了初始聚类中心的分布, εΞ决定了算法的结束时间, 两者共同决定了最终的类别分布与类别数目.

2) α的变化并不会对系统的调节性能产生明显的影响(见图 10(c)), 主要原因在于α仅决定每个样本的初始势, 而对于最终的类别分布起不到决定性的作用.

4.3 聚类参数与调节性能间的映射

本节中, 通过构造具有一定数量的聚类参数集合, 采用4.2节中的方法即可得到系统调节性能的集合.考察的聚类参数范围为α∈({0, 0}{.1]}, β∈({0, 0}{.1]}, 且βα, εΞ∈[0.001, 0.01].在对应的取值区间内分别平均取20个点, 组合后构成聚类参数样本集.对于任一聚类参数样本, 即可按照4.2节方法得到对应的系统调节性能样本, 进而建立样本数为4 200的一个聚类参数的集合(输入集合)以及对应的调节性能指标的集合(输出集合), 系统调节性能指标如图 11所示. 图 11中, 黑点表示上升时间、调节时间、超调量构成的三维向量, 黑圆表示上升时间、调节时间、类别密度在三维空间上的点.

图 11 系统调节性能分布

将系统调节性能样本归一化到0-1之间, 利用所提出的最大熵聚类方法对输出样本集合进行类别划分, 聚类参数αβ的取值分别设为0.099 8和0.100 8, εΞ= 0.001, 将输出集合划分为66类.

以输出样本所属类别作为对应的输入样本的类别标签, 则输入集合也被划分为66类, 对于输入类别内的任意样本, 网络输出的调节性能为其所对应输出类别的类别中心.根据覆盖算法构造输入集合的每个类别的覆盖.构造的覆盖总数为1 746个, 进而建立覆盖分类神经网络.

从所有的输入输出样本中随机选择4 100个数据学习隐含层到输出层的系数矩阵与覆盖的扩展变量, 其余的100组数据用于验证该构造型分类神经网络的有效性, 验证结果如图 12所示.在覆盖类神经网络进行寻优时, λo = 1, λw = 0.5, Cw = Co=1.当优化指标的增量小于0.000 01时, 学习过程结束, 其中η = 0.5, ς = 0.9.

图 12 构造型覆盖分类神经网络输出效果

图 12可以看出, 基于覆盖的分类神经网络可以建立聚类参数与系统调节性能间的关系; 当给出系统调节性能要求时, 可以为聚类参数的选择提供依据.

5 结论

针对一类复杂的生产过程, 在基于模式运动的系统动力学描述方法的基础上, 分析了聚类参数对系统动态调节性能以及产品质量调节性能的影响, 建立了聚类参数与生产过程调节性能间的关系; 提出了基于粒子群搜索的最大熵聚类方法, 给出了状态反馈控制器的设计方法; 定义了系统动态调节性能指标与产品质量调节指标, 并从聚类结果与系统响应中提取了生产过程的调节性能, 分析了聚类参数对调节性能影响; 提出了新的基于覆盖算法的分类神经网络, 并给出了采用该网络建立聚类参数与系统调节性能间关系的方法; 最后, 采用实际烧结矿生产数据进行仿真, 分析了聚类参数对调节性能的影响, 并对产生影响的原因进行了讨论; 验证了采用分类神经网络建立聚类参数与调节性能间关系的有效性.

在基于模式运动描述的实际生产过程中, 不仅要求系统具有较好的动态调节性能, 而且在工作点附近还需有较好的产品质量区分性, 本文的工作可以为达到上述的生产要求提供一定的参考与依据.

参考文献
[1]
瞿寿德. 智能自动化的模式识别方法[J]. 北京科技大学学报, 1998, 20(4): 385-389.
(Qu S D. Pattern recognition approach to intelligent automation for complex industrial processes[J]. Journal of University of Science and Technology Beijing, 1998, 20(4): 385-389.)
[2]
瞿寿德, 李泽飞, 周尚明.模式识别与智能自动化[C]. 1995年中国智能自动化学术会议.天津: 天津大学出版社, 1995: 64-66.
(Qu S D, Li Z F, Zhou S M. Pattern recognition and intelligent automation[C]. Proceedings of Intelligent Automation in China. Tianjin: Tianjin University Press, 1995: 64-66.)
[3]
孙一康, 瞿寿德. 人工智能与过程控制[J]. 控制理论与应用, 1992, 9(3): 312-313.
(Sun Y K, Qu S D. Artificial intelligence and processcontrol[J]. Control Theory & Applications, 1992, 9(3): 312-313.)
[4]
徐正光.智能自动化的模式识别方法及其工程实现[D].北京: 北京科技大学, 2001: 126-141.
(Xu Z G. Pattern recognition method of intelligent automation and its implementation in engineering[D]. Beijing: University of Science and Technology Beijing, 2001: 126-141.)
[5]
孙昌平, 徐正光. 基于多维区间T-S模糊模型的多维运动模式预测[J]. 控制与决策, 2016, 31(9): 1569-1576.
(Sun C P, Xu Z G. Multi-dimensional moving pattern prediction based on multi-dimensional interval T-S fuzzy model[J]. Control and Decision, 2016, 31(9): 1569-1576.)
[6]
徐正光, 孙昌平. 基于区间T-S模糊模型的运动模式预测[J]. 控制与决策, 2012, 27(11): 1699-1705.
(Xu Z G, Sun C P. Moving pattern forecasting using interval T-S fuzzy model[J]. Control and Decision, 2012, 27(11): 1699-1705.)
[7]
Xu Z G, Sun C P. Moving pattern-based approach to modeling of a class of complex production processes[C]. 2011 IEEE International Conference on Fuzzy Systems. Taipei: IEEE, 2011: 2282-2287.
[8]
Xu Z G, Sun C P. Moving pattern-based forecasting model of a class of complex dynamical systems[C]. Proceedings of the IEEE on Decision and Control. Orlando: IEEE, 2011: 4967-4972.
[9]
Xu Z G, Wu J X. Pattern recognition: An alternative to dynamics description[C]. Proceedings of the IEEE Conference on Decision and Control. Maui: IEEE, 2012: 5566-5571.
[10]
Xu Z G, Wu J X, Guo L L. Modeling and optimal control based on moving pattern[C]. Chinese Control Conference. Xi'an: IEEE, 2013: 7894-7899.
[11]
徐正光, 王目树, 郭玲利. 基于模式运动的一类复杂生产过程的状态反馈渐近稳定性[J]. 控制理论与应用, 2019, 36(2): 249-261.
(Xu Z G, Wang M S, Guo L L. State feedback asymptotic stability of a kind of complex production processes based on pattern moving[J]. Control Theory & Applications, 2019, 36(2): 249-261.)
[12]
Wu J X, Liu C. A new pattern based Petri net to model sintering production process[J]. Transactions of the Institute of Measurement and Control, 2018. DOI:10.1177/0142331217737834
[13]
Wu J X, Liu C. Data driven pattern moving and Petri nets prediction model[C]. Proceedings of the 35th Chinese Control Conference. Chengdu: IEEE, 2016: 9049-9054.
[14]
Guo L L, Xu Z G, Wang Y. Dynamic modeling and optimal control for complex systems with statistical trajectory[J]. Discrete Dynamics in Nature & Society, 2014(1): 1-8.
[15]
Jelali M. An overview of control performance assessment technology and industrial applications[J]. Control Engineering Practice, 2006, 14(5): 441-446. DOI:10.1016/j.conengprac.2005.11.005
[16]
Harris T J, Boudreau F, Macgregor J F. Performance assessment of multivariable feedback controllers[J]. Automatica, 1996, 32(11): 1505-1518. DOI:10.1016/S0005-1098(96)00108-2
[17]
Astrom K J. Assessment of achievable performance of simple feedback loops[J]. International Journal of Adaptive Control and Signal Processing, 1991, 5(1): 3-19. DOI:10.1002/acs.4480050103
[18]
Hagglund T. Automatic detection of sluggish control loops[J]. Control Engineering Practice, 1999, 7(12): 1505-1511. DOI:10.1016/S0967-0661(99)00116-1
[19]
Khan M, Tahiyat M, Imtiaz S, et al. Experimental evaluation of control performance of MPC as a regulatory controller[J]. ISA Transactions, 2017, 70(2017): 512-520.
[20]
Kwon B, Youn M. Optimal regulators using time-weighted quadratic performance index with prespecified closed-loop eigenvalues[J]. IEEE Transactions on Automatic Control, 1986, 31(5): 449-451. DOI:10.1109/TAC.1986.1104302
[21]
王凌, 李文峰, 郑大钟. 非最小相位系统控制器的优化设计[J]. 自动化学报, 2003, 29(1): 135-141.
(Wang L, Li W F, Zheng D Z. Optimal design of controller for non-minimum phase systems[J]. Acta Automatica Sinica, 2003, 29(1): 135-141.)
[22]
李大字, 焦军胜, 靳其兵, 等. 基于输出方差限制的广义多变量控制系统性能评价[J]. 自动化学报, 2013, 39(5): 654-658.
(Li D Z, Jiao J S, Jin Q B, et al. Generalized multivariable control system performance assessment based on output variance limit[J]. Acta Automatica Sinica, 2013, 39(5): 654-658.)
[23]
荣冈, 杨胜蓝, 周培杰, 等. 一种基于优先级的控制系统性能评估和安全监控系统[J]. 化工学报, 2016, 67(3): 707-814.
(Rong G, Yang S L, Zhou P J, et al. A control performance monitoring and assessment system with priority strategy for process industry[J]. CIESC Journal, 2016, 67(3): 707-814.)
[24]
Wang Y Q, Zhang H, Wei S L, et al. Control performance assessment for ILC-controlled batch processes in a 2-D system framework[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2018, 48(9): 1493-1504. DOI:10.1109/TSMC.2017.2672563
[25]
王大海. 一组新的全方位鲁棒调节性能指标[J]. 中国科学: A辑, 1991, 3: 317-324.
(Wang D H. A new set of omnidirectional robust adjustment performance indicators[J]. Science in China: Series A, 1991, 3: 317-324.)
[26]
Lynch C B, Dumont G A. Control loop performance monitoring[J]. IEEE Transactions on Control Systems Technology, 1996, 4(2): 185-192. DOI:10.1109/87.486345
[27]
Wang Y S, Li S Z, Tian J Y, et al. Performance assessment of thermal power plant load control system based on covariance index[J]. Control Engineering Practice, 2016, 54: 58-69. DOI:10.1016/j.conengprac.2016.04.015
[28]
Khamseh S A, Sedigh A K, Moshiri B, et al. Control performance assessment based on sensor fusion techniques[J]. Control Engineering Practice, 2016, 49: 14-28. DOI:10.1016/j.conengprac.2016.01.008
[29]
Liu D, Yang Y, Li L L, et al. Control performance-based fault-tolerant control strategy for singular systems[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2018. DOI:10.1109/TSMC.2018.2815002
[30]
Zheng M K, Li L N, Zhou T R, et al. Influence of damping factor on ship PID course control performance[C]. The 29th Chinese Control and Decision Conference. Chongqing: IEEE, 2017: 609-615.
[31]
Chen W T, Shi D W, Wang J Z, et al. Event-triggered state estimation: Experimental performance assessment and comparative study[J]. IEEE Transactions on Control Systems Technology, 2017, 25(5): 1865-1872. DOI:10.1109/TCST.2016.2623776
[32]
Chiu S L. Fuzzy model identification based on cluster estimation[J]. Journal of Intelligent and Fuzzy Systems, 1994, 2(3): 267-278. DOI:10.3233/IFS-1994-2306
[33]
Rajagopalan V, Ray A. Symbolic time series analysis via wavelet-based partitioning[J]. Signal Processing, 2006, 86(11): 3309-3320. DOI:10.1016/j.sigpro.2006.01.014
[34]
Zhang L, Zhang B. A geometrical representation of McCulloch-Pitts neural model and its applications[J]. IEEE Transactions on Neural Networks, 1999, 10(4): 925-929. DOI:10.1109/72.774263
[35]
Zhang L, Zhang B. A geometrical representation of M-P neural model and its applications[J]. Journal of Software, 1998, 9(5): 334-338. DOI:10.1109/72.774263
[36]
刘承水. 基于构造型神经网络的分类算法[J]. 中南大学学报:自然科学版, 2009, 40(3): 738-741.
(Liu C S. Classification algorithm based on constructive neural networks[J]. Journal of Central University: Sciences and Technology, 2009, 40(3): 738-741.)
[37]
Wang D. Fast constructive-covering algorithm for neural networks and its implement in classification[J]. Applied Soft Computing, 2008, 8(1): 166-173.
[38]
Wang D, Chaudhari N S. A fast modified constructive-covering algorithm for binary multi-layer neural networks[J]. Neurocomputing, 2006, 70(1): 445-461.
[39]
黄国宏, 邵惠鹤. 一种新的基于神经网络覆盖分类算法[J]. 中国图象图形学报, 2004, 9(10): 1165-1168.
(Huang G H, Shao H H. A new classification method based on neural network covering algorithm[J]. Journal of Image and Graphics, 2004, 9(10): 1165-1168.)
[40]
Gonzalez J, Rojas I, Ortega J, et al. Multi-objective evolutionary optimization of the size, shape, and position parameters of radial basis function networks for function approximation[J]. IEEE Transactions on Neural Networks, 2003, 14(6): 1478-1495. DOI:10.1109/TNN.2003.820657
[41]
Qian X S, Huang H, Chen X P, et al. Generalized hybrid constructive learning algorithm for multioutput RBF networks[J]. IEEE Transactions on Cybernetics, 2017, 47(11): 3634-3648. DOI:10.1109/tcyb.2016.2574198
[42]
Meng X, Pawel R, Qiao J F, et al. Nonlinear system modeling using RBF networks for industrial application[J]. IEEE Transactions on Industrial Informatics, 2018, 14(3): 931-940. DOI:10.1109/TII.2017.2734686
[43]
Wang S J. Bionic(Topological) pattern recognition --- A new model of pattern recognition theory and its applications[J]. Acta Electronica Sinica, 2002, 30(10): 1417-1420. DOI:10.1007/BF02960786
[44]
Vapnik V D. The nature of statistics learning theory[M]. New York: Springer, 1995: 131-172.
[45]
Shen D, Chen H F. A Kiefer-Wolfowitzal algorithm based iterative learning control for Hammerstein-Wiener systems[J]. Asian Journal of Control, 2012, 14(4): 1070-1083. DOI:10.1002/asjc.378