2024, 39(1):1-16. DOI: 10.13195/j.kzyjc.2022.1899
摘要:现实中的多目标优化问题会随着时间或环境的变化而发生改变,因此在全周期优化过程中,环境变化检测和算法响应是求解动态多目标优化问题的两大关键步骤,为此重点对动态多目标进化算法方面的研究进行总结.为有效求解动态多目标优化问题,大量追踪性能优良的动态多目标进化算法在近20年里被提出,但是很少有文献从时空角度对已有研究进行分析和报道,鉴于此,从该视角对动态多目标进化算法研究进行综述.首先介绍动态多目标优化的基本概念、问题和性能指标;然后从时空视角对近5年提出的动态多目标进化算法研究进行分别介绍;最后列出目前动态多目标进化算法方面研究存在的一些挑战,并对未来研究进行展望.
2024, 39(1):17-25. DOI: 10.13195/j.kzyjc.2022.2023
摘要:传统人驾车(HVs)为了能够快速行驶到目标车道,常常会向目标车道进行强制换道,这一过程被视为传统人驾车的切入机制.然而,该过程会影响目标车道中由传统人驾车和网联自动车(CAVs)组成的混合车群稳定性.当一个车道上由多个传统人驾车组成的车群同时切入到目标车道上的混合车群中时会对混合车群的稳定性影响较大.针对这一问题,首先对车辆动力学模型进行刻画,以描述车辆行驶的平稳性和混合车群的稳定性.然后,为了确保由多个传统人驾车组成的车群同时切入到混合车群时的稳定性,从信息物理系统(CPS)的视角出发,并基于一致性约束和通信拓扑结构,提出一种考虑通信时延和反应时延的混合车群协同控制方法;同时,利用Lyapunov-Krasovskiis理论进一步分析所提出控制方法满足的稳定性条件.最后,通过仿真实验结果表明了所提出控制方法的有效性和可行性.
2024, 39(1):26-38. DOI: 10.13195/j.kzyjc.2022.0432
摘要:针对传统多任务优化算法(MTEA)存在负向知识迁移、迁移算子效率低下等问题,提出一种基于超粒子引导的自适应知识迁移的多任务差分进化算法(SAKT_MFDE).首先,通过任务之间的相似程度自适应地调节任务之间的交配概率,增大任务之间的正向迁移;其次,利用超粒子引导算法的搜索方向,进一步提升算法整体的优化效率;最后,通过多任务基准函数进行仿真实验来评价改进算法的寻优性能.实验结果表明,所提出算法可以有效规避任务之间的负向迁移,提高相似度较低的任务组的优化性能.
2024, 39(1):39-48. DOI: 10.13195/j.kzyjc.2022.0703
摘要:针对复杂电磁环境下雷达辐射源信号识别方法中存在的抗噪性能差、识别准确率低等问题,提出一种融合模糊函数多域投影特征的集成深度学习识别方法.首先,对信号的模糊函数进行高斯平滑处理,从多域视角出发选取合适角度对模糊函数进行二维投影以构建特征数据集;然后,构建一种基于多域特征融合的两阶段识别分类方法,使用多个密集连接网络DenseNet121作为初级分类器分别对3类特征数据集进行训练学习,得到初级分类结果;最后,通过Stacking策略对初级分类结果进行融合学习,得到最终类别信息.实验结果表明,所提出方法在信噪比为0dB时对6类典型雷达信号的整体平均识别率均保持在97.24%以上,即使是在-4dB环境中,识别率也稳定在87.16%以上,验证了所提出方法的有效性和可行性,具有一定的工程价值.
2024, 39(1):49-58. DOI: 10.13195/j.kzyjc.2022.0349
摘要:垃圾焚烧过程二次风量通常是依据人工经验设定,具有主观随意性,使污染物排放浓度不达标.针对此问题,提出一种二次风量智能优化设定方法.首先,建立二次风量的案例推理预设定模型、设定值的评价与学习模型;其次,建立工艺指标的随机配置网络预测模型;接着,建立基于径向基神经网络自学习模糊推理的智能补偿模型;最后,将二次风量预设定模型、工艺指标预测模型、智能补偿模型以及设定值的评价与学习模型有机集成,设计二次风量智能优化设定方法的结构与功能,并给出算法实现.采用某垃圾焚烧厂历史数据进行实验,结果表明,所提方法获得的二次风量设定值波动程度更小,按此设定值运行的控制系统可以减少污染物排放浓度,促进垃圾焚烧过程运行优化目标的实现.
2024, 39(1):59-68. DOI: 10.13195/j.kzyjc.2022.0647
摘要:针对爬行动物搜索算法存在收敛速度慢、寻优精度低和易陷入局部极值等缺陷,提出一种基于水波进化和动态莱维飞行的爬行动物搜索算法.采用Halton序列初始化种群,生成均匀分布的个体,减少个体搜索盲区和重叠概率以提升种群多样性;引入水波动态进化因子和自适应权重,协调算法全局搜索与局部开发之间的转换,提高算法收敛速度和寻优精度;结合一种动态莱维飞行变异策略,提升算法局部抗停滞能力.通过对14个基准测试函数的寻优对比分析、Wilcoxon秩和检验以及寻优时间对比结果可知,改进算法具有更好的收敛性能、寻优性能和鲁棒性.最后,通过工程应用中焊接梁设计的优化对比结果,进一步验证了改进算法处理实际工程问题的优越性.
2024, 39(1):69-77. DOI: 10.13195/j.kzyjc.2022.0211
摘要:针对秃鹰搜索算法(BES)存在全局搜索性能与局部开发能力不协调、易陷入局部最优等缺陷,提出一种融合多策略的改进秃鹰搜索算法(IBES).采用凸型自适应控制因子使算法在迭代寻优过程中可根据搜索进程动态调整位置更新方程以修正模型,实现自适应寻优,有效平衡算法的全局搜索性能和局部开发能力;引入折射反向学习机制可对问题当前解在其解空间内进行折射反向学习找到与之对应的折射反向解,增加寻到最优解的概率,提升算法求解精度和收敛速度;同时,利用定向重组与诱导突变策略实现种群个体多维信息的重组和突变,提升个体质量和种群多样性,增加算法跳出局部最优的机率,提高搜索精度.以最优值、平均值、标准差和平均收敛代数作为算法性能的评价指标,对10个不同基准测试函数进行数值仿真实验,实验结果验证了所提改进方法的有效性及IBES算法的优越性.此外,经IBES算法优化后的PID神经网络控制器响应速度快、超调量小、调节时间短,进一步验证了算法的实用性.
2024, 39(1):78-86. DOI: 10.13195/j.kzyjc.2022.0500
摘要:动态多目标优化问题(DMOPs)需要进化算法跟踪不断变化的Pareto最优前沿,从而在检测到环境变化时能够及时有效地做出响应.为了解决上述问题,提出一种基于决策变量关系的动态多目标优化算法.首先,通过决策变量对收敛性和多样性贡献大小的检测机制将决策变量分为收敛性相关决策变量(CV)和多样性相关决策变量(DV),对不同类型决策变量采用不同的优化策略;其次,提出一种局部搜索多样性维护机制,使个体在Pareto前沿分布更加均匀;最后,对两部分产生的组合个体进行非支配排序构成新环境下的种群.为了验证DVR的性能,将DVR与3种动态多目标优化算法在15个基准测试问题上进行比较,实验结果表明,DVR算法相较于其他3种算法表现出更优的收敛性和多样性.
2024, 39(1):87-94. DOI: 10.13195/j.kzyjc.2022.0585
摘要:面对主流计算平台对框架轻量化的需求,设计一种基于多任务结构的轻量化抠图框架.将总体任务拆分为两类子任务,其中一类任务用来在语义层面上为高级特征分类,区分前景背景与未知区域的特征;另一类任务用于计算前景与背景图层的线性组合权重.通过与特征分类任务共享高级特征网络的权值获得精准的前景特征,再与低级别卷积特征相融合.所提出的模型能够生成精准的抠图掩膜,同时优化卷积神经网络来实现模型轻量化.在Composition1K数据集上对比不同方法的实验结果:在分辨率为$640\times640$的输入条件下,所提方法比DIM(deep image matting)和AdaMatting(adaptation and matting)方法分别减少19%和81%的空间消耗;对于同样的数据输入,所提方法需要的处理时间只有DIM消耗时间的五分之一.
2024, 39(1):95-102. DOI: 10.13195/j.kzyjc.2022.0015
摘要:安全控制是开展一系列大型工程的重要前提之一,但大型工程往往受多种因素影响且同时需要考虑多个安全指标,对此,提出一种基于置信规则库(belief rule base,BRB)的具有解析和可追溯特征的多目标安全控制方法.首先,面向多个安全指标建立多个BRB;其次,计算各影响因素对各安全指标的贡献度,根据贡献度值得到面向单个安全指标的关键因素序列;再次,综合获得面向多个安全指标的关键因素序列;最后,仅针对面向多安全指标的关键因素开展多目标优化.以隧道施工过程中地面沉降值和建筑斜率作为目标开展安全控制.实例结果表明,所提出方法能够精准识别关键因素,通过优化关键因素可以有效降低地面沉降值和建筑斜率.此外,还进一步研究了关键因素数量对安全控制过程和结果的影响.
2024, 39(1):103-111. DOI: 10.13195/j.kzyjc.2022.0814
摘要:激光雷达作为同时定位与地图构建(SLAM)传感器之一,因精度高、性能稳定等特点而被广泛研究使用.但其获得的点云数据较稀疏,包含特征信息少,会导致误匹配、位姿估计误差大等问题,影响SLAM的定位和建图精度.对此,提出一种将视觉语义信息与激光点云数据融合的SLAM算法(VSIL-SLAM).首先,基于投影思想将聚类后的点云映射到语义检测框内,生成语义物体,解决原始激光点云特征稀缺问题;然后,在形状特征的基础上引入拓扑特征对语义物体进行表述,提出基于匹配的拓扑相似性度量方法,解决单一特征造成的误匹配问题,提高匹配准确度;最后,加入语义物体点到点的几何约束,基于几何特征和语义物体构建前端里程计,并完成后端回环检测和位姿图优化设计.实验结果表明,所提出算法在定位和建图效果上都有显著提高,改善了激光SLAM算法的性能.
2024, 39(1):112-120. DOI: 10.13195/j.kzyjc.2022.0073
摘要:针对影响多臂抓取稳定性的接触力不平衡和接触振动问题,提出多臂空间机器人力分配和柔顺控制策略.首先,分析满足多臂稳定抓取的力学条件,基于摩擦锥约束设计抓取力安全系数,并将其引入力优化模型进行抓取力分配,实现目标物体稳定抓取条件下受力最小;然后,分析抓取过渡过程的振动成因,设计基于动能消耗的末端输出力控制策略实现快速振动抑制和柔顺抓取;最后,设计机械臂末端控制律切换策略,一旦在抓取过渡过程中发生接触脱离可引导其快速返回物体表面.仿真结果表明,所提出方法提升了稳定抓取安全裕度,显著降低了机械臂末端的振动幅值、持续时间和接触力,提升了空间机器人多臂抓取目标操作的稳定性和柔顺性.
2024, 39(1):121-128. DOI: 10.13195/j.kzyjc.2022.0541
摘要:针对一款具有波纹管外形的充气伸长型气动软体驱动器(简称“气动波纹管驱动器”),提出一种基于宽度学习系统的无模型跟踪控制方法,使该驱动器有效跟踪期望轨迹.首先,介绍气动波纹管驱动器结构,以及气动波纹管驱动器整体实验平台工作原理.根据驱动器实时位置信息提出一种基于宽度学习系统的跟踪控制方法,受PID跟踪控制方法中积分项作用的启发,所提出控制方法不仅采用系统跟踪误差作为宽度学习系统的输入之一,还将跟踪误差对时间的积分项作为另一输入以消除期望轨迹与实际轨迹间的恒定偏差.然后,采用宽度学习系统计算得到控制气压,同时,利用基于梯度下降法的学习律在线调整宽度学习系统权值,进而减小驱动器跟踪误差.最后,通过实验验证所提出方法的有效性.所提出方法无需建立驱动器模型,能够简化控制器设计步骤,且与深度神经网络控制方法相比,能在避免计算量过大的前提下实现较高的跟踪控制精度.
2024, 39(1):129-136. DOI: 10.13195/j.kzyjc.2022.0501
摘要:针对自动跨运车状态估计问题,设计改进的集员滤波算法,在未知有界噪声环境下,获取自动跨运车实时运动状态的估计信息.首先,将自动跨运车运动学模型进行线性化处理,同时考虑其转向因素和侧倾因素,得到车辆的动力学线性模型;其次,将可能存在的内外部扰动建模为未知有界噪声,进而设计改进的集员滤波器,通过获取状态椭球域实现对自动跨运车运动参数的状态估计,同时给出改进的集员滤波算法;最后,通过仿真实验验证所提出算法的可行性和有效性.实验结果表明,所提出的改进集员滤波算法具有良好的状态估计性能.
2024, 39(1):137-142. DOI: 10.13195/j.kzyjc.2022.0658
摘要:针对状态空间模型中存在服从伯努利分布的时延和随机观测丢失的情况,基于极大似然法则,分别设计有限脉冲响应(finite impulse response, FIR)滤波器的慢速率批处理形式和快速率迭代形式.首先,将时延和数据丢失情况下的模型表述为服从伯努利分布的概率线性函数;然后,通过极大似然处理从而得到所提出极大似然FIR算法;最后,将在相同条件下的极大似然FIR估计、改进型卡尔曼滤波以及无偏FIR估计3种滤波方法进行对比,从估计误差、均方根误差和不确定性影响等角度进行比较分析.实验部分通过3-DOF直升机模型仿真,可发现所提出极大似然FIR估计方法在处理时延和数据丢失问题时更加有效,鲁棒性更高.
2024, 39(1):143-150. DOI: 10.13195/j.kzyjc.2022.1592
摘要:为了提高智能车辆路径跟踪控制器的可靠性和控制精度,提出一种基于误差动力学模型的路径跟踪控制方法.基于车辆运动学模型和动力学模型建立系统误差动力学模型,并在此基础上推导出车辆路径跟踪控制的稳态控制律,利用李雅普诺夫稳定性理论验证稳态控制律的正确性.为了减小外部干扰对控制性能的影响,提高控制器的可靠性,进一步设计基于车辆侧向位移误差的瞬态控制律,并利用李雅普诺夫稳定性理论验证闭环系统的稳定性.稳态控制律和瞬态控制律构成了非线性的路径跟踪控制器.通过与车辆路径跟踪常用的线性控制器和非线性控制器对比验证所提出控制方法的有效性,线性控制器选用LQR控制器,非线性控制器选用Stanley控制器.仿真结果表明,与LQR控制器相比,所提出控制方法的路径跟踪控制精度、抗干扰性和可靠性更好.与Stanley控制器相比,所提出控制方法具有更好的路径跟踪控制精度和控制收敛速度,且在大曲率路径跟踪过程中具有更好的可靠性.
2024, 39(1):151-160. DOI: 10.13195/j.kzyjc.2022.0370
摘要:针对机电伺服系统存在参数不确定、未建模动态及时变扰动这一问题,提出一种基于滤波器的浸入与不变自适应算法,该算法能够准确估计伺服系统中的未知参数.首先,构造系统状态及回归函数的滤波器,再根据滤波后的辅助变量构造参数估计器;然后,依据浸入与不变理论设计参数估计器中的辅助函数,从而保证参数估计误差的收敛性.此外,为了进一步降低集总扰动对系统闭环性能的影响,提出一种扰动观测器,这种扰动观测器结构简单,并且能保证估计误差的渐近稳定,从而有效地补偿系统中的未建模动态和外部扰动.最后,利用Lyapunov理论分别证明了参数估计器、扰动观测器及闭环系统的稳定性,仿真与实验结果验证了所提出的自适应方法及扰动观测器的有效性.
2024, 39(1):161-170. DOI: 10.13195/j.kzyjc.2022.0601
摘要:针对马尔科夫链通信拓扑下的车辆队列控制问题,综合考虑车辆队列的非线性动力学模型和行驶能耗优化目标,提出一种基于分布式状态观测器的车辆队列能耗优化控制方法.由于在马尔科夫链通信拓扑下,部分车辆获取的邻居车辆信息具有动态切换特性,严重影响了车辆队列控制算法的有效性和稳定性.鉴于此,首先,设计一种用于估计领航车辆状态信息的状态观测器,有效避免通讯拓扑切换对队列控制系统造成的干扰;然后,结合车辆的非线性动力学模型与队列优化目标,构建一种基于指数折扣函数的车辆队列能耗优化框架,将车辆队列的能耗优化问题转化为Riccati方程的求解问题,进而得到车辆队列的最优能耗控制输入,在此基础上,通过构造动态通信拓扑下的李雅普诺夫函数,分析车辆队列控制系统的稳定性条件,即只要每个可能的通信拓扑均需包含一个以领航车辆为根的有向生成树,就可使得该车辆队列控制系统满足稳定性和队列稳定性;最后,通过数值仿真验证所提出控制算法的可行性和有效性.
2024, 39(1):171-179. DOI: 10.13195/j.kzyjc.2022.0596
摘要:针对结构未知的系统提出一种新的降维辨识方法.借助核函数方法,利用一个高维Volterra模型逼近未知系统.由于Volterra模型未知参数维数较高,为避免高阶矩阵求逆和求特征值,提出变量消去算法,将高维系统的辨识问题转化为两个低维系统辨识问题.通过理论证明采用降维算法后降维系统信息矩阵条件数变小,参数收敛速度得到提高.进一步引入Aitken 加速方法提高算法收敛速度,增强算法对步长的鲁棒特性.最后通过仿真例子验证所提出方法的有效性.
2024, 39(1):180-188. DOI: 10.13195/j.kzyjc.2022.0857
摘要:给定由若干连边和节点组成的网络系统,为了有效、经济地提升整个网络的可靠性,一些耦合的2条连边关于整个网络失效的交互机理需要加以分析.首先,采用饱和非时齐泊松过程刻画连边的失效过程,基于组合计数的思想,导出2条连边处于4种不同状态的概率公式,并结合2条连边的联合D-谱,发展联合失效重要度的计算公式,用于分析2条连边关于网络失效的交互机理.理论分析表明,当时间t趋于0或趋于无穷大时,2条连边的交互效果越来越微弱.然后,由于精确的计算联合失效重要度的值是NP-难问题,设计蒙特卡洛近似算法求其值.最后,提供一个路网的算例,其数值结果表明,所提出联合失效重要度计算方法能够有效地阐释2条连边关于网络失效的交互机理.
2024, 39(1):189-195. DOI: 10.13195/j.kzyjc.2022.0534
摘要:针对复杂协同攻击下一类非线性系统的状态估计问题,提出一种分布式一致性递推滤波算法.首先,将拒绝服务攻击(denial of service,DoS)和虚假数据注入攻击(false data injection,FDI)现象描述为两个随机Bernoulli序列,并利用统一的框架建立包含DoS和FDI的复杂协同攻击模型;然后,基于一致性理论设计具有分布式结构的递推滤波器,计算最优滤波器增益,并推导该滤波器估计误差满足均方有界的充分必要条件;最后,利用室内机器人的定位问题进行验证,仿真结果验证了所提出滤波器算法的有效性.
2024, 39(1):196-205. DOI: 10.13195/j.kzyjc.2022.0021
摘要:五相内嵌式永磁同步电机(interior permanent magnet synchronous motor,IPMSM)发生两相开路故障后,由于两相的缺失,重构后的电压矢量数目减少且分布不均,将影响模型预测控制(model predictive control,MPC)方法的预测精度.而现有的多矢量模型预测控制方法缺乏对电机两相故障工况下的分析.为此,针对两相开路故障,提出一种基于电压误差的多矢量模型预测控制方法.该方法的关键在于在扇区三角形内以等分线段的方式扩展电压矢量的组合,并且推导两相开路故障后的参考电压预测方程和电压误差价值函数来简化多个矢量选择和合成过程.该方法适用于故障工况下不对称形状的扇区,同时兼顾了内嵌式电机$d-q$轴电感不等的特性.最后通过实验验证该方法的动态、稳态性能和鲁棒性,该方法能实现五相内嵌式永磁同步电机的高品质两相开路容错运行.
2024, 39(1):206-218. DOI: 10.13195/j.kzyjc.2022.0557
摘要:针对存在拒绝服务(DoS)攻击与执行器故障的工业信息物理融合系统(ICPS),将机理解析与数据驱动方法相结合,在新型自适应事件触发通信机制下,研究双重安全控制问题.首先,设计自适应事件触发机制,能够触发参数随系统行为动态自适应变化,节约更多网络通信资源;其次,基于系统最大允许时延建立攻击检测机制,可以有效区分大、小能量DoS攻击;再次,基于极限学习机算法(ELM)建立时序预测模型,用于大能量DoS攻击时重构修正控制量,以主动容侵攻击的影响,并给出与小能量攻击时机理解析的弹性被动容侵来提升系统对攻击的防御能力;然后,借助T-S模糊理论、时滞系统理论、新型Bessel-Legendre不等式等,推证得到系统鲁棒观测器及双重安全控制器的解析求解方法,使双重安全控制与通讯性能得到折衷协同提升;最后,通过实例仿真验证所提出方法的有效性.
2024, 39(1):219-226. DOI: 10.13195/j.kzyjc.2022.0622
摘要:在线教育中,学生实时动作能够准确反映学生当前的学习状态,在不影响学习注意力和保证个人隐私信息安全的情况下,准确识别学习动作是监测在线教育质量的关键要素.对此,提出一种基于无源RFID的网络学习动作识别系统LD-identify.LD-identify仅通过射频信号完成学生动作识别,所以识别系统可以很好地保护个人的隐私信息,且避免设备昂贵等一系列问题.通过提取相位和信号强度的有效特征和深度学习算法,LD-identify能够获得很好的识别准确率的性能.实验表明,LD-identify只需要在帽子的背面粘贴两个射频标签,就能很好地识别出抬头低头、左右摇头、前倾后倾3种动作.为了进一步验证系统性能,研究6名志愿者在不同的场景中的动作识别的准确率,实验结果显示LD-identify能够在不同的场景下很好地识别所有用户的3种动作,利用卷积神经网络构建分类模型来识别动作可以取得很好的识别率,识别准确率达到95.5%以上.
2024, 39(1):227-235. DOI: 10.13195/j.kzyjc.2022.0808
摘要:现有的红外与可见光图像融合算法通常从单一尺度提取图像特征,导致融合图像无法全面保留原始特征信息.针对上述问题,提出一种基于多尺度和注意力机制的自编码网络结构实现红外与可见光图像融合.首先,采用密集连接和多尺度注意力模块构建编码器网络,并引入自注意力机制增强像素间的依赖关系,充分提取红外图像的显著目标和可见光图像的细节纹理;然后,特征融合阶段采用基于通道与空间的联合注意融合网络,进一步融合图像典型特征;接着,设计基于像素、结构相似性和色彩的混合损失函数指导网络训练,进一步约束融合图像与源图像的相似性;最后,通过对比实验的主观和客观评价结果,验证所提出算法相比于其他代表性融合算法具有更优异的图像融合能力.
2024, 39(1):236-243. DOI: 10.13195/j.kzyjc.2022.0364
摘要:针对传统系统评价方法在评价指标体系构建和权重分配过程中过于依赖专家主观意见的缺点,利用网络分析法(ANP)结构与知识图谱结构的相似性,提出一种基于知识图谱的网络分析强化方法,充分使用先验知识,增强评价的完备性和客观性.首先,收集评价任务相关的文本数据建立知识图谱,作为网络分析法的网络层指标库;然后,依据评价任务确定网络分析法的控制层,包括评价目标和评价准则.根据控制层,在网络层指标库中搜索适配的指标构建网络层;接着,以指标与准则间的相似度为客观度标准,调整指标相对重要性,并通过网络分析法计算各指标的权重,依据各指标的得分完成系统评价;最后,应用案例的结果验证该方法具有有效性、先进性以及通用性.
2024, 39(1):244-252. DOI: 10.13195/j.kzyjc.2022.1234
摘要:在B2B(business to business)物流配送中,收货方通常对配送时间的规律性有较高要求,以配合自身的生产经营活动.对考虑时间窗一致性的车辆路径优化问题展开研究,构建其混合整数线性规划模型,并设计自适应大规模邻域搜索算法进行求解.针对每日配送路径在时间维度的一致性耦合关系,提出距离优先和时间窗优先相结合的优化策略,在算法框架中嵌入时间窗标定及一致性检验模型,并设计联动型算子以对每日路径方案进行协同操作.基于既有数据集、自建数据集和大规模实际算例对模型算法的有效性进行验证,结果表明,所提算法可以快速求得高质量解,提出的时间窗优先策略及对应的联动型算子可以显著提升算法性能.根据数值计算结果量化分析实现时间窗一致性的附加运输成本,揭示了不同客户点规模和时间窗长度下一致性成本的变化规律.
2024, 39(1):253-262. DOI: 10.13195/j.kzyjc.2022.1821
摘要:针对作业车间中自动引导运输车(automated guided vehicle,AGV)与机器联合调度问题,以完工时间最小化为目标,提出一种基于卷积神经网络和深度强化学习的集成算法框架.首先,对含AGV的作业车间调度析取图进行分析,将问题转化为一个序列决策问题,并将其表述为马尔可夫决策过程.接着,针对问题的求解特点,设计一种基于析取图的空间状态与5个直接状态特征;在动作空间的设置上,设计包含工序选择和AGV指派的二维动作空间;根据作业车间中加工时间与有效运输时间为定值这一特点,构造奖励函数来引导智能体进行学习.最后,设计针对二维动作空间的2D-PPO算法进行训练和学习,以快速响应AGV与机器的联合调度决策.通过实例验证,基于2D-PPO算法的调度算法具有较好的学习性能和可扩展性效果.
2024, 39(1):263-270. DOI: 10.13195/j.kzyjc.2022.0768
摘要:复杂装备制造企业的售后配件需求不定时发生、需求波动大,导致需求数据呈现典型的间歇性、小样本特点.当面对间歇性程度高、突发需求较大的序列时,现有预测模型难以准确捕获其需求波动规律,无法有效预测配件需求走势.为提高多组配件的预测精度和稳定性,同时考虑序列间结构化信息和序列自身时序演化信息,提出一种新的多变量间歇性时间序列预测方法.首先,提出一种基于张量的轻型梯度提升机模型,通过张量分解,重构原始需求数据,修正序列中的异常需求值,并利用轻型梯度提升机对多组序列进行联合预测;然后,构建一种新的线性衰减修正模型,将修正因子引入线性衰减指数平滑方法,对每条序列分别预测需求量和间隔区间;最后,将2个预测模型进行加权融合,得到最终预测结果.分别在2个复杂装备制造企业的售后配件需求数据集上进行实验验证,实验结果表明,与多个时间序列预测算法相比,所提出方法能够有效预测需求波动趋势,提升预测精度和数值稳定性.
2024, 39(1):271-280. DOI: 10.13195/j.kzyjc.2022.0414
摘要:在企业与企业之间竞争日趋激烈的背景下,能否在多个企业紧密联系的供应链中通过收益分配高效赋能上下游企业成为决策者撬动协同优势、凝聚创新合力的关键.基于失望理论,运用微分博弈方法针对供应链协同产品创新动态改进与协调进行策略挖掘,将产品创新研发商誉和失望规避因素纳入决策行为之中,在此基础上提出产品创新补贴契约和收益配比调节机制,最后对计算结果进行仿真分析.研究发现:无论在哪种博弈情形下,失望规避系数越大,供应链成员目标利润越低;在一定条件下,创新研发及推广补贴契约的设计与实施,能有效提升受补贴方研发和推广水平、最优收益和供应链整体收益,而提供补贴方的研发努力水平保持不变;将收益分配比率约束在特定的范围内,可有效提高供应链系统的总体绩效,实现协同合作下帕累托最优.
2024, 39(1):281-290. DOI: 10.13195/j.kzyjc.2022.0149
摘要:云环境下工业信息物理系统架构的转变使得工业现场设备更加暴露于网络攻击下,对工业现场层提出更高的安全需求.随着系统结构愈渐复杂,网络攻击更加智能,系统难以准确获取安全状态,传统的基于状态的安全决策方法将不能实现有效防护,对此提出一种工业信息物理系统现场层安全策略决策方法.首先,根据功能结构划分现场区域,分析潜在的攻击目标、攻击事件与系统防御策略间的关联性,构建攻击防御树;然后,从攻击和防护属性的视角,利用模糊层次分析法量化防御策略收益;接着,结合部分攻击状态构建部分可观的马尔可夫决策过程模型,通过求解模型得到最优安全策略;最后,以简化的田纳西-伊斯曼过程控制系统为对象验证所提出方法能够有效地决策出最优安全策略.
2024, 39(1):291-300. DOI: 10.13195/j.kzyjc.2022.0368
摘要:在由单个制造商和单个零售商构成的低碳供应链中,制造商与零售商之间不同的权力结构决定着他们的减排策略与博弈方式.同时,低碳产品商誉与需求受到制造商与零售商减排策略及随机因素的长期动态影响.在不同的权力结构下,对制造商减排努力策略与零售商宣传努力策略进行随机微分博弈分析;在集中式决策基础上,分别构建制造商主导与零售商主导的Stackelberg博弈、无主导Nash博弈模型,求解模型并对结果进行理论分析与数值实验.研究发现:相较于自己作为主导者,对方作为主导者会促使制造商或零售商做出更大的减排努力或宣传努力;与有主导者的供应链相比,无主导者的供应链可能实现更大的低碳产品商誉;制造商作为主导者能够提升低碳产品商誉与需求以及供应链总利润.随机因素促使制造商和零售商分别提高了减排努力和宣传努力以及低碳产品商誉.
2024, 39(1):301-310. DOI: 10.13195/j.kzyjc.2022.0655
摘要:复杂武器装备的交付效率直接影响国防战斗力的转化,为提高交付效率,基于复杂武器装备交付问题处理的多任务特点,建立考虑追责机制的交付链式激励契约模型,探究在信息对称和信息不对称两种情况下追责机制、公平偏好、风险类型、依赖等因素对激励契约的影响.研究表明:公平偏好因素对各技术业务部门的努力水平有明显激励作用;代理人在相对重要且成本系数低的交付任务上投入了更多的努力;部门的综合技术水平、依赖系数、公平偏好对最优激励契约的影响与其风险偏好类型以及风险偏好程度相关;追责机制在一定程度上能够提高整体努力水平和收益分成比例,但是过高的追责能力水平反而会降低交付积极性.研究结论可为复杂装备交付环节激励契约设计提供理论支撑和依据.
2024, 39(1):311-318. DOI: 10.13195/j.kzyjc.2022.0666
摘要:在演化博弈论中,合作有利于增加群体收益.目前,大量的研究工作都在关注合作水平的提高,但忽视了理论与实际的相关性,同时策略更新时间仅限于一个点上的收益.为此,引入完全同步、相对同步、高斯异步、指数异步4种观察机制模型,考虑智能体观察期内所获得的平均收益.随后,采用蒙特卡洛方法进行实验仿真,并分析各观察机制对囚徒困境博弈合作水平的影响.结果表明:在4种模型中都存在观察时间阈值,此时合作水平将达到峰值;最高合作水平在指数异步模型中实现;高斯异步模型中,合作水平与方差成正相关;智能体间的异质性也对合作产生积极影响.这项研究有助于打破传统研究收益的局限,促进合作水平的提高.仿真实验结果为支持社会群体合作提供了一定的理论依据.
2024, 39(1):319-326. DOI: 10.13195/j.kzyjc.2022.1319
摘要:针对工人和任务进行匹配是空间众包研究的核心问题之一,但已有的方法通常会忽略工人路径对任务分配结果产生的影响.传统的任务分配方法存在计算速度慢、适用范围小和协作效果不突出等问题.对此,从空间众包平台的角度出发研究面向路网的空间众包任务分配问题,以任务完成时间最短为目标,提出考虑工人路径规划的基于多智能体强化学习的QMIX-A*算法,缩短任务的平均完成时间,进而提高用户的满意度.大量的数值仿真研究验证了QMIX-A*的有效性和稳定性,为空间众包服务平台的任务分配与路径优化策略的选择提供决策支持.
2024, 39(1):327-335. DOI: 10.13195/j.kzyjc.2022.0636
摘要:提出基于社会网络分析的专家负面行为识别与管理,以及基于改进的最小成本共识模型的大群体决策方法.首先,定义专家正面社会形象、负面社会形象以及观点指标等概念,根据专家负面行为表现方式提出负面社会形象管理、负面评估偏好管理以及双重负面行为管理3种策略;其次,计算专家的观点相似度、正面社会形象相似度、负面社会形象相似度,基于K均值聚类方法对大群体专家聚类;然后,考虑社会形象对共识达成的影响作用,提出基于社会形象的改进最小成本共识模型,以达成群体共识并获得最终方案排序;最后,通过一个众筹平台选择算例分析说明所提出方法的有效性和可行性.
2024, 39(1):336-344. DOI: 10.13195/j.kzyjc.2022.0260
摘要:船舶在自动靠泊的过程中会受到风、浪、流和岸壁效应等多种因素的干扰.鉴于此,针对全驱动船舶在复杂海洋条件下的自动靠泊问题,基于事件触发机制和模型预测控制,设计一种船舶自动靠泊控制器,以解决全驱动船舶在模型不确定性、执行器饱和、未知环境扰动以及岸壁效应等因素影响下的船舶自动靠泊问题.首先将船舶的三自由度模型进行线性化和离散化处理,并根据全驱动船舶的特性采用先泊位外镇定再平行靠拢的靠泊方式;然后为了提高求解速度,提出一种基于事件触发的自适应时域模型预测控制方案并进行稳定性分析;最后对一艘全驱动船舶进行仿真实验,将所提出的控制方案与其他已知方法进行对比.实验结果表明,所提出控制方案不仅能明显降低运算时间,而且具有更好的控制效果.
2024, 39(1):345-352. DOI: 10.13195/j.kzyjc.2022.0892
摘要:针对一类模型未知的离散时间非线性多智能体系统聚类一致性问题,提出一种无模型自适应控制算法.首先,假设系统具有固定拓扑,利用伪偏导数概念得到系统的数据关系模型,在考虑多智能体之间耦合系数条件下给出聚类一致性误差,在此基础上设计一种数据驱动的聚类一致性跟踪控制协议;然后,采用压缩映射方法在理论上分析了跟踪误差的收敛性,结果表明所提出算法不需要智能体模型信息即可完成跟踪任务,是一种数据驱动的控制方法;最后,将结果拓展至随机切换拓扑结构的多智能体系统中,数值仿真结果验证了所提出算法的有效性.
办公地点:东北大学 综合楼313室
通讯地址:沈阳市和平区文化路3巷11号 东北大学125信箱 《控制与决策》编辑部(110819)
收件人:《控制与决策》编辑部 (如果快递,请选择EMS或顺丰快递,其他快递无法送达。)
电话: 024-83687766,23906437
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司
E-mail: kzyjc@mail.neu.edu.cn
版权所有 :控制与决策
技术支持:北京勤云科技发展有限公司