2026年第41卷第5期文章目次

2026, 41(5):1201-1218. DOI: 10.13195/j.kzyjc.2024.1492

摘要 (8) HTML (7) PDF 161.07 K (9) 评论 (0) 收藏

摘要:近年来交通运输业呈现出迅猛发展的态势, 电动汽车由于可以减少环境污染并使得交通系统更加智能得到了快速发展. 然而, 由于电动汽车充电桩分布不均匀, 导致出现电动汽车里程焦虑问题. 车-车(V2V)能量互济装置的研究成为消除电动汽车里程焦虑的关键技术之一. V2V技术不仅可实现两辆电动汽车之间的电能传输, 缓解电池续航不足与充电桩分布不均的问题, 还能显著提升充电灵活性. 鉴于此, 对现有车-车能量互济装置的拓扑结构和控制策略进行全面讨论, 首先分析隔离型、非隔离型和无线传输型3类主要拓扑结构的工作原理和应用场景; 进而探讨对其线性和非线性控制策略的优缺点, 并结合不同拓扑给出优化建议; 同时扩展讨论V2X技术的发展趋势, 包括车-车(V2V)、车-家(V2H)、车-网(V2G)协同控制等多种应用场景在智能电网中的应用前景; 最后讨论V2V充电技术的商业化发展现状、商业化解决方案和面临的挑战.

基于多智能体深度强化学习的轨道车辆组装分布式异构柔性作业调度

孟祥恒，郭鹏，李嘉雯，史海超，张志瑶，马永敬，孙轶杰

2026, 41(5):1219-1228. DOI: 10.13195/j.kzyjc.2025.0857

摘要 (2) HTML (6) PDF 120.84 K (7) 评论 (0) 收藏

摘要:针对轨道车辆组装作业中多车型混线生产、工序复杂、工艺路线差异显著及制造资源高度异构带来的分布式异构柔性作业车间调度挑战, 提出一种两阶段多智能体深度强化学习方法. 将调度流程建模为多阶段马尔可夫决策过程, 决策涵盖工件分配、工序排序和机器选择, 通过奖励设计引导智能体最小化全局最大完工时间. 上层智能体基于分层异构图注意力网络提取产线全局状态, 实现工件在不同组装线或工区间的合理分配与负载均衡; 下层智能体采用双智能体协作策略, 利用基于图神经网络的编码器-解码器结构捕捉工序间前后约束及资源占用等依赖关系, 实现局部优化. 基于实际作业场景数据, 通过计算验证该方法在缩短制造周期方面的有效性, 展现出良好的泛化能力.

面向多动态目标基于拍卖机制与MASAC的AUV协同围捕

谢地杰，李敏，曾祥光，任文哲，张滔，彭倍

2026, 41(5):1229-1241. DOI: 10.13195/j.kzyjc.2025.0710

摘要 (1) HTML (5) PDF 122.54 K (6) 评论 (0) 收藏

摘要:针对多动态目标的自主水下航行器集群协同围捕决策与控制问题, 提出一种融合拍卖机制与多智能体深度强化学习的围捕算法. 该方法将围捕任务分解为目标分配和运动控制两个阶段: 首先, 基于最优控制理论中的配点法, 综合考虑围捕态势、最短时间和最低能耗等优化目标, 生成训练数据与竞标值标签, 并利用监督学习训练拍卖神经网络, 实现了自主水下航行器的实时目标分配; 接着, 构建分配后的个体状态空间, 设计多目标围捕奖励函数, 采用多智能体柔性演员-评论家算法, 优化了围捕策略. 高效、自适应的拍卖算法确保了动态复杂环境下的快速目标分配, 多智能体强化学习则提升了群体的协同控制快速响应能力. 最后, 开展不同场景中的围捕实验. 实验结果表明, 所提方法能够显著提高围捕策略的表现效果, 在应对2、3和4个动态目标时, 平均围捕成功率分别为79.04%、89.78%和90.43%, 相较于基线方法, 分别提升了48.41%、54.00%和53.93%, 即所提算法在处理不同规模围捕任务时均具有更好的效果.

多智能体系统层级预定义时间最优容错控制

刘尚坤，谢俊江，黄景丽，黄捷

2026, 41(5):1242-1256. DOI: 10.13195/j.kzyjc.2025.0818

摘要 (2) HTML (5) PDF 143.09 K (5) 评论 (0) 收藏

摘要:针对存在传感器故障与非仿射故障的多智能体系统容错控制问题, 提出一种层级预定义时间最优容错控制框架. 以提升系统可靠性和收敛速度为研究目标, 基于层级控制、强化学习和预定义时间稳定性理论, 构建虚拟层与实际控制层的协同机制. 在虚拟层设计分布式最优一致性跟踪控制器, 通过自适应状态观测器估计未知非线性动态, 结合滑模面与演员-评论家结构求解近似最优控制策略, 实现多智能体同步最优控制与能量最小化; 实际控制层基于虚拟层生成的最优轨迹, 设计自适应模糊预定义时间容错跟踪控制器, 利用 Lyapunov 稳定性理论保证跟踪误差在预定义时间内收敛至有界集合, 同时逼近传感器故障参数与非仿射故障函数. 通过调整所设计控制器中的预定义参数, 系统可以在期望的预定义时间内实现自适应跟踪的目标. 最后, 通过仿真实验验证了所提出控制策略的有效性.

时变多智能体系统的鲁棒自适应一致性跟踪控制

李艳辉，石远彬，孙家兴

2026, 41(5):1257-1264. DOI: 10.13195/j.kzyjc.2025.1178

摘要 (4) HTML (3) PDF 78.15 K (8) 评论 (0) 收藏

摘要:传统固定增益控制策略在多智能体系统面临时变参数不确定性时, 常存在收敛速度与控制精度难以兼顾, 以及鲁棒性不足的问题. 为此, 提出一种鲁棒自适应控制策略, 以提升系统在参数动态变化环境下的一致性跟踪性能. 首先, 基于系统的固定通信拓扑, 构造图结构一致性误差, 该误差包含智能体与相邻跟随者以及领导者之间的状态误差; 其次, 设计一种分布式控制律, 该控制律融合参数自适应律与基于全局代价函数梯度的优化机制, 可以实现在线优化控制增益. 此外, 基于Lyapunov稳定性理论, 证明闭环系统的一致最终有界性. 仿真结果进一步表明, 在固定通信拓扑且系统存在参数扰动的情况下, 所提出策略仍能实现快速、平滑的状态收敛, 有效提高了系统的跟踪性能与鲁棒性.

有界控制增益下异构多智能体系统的预设时间时变编队跟踪

刘恩豪，贾新春，段苏娜，李宏鹏，李寰宇

2026, 41(5):1265-1274. DOI: 10.13195/j.kzyjc.2025.0990

摘要 (1) HTML (4) PDF 105.66 K (9) 评论 (0) 收藏

摘要:研究有向图下具有有界控制增益的异构多智能体系统(HMASs)的预设时间时变编队跟踪(TVFT)问题. 首先, 为每个智能体提出一个预设时间切换观测器用于估计领导者的状态, 该观测器从一个基于时基生成器(TBG)项的观测器切换到另一个基于分数阶项的观测器. 基于预设时间切换观测器, 提出一个编队跟踪切换控制器, 该控制器从一个基于TBG反馈的控制器切换到另一个基于分数阶反馈的控制器. 所提出的预设时间切换观测器和编队跟踪切换控制器中的切换时刻均可由用户提前任意预设. 然后, 使用李雅普诺夫稳定性理论, 证明在所提控制器下可以使编队跟踪误差在预设切换时刻收敛到一个可调域内, 并在预设切换时刻后的另一个预设时间内收敛到零. 与现有的具有时变扩展函数的控制器相比, 所提出的控制器可以避免无界控制增益带来的数值实现问题. 最后, 通过两个仿真示例验证理论结果的有效性.

一种融合改进滑模扩张状态观测器和卡尔曼滤波的进气系统自抗扰控制方法

荣海娜，周泽震，张葛祥，刘俊，但志宏，张松

2026, 41(5):1275-1286. DOI: 10.13195/j.kzyjc.2025.0854

摘要 (1) HTML (3) PDF 122.27 K (4) 评论 (0) 收藏

摘要:针对高空飞行环境模拟试验装置的进气系统在应对发动机过渡态时, 表现出强非线性和模型不确定性, 受未知扰动及测量噪声影响, 难以快速、平稳和精确控制的问题, 提出一种融合改进滑模扩张状态观测器和卡尔曼滤波的自抗扰控制方法. 首先, 设计一种变幂次趋近律来提高状态收敛速度; 然后, 构造一种非奇异快速收敛滑模面来加速跟踪误差收敛, 并推导对应的滑模非线性收敛函数; 接着, 将所设计观测器与卡尔曼滤波相融合, 通过扩张状态观测器对总扰动进行观测和补偿, 同时, 利用卡尔曼滤波抑制测量噪声, 二者通过相互协同可实现对扰动和噪声的双重抑制, 并基于此设计自抗扰控制器; 最后, 给出完整的稳定性证明和仿真验证. 仿真实验结果表明: 基于改进滑模扩张状态观测器的自抗扰控制器在受测量噪声干扰下, 比基于传统扩张状态观测器的自抗扰算法具有更高的跟踪精度和跟踪速度; 融合卡尔曼滤波器后, 在保证跟踪性能的同时能够有效降低进气系统调节阀控制量摆动幅度.

基于事件触发的多四旋翼无人机编队双层串联博弈控制

蔡方玉，黄宜庆，邓雄峰，许刚

2026, 41(5):1287-1298. DOI: 10.13195/j.kzyjc.2025.0494

摘要 (1) HTML (5) PDF 133.41 K (10) 评论 (0) 收藏

摘要:针对多四旋翼无人机系统编队控制问题, 提出一种基于事件触发机制的双层串联博弈编队控制算法. 该算法对多四旋翼无人机编队任务进行解构, 以此设计多场对局并构建双层串联博弈控制框架. 首先, 在第1层博弈中, 具备通信能力的四旋翼无人机对通过在两场对局中的博弈交互, 求解出可使双方位置与速度达到纳什均衡状态的位置策略与速度策略. 其次, 每架四旋翼无人机对第1层博弈中与多架四旋翼无人机对局产生的两组策略进行加权处理, 生成作为第2层博弈参与变量的两个控制策略. 进一步, 围绕各四旋翼无人机的位置误差与速度误差构建第2层博弈中的对局模型, 通过博弈优化过程确定最佳增益系数, 进而获取使位置误差与速度误差达到纳什均衡的最优控制策略. 此外, 引入事件触发机制, 动态调整控制策略更新, 降低对四旋翼无人机有限机载资源的消耗. 最后, 通过仿真实验与实际平台测试, 验证所提算法在多四旋翼无人机编队控制中的有效性与可行性.

基于预设时间滑模的多直线电机系统位置协同控制

许德智，牟泮龙，潘庭龙，张清越，叶宇剑，花为

2026, 41(5):1299-1309. DOI: 10.13195/j.kzyjc.2025.0204

摘要 (1) HTML (4) PDF 95.82 K (5) 评论 (0) 收藏

摘要:多电机协同控制系统的跟踪性能和同步性能是评估工业过程中安全性和可靠性的关键指标, 通过创新性地设计基于预设时间滑模控制方法的改进跟踪算法, 在动态不确定条件下实现多电机系统的高精度跟踪控制与同步误差最小化. 首先, 设计预设时间滑模控制器使综合误差在预设时间内收敛到零邻域, 同时设计非线性干扰观测器观测系统扰动并前馈给控制器. 为了解决奇异性问题, 使用控制律切换方法使系统稳定后的控制器不再依赖时间. 仿真和实验对比结果表明, 所提出的方法能够有效实现多电机系统的协同跟踪一致性.

基于适应性支配策略的高维多目标优化算法

郭肇禄，赵擎宇，杨火根

2026, 41(5):1310-1320. DOI: 10.13195/j.kzyjc.2025.0701

摘要 (1) HTML (5) PDF 141.19 K (5) 评论 (0) 收藏

摘要:在高维多目标优化算法中, 维持收敛性和多样性的平衡对算法性能尤为关键. 然而, 单一的支配关系难以有效维持二者的平衡. 鉴于此, 提出一种基于适应性支配策略的高维多目标进化算法ADSMOEA. 适应性支配策略通过融合两种在收敛性和多样性上互补的支配关系, 并根据种群当前的状态选择合适的支配关系, 从而维持二者的平衡. 同时, 为了准确评估种群的收敛状态, 设计一种角度收敛指标, 通过引入目标向量夹角信息提高种群收敛性评价的准确性, 为支配关系的选择提供指导. 此外, 设计一种适应性的多样性算子以维持种群的多样性. 将所提出算法与7个先进算法进行对比实验以验证ADSMOEA的有效性. 实验结果表明, 所提出ADSMOEA算法在解决高维多目标优化问题时具有较强的竞争力.

多变量阻尼累加非线性时滞离散灰色模型及其应用

杨林云，沈琴琴，曹阳

2026, 41(5):1321-1330. DOI: 10.13195/j.kzyjc.2025.0735

摘要 (1) HTML (5) PDF 139.03 K (5) 评论 (0) 收藏

摘要:针对多变量时滞阻尼累加灰色模型$({\rm TLDAGM} (1,N)) $建模机理不明确、非线性特征挖掘不充分以及存在转换误差等问题, 提出一种多变量阻尼累加非线性时滞离散灰色模型. 首先, 引入线性和非线性修正项拓展模型灰信息结构, 不仅能够增强对数据非线性特征的挖掘能力, 还能实现与经典${\rm GM }(1,1) $模型的兼容性; 然后, 通过数值积分可有效避免原模型中将时间驱动项视为灰常量以及对导数项的近似处理所引起的建模误差; 最后, 结合离散灰色建模的思想, 有效消除微分方程到差分方程的转换误差. 选取近年来上海市高新技术产业产值数据进行实证分析, 并利用量子粒子群优化算法寻求模型的最优参数. 结果表明, 新模型的拟合和预测精度均优于${\rm TLDAGM} (1,N) $模型以及其他几种多变量灰色模型, 且展现出良好的稳定性.

具有误差约束的机械臂系统自适应强化学习控制

苏航，张滋林

2026, 41(5):1331-1337. DOI: 10.13195/j.kzyjc.2025.1010

摘要 (0) HTML (4) PDF 79.81 K (4) 评论 (0) 收藏

摘要:为了提高机械臂控制过程中的安全性, 针对机械臂系统的误差约束问题提出一种基于强化学习的自适应控制方法. 将机械臂的动力学系统转化为关于跟踪误差的动态方程, 然后利用一类误差转换函数, 将受约束的误差系统转换为新的不受约束系统, 并基于此系统设计最优控制器. 为了解决最优控制问题, 利用强化学习的方法求解系统的HJB方程, 其中评价网络用于逼近系统最优值函数, 执行网络用于逼近最优控制器的输出, 并利用一类正定函数来大幅简化评价-执行网络的自适应率. 基于李雅普诺夫稳定性理论, 证明系统所有误差信号半全局一致最终有界. 最后通过一个2自由度机械臂的仿真案例验证所提出方法的有效性.

低碳视角下油电混合车队配送路径优化研究

巩亮，郑世龙，许得杰，耿慧琳，周健，惠昌武

2026, 41(5):1338-1347. DOI: 10.13195/j.kzyjc.2025.0435

摘要 (1) HTML (4) PDF 100.73 K (5) 评论 (0) 收藏

摘要:针对道路行驶速度随时间变化且软时间窗条件下的同时配集车辆路径优化问题, 以配送总成本最小化与客户满意度最大化为目标, 考虑车辆载重等约束条件, 构建时变交通下油车-电车混合车队货物配送路径优化模型. 根据模型特点设计考虑时空距离、基于Pareto非支配排序的多目标混合启发式算法, 将遗传算法与变邻域搜索算法结合, 增强算法的局部搜索能力. 以Solomon中C101类部分客户为例进行算例分析, 进行不同规模客户点对比分析和模拟数据与真实数据对比实验. 研究结果表明: 与多目标协同优化遗传算法等相比, 所提出的算法将总成本降低至7 008.47元, 降幅分别为4.59%、5.46%、6.80%、10.77%和8.41%, 客户满意度提升至0.841. 考虑不同情况下对参数进行灵敏度分析, 合理的配送重量可将配送总成本节约69.28%、28.14%和38.61%; 合理的车辆载重量可将配送成本节约31.2%和62.3%. 研究结果表明, 所构建的模型和所提出的算法能合理调配不同类型的车辆, 科学规划车辆路径, 降低物流配送总成本, 减少车辆碳排放, 提高企业经济效益.

一种退化环境下多传感器融合的SLAM算法

彭雯宇，齐咏生，刘利强，苏建强，张丽杰

2026, 41(5):1348-1358. DOI: 10.13195/j.kzyjc.2025.0527

摘要 (0) HTML (3) PDF 99.78 K (5) 评论 (0) 收藏

摘要:针对单一传感器同步定位与地图构建(SLAM)技术在退化环境下定位精度低、地图漂移和可靠性差等问题, 提出一种基于R3LIVE框架改进的多传感器融合的SLAM算法RMF-SLAM(refined multi-modal fusion SLAM). 首先, 设计一种随机过程增强的运动学模型, 将IMU测量作为输出建模, 即使在IMU测量运动饱和的情况下, 所提出算法也能对激烈运动进行准确定位和可靠映射; 其次, 构建一种基于Hessian矩阵特征值退化判别的LiDAR和视觉退化感知模块, 通过实时评估系统状态和传感器可靠性来动态调整不同传感器信息权重比例和筛选高价值视觉观测帧, 在视觉和LiDAR均极度退化时, 系统沉睡当前地图, 防止定位失败, 当传感器再次正常工作时重新激活沉睡地图; 最后, 提出一种采用全局描述符对地图进行相似性检测的方法, 将相应的睡眠地图集成到当前活跃地图中, 从而在系统运行完成后形成高度精确的全局地图. 通过在公开数据集与经典的SLAM算法进行对比, 并在私有数据集及真实场景中验证算法能有效抑制退化环境对轨迹估计和地图构建的负面影响, 提升算法的精度和可靠性.

基于知识增强的智能体复杂任务分解方法

金宗瀚，吴李康，刘玉祥，何明，赵洪科

2026, 41(5):1359-1369. DOI: 10.13195/j.kzyjc.2025.0833

摘要 (2) HTML (3) PDF 103.28 K (5) 评论 (0) 收藏

摘要:基于大语言模型的智能体在复杂任务的处理中表现出卓越的语言理解和深度推理潜力, 然而, 当它在应对更加复杂的挑战时, 尤其是某一特定领域内涉及到领域规则的复杂任务时, 其表现往往不尽人意. 这种不足主要源于大语言模型内部缺乏对领域中专业知识和依赖约束的显示建模, 导致解决问题的过程中生成不符合逻辑或不可执行的子任务序列, 进而引发规划幻觉和领域知识结构性缺失等问题. 为解决这类问题, 提出一种基于知识增强的复杂任务分解框架. 该框架将知识图谱与思维链技术相融合, 旨在以知识增强为核心, 通过构建约束关系和领域知识双图谱, 为大语言模型在解析复杂任务的过程中提供结构化知识约束, 并结合高质量的推理路径输入, 引导模型生成语义完整、逻辑合理且可执行的子任务序列. 实验结果表明, 在2WikiMultiHopQA、HotpotQA和MuSiQue三类多跳问答数据集上, 基于不同参数规模的Qwen2.5模型中, KTD框架在所有任务和资源配置下均显著优于主流的相关Prompting策略方法, 其中在1.5B低资源配置下任务准确率最高可提升13.86%, 进一步表明了KTD框架在缓解规划幻觉和弥补领域知识结构性缺失方面的有效性.

基于云模型的在线协诊三边匹配决策方法

彭娟娟，凌初阳，隆清琦

2026, 41(5):1370-1380. DOI: 10.13195/j.kzyjc.2025.0669

摘要 (3) HTML (3) PDF 113.09 K (4) 评论 (0) 收藏

摘要:针对分级诊疗在线协诊三边匹配问题, 提出基于云模型的三边匹配决策方法, 以满足医联体背景下分级诊疗在线协诊匹配的服务需求. 首先, 利用BERTopic、Stanza和Textlob处理好大夫在线评论信息, 获取患者对基层医生客观的匹配属性, 并结合属性的偏好信息确定相应权重; 然后, 构建多粒度概率语言非对称云模型以及相应的概率语言非对称云Bonferroin Mean聚合算子; 接着, 考虑基层医生与专家间的协同性、医生间的工作量均衡性以及医患匹配的稳定性等因素, 构建相应的三边稳定匹配决策优化模型, 并给出求解算法; 最后, 结合实际案例、灵敏度分析和比较分析验证了所提出方法的可行性和稳定性, 为分级诊疗在线医疗的三边匹配决策问题提供了理论支撑.

基于声信号多特征时频谱图的供水管网漏损检测

孙庆帅，张英杰，刘华亮，李述杰

2026, 41(5):1381-1391. DOI: 10.13195/j.kzyjc.2025.0391

摘要 (1) HTML (4) PDF 107.18 K (3) 评论 (0) 收藏

摘要:基于声信号的漏损检测方法在人工巡检中具有重要应用价值, 正逐步发展为一种新兴的远程监测手段. 传统基于深度学习的漏损声信号识别方法往往受到信号预处理流程繁琐以及环境噪声干扰的限制, 难以在其他供水管网中实现良好的泛化性能, 漏损检测的准确率亦有待进一步提升. 鉴于此, 首先, 针对供水管网声信号构建高时间分辨率和高频率分辨率下的线性谱图和对数梅尔谱图, 兼顾声信号的高频与低频特征, 突出短时动态变化以及微弱频率特征, 并以并行方式输入至卷积神经网络; 然后, 引入并行机制的时-频注意力卷积块进行特征提取, 增强对时间和频率维度的细粒度特征捕捉能力; 最后, 利用真实供水管网声信号数据和物理仿真数据对所提出方法进行漏损检测性能实验验证, 实验结果表明, 所提出方法显著提高了对漏损事件的识别率, 具有良好的鲁棒性和泛化能力.

基于灰色扩展卡尔曼滤波模型的锂电池健康状态估计

徐志存，谢乃明

2026, 41(5):1392-1402. DOI: 10.13195/j.kzyjc.2025.0537

摘要 (2) HTML (4) PDF 155.86 K (6) 评论 (0) 收藏

摘要:锂电池健康状态估计作为现代能源存储技术的核心, 广泛应用于电动汽车、移动设备等领域. 随着使用时间的增长, 其性能衰减问题逐渐显现, 这不仅会影响电池的存储能力, 还可能引发安全隐患, 因此, 准确估计锂电池的健康状态显得尤为重要. 经验模型是锂电池退化理论中常用的解决方法, 其中的双指数模型可演化推导出幂指数驱动的灰色GM(1,1,$ \mathrm{e}^{\mathit{\lambda}t} $)模型. 在GM(1,1,$ \mathrm{e}^{\mathit{\lambda}t} $)模型的基础上建立状态空间模型, 融合扩展卡尔曼滤波模型形成灰色扩展卡尔曼滤波模型. 将所提出的灰色扩展卡尔曼滤波模型用于锂电池健康状态非线性退化估计问题. 采用牛津大学公开的单体电池数据进行验证, 在单个电池的基础上将所提出模型用于估计 20 辆电动汽车的锂电池健康状态, 以进一步验证所提出模型在实际场景中的适用性.

几何先验引导的堆叠点云抓取位姿联合预测方法

李小晗，张哲戬，徐胜军，孟月波，杨玥，武经，苏晓杰，陈义明

2026, 41(5):1403-1414. DOI: 10.13195/j.kzyjc.2025.0696

摘要 (0) HTML (4) PDF 109.53 K (8) 评论 (0) 收藏

摘要:为提升机器人在非结构化堆叠场景中的抓取识别精度与执行稳定性, 提出一种融合几何先验建模与姿态质量评估机制的六自由度抓取预测算法. 首先, 构建点云识别网络 Point-LaKan, 通过增强输入点云的局部几何特征, 设计由局部聚合模块与高维非线性映射模块构成的LAKAN特征提取结构, 提升对堆叠抓取区域的结构表征能力; 其次, 设计方向向量约束下的抓取姿态估计策略, 通过最小化初始与目标姿态间的空间差异, 提升姿态生成的可执行性与可解释性; 最后, 构建融合方向约束、碰撞检测与质心评分的抓取姿态筛选机制, 实现候选姿态的多因素评估与排序, 增强算法在复杂环境下的执行鲁棒性. 为验证算法性能, 自主构建多类别堆叠物体仿真点云抓取数据集, 分别在CoppeliaSim仿真平台与真实机器人系统中开展实验. 结果表明: 在模型参数量减少 4.69%、推理速度提升37.19% 的条件下, 抓取区域识别准确率提升了25.26%; 真实抓取成功率与任务完成率最高可提升29.40%与18.39%.

共享近邻加权和隶属点分配的时空密度峰值聚类算法

赵嘉，朱伟涛，肖人彬，李思维，白晖峰，谢海华，夏志红

2026, 41(5):1415-1426. DOI: 10.13195/j.kzyjc.2025.0656

摘要 (1) HTML (3) PDF 113.45 K (7) 评论 (0) 收藏

摘要:快速搜索密度峰值的时空聚类算法计算局部密度时, 难以区分所在区域的密度差异, 易引发类簇中心的选择错误; 分配策略缺乏足够的时空约束, 易将时间特征差异明显但空间位置相近的非密度峰值错误分配; 缺乏独立的噪声识别机制, 其检测效能完全依赖样本分配的准确性, 样本分配偏差致噪声识别精度显著降低. 针对这些挑战, 提出一种共享近邻加权和隶属点分配的时空密度峰值聚类(SNMP-STDPC)算法. 引入共享近邻加权策略, 构建时空距离相似度矩阵, 精确反映样本间的密度差异, 有效提升密度峰值选择的可靠性; 结合共享近邻增强时空约束, 将非密度峰值分为必然隶属点和可能隶属点, 确保样本分配的准确性; 提出一种新的噪声识别机制, 计算样本的异常分数并使用动态阈值检测噪声, 提高噪声识别的有效性. 将SNMP-STDPC算法与当前主流时空聚类方法在模拟数据集和实际地震观测数据上进行比较, 实验结果表明, SNMP-STDPC算法显著提升了模拟数据集的聚类效果, 并在真实数据集上表现良好.

基于模仿学习的工业机器人控制策略

朱易凡，刘晋飞，黄华，陈明

2026, 41(5):1427-1438. DOI: 10.13195/j.kzyjc.2025.0749

摘要 (1) HTML (6) PDF 97.01 K (8) 评论 (0) 收藏

摘要:针对当前智能制造背景下复杂多变的工业应用场景对工业机器人智能化提升的需求, 提出一种基于Transformer的模仿学习控制策略. 首先, 设计示教机器人模型并搭建模仿学习实验平台, 降低专家演示数据采集难度, 提高效率; 其次, 提出基于夹爪状态的动作分块预测模仿学习模型(GACT), 在其中引入面向气动夹爪状态的二元交叉熵损失函数, 并为其设计独立的交叉注意力机制; 再次, 在MuJoCo环境中进行仿真验证, 并通过消融实验评估模型优化效果; 最后, 在KUKA工业机器人平台上开展实物实验验证. 仿真结果表明, GACT模型相较于基线及其变体具有更高的任务成功率与轨迹准确性; 实物实验结果进一步验证了该模型可有效实现工业机器人的运动控制.

基于事后经验回放和策略延迟更新的深度强化学习充电枪装配策略

王福杰，彭永岗，李醒，郭芳，秦毅，戚远航

2026, 41(5):1439-1448. DOI: 10.13195/j.kzyjc.2025.0386

摘要 (1) HTML (3) PDF 93.13 K (6) 评论 (0) 收藏

摘要:为解决充电枪装配过程中传统强化学习算法训练样本效率低、策略不稳定和对硬件资源利用不充分的问题, 提出融合事后经验回放(HER)和策略延迟更新(DPU)的软演员-评论家(SAC)算法 (SAC with HER-DPU). 首先, 建立充电枪装配模型, 通过在经验回放池中引入HER, 重新定义目标以生成“伪成功”经验; 然后, 在算法的梯度更新部分加入DPU, 通过多次更新价值网络后再更新策略网络, 确保策略更新基于更稳定的价值估计; 最后, 在使用SAC with HER-DPU 算法进行充电枪装配训练时采用双线程训练架构, 将数据收集和神经网络训练解耦. 实验结果表明, 所提算法的收敛时间为33.2 h, 平均装配步数为75步, 相较于SAC算法, 收敛时间减少21.4 h, 平均装配步数少17步, 可有效提高训练的样本效率、策略稳定性和训练速度.

面向去中心化的零知识联邦半监督学习

陈思光，潘沭伽

2026, 41(5):1449-1456. DOI: 10.13195/j.kzyjc.2025.0599

摘要 (1) HTML (3) PDF 83.27 K (6) 评论 (0) 收藏

摘要:为了在去中心化联邦学习场景中实现隐私保护与半监督训练的高效协同, 提出一种面向去中心化的零知识联邦半监督学习算法. 具体地, 首先设计一种反映本地数据特征的零知识特征码, 通过融合Pedersen承诺与Schnorr证明, 该特征码在实现客户端特征共享的同时, 可保障本地数据不可恢复性与交换过程的合法性验证. 其次, 设计一种高效的去中心化零知识标签传播方法, 利用特征码之间的相似度引导伪标签生成, 在保护隐私的前提下实现高效的标签信息传播, 并通过复杂度分析验证其计算开销显著低于同态加密方案. 最后, 通过在多个数据集上的实验表明, 所提出的算法在不同数据分布与无标签数据配置下均优于现有基准方法, 在准确率和鲁棒性方面具有显著提升; 同时, 通过可变聚类核心数量和网络拓扑结构的实验分析, 进一步验证聚类核心数量对性能的影响, 以及算法在不同去中心化设置中的稳健性和实用性.

基于隐连续性恢复的粗粒度离散标签混合时序预测方法

孙曦，赵春晖，张皓然

2026, 41(5):1457-1467. DOI: 10.13195/j.kzyjc.2025.0931

摘要 (0) HTML (2) PDF 112.97 K (4) 评论 (0) 收藏

摘要:受传感器精度、数据存储以及人工标注效率等因素限制, 工业场景中常常使用粗粒度的离散标签替代原本连续的值. 然而, 离散标签通常会造成信息损失, 导致其背后隐含的连续动态过程难以准确建模; 此外, 离散变量与连续变量在分布特性和信息粒度上存在差异, 无法实现统一的预测. 针对上述问题, 提出一种基于隐连续性恢复的粗粒度离散标签混合时序预测方法(CDL-HCR). 首先, 所提出方法通过隐连续性恢复策略, 利用可观测的离散标签推断不可观测的连续变量, 从而实现对原本不可测连续变量的估计. 然后, 结合自监督学习机制, 将恢复得到的隐连续变量与原有连续变量在统一空间中进行特征融合, 以提升混合时序数据的预测精度. 在线应用阶段, 模型可直接输入实时采集的混合数据进行预测. 最后, 在真实的滚筒烘丝过程数据集上验证所提出方法, 验证结果显示其在混合时序数据预测任务中相比于传统方法具有更高的准确性.

非稳态扩散下基于指数权重调节和分层重采样的信息趋向溯源算法

宋程，马少杰，贺昱曜，雷小康

2026, 41(5):1468-1476. DOI: 10.13195/j.kzyjc.2025.0687

摘要 (0) HTML (3) PDF 97.61 K (4) 评论 (0) 收藏

摘要:在浮力烟羽环境下, 气体扩散方向的高度非稳态特征使信息趋向算法依赖的扩散方向平稳性假设失效, 导致信息熵梯度计算失准, 引发粒子错误收敛和搜索效率下降. 为此, 提出一种非稳态气体扩散下基于指数权重调节和分层重采样的改进信息趋向溯源算法. 首先, 在权重归一化过程中引入指数型权重修正系数, 通过指数变换有效平衡权重分布差异, 减少粒子错误收敛; 其次, 构建基于残差信息的分层重采样模型, 采用分层抽样方法提升粒子集表征能力, 提高源位置估计准确度; 最后, 建立基于接近指数-区块序列的双阈值监测机制, 当监测到搜索停滞时触发位置迁移策略, 有效解决局部最优困境. 仿真实验表明, 所提出的权重优化策略和动态重定位机制显著增强了算法在非稳态扩散环境下的鲁棒性和搜索效率.

考虑可持续性的云制造服务组合优化研究

孙琳，禹春霞，陈萌，李灿灿

2026, 41(5):1477-1488. DOI: 10.13195/j.kzyjc.2025.0775

摘要 (0) HTML (6) PDF 116.88 K (4) 评论 (0) 收藏

摘要:在“双碳”目标与工业5.0理念的共同驱动下, 面向可持续发展的云制造服务组合策略既契合国家战略, 又满足企业的现实需求. 基于此, 提出考虑可持续性的云制造服务组合决策模型. 首先, 基于三重底线原则和服务生命周期理论构建可持续性评价指标体系, 并采用模糊最优最差法确定指标权重; 其次, 结合任务结构及物流关键因素, 计算服务组合的指标聚合值并构建多目标优化模型; 然后, 提出基于可持续性评价的多目标人工蜂鸟算法(SE-MOAHA)求解模型, 并通过综合评价方法确定最优方案; 最后, 以阿里云制造平台的复杂机械手制造任务为案例, 验证所提决策模型的有效性和优越性, 与初始算法MOAHA及经典算法U-NSGA-III的对比结果表明, 所提方法在求解质量、效率与稳定性方面均具有优势.

首页

期刊简介

编委会

作者中心

精选专辑

品牌联动

>综述

>多智能体系统与协同控制专栏

>控制理论与控制技术

>智能感知与决策

>工业人工智能

当期目录

刊期浏览

本期排行

下载排行
更多+

摘要点击排行
更多+

引用排行
更多+

首页