主管单位:中华人民共和国教育部

主办单位:东北大学

国内刊号:21-1124/TP

国际刊号:1001-0920

创刊时间:1986年

出版周期:月刊

热文排行

控制与决策期刊

中国控制与决策会议

纪念《控制与决策》创刊40周年特别栏目
控制与决策2026新年贺词
“智能微电网多源协同与自主决策”专刊征稿
第37届中国控制与决策会议(CCDC2025)于5月16-19日在厦门成功举办,国内外共1613位代表参加大会
编辑推荐
针对融合游客个性化偏好、景点实时拥挤度和通勤时间的多目标旅行路线规划问题, 提出一种基于大语言模型(LLM) 的交互式旅行方案智能生成规划器. 首先, 建立LLM 信息处理模块, 实现用户需求的识别、推理以及结构化转换; 然后, 构建基于随机森林算法的景点客流预测模块, 整合历史客流、天气、节假日等多维因素以实现精确客流预测, 继而借助LLM 信息处理模块将预测结果映射为多等级拥挤度; 最后, 构建以并行非支配排序遗传算法(PNSGA-II) 为核心的多目标旅行路线规划器, 实现旅行路线的智能规划和全局最优解搜索. 仿真实验结果表明: 相较于其他多目标优化算法, PNSGA-II 在多目标路径规划问题中展现出更优的解质量和更高的计算效率; 此外, 与其他规划器生成的方案相比, 所提出规划器在方案效果和生成效率上也均展现出显著优势.
物流配送效率及其成本优化是制造业供应链管理的核心挑战之一, 相关问题常建模为车辆路径规划问题. 易碎家电等货物在物流运输中无法堆叠, 需在车厢中平铺, 针对这一实际约束, 考虑在传统车辆路径规划模型基础上增加货物的二维装载约束, 形成带有二维装箱约束的车辆路径问题(2L-CVRP). 该问题包含路径规划与二维装箱两个子问题, 存在强约束、多极组合优化的特性. 传统精确算法及启发式方法在其大规模问题求解上存在 耗时长、效率低的局限, 难以应对客户位置、需求即时变化的动态需求. 针对上述快速求解挑战, 设计一种基于强化学习及变邻域搜索协同的知识驱动强化学习求解算法, 优化2L-CVRP 的车辆行驶距离. 首先, 以车辆行驶距离为奖励设计基于注意力机制与指针网络的Actor-Critic 强化学习框架, 在此框架下采用多种启发式算法协同处理装箱约束, 改进不可行解, 生成车辆初始路径; 然后, 设计一种高效的问题知识驱动的变邻域搜索策略, 改进端到端网络得到的初始路径序列; 最后, 基于经典2L-CVRP 测试集验证所提出算法的有效性. 仿真实验表明, 相比经典启发式方法, 所提出算法在小规模实例上车辆行驶距离减少21.52%, 并更新50% 的大规模实例最优解. 同时, 所提出算法的求解速度显著优于对比算法, 大规模测例中求解效率优势更加明显, 验证了所提出算法求解2LCVRP的高效性.
: 现代战场环境下的动态传感器-武器-目标分配 (SWTA) 问题具有高动态、强对抗的特点, 传统静态分配方法难以适应战场态势的快速演化, 存在求解效率低、环境适应性差等局限. 鉴于此, 提出一种基于近端策略优化 (PPO) 的动态 SWTA 方法, 融合 OODA(观察-判断-决策-行动) 循环理论, 构建符合实际作战场景的传感器探测概率模型与武器毁伤概率模型, 通过 PPO 算法实现智能体与环境的持续交互与策略优化, 在决策过程中统筹作战效能与资源消耗. 实验结果表明, 该方法在多种弹药目标比场景下均表现出优越性能, 能够显著提升系统整体作战的效能与资源利用率. 所提出方法为动态 SWTA 问题提供了一种高效、自适应的智能决策框架, 推动了指挥决策的智能化进程, 具备较强的实际应用潜力.
针对分布式流水车间中加工时间不确定性与序列相关准备时间耦合的鲁棒调度问题, 提出一种强化学习驱动的迭代局部搜索算法(QILS). 首先, 构建以最大完工时间为目标的期望-风险鲁棒调度模型, 有效平衡调度方案的稳定性与最优性; 其次, 设计面向不确定环境的NEHUPT 启发式方法, 基于场景分析确定工件的调度优先级, 结合微调策略提升初始解的质量; 另外, 构建-learning 与迭代局部搜索算法的协同优化框架, 利用强化学习以及动态衰减方法驱动扰动策略的动态选择, 平衡算法的搜索和开发能力; 最后, 提出一种基于鲁棒贡献度的局部搜索方法, 进一步提升解的质量. 通过系统性的仿真实验及与多种先进代表性算法的对比分析结果表明, 所提出的算法在求解分布式鲁棒车间调度问题方面具有显著优势.
随着地球观测领域相关技术的高速发展, 近年来具有先进姿态调整能力的敏捷地球观测卫星已经引起了广泛的关注. 敏捷卫星任务调度具有时间依赖性切换时间, 在多星、多轨道、多需求的卫星观测场景下, 产生了复杂的时间依赖性多敏捷卫星多目标调度问题. 针对该问题, 首先, 基于问题特征和优化目标建立问题的数学规划模型; 其次, 提出一种分布式元学习协同进化框架, 包括预训练和进化搜索两个阶段, 预训练阶段通过分布式 学习提高训练效率, 进化搜索阶段通过训练好的分布式学习模型实现多种群进化算子的自适应选择; 然后, 基于所提出的进化框架和问题特征, 设计多样化的进化算子和动态种群划分选择策略, 建立一种分布式元学习协同进化算法(DMCEA); 最后通过实验验证DMCEA 求解问题的有效性.
针对矩阵权重网络上一阶混杂多智能体系统的分布式优化问题, 提出一种新颖的分布式优化控制算法, 对于连续时间子系统采用了采样控制方法. 在所提出的优化控制协议下, 基于矩阵理论、Lyapunov 稳定性理论和不等式技术等方法建立了该混杂系统实现优化一致的代数条件, 并进一步推导出代数图条件. 具体而言, 如果混杂系统的采样周期满足一定条件以及每个智能体的局部代价函数为强凸时, 当拉普拉斯矩阵的零空间跨越一致 性子空间或者矩阵权重图中包含正生成树时, 系统可以在全局最优解处达到一致. 最后, 通过数值仿真验证了所提出算法的有效性.
在城市物流配送行业中, 配送时间需求的变化直接干扰配送方案的制定, 影响配送效率, 给高效寻找车辆路径方案带来了挑战. 鉴于此, 提出考虑动态配送时间需求的多策略协同车辆路径优化算法. 首先, 构建一个动态车辆路径优化模型, 根据配送时间需求变化带来的影响设计约束条件, 将最短行驶距离、最小等待时间和最少车辆使用数作为优化目标; 其次, 定性分析配送时间需求的变化类型, 定量描述配送时间需求变化强度, 设计需求变化连锁影响因子, 研究动态配送时间需求综合评价指标; 最后, 构建差分进化算法进化策略库, 根据配送时间需求的变化类型和时间需求综合评价指标, 筛选重点优化客户, 设计多策略协同车辆路径优化算法. 实验结果表明, 所提出方法能够定性分析和定量表征客户配送时间需求的变化, 显著降低配送时间需求变化对配送方案的影响, 提升车辆路径优化效率.
在实际应用中, 标注数据的稀缺与源域、目标域的分布差异导致模型泛化性受限. 无监督域适应(UDA) 通过缩小域间分布差异, 确保模型在新的环境下性能稳定. 过去20 年, 域适应在分布对齐、特征变换等方面得到广泛研究, 但现有综述多聚焦于域不变特征学习视角, 鲜有文献从域间类别差异角度系统性总结. 鉴于此,以类别空间不一致为核心视角, 对域不变特征学习和跨域类别匹配两个技术手段展开全面综述. 首先介绍域适应中分布漂移的基本概念与数学定义, 并基于标签集差异划分为闭集、部分集、开集与通用域适应; 其次从域不变 特征学习和跨域类别匹配两方面对现有方法进行全面综述, 继而阐述域适应的多种变体, 包括无源、多源、域泛化, 并首次在综述中引入时序域适应/泛化问题; 最后总结域适应在自然语言处理、计算机视觉、工业时序与推荐系统等领域的应用, 并展望未来发展方向与挑战.
针对飞机蒙皮覆盖检测的场景下, 传统人工检测存在的作业效率低下及检测时效性约束严格等瓶颈问题, 现有研究多集中于多无人机协同作业的技术方案, 其中面向飞机蒙皮盖检测的多无人机协同任务规划(MCMP) 是描述多无人机协同检测的问题模型, 当前算法多采用启发式算法, 但其求解速度和解的质量无法满足实际要求. 为此, 将MCMP 问题建模为带有容量约束的车辆路径规划问题(CVRP), 提出两阶段的深度强化学习(TSDRL) 的求解模型: 第1 阶段根据节点数量, 利用基于注意力机制的策略网络求解最优无人机数量; 第2 阶段 设计一种新的编码器-解码器结构的策略网络, 以构建每架无人机的路径. 该模型通过策略梯度训练, 能够快速求解每架无人机的高质量路径, 为了解决三维环境碰撞问题, 使用RRT*算法优化路径以满足碰撞约束. 仿真结果表明, 所提模型在计算效率与求解质量上均优于现有的深度强化学习方法和启发式算法, 并且模型具有良好的泛化性, 可应用于不同机型.
高维不平衡数据广泛存在于社会生产的各个领域, 其特点是数据维度高以及数据类别的不平衡, 这种特性对传统分类算法的性能提出了极大的挑战. 不平衡的数据使得分类器偏向于多数类, 冗余特征导致分类性能的进一步下降. 对此, 首先针对冗余的高维特征提出基于多目标优化的特征提取算法, 考虑数据可分性和特征的泛化性能两个目标, 同时在目标内考虑数据的不平衡性; 其次, 提出基于双层优化的决策树分类算法, 将非叶子节点构建为双层优化的分类器, 上层搜索不同的特征组合, 下层求解该组合下的类别分界面; 最后, 在多个公开数据集上将所提出算法与其他算法进行对比实验验, 结果表明所提出算法在F-score 和G-mean 指标上明显优于其他对比算法, 验证了所提出算法的有效性.
  • 当期目录
  • |
  • 最新录用
  • |
  • 网络首发
  • |
  • 热文排行
  • |
  • 过刊浏览

    2026年第41卷第5期 刊出时间:2026-05-10

    全选
    显示方式: |
      综述
    • 王睿,贾惟,孙秋野,王鹏

      2026,41(5):1201-1218, DOI: 10.13195/j.kzyjc.2024.1492

      摘要:近年来交通运输业呈现出迅猛发展的态势, 电动汽车由于可以减少环境污染并使得交通系统更加智能得到了快速发展. 然而, 由于电动汽车充电桩分布不均匀, 导致出现电动汽车里程焦虑问题. 车-车(V2V)能量互济装置的研究成为消除电动汽车里程焦虑的关键技术之一. V2V技术不仅可实现两辆电动汽车之间的电能传输, 缓解电池续航不足与充电桩分布不均的问题, 还能显著提升充电灵活性. 鉴于此, 对现有车-车能量互济装置的拓扑结构和控制策略进行全面讨论, 首先分析隔离型、非隔离型和无线传输型3类主要拓扑结构的工作原理和应用场景; 进而探讨对其线性和非线性控制策略的优缺点, 并结合不同拓扑给出优化建议; 同时扩展讨论V2X技术的发展趋势, 包括车-车(V2V)、车-家(V2H)、车-网(V2G)协同控制等多种应用场景在智能电网中的应用前景; 最后讨论V2V充电技术的商业化发展现状、商业化解决方案和面临的挑战.

    • 多智能体系统与协同控制专栏
    • 孟祥恒,郭鹏,李嘉雯,史海超,张志瑶,马永敬,孙轶杰

      2026,41(5):1219-1228, DOI: 10.13195/j.kzyjc.2025.0857

      摘要:针对轨道车辆组装作业中多车型混线生产、工序复杂、工艺路线差异显著及制造资源高度异构带来的分布式异构柔性作业车间调度挑战, 提出一种两阶段多智能体深度强化学习方法. 将调度流程建模为多阶段马尔可夫决策过程, 决策涵盖工件分配、工序排序和机器选择, 通过奖励设计引导智能体最小化全局最大完工时间. 上层智能体基于分层异构图注意力网络提取产线全局状态, 实现工件在不同组装线或工区间的合理分配与负载均衡; 下层智能体采用双智能体协作策略, 利用基于图神经网络的编码器-解码器结构捕捉工序间前后约束及资源占用等依赖关系, 实现局部优化. 基于实际作业场景数据, 通过计算验证该方法在缩短制造周期方面的有效性, 展现出良好的泛化能力.

    • 谢地杰,李敏,曾祥光,任文哲,张滔,彭倍

      2026,41(5):1229-1241, DOI: 10.13195/j.kzyjc.2025.0710

      摘要:针对多动态目标的自主水下航行器集群协同围捕决策与控制问题, 提出一种融合拍卖机制与多智能体深度强化学习的围捕算法. 该方法将围捕任务分解为目标分配和运动控制两个阶段: 首先, 基于最优控制理论中的配点法, 综合考虑围捕态势、最短时间和最低能耗等优化目标, 生成训练数据与竞标值标签, 并利用监督学习训练拍卖神经网络, 实现了自主水下航行器的实时目标分配; 接着, 构建分配后的个体状态空间, 设计多目标围捕奖励函数, 采用多智能体柔性演员-评论家算法, 优化了围捕策略. 高效、自适应的拍卖算法确保了动态复杂环境下的快速目标分配, 多智能体强化学习则提升了群体的协同控制快速响应能力. 最后, 开展不同场景中的围捕实验. 实验结果表明, 所提方法能够显著提高围捕策略的表现效果, 在应对2、3和4个动态目标时, 平均围捕成功率分别为79.04%、89.78%和90.43%, 相较于基线方法, 分别提升了48.41%、54.00%和53.93%, 即所提算法在处理不同规模围捕任务时均具有更好的效果.

    • 刘尚坤,谢俊江,黄景丽,黄捷

      2026,41(5):1242-1256, DOI: 10.13195/j.kzyjc.2025.0818

      摘要:针对存在传感器故障与非仿射故障的多智能体系统容错控制问题, 提出一种层级预定义时间最优容错控制框架. 以提升系统可靠性和收敛速度为研究目标, 基于层级控制、强化学习和预定义时间稳定性理论, 构建虚拟层与实际控制层的协同机制. 在虚拟层设计分布式最优一致性跟踪控制器, 通过自适应状态观测器估计未知非线性动态, 结合滑模面与演员-评论家结构求解近似最优控制策略, 实现多智能体同步最优控制与能量最小化; 实际控制层基于虚拟层生成的最优轨迹, 设计自适应模糊预定义时间容错跟踪控制器, 利用 Lyapunov 稳定性理论保证跟踪误差在预定义时间内收敛至有界集合, 同时逼近传感器故障参数与非仿射故障函数. 通过调整所设计控制器中的预定义参数, 系统可以在期望的预定义时间内实现自适应跟踪的目标. 最后, 通过仿真实验验证了所提出控制策略的有效性.

    • 李艳辉,石远彬,孙家兴

      2026,41(5):1257-1264, DOI: 10.13195/j.kzyjc.2025.1178

      摘要:传统固定增益控制策略在多智能体系统面临时变参数不确定性时, 常存在收敛速度与控制精度难以兼顾, 以及鲁棒性不足的问题. 为此, 提出一种鲁棒自适应控制策略, 以提升系统在参数动态变化环境下的一致性跟踪性能. 首先, 基于系统的固定通信拓扑, 构造图结构一致性误差, 该误差包含智能体与相邻跟随者以及领导者之间的状态误差; 其次, 设计一种分布式控制律, 该控制律融合参数自适应律与基于全局代价函数梯度的优化机制, 可以实现在线优化控制增益. 此外, 基于Lyapunov稳定性理论, 证明闭环系统的一致最终有界性. 仿真结果进一步表明, 在固定通信拓扑且系统存在参数扰动的情况下, 所提出策略仍能实现快速、平滑的状态收敛, 有效提高了系统的跟踪性能与鲁棒性.

    • 刘恩豪,贾新春,段苏娜,李宏鹏,李寰宇

      2026,41(5):1265-1274, DOI: 10.13195/j.kzyjc.2025.0990

      摘要:研究有向图下具有有界控制增益的异构多智能体系统(HMASs)的预设时间时变编队跟踪(TVFT)问题. 首先, 为每个智能体提出一个预设时间切换观测器用于估计领导者的状态, 该观测器从一个基于时基生成器(TBG)项的观测器切换到另一个基于分数阶项的观测器. 基于预设时间切换观测器, 提出一个编队跟踪切换控制器, 该控制器从一个基于TBG反馈的控制器切换到另一个基于分数阶反馈的控制器. 所提出的预设时间切换观测器和编队跟踪切换控制器中的切换时刻均可由用户提前任意预设. 然后, 使用李雅普诺夫稳定性理论, 证明在所提控制器下可以使编队跟踪误差在预设切换时刻收敛到一个可调域内, 并在预设切换时刻后的另一个预设时间内收敛到零. 与现有的具有时变扩展函数的控制器相比, 所提出的控制器可以避免无界控制增益带来的数值实现问题. 最后, 通过两个仿真示例验证理论结果的有效性.

    • 控制理论与控制技术
    • 荣海娜,周泽震,张葛祥,刘俊,但志宏,张松

      2026,41(5):1275-1286, DOI: 10.13195/j.kzyjc.2025.0854

      摘要:针对高空飞行环境模拟试验装置的进气系统在应对发动机过渡态时, 表现出强非线性和模型不确定性, 受未知扰动及测量噪声影响, 难以快速、平稳和精确控制的问题, 提出一种融合改进滑模扩张状态观测器和卡尔曼滤波的自抗扰控制方法. 首先, 设计一种变幂次趋近律来提高状态收敛速度; 然后, 构造一种非奇异快速收敛滑模面来加速跟踪误差收敛, 并推导对应的滑模非线性收敛函数; 接着, 将所设计观测器与卡尔曼滤波相融合, 通过扩张状态观测器对总扰动进行观测和补偿, 同时, 利用卡尔曼滤波抑制测量噪声, 二者通过相互协同可实现对扰动和噪声的双重抑制, 并基于此设计自抗扰控制器; 最后, 给出完整的稳定性证明和仿真验证. 仿真实验结果表明: 基于改进滑模扩张状态观测器的自抗扰控制器在受测量噪声干扰下, 比基于传统扩张状态观测器的自抗扰算法具有更高的跟踪精度和跟踪速度; 融合卡尔曼滤波器后, 在保证跟踪性能的同时能够有效降低进气系统调节阀控制量摆动幅度.

    • 蔡方玉,黄宜庆,邓雄峰,许刚

      2026,41(5):1287-1298, DOI: 10.13195/j.kzyjc.2025.0494

      摘要:针对多四旋翼无人机系统编队控制问题, 提出一种基于事件触发机制的双层串联博弈编队控制算法. 该算法对多四旋翼无人机编队任务进行解构, 以此设计多场对局并构建双层串联博弈控制框架. 首先, 在第1层博弈中, 具备通信能力的四旋翼无人机对通过在两场对局中的博弈交互, 求解出可使双方位置与速度达到纳什均衡状态的位置策略与速度策略. 其次, 每架四旋翼无人机对第1层博弈中与多架四旋翼无人机对局产生的两组策略进行加权处理, 生成作为第2层博弈参与变量的两个控制策略. 进一步, 围绕各四旋翼无人机的位置误差与速度误差构建第2层博弈中的对局模型, 通过博弈优化过程确定最佳增益系数, 进而获取使位置误差与速度误差达到纳什均衡的最优控制策略. 此外, 引入事件触发机制, 动态调整控制策略更新, 降低对四旋翼无人机有限机载资源的消耗. 最后, 通过仿真实验与实际平台测试, 验证所提算法在多四旋翼无人机编队控制中的有效性与可行性.

    • 许德智,牟泮龙,潘庭龙,张清越,叶宇剑,花为

      2026,41(5):1299-1309, DOI: 10.13195/j.kzyjc.2025.0204

      摘要:多电机协同控制系统的跟踪性能和同步性能是评估工业过程中安全性和可靠性的关键指标, 通过创新性地设计基于预设时间滑模控制方法的改进跟踪算法, 在动态不确定条件下实现多电机系统的高精度跟踪控制与同步误差最小化. 首先, 设计预设时间滑模控制器使综合误差在预设时间内收敛到零邻域, 同时设计非线性干扰观测器观测系统扰动并前馈给控制器. 为了解决奇异性问题, 使用控制律切换方法使系统稳定后的控制器不再依赖时间. 仿真和实验对比结果表明, 所提出的方法能够有效实现多电机系统的协同跟踪一致性.

    • 郭肇禄,赵擎宇,杨火根

      2026,41(5):1310-1320, DOI: 10.13195/j.kzyjc.2025.0701

      摘要:在高维多目标优化算法中, 维持收敛性和多样性的平衡对算法性能尤为关键. 然而, 单一的支配关系难以有效维持二者的平衡. 鉴于此, 提出一种基于适应性支配策略的高维多目标进化算法ADSMOEA. 适应性支配策略通过融合两种在收敛性和多样性上互补的支配关系, 并根据种群当前的状态选择合适的支配关系, 从而维持二者的平衡. 同时, 为了准确评估种群的收敛状态, 设计一种角度收敛指标, 通过引入目标向量夹角信息提高种群收敛性评价的准确性, 为支配关系的选择提供指导. 此外, 设计一种适应性的多样性算子以维持种群的多样性. 将所提出算法与7个先进算法进行对比实验以验证ADSMOEA的有效性. 实验结果表明, 所提出ADSMOEA算法在解决高维多目标优化问题时具有较强的竞争力.

    • 杨林云,沈琴琴,曹阳

      2026,41(5):1321-1330, DOI: 10.13195/j.kzyjc.2025.0735

      摘要:针对多变量时滞阻尼累加灰色模型$({\rm TLDAGM} (1,N)) $建模机理不明确、非线性特征挖掘不充分以及存在转换误差等问题, 提出一种多变量阻尼累加非线性时滞离散灰色模型. 首先, 引入线性和非线性修正项拓展模型灰信息结构, 不仅能够增强对数据非线性特征的挖掘能力, 还能实现与经典${\rm GM }(1,1) $模型的兼容性; 然后, 通过数值积分可有效避免原模型中将时间驱动项视为灰常量以及对导数项的近似处理所引起的建模误差; 最后, 结合离散灰色建模的思想, 有效消除微分方程到差分方程的转换误差. 选取近年来上海市高新技术产业产值数据进行实证分析, 并利用量子粒子群优化算法寻求模型的最优参数. 结果表明, 新模型的拟合和预测精度均优于${\rm TLDAGM} (1,N) $模型以及其他几种多变量灰色模型, 且展现出良好的稳定性.

    • 苏航,张滋林

      2026,41(5):1331-1337, DOI: 10.13195/j.kzyjc.2025.1010

      摘要:为了提高机械臂控制过程中的安全性, 针对机械臂系统的误差约束问题提出一种基于强化学习的自适应控制方法. 将机械臂的动力学系统转化为关于跟踪误差的动态方程, 然后利用一类误差转换函数, 将受约束的误差系统转换为新的不受约束系统, 并基于此系统设计最优控制器. 为了解决最优控制问题, 利用强化学习的方法求解系统的HJB方程, 其中评价网络用于逼近系统最优值函数, 执行网络用于逼近最优控制器的输出, 并利用一类正定函数来大幅简化评价-执行网络的自适应率. 基于李雅普诺夫稳定性理论, 证明系统所有误差信号半全局一致最终有界. 最后通过一个2自由度机械臂的仿真案例验证所提出方法的有效性.

    • 智能感知与决策
    • 巩亮,郑世龙,许得杰,耿慧琳,周健,惠昌武

      2026,41(5):1338-1347, DOI: 10.13195/j.kzyjc.2025.0435

      摘要:针对道路行驶速度随时间变化且软时间窗条件下的同时配集车辆路径优化问题, 以配送总成本最小化与客户满意度最大化为目标, 考虑车辆载重等约束条件, 构建时变交通下油车-电车混合车队货物配送路径优化模型. 根据模型特点设计考虑时空距离、基于Pareto非支配排序的多目标混合启发式算法, 将遗传算法与变邻域搜索算法结合, 增强算法的局部搜索能力. 以Solomon中C101类部分客户为例进行算例分析, 进行不同规模客户点对比分析和模拟数据与真实数据对比实验. 研究结果表明: 与多目标协同优化遗传算法等相比, 所提出的算法将总成本降低至7 008.47元, 降幅分别为4.59%、5.46%、6.80%、10.77%和8.41%, 客户满意度提升至0.841. 考虑不同情况下对参数进行灵敏度分析, 合理的配送重量可将配送总成本节约69.28%、28.14%和38.61%; 合理的车辆载重量可将配送成本节约31.2%和62.3%. 研究结果表明, 所构建的模型和所提出的算法能合理调配不同类型的车辆, 科学规划车辆路径, 降低物流配送总成本, 减少车辆碳排放, 提高企业经济效益.

    • 彭雯宇,齐咏生,刘利强,苏建强,张丽杰

      2026,41(5):1348-1358, DOI: 10.13195/j.kzyjc.2025.0527

      摘要:针对单一传感器同步定位与地图构建(SLAM)技术在退化环境下定位精度低、地图漂移和可靠性差等问题, 提出一种基于R3LIVE框架改进的多传感器融合的SLAM算法RMF-SLAM(refined multi-modal fusion SLAM). 首先, 设计一种随机过程增强的运动学模型, 将IMU测量作为输出建模, 即使在IMU测量运动饱和的情况下, 所提出算法也能对激烈运动进行准确定位和可靠映射; 其次, 构建一种基于Hessian矩阵特征值退化判别的LiDAR和视觉退化感知模块, 通过实时评估系统状态和传感器可靠性来动态调整不同传感器信息权重比例和筛选高价值视觉观测帧, 在视觉和LiDAR均极度退化时, 系统沉睡当前地图, 防止定位失败, 当传感器再次正常工作时重新激活沉睡地图; 最后, 提出一种采用全局描述符对地图进行相似性检测的方法, 将相应的睡眠地图集成到当前活跃地图中, 从而在系统运行完成后形成高度精确的全局地图. 通过在公开数据集与经典的SLAM算法进行对比, 并在私有数据集及真实场景中验证算法能有效抑制退化环境对轨迹估计和地图构建的负面影响, 提升算法的精度和可靠性.

    • 金宗瀚,吴李康,刘玉祥,何明,赵洪科

      2026,41(5):1359-1369, DOI: 10.13195/j.kzyjc.2025.0833

      摘要:基于大语言模型的智能体在复杂任务的处理中表现出卓越的语言理解和深度推理潜力, 然而, 当它在应对更加复杂的挑战时, 尤其是某一特定领域内涉及到领域规则的复杂任务时, 其表现往往不尽人意. 这种不足主要源于大语言模型内部缺乏对领域中专业知识和依赖约束的显示建模, 导致解决问题的过程中生成不符合逻辑或不可执行的子任务序列, 进而引发规划幻觉和领域知识结构性缺失等问题. 为解决这类问题, 提出一种基于知识增强的复杂任务分解框架. 该框架将知识图谱与思维链技术相融合, 旨在以知识增强为核心, 通过构建约束关系和领域知识双图谱, 为大语言模型在解析复杂任务的过程中提供结构化知识约束, 并结合高质量的推理路径输入, 引导模型生成语义完整、逻辑合理且可执行的子任务序列. 实验结果表明, 在2WikiMultiHopQA、HotpotQA和MuSiQue三类多跳问答数据集上, 基于不同参数规模的Qwen2.5模型中, KTD框架在所有任务和资源配置下均显著优于主流的相关Prompting策略方法, 其中在1.5B低资源配置下任务准确率最高可提升13.86%, 进一步表明了KTD框架在缓解规划幻觉和弥补领域知识结构性缺失方面的有效性.

    • 彭娟娟,凌初阳,隆清琦

      2026,41(5):1370-1380, DOI: 10.13195/j.kzyjc.2025.0669

      摘要:针对分级诊疗在线协诊三边匹配问题, 提出基于云模型的三边匹配决策方法, 以满足医联体背景下分级诊疗在线协诊匹配的服务需求. 首先, 利用BERTopic、Stanza和Textlob处理好大夫在线评论信息, 获取患者对基层医生客观的匹配属性, 并结合属性的偏好信息确定相应权重; 然后, 构建多粒度概率语言非对称云模型以及相应的概率语言非对称云Bonferroin Mean聚合算子; 接着, 考虑基层医生与专家间的协同性、医生间的工作量均衡性以及医患匹配的稳定性等因素, 构建相应的三边稳定匹配决策优化模型, 并给出求解算法; 最后, 结合实际案例、灵敏度分析和比较分析验证了所提出方法的可行性和稳定性, 为分级诊疗在线医疗的三边匹配决策问题提供了理论支撑.

    • 孙庆帅,张英杰,刘华亮,李述杰

      2026,41(5):1381-1391, DOI: 10.13195/j.kzyjc.2025.0391

      摘要:基于声信号的漏损检测方法在人工巡检中具有重要应用价值, 正逐步发展为一种新兴的远程监测手段. 传统基于深度学习的漏损声信号识别方法往往受到信号预处理流程繁琐以及环境噪声干扰的限制, 难以在其他供水管网中实现良好的泛化性能, 漏损检测的准确率亦有待进一步提升. 鉴于此, 首先, 针对供水管网声信号构建高时间分辨率和高频率分辨率下的线性谱图和对数梅尔谱图, 兼顾声信号的高频与低频特征, 突出短时动态变化以及微弱频率特征, 并以并行方式输入至卷积神经网络; 然后, 引入并行机制的时-频注意力卷积块进行特征提取, 增强对时间和频率维度的细粒度特征捕捉能力; 最后, 利用真实供水管网声信号数据和物理仿真数据对所提出方法进行漏损检测性能实验验证, 实验结果表明, 所提出方法显著提高了对漏损事件的识别率, 具有良好的鲁棒性和泛化能力.

    • 徐志存,谢乃明

      2026,41(5):1392-1402, DOI: 10.13195/j.kzyjc.2025.0537

      摘要:锂电池健康状态估计作为现代能源存储技术的核心, 广泛应用于电动汽车、移动设备等领域. 随着使用时间的增长, 其性能衰减问题逐渐显现, 这不仅会影响电池的存储能力, 还可能引发安全隐患, 因此, 准确估计锂电池的健康状态显得尤为重要. 经验模型是锂电池退化理论中常用的解决方法, 其中的双指数模型可演化推导出幂指数驱动的灰色GM(1,1,$ \mathrm{e}^{\mathit{\lambda}t} $)模型. 在GM(1,1,$ \mathrm{e}^{\mathit{\lambda}t} $)模型的基础上建立状态空间模型, 融合扩展卡尔曼滤波模型形成灰色扩展卡尔曼滤波模型. 将所提出的灰色扩展卡尔曼滤波模型用于锂电池健康状态非线性退化估计问题. 采用牛津大学公开的单体电池数据进行验证, 在单个电池的基础上将所提出模型用于估计 20 辆电动汽车的锂电池健康状态, 以进一步验证所提出模型在实际场景中的适用性.

    • 李小晗,张哲戬,徐胜军,孟月波,杨玥,武经,苏晓杰,陈义明

      2026,41(5):1403-1414, DOI: 10.13195/j.kzyjc.2025.0696

      摘要:为提升机器人在非结构化堆叠场景中的抓取识别精度与执行稳定性, 提出一种融合几何先验建模与姿态质量评估机制的六自由度抓取预测算法. 首先, 构建点云识别网络 Point-LaKan, 通过增强输入点云的局部几何特征, 设计由局部聚合模块与高维非线性映射模块构成的LAKAN特征提取结构, 提升对堆叠抓取区域的结构表征能力; 其次, 设计方向向量约束下的抓取姿态估计策略, 通过最小化初始与目标姿态间的空间差异, 提升姿态生成的可执行性与可解释性; 最后, 构建融合方向约束、碰撞检测与质心评分的抓取姿态筛选机制, 实现候选姿态的多因素评估与排序, 增强算法在复杂环境下的执行鲁棒性. 为验证算法性能, 自主构建多类别堆叠物体仿真点云抓取数据集, 分别在CoppeliaSim仿真平台与真实机器人系统中开展实验. 结果表明: 在模型参数量减少 4.69%、推理速度提升37.19% 的条件下, 抓取区域识别准确率提升了25.26%; 真实抓取成功率与任务完成率最高可提升29.40%与18.39%.

    • 赵嘉,朱伟涛,肖人彬,李思维,白晖峰,谢海华,夏志红

      2026,41(5):1415-1426, DOI: 10.13195/j.kzyjc.2025.0656

      摘要:快速搜索密度峰值的时空聚类算法计算局部密度时, 难以区分所在区域的密度差异, 易引发类簇中心的选择错误; 分配策略缺乏足够的时空约束, 易将时间特征差异明显但空间位置相近的非密度峰值错误分配; 缺乏独立的噪声识别机制, 其检测效能完全依赖样本分配的准确性, 样本分配偏差致噪声识别精度显著降低. 针对这些挑战, 提出一种共享近邻加权和隶属点分配的时空密度峰值聚类(SNMP-STDPC)算法. 引入共享近邻加权策略, 构建时空距离相似度矩阵, 精确反映样本间的密度差异, 有效提升密度峰值选择的可靠性; 结合共享近邻增强时空约束, 将非密度峰值分为必然隶属点和可能隶属点, 确保样本分配的准确性; 提出一种新的噪声识别机制, 计算样本的异常分数并使用动态阈值检测噪声, 提高噪声识别的有效性. 将SNMP-STDPC算法与当前主流时空聚类方法在模拟数据集和实际地震观测数据上进行比较, 实验结果表明, SNMP-STDPC算法显著提升了模拟数据集的聚类效果, 并在真实数据集上表现良好.

    • 工业人工智能
    • 朱易凡,刘晋飞,黄华,陈明

      2026,41(5):1427-1438, DOI: 10.13195/j.kzyjc.2025.0749

      摘要:针对当前智能制造背景下复杂多变的工业应用场景对工业机器人智能化提升的需求, 提出一种基于Transformer的模仿学习控制策略. 首先, 设计示教机器人模型并搭建模仿学习实验平台, 降低专家演示数据采集难度, 提高效率; 其次, 提出基于夹爪状态的动作分块预测模仿学习模型(GACT), 在其中引入面向气动夹爪状态的二元交叉熵损失函数, 并为其设计独立的交叉注意力机制; 再次, 在MuJoCo环境中进行仿真验证, 并通过消融实验评估模型优化效果; 最后, 在KUKA工业机器人平台上开展实物实验验证. 仿真结果表明, GACT模型相较于基线及其变体具有更高的任务成功率与轨迹准确性; 实物实验结果进一步验证了该模型可有效实现工业机器人的运动控制.

    • 王福杰,彭永岗,李醒,郭芳,秦毅,戚远航

      2026,41(5):1439-1448, DOI: 10.13195/j.kzyjc.2025.0386

      摘要:为解决充电枪装配过程中传统强化学习算法训练样本效率低、策略不稳定和对硬件资源利用不充分的问题, 提出融合事后经验回放(HER)和策略延迟更新(DPU)的软演员-评论家(SAC)算法 (SAC with HER-DPU). 首先, 建立充电枪装配模型, 通过在经验回放池中引入HER, 重新定义目标以生成“伪成功”经验; 然后, 在算法的梯度更新部分加入DPU, 通过多次更新价值网络后再更新策略网络, 确保策略更新基于更稳定的价值估计; 最后, 在使用SAC with HER-DPU 算法进行充电枪装配训练时采用双线程训练架构, 将数据收集和神经网络训练解耦. 实验结果表明, 所提算法的收敛时间为33.2 h, 平均装配步数为75步, 相较于SAC算法, 收敛时间减少21.4 h, 平均装配步数少17步, 可有效提高训练的样本效率、策略稳定性和训练速度.

    • 陈思光,潘沭伽

      2026,41(5):1449-1456, DOI: 10.13195/j.kzyjc.2025.0599

      摘要:为了在去中心化联邦学习场景中实现隐私保护与半监督训练的高效协同, 提出一种面向去中心化的零知识联邦半监督学习算法. 具体地, 首先设计一种反映本地数据特征的零知识特征码, 通过融合Pedersen承诺与Schnorr证明, 该特征码在实现客户端特征共享的同时, 可保障本地数据不可恢复性与交换过程的合法性验证. 其次, 设计一种高效的去中心化零知识标签传播方法, 利用特征码之间的相似度引导伪标签生成, 在保护隐私的前提下实现高效的标签信息传播, 并通过复杂度分析验证其计算开销显著低于同态加密方案. 最后, 通过在多个数据集上的实验表明, 所提出的算法在不同数据分布与无标签数据配置下均优于现有基准方法, 在准确率和鲁棒性方面具有显著提升; 同时, 通过可变聚类核心数量和网络拓扑结构的实验分析, 进一步验证聚类核心数量对性能的影响, 以及算法在不同去中心化设置中的稳健性和实用性.

    • 孙曦,赵春晖,张皓然

      2026,41(5):1457-1467, DOI: 10.13195/j.kzyjc.2025.0931

      摘要:受传感器精度、数据存储以及人工标注效率等因素限制, 工业场景中常常使用粗粒度的离散标签替代原本连续的值. 然而, 离散标签通常会造成信息损失, 导致其背后隐含的连续动态过程难以准确建模; 此外, 离散变量与连续变量在分布特性和信息粒度上存在差异, 无法实现统一的预测. 针对上述问题, 提出一种基于隐连续性恢复的粗粒度离散标签混合时序预测方法(CDL-HCR). 首先, 所提出方法通过隐连续性恢复策略, 利用可观测的离散标签推断不可观测的连续变量, 从而实现对原本不可测连续变量的估计. 然后, 结合自监督学习机制, 将恢复得到的隐连续变量与原有连续变量在统一空间中进行特征融合, 以提升混合时序数据的预测精度. 在线应用阶段, 模型可直接输入实时采集的混合数据进行预测. 最后, 在真实的滚筒烘丝过程数据集上验证所提出方法, 验证结果显示其在混合时序数据预测任务中相比于传统方法具有更高的准确性.

    • 宋程,马少杰,贺昱曜,雷小康

      2026,41(5):1468-1476, DOI: 10.13195/j.kzyjc.2025.0687

      摘要:在浮力烟羽环境下, 气体扩散方向的高度非稳态特征使信息趋向算法依赖的扩散方向平稳性假设失效, 导致信息熵梯度计算失准, 引发粒子错误收敛和搜索效率下降. 为此, 提出一种非稳态气体扩散下基于指数权重调节和分层重采样的改进信息趋向溯源算法. 首先, 在权重归一化过程中引入指数型权重修正系数, 通过指数变换有效平衡权重分布差异, 减少粒子错误收敛; 其次, 构建基于残差信息的分层重采样模型, 采用分层抽样方法提升粒子集表征能力, 提高源位置估计准确度; 最后, 建立基于接近指数-区块序列的双阈值监测机制, 当监测到搜索停滞时触发位置迁移策略, 有效解决局部最优困境. 仿真实验表明, 所提出的权重优化策略和动态重定位机制显著增强了算法在非稳态扩散环境下的鲁棒性和搜索效率.

    • 孙琳,禹春霞,陈萌,李灿灿

      2026,41(5):1477-1488, DOI: 10.13195/j.kzyjc.2025.0775

      摘要:在“双碳”目标与工业5.0理念的共同驱动下, 面向可持续发展的云制造服务组合策略既契合国家战略, 又满足企业的现实需求. 基于此, 提出考虑可持续性的云制造服务组合决策模型. 首先, 基于三重底线原则和服务生命周期理论构建可持续性评价指标体系, 并采用模糊最优最差法确定指标权重; 其次, 结合任务结构及物流关键因素, 计算服务组合的指标聚合值并构建多目标优化模型; 然后, 提出基于可持续性评价的多目标人工蜂鸟算法(SE-MOAHA)求解模型, 并通过综合评价方法确定最优方案; 最后, 以阿里云制造平台的复杂机械手制造任务为案例, 验证所提决策模型的有效性和优越性, 与初始算法MOAHA及经典算法U-NSGA-III的对比结果表明, 所提方法在求解质量、效率与稳定性方面均具有优势.

    全选
    显示方式: |
    全选
    显示模式: |
    • 王睿谦, 刘鑫蕊, 富若涵, 张浩晨, 孙秋野

      优先出版时间:2026-04-17  DOI: 10.13195/j.kzyjc.2025.1009

      摘要:随着分布式能源的大规模接入,配电网运行的不确定性显著增加,配电网动态重构(DDNR)成为保障系统经济性与安全性的关键技术。深度强化学习(DRL)因其对不确定性的自适应能力和数据驱动特性而应用于DDNR求解。针对离散动作空间的DRL方法求解重构时存在的维数灾难和动作盲区问题,本文提出一种分阶段的结构感知(SA)DRL动态重构求解框架。首先,提出一种性能与结构驱动的重构决策优化方法,通过启发式生成与结构化聚类,构建一个高质量且规模可控的拓扑集合,从维度、性能和结构三方面优化了DDNR的决策空间;随后,改进DRL架构,结合图卷积网络和动作嵌入,设计了SA-Q网络,利用图卷积网络(GCN)将拓扑编码为图嵌入向量,实现了对配电网运行状态与开关动作的结构化感知和并行处理,使智能体能够利用拓扑间的结构关系进行高效泛化,并将模型集成到改进的Rainbow DQN算法框架中,实现离线训练和在线求解。最后,通过仿真结果验证了本文提出的方法可以有效降低配电网运行损耗、改善电压分布并减少开关不必要动作,收敛速度快且稳定,能够显著改善配电网的运行水平。

    • 潘德骏, 付程, 于海生, 王晓玲, 于金鹏

      优先出版时间:2026-04-17  DOI: 10.13195/j.kzyjc.2025.1165

      摘要:三相PWM整流器系统中不确定扰动,如负载扰动和电网幅值波动,会导致直流电压的显著波动,甚至导致系统失稳.为增强系统抗扰能力,本文在两相静止坐标系下建立了考虑系统扰动三相PWM整流器的动态模型,提出了一种电压-功率双环固定时间自适应神经网络控制方法.在电压跟踪外环,通过自适应神经网络估计负载扰动等不确定性,设计直流电压控制器来提高电压动态响应性能.在功率跟踪内环,构造命令滤波器估计功率参考导数,设计固定时间控制器以实现快速精准功率跟踪.理论分析和测试结果验证了所提方法具有快速动态响应和良好抗扰能力.对比现有PI+前馈控制、自抗扰控制和DPC-BSC方法,FTANNC方法在电压调节工况下将直流电压整定时间缩短近76.5%,将稳态跟踪误差降低约36.8%.在负载扰动和电网幅值波动等工况下,将直流电压整定时间缩短至少40%且波动幅值最小.

    • 任智, 张栋, 唐硕, 熊威, 杨书恒, 刘文逸

      优先出版时间:2026-04-17  DOI: 10.13195/j.kzyjc.2025.1188

      摘要:随着无人系统平台的快速发展,无人集群对抗是未来体系能力发展与建设的关键.然而,在应对集群目标时,集群间的对抗博弈加剧了有限通信约束下通信带宽压力、链路动态变化和信息时延积累等问题,集群对抗决策面临态势信息过载、协同能力下降与团队响应滞后的挑战. 针对上述问题,首先构建了多智能体对抗的运动学模型与对抗损耗模型,并在此基础上提出了有限通信约束下多智能体对抗的团队博弈建模与求解方法.通过设计小世界网络通信的团队联盟策略,将有限通信约束引入多智能体对抗的团队博弈模型,给出了基于关联团队最大最小均衡解概念的团队博弈均衡定义与存在性条件.然后,基于异构智能体强化学习算法设计了交替冻结训练的团队博弈均衡求解算法.最后,仿真结果表明,所提出的博弈模型与交替冻结训练框架能够获得稳定的策略剖面,实现了有限通信条件下的集群自适应动态决策与对抗策略优化.

    • 王崟铸, 陶翼飞, 王越秋

      优先出版时间:2026-04-15  DOI: 10.13195/j.kzyjc.2025.1281

      摘要:针对多自动导引车路径规划研究中传统深度强化学习方法收敛速度缓慢、探索效率低、样本利用不充分等问题导致的路径规划成功率低且效果不佳,提出一种基于自适应探索与课程学习的改进型多智能体深度确定性策略梯度算法(AECL-MADDPG).首先,设计基于动态拥塞感知的自适应探索策略,将双Critic的Q值差异作为决策不确定性度量,与环境拥塞度联合驱动探索强度动态调整,提高探索策略的动态适应性;其次,构建基于课程学习的优先经验回放机制(PER),将课程学习的"任务难度递进"与优先经验回放的"样本价值排序"深度融合,通过课程权重实现跨难度等级样本的平滑过渡,避免策略震荡;再次,设计多维度课程晋级与回调机制,突破单一成功率阈值的粗糙晋级标准,引入碰撞率和路径效率等多指标综合评估及性能回退保护,提升训练稳定性;最后,在仓储环境中开展仿真实验,并将所提算法与主流算法进行对比验证,通过对比在收敛速度、成功率、平均路径长度等关键指标上的差异,验证了所提出路径规划算法的可行性和有效性.

    • 李二超, 闫世韬

      优先出版时间:2026-04-14  DOI: 10.13195/j.kzyjc.2025.1194

      摘要:动态多目标进化算法(DMOEA)通过从历史环境中提取知识来预测新解,能有效解决动态多目标优化问题(DMOP)。目前现有基于预测的动态多目标进化算法(DMOEAs)多依赖前两个历史环境的信息,且缺乏对提取到的历史知识的动态维护和选择性复用。针对这些问题,本文提出一种多源知识自适应融合预测的动态多目标进化算法(DMOEA),称为MSFP-DMOEA。该框架通过动态特征投影网络(DFPN)捕捉决策空间中的非线性变化趋势,并利用多模态知识库(MultiModalKB)系统化存储和检索历史环境中的优化模式,最后利用多源知识融合预测机制,将近期环境趋势预测与历史相似模式预测加权融合,生成高质量初始种群,并通过模态更新、合并与淘汰机制,实现历史知识的动态维护。在多个基准测试问题上的实验结果表明,MSFP-DMOEA在收敛性、多样性及稳定性方面均显著优于当前几种主流动态多目标优化算法。

    • 陈志旺, 孙艺萱, 彭勇

      优先出版时间:2026-04-14  DOI: 10.13195/j.kzyjc.2025.1220

      摘要:针对无人机航拍图像中的目标存在尺寸小、分布密集、纹理细节模糊等问题, 本文提出了基于跨域双流网络的引导式特征融合小目标检测算法. 首先, 在主干网络部分提出了空间-频域协同作用的跨域双流检测架构, 该架构并行构建了空间域与频域两条特征提取路径. 空间流侧重于捕获局部细节特征, 频域流设计了边缘与频域增强模块, 通过频域变换与动态高斯掩码进行三频带划分, 并利用上下文感知门控机制自适应增强不同频率特征, 从而提升网络的全局上下文感知能力. 然后, 在跨域特征融合部分设计了自适应空间-频域协同融合模块, 通过动态权重分配实现跨域特征的高效整合. 最后, 在颈部网络采用了引导式三路融合模块, 以主路特征为引导自适应整合上采样、主路以及跨层特征之间的语义与细节信息, 有效缓解多尺度特征间的语义差异. 在 VisDrone2019 和 TinyPerson 两个公开数据集上进行实验, 实验结果验证了本文方法的有效性.

    • 郭都, 冯宜伟

      优先出版时间:2026-04-14  DOI: 10.13195/j.kzyjc.2025.1302

      摘要:针对高速公路场景下网联车队遭受虚假数据注入(False Data Injection, FDI)攻击时的编队安全与通信资源优化双重挑战,提出融合攻击参数显式建模与编队误差约束的神经网络-动态事件触发弹性控制策略,实现攻击抑制与通信优化的统一。具体包括:1)构建嵌入FDI攻击时变特性的分布式输出反馈架构,设计径向基函数(RBF)神经网络状态观测器,将攻击参数显式建模于观测器结构与自适应更新律中,通过神经网络动态逼近攻击信号,重构不可测车辆状态;2)设计由攻击强度与神经逼近误差双驱动的动态事件触发条件,通过引入受攻击强度负反馈调节的动态阈值变量,形成“攻击增强→动态变量衰减→触发阈值降低→通信频率提升”的闭环自适应机制,实现攻击抑制与通信优化的动态平衡;3)构造攻击参数依赖型李雅普诺夫泛函,包含神经权重误差、状态估计误差与触发动态变量,并基于线性矩阵不等式(LMI)证明闭环系统所有信号的半全局一致最终有界性(SGUUB),降低了保守性。理论分析证明该策略保障了攻击与通信约束下的编队安全;仿真结果显示,在时变FDI攻击下,编队误差小于2m,通信负载较时间触发降低96.4%,收敛速度与控制精度优于传统分离设计方法,验证其有效性和工程潜力。

    • 高如虎

      优先出版时间:2026-04-14  DOI: 10.13195/j.kzyjc.2025.1334

      摘要:客流在时空维度上呈现的时变特性对城市轨道交通运营管理提出了严峻挑战,同时,需求响应式列车时刻表优化问题的复杂性对于算法设计提出了更高的要求. 为此,本文将人工智能领域的深度强化学习方法应用到地铁列车时刻表的优化问题中,以提升地铁运营管理的智能化水平. 将时变客流需求与列车时刻表决策互动关系构建为马尔可夫决策过程,为智能体提供训练和学习环境. 其中,以列车到发、乘客状态以及列车数量作为状态空间,以列车发车间隔作为动作空间,并设计了“人-车-站”一体化的多维复合奖励函数. 开发了一种基于自适应发车间隔和列车数量的多目标软演员-评论家优化算法提升求解效率. 以小规模算例进行超参数优化,并验证了需求响应式列车时刻表相对于均衡列车时刻表的优势. 以广州市地铁8号线进行仿真实验,结果表明,所提出的方法相对于其他人工智能方法及启发式算法具有较快的收敛速度和求解效率. 此外,针对不同客流扰动场景,方法能够在短时间内生成满意的运营方案,说明方法具有较好的泛化能力. 研究结果可为进一步提升地铁运营调度智能化水平提供理论和方法支撑.

    • 王槊, 张贞凯

      优先出版时间:2026-04-14  DOI: 10.13195/j.kzyjc.2025.1140

      摘要:针对差分驱动无人艇轨迹跟踪中存在的轨迹复杂、跟踪困难及能耗高的问题,本文提出了一种轨迹优化与跟踪一体化的分层控制框架。上层基于安全域约束的贝塞尔轨迹优化方法对参考路径进行拟合与平滑化,以保证轨迹的可行性与连续性。下层在改进的非线性模型预测控制算法中引入择优参考策略,将轨迹高度离散化后,在动力学可达范围内选取超出预测步长的候选点,构建参考点索引集合,并通过滚动优化求解最优参考点序列,从而降低轨迹跟踪能量消耗,同时,引入了状态观测器用于补偿海浪扰动。仿真结果表明,所提出的方法能够有效提升轨迹拟合精度与跟踪稳定性,并在保证控制性能的前提下降低了总体能耗。

    • 毛志忠, 刘文程

      优先出版时间:2026-04-11  DOI: 10.13195/j.kzyjc.2026.0001

      摘要:微电网在分布式新能源消纳和局域负荷分配中具有独特优势,但其负荷优化分配面临可再生能源出力随机性及系统复杂性等挑战。大语言模型(LLM)的兴起为解决微电网复杂优化问题提供了新思路。本文系统性综述了LLM结合微电网负荷优化分配的研究现状。首先,介绍LLM的Transformer架构与主流训练范式,并回顾微电网负荷分配技术现状。然后,借鉴现有综述对微电网能量管理系统的典型划分方法,将负荷分配视为核心目标,从四个关键环节展开讨论:电源调度、负荷预测、储能管理和需求响应。这四个环节共同支撑微电网负荷分配的优化,因此重点评述了 LLM 在这四个方面的最新应用进展。研究表明,基于LLM的方案通过提示工程和序列生成可实现高精度的短期负荷预测;专用大模型能够提供接近人工专家水平的调度方案;在储能寿命预测、用户行为模拟等方面LLM也展现出潜在优势。接着,针对LLM落地微电网的关键技术挑战,包括模型可解释性、多模态融合、实时性要求、隐私与安全,进行了深入讨论并总结了相应的改进策略。最后,展望未来研究方向,包括研制能源领域专用LLM、将物理机理融入LLM推理、建立标准化评估基准、拓展更广泛的能源应用,以及关注AI应用的社会影响等。综上,LLM的引入为微电网负荷优化带来全新范式,有望突破现有方法瓶颈,显著提升微电网运行的智能化水平、效率和可靠性。

    • 韩嘉雯, 陈莹

      优先出版时间:2026-04-10  DOI: 10.13195/j.kzyjc.2025.1014

      摘要:开放集目标检测中通常采用对比学习方法虽能使类内聚拢类间分离,然而未能充分考虑未知目标的分布特性,导致当已知目标与未知目标特征相似时易发生误判。从本质上看,该问题源于开放集场景下已知与未知目标在视觉与语义表示层面的特征混淆,以及模型在判别边界区域容易产生过度自信预测。为此,本文从语义表示与判别置信两个互补维度出发,提出了一种在多模态引导下挖掘样本不确定性的新型网络框架。具体而言,网络首先设计区域生成模块,生成大量无类别候选框区域。其次,通过设计区域-文本匹配模块,引入文本模态构建区域-文本对齐损失,进而在多模态信息的引导下实现已知类与未知类在特征空间的显式分离;同时利用视觉特征对比损失进一步聚拢语义簇,从而构建紧凑的已知边界。在此基础上,为抑制模型在边界区域的过度自信预测,并识别潜在未知目标,在区域-文本匹配分数的引导下,建立基于双重不确定性的伪未知样本挖掘机制,联合运用归因梯度思想设计特征不确定性估计方法计算候选框的不确定性值,并通过视觉定位质量进行校准优化,最终筛选出高质量伪未知样本并构建已知与未知的自适应阈值边界。实验结果表明,相比目前的SOTA,该方法在VOC-COCO-60测试数据集上,将未知类的平均精确度提升了165.14%,充分验证了其有效性和优越性。

    • 廖禄伟, 杨忠, 卓浩泽, 许诺, 游雨龙, 陈旭

      优先出版时间:2026-04-09  DOI: 10.13195/j.kzyjc.2025.1089

      摘要:针对常规多旋翼飞行器存在着位姿耦合及动力系统冗余等问题. 本文将双旋翼旋翼数目精简的结构优势与倾转旋翼位姿解耦优势相结合, 提出一种二自由度机臂可倾转双旋翼飞行器(Tiltable Bicopter with Two-degrees-of-freedom Arms, TBTA). 首先对其进行了基于四元数的动力学建模与运动学建模,并在此基础上研究了解耦控制分配方法. 针对其变姿过程中强耦合、非线性和参数摄动与扰动问题, 设计了位姿非奇异终端滑模自抗扰控制器(NTSMC-ADRC). 通过仿真验证了NTSMC-ADRC控制器良好的鲁棒性和抗扰性. 最后通过变姿与斜面应用飞行实验验证其在斜坡、树木和高空建筑等非水平面类型场景下起降的应用价值.

    • 王靖傲, 孙秋野, 刘子铭, 赵慧冰, 刘鑫蕊

      优先出版时间:2026-04-09  DOI: 10.13195/j.kzyjc.2025.0666

      摘要:可再生能源(Renewable energy sources, RES)在电力系统中渗透率的不断提升,其固有的波动性及碳排放传播路径的复杂性,给低碳经济调度带来了严峻挑战。现有方法难以精确量化RES不确定性成本,传统碳定价机制亦无法有效追溯RES波动引发的间接碳排放。为此,本研究提出一种融合信息论不确定性成本建模与动态碳流分配的多目标优化框架。首先,设计了基于信息熵的RES不确定性成本模型,通过Shapley值公平分摊不确定性风险,解决了RES近乎零边际成本参与机组组合的难题。其次,建立了碳流驱动的动态节点碳强度分摊模型,精确追踪RES功率偏差引致的额外碳排放传播路径。进而,提出了多模态NSGA-III(Multi modal NSGAIII,MMNSGA-III)算法,协调信息论不确定性成本模型与动态碳分配机制之间的权衡。该算法采用动态参考点和多模态策略,有效应对RES导致的决策空间碎片化问题,确保在同时最小化不确定性成本和碳排放传播方面获得帕累托最优解。仿真结果表明,所提框架可降低系统碳排放16.2%,减少运行成本10.87%,为高比例RES接入下的低碳经济可靠调度提供了有效解决方案。

    • 任清爽, 陈珺, 闻继伟, 刘飞

      优先出版时间:2026-04-02  DOI: 10.13195/j.kzyjc.2025.1232

      摘要:本文研究了未知信息物理系统在DoS攻击下的自适应事件触发数据驱动预测控制问题.针对传统事件触发机制在 DoS 攻击下易丢失关键数据的缺陷,提出引入动态补偿因子的自适应事件触发机制,通过指数衰减特性量化攻击持续时间对触发阈值的影响,实现资源开销和控制性能之间的平衡.另外结合 Willems 基本引理,利用离线数据直接构建预测控制器,通过优化问题求解预测序列以补偿DoS攻击带来的影响.在理论上,证明了自适应事件触发机制下无终端约束的多步控制的迭代可行性,并推导出系统稳定条件.最后,以开环不稳定反应器为例,在DoS攻击和噪声干扰共存的环境下,充分验证了该方法的有效性与鲁棒性.

    • 周凌云, 关哲, 华长春, 曾祥端

      优先出版时间:2026-04-01  DOI: 10.13195/j.kzyjc.2025.1341

      摘要:针对多自由度机械臂的轨迹跟踪问题, 本文提出一种基于增强型近端策略优化的 PID(Enhanced PPO-PID) 控制算法. 首先, 该方法构建了基于共享特征提取层的统一网络架构, 在提升策略与价值函数协同优化能力的同时, 显著减少模型参数量, 提高了收敛速度与学习效率;其次, 提出一种基于性能回报动态调节训练迭代次数的机制, 从而实现训练初期快速收敛与后期策略稳定之间的平衡;再次, 引入价值函数裁剪, 通过限制单次更新幅度, 有效平滑学习曲线, 增强了高方差环境下的训练鲁棒性;最后, 在 PandaReach-v3 机械臂仿真平台上, 通过对比实验验证了所提方法在轨迹跟踪性能和鲁棒性方面的优越性.

    • 党耀国, 周心炎, 王俊杰, 许泽东, 尹凤凤

      优先出版时间:2026-04-01  DOI: 10.13195/j.kzyjc.2025.1354

      摘要:当前灰色分数阶多变量模型多是系统项和驱动项取相同分数阶数,忽视了驱动项分数阶数变化对模型精度的影响.为了进一步提高含分数阶的灰色多变量预测模型的拟合预测精度,通过引入非等阶分数阶和非线性函数,提出一个新的非等阶离散非线性灰色多变量预测模型. 对该模型的建模机理、参数估计、递推时间响应式等进行研究,并讨论模型参数几种特殊取值下该模型的性质.最后将该模型应用于江苏省港口货物吞吐量的预测问题中,拟合精度1.05%,预测精度1.91%.结果表明:所提模型拟合和预测的精度均显著优于对比模型,验证了所提模型的适用性和有效性.

    • 周元, 吴仕勋, 蓝章礼, 徐凯, 张淼, 靳双

      优先出版时间:2026-04-01  DOI: 10.13195/j.kzyjc.2026.0066

      摘要:复杂室内环境下的非视距传播、多径以及动态干扰等问题严重制约UWB定位精度的提升,现有的锚点选择策略难以在信号质量与几何分布之间实现自适应平衡。为此,本文提出了一种基于双层深度近端策略优化(DDPPO)的自适应锚点选择方法,将锚点选择建模为序贯决策问题,并利用深度强化学习实现智能筛选。首先,构建融合信道冲激响应、几何分布、轨迹时序与信号质量的多源状态空间,实现对动态环境的全面感知。其次,设计层次化双层PPO架构将锚点选择解耦为数量决策与组合决策两个层次,结合课程学习策略引导模型快速收敛。最后,策略网络输出的锚点子集经加权最小二乘解算位置,以定位误差为主导构建奖励函数,该函数所包含的样本难度自适应机制可根据实时误差动态调整对锚点数量的偏好,生成的奖励信号反馈至决策网络学习形成闭环。在四类真实室内场景数据集上的实验表明,DDPPO方法平均定位误差为0.219米,较现有六种方法降幅达45.9%至72.5%,在定位精度与计算效率间取得良好平衡。

    • 曹伟, 司艳春, 乔金杰

      优先出版时间:2026-03-31  DOI: 10.13195/j.kzyjc.2025.0809

      摘要:针对四旋翼无人机系统陀螺效应因子与风阻系数未知, 且在实际轨迹跟踪过程中易受阵风干扰的问题, 提出了一种具有参数自适应和干扰估计的反步控制算法. 首先, 对四旋翼无人机的数学模型进行分析, 将其转化为带有阵风干扰的严格反馈形式, 并利用已知参数和状态变量误差分别设计陀螺效应因子和风阻系数的自适应学习律; 其次, 利用自适应律实时得到的参数值, 结合位姿跟踪误差及其导数分别设计位姿环的干扰估计器, 用于在控制输入中补偿阵风扰动; 然后, 利用未知参数的自适应值和阵风扰动估计值设计出反步控制算法, 并基于Lyapunov稳定性理论, 对无人机的位置环和姿态环的渐近稳定性进行了严格证明. 研究结果表明, 所提算法在部分参数未知和阵风干扰情况下能够使无人机精确跟踪期望轨迹, 增强了无人机的抗干扰性. 最后, 通过仿真实验进一步验证了所提方法的有效性.

    • 林剑, 徐占, 何以凡, 许晨昊, 赵治涵

      优先出版时间:2026-03-31  DOI: 10.13195/j.kzyjc.2025.1088

      摘要:针对资源不确定环境下雾计算工作流动态调度问题(DWSPFC-RU),构建了以最小化总延迟时间为目标的数学模型,并提出一种多树小生境遗传编程辅助的深度强化学习(MTNGPDRL)方法进行求解。首先,将DWSPFC-RU分解为路由决策子问题和排序决策子问题,并据此构建路由智能体与排序智能体。其次,提出基于小生境策略的多树遗传编程算法(MTNGP),用于生成高效且多样的路由与排序规则。在此基础上,将MTNGP的规则学习能力与决斗双重深度Q网络相结合,构建了多树小生境遗传编程辅助的多智能体深度强化学习框架。针对DWSPFC-RU问题特点,为两类智能体设计相应的状态空间和奖励函数,并以MTNGP生成的规则构建其动作集合。最后,基于不同规模算例进行仿真实验与对比分析,结果验证了所提方法在求解DWSPFC-RU上的有效性与鲁棒性。

    • 张艺楠, 牛宏

      优先出版时间:2026-03-31  DOI: 10.13195/j.kzyjc.2025.1148

      摘要:针对一类非线性动态系统,提出一种带有遗忘因子的递推最小二乘法与物理信息神经网络融合的非线性智能建模方法,实现了非线性系统的动态建模.采用带有遗忘因子的递推最小二乘法对低阶线性模型的未知参数进行辨识,通过逐步更新模型参数,有效应对非线性系统中的动态变化以及参数跳变的情况,并根据数据信息逐步修正模型,提高精度.在获得低阶线性模型的基础上,引入物理信息神经网络对未建模动态未知增量进行估计.将机理模型的部分先验知识作为约束条件嵌入物理信息神经网络中,使神经网络能够快速收敛到最优解,提高建模精度.该方法弥补了实际工业过程中数据样本不足或数据损坏的建模需求.最后,通过数值仿真对比实验验证了所提方法的有效性.

    • 姬心想, 王婷婷

      优先出版时间:2026-03-31  DOI: 10.13195/j.kzyjc.2025.1207

      摘要:针对传统基于图像的视觉伺服(IBVS)在实际应用中存在的对图像雅可比模型依赖、固定增益适应性不足以及特征点易出视场等问题,本文提出了一种改进的模糊在线极限学习机视觉伺服控制方法(FA-OS-ELM-IBVS)。该方法以在线序列极限学习机(OS-ELM)直接从图像误差估计相机速度,避免显式计算图像雅可比及其奇异性;构建以误差范数、可操纵性与误差收敛角为输入的Mamdani模糊增益,实现了伺服增益的非线性自适应调节;并通过分层矩形区域与sigmoid平滑补偿实现连续、可控的视场保持。基于李雅普诺夫理论给出了所设计控制系统的稳定性分析与证明。仿真实验结果表明,与经典IBVS相比,所提方法的收敛时间缩短约7.09%–16.7%,相机轨迹长度降低约27.48%–57.94%,且IAE、ITAE等积分性能指标显著降低;在假设深度与真实深度存在明显失配的情况下,系统仍能保持稳定收敛。进一步与改进IBVS方法对比,所提方法在收敛速度与伺服性能方面均表现出进一步优势。在六自由度CGXi G6机器人平台上的实验结果进一步验证了该方法在真实场景下的收敛效率提升,以及所提无标定框架的鲁棒性与有效性。

    • 彭莉莎, 章荣溢, 彭娟娟, 黄锦涛

      优先出版时间:2026-03-30  DOI: 10.13195/j.kzyjc.2025.1191

      摘要:三支协同推荐将三支决策思想引入协同过滤中,在处理推荐不确定问题上取得了进展,但现有三支协同过滤方法仍存在两方面不足:首先,基于个体邻域相似度的判定往往忽视对象间的群体共性,导致低频对象被忽略并产生推荐不平衡;其次,采用静态阈值或离线调参的策略在持续获得反馈的动态推荐场景中难以及时调整决策边界,进而增加误推荐率.针对上述问题,提出一种基于增量聚类的动态自适应序贯三支协同推荐(IC-DASTCR),具体而言,该模型涵盖两个创新模块:1)将增量聚类引入序贯三支推荐,用于刻画群体共性,提高推荐准确率并降低决策代价.2)基于随机梯度下降算法,设计了一种动态阈值自适应机制,以在线更新决策边界并进一步提高推荐准确性.在多个公开数据集与真实场景上与若干推荐算法进行了实验对比与分析,结果表明,本研究构建的模型IC-DASTCR具有更优的推荐质量与效率.

    • 赵世杰, 邓姝婷, 赵秋丽, 宋金玲

      优先出版时间:2026-03-30  DOI: 10.13195/j.kzyjc.2025.0834

      摘要:求解非线性方程组是数值计算领域中一项重要且具有挑战性的工作,其目标是在一次运行中找到多个根。为充分利用邻域拥挤差分进化算法的寻优信息,同时保持良好的种群多样性和计算资源利用效率,提出一种基于近邻频次信息引导的多变异差分进化算法。多变异策略基于个体适应度值进行分组,每组个体采用不同变异算子,以实现全局和个体邻域信息的综合学习,从而增强算法的多根联解能力;近邻频次信息引导机制利用个体被选为邻域个体的频次信息,以提升进化过程的效率并增强对潜在根的探索能力。实验结果表明,所提算法相较于其他对比算法有更高的计算资源利用效率、更高的找根率和成功率。

    • 任凯楠, 付东飞

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2025.1036

      摘要:模型预测控制(MPC)的性能高度依赖精确的系统模型与精心设计的代价函数,这限制了其在复杂非线性系统中的应用. 为克服该局限性,本文提出一种融合扩散模型与生成式对抗模仿学习(DGAIL)的智能MPC策略. 该方法利用扩散模型的分布建模能力,从专家示范中更准确地学习隐式奖励函数,从而有效减少对研究者经验与人工奖励设计的过度依赖,并兼具无模型学习与基于模型优化的优势. 进一步引入一种基于粒子群优化(PSO)的在线更新策略,以高效求解非线性MPC的约束优化问题. 在多个基准仿真环境中的实验结果表明,所提方法在控制性能与安全性方面均优于现有模仿学习与强化学习算法,验证了其有效性与泛化能力.

    • 郭鑫, 张俊拓, 崇玉婷, Celso Grebogi, 焦尚彬

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2025.1102

      摘要:光储直柔微电网中各种分布式电源及储能装置等运行状态的优化,是实现整体系统高效、经济、可靠运行的关键,但面临着设备参数配置与运行功率调度的双重不确定性挑战。本文针对一类多层直流母线结构且含光伏、储能、电动汽车、中央空调、负荷的光储直柔微电网系统,构建了考虑运行成本、碳排放及柔性负荷任务调控的多任务优化目标函数,并提出了一种多任务进化混沌粒子群优化算法(MTECPSO)以实现光储直柔微电网的设备参数配置与运行功率调度的协同优化。算例仿真比较结果表明,相较于传统基于进化算法的单目标、多目标优化算法,所提方法在保证多任务优化目标的前提下,计算效率显著提升。

    • 常绪成, 王敬宇, 朱锋, 任高峰, 李康, 刘代军

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2025.0979

      摘要:针对无人机集群协同控制中的高维非凸优化难题,本文提出一种分布式时空解耦模型预测控制(DSTMPC)框架,将复杂的时空轨迹优化问题解耦为空间几何规划与时间调度两个序贯而协同的子问题:空间层采用基于迭代线性化与自适应信赖域(ILAC)的序贯凸化方法处理避障、避碰等非凸约束,并融合控制障碍函数(CBF)确保实时安全;时间层则将轨迹执行转化为高效凸优化问题,通过分布式一致性协议实现集群同步。基于开环解耦系统,设计了一种基于冲突状态观测器的时空协同反馈机制,优化了时间层至空间层的闭环优化回路。仿真结果表明,本框架在不同复杂度场景下均实现了良好的控制性能:编队误差稳态收敛至0.37m以内,障碍物最小间距保持在0.2m以上,验证了所提方法的有效性和可扩展性,为大规模集群的高效协同控制提供了一种可行方案。

    • 张旭, 曾玉婷, 张峰

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2025.1127

      摘要:离线强化学习中的数据常由多种策略混合采集,导致动作空间呈现复杂多模分布。现有扩散策略虽能有效刻画多模分布,但由于其动作生成依赖多步逆向推理,效率较低。此外,生成的动作可能接近分布外区域,但并不完全超出数据支持范围,这种不确定性容易引起Q值高估,导致策略不稳定或性能退化。本文提出一种基于Q集成下置信域引导的高效扩散策略(Efficient Q-Ensemble Diffusion Policy, E2DP).该方法通过设计两步逆向推理机制,在显著降低推理开销的同时保留对多模的动作分布的建模能力。为解决Q值高估问题,引入集成Q网络下置信域估计,利用独立目标函数和随机权重系数的方差正则化增强网络多样性,使E2DP仅需少量Q网络即可在分布内动作与数据支持附近的潜在高价值候选之间形成有效权衡,有效提升了策略的性能及鲁棒性。 在Bandit任务和D4RL基准任务上的实验结果表明,E2DP在保持与现有扩散策略相当分布表达能力的同时,推理速度提升约2.5倍,并在多个任务中取得最优归一化得分.本文的实验代码已开源至GitHub平台:https://github.com/smartredcat/E2DP.

    • 郭戈, 刘上

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2025.1195

      摘要:针对空地跨域无人系统在低空协同立体监测任务中的协同控制需求, 本文提出一种融合预测机制的自适应神经网络协同控制方法. 首先, 针对三自由度欠驱动无人车(UGV)与六自由度全驱动无人机(UAV)分别建立动力学模型, 并将二者以组合动力学模型的形式进行描述, 从而为后续空地协同决策与控制提供协调一致的建模基础. 随后, 设计基于卡尔曼滤波的状态预测模块, 利用无人车的实时状态信息对其未来位置进行动态预测, 并将预测结果作为无人机的低空跟踪与监测控制目标. 进一步, 基于Backstepping方法逐步构造协同控制律, 引入径向基函数神经网络(RBF-NN)逼近系统中的非线性不确定性及外部扰动, 并通过李雅普诺夫稳定性理论证明系统状态满足半全局一致最终有界(SGUUB)收敛. 仿真结果验证了所提方法对无人车轨迹预测与无人机稳定跟踪的有效性.

    • 靳双, 刘安龙, 赵杭, 吴仕勋

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2025.1145

      摘要:针对车队在变曲率匝道等复杂道路场景下行驶易出现队形不稳、控制迟滞及安全性下降的问题,本文提出一种基于分阶段奖励优化的双延迟深度确定性策略梯度算法(Stage Reward Shaping Twin Delayed DDPG,SRTD3),该算法结合车联网信息与多智能体强化学习框架,通过在进入、保持和驶出三个曲率阶段分别设计安全、 平滑与效率导向的奖励函数,实现车队在变曲率道路下的稳定协同控制.在算法结构上采用集中训练与分布执行架构,融合参数共享与优先经验回放机制,并在Critic网络中引入残差正则项以抑制价值波动.基于CARLA仿真平台的实验结果表明,与现有的五种算法相比,SR-TD3算法在收敛速度、稳定性及跟车精度方面均有显著提升.其中,在道路曲率过渡阶段车速均方根误差较五种算法分别降低了41.21%、 86.49%、 67.53%、 80.92%和83.33%;在整个变曲率匝道上,车距控制较前五者分别提升了27.30%、 54.52%、 61.57%、 77.51%和76.37%,同时奖励曲线收敛更快、波动更小,表现出更高的控制稳定性与学习效率.仿真结果表明,SR-TD3算法能够在变曲率道路场景下实现更优的协同控制性能.

    • 吴煜轩, 王睿, 郭宇涵, 孙秋野

      优先出版时间:2026-03-26  DOI: 10.13195/j.kzyjc.2026.0036

      摘要:信息-能量复合调制技术逐步成为直流微电网多源变换器的高效分布式协同控制的通信基础。相较于传统光纤和电力载波通信技术,具备无需专用通信线路和特定信号发生单元的优势。然而,现有解调方法普遍依赖离散傅里叶变换(DFT)进行频谱分析,在嵌入式系统“资源受限、非同步采样”的约束下,面临频谱泄露与实时性不足问题。因此,本文提出一种基于Goertzel算法的高效解调技术。首先,本文以典型的功率/数据2FSK单载波调制方案为研究对象,阐述了其解调性能的挑战。其次,设计一种基于Goertzel算法的高效解调技术,通过较低的计算复杂度,有效缓解了频谱泄露与实时性不足。最后,为验证所提方法,设计了系统的仿真对比实验。实验结果表明:在相同计算资源下,所提方法的幅值估计均方根误差较传统DFT方案最高降低98%,有效抑制了频谱泄露;在分析窗长相等的条件下,其处理耗时较传统DFT算法平均减少60.5%,实现2.53倍的加速比。

    • 徐智豪, 张柯, 邢卓琳, 姜斌, 叶准元

      优先出版时间:2026-03-24  DOI: 10.13195/j.kzyjc.2025.1197

      摘要:针对无人机自组网在复杂任务场景下拓扑控制存在的优化目标单一、多目标优先级模糊及传统算法快 速寻优能力不足等问题,本文提出基于超启发式算法的多目标拓扑优化控制方案。首先,建立涵盖网络连通度、总吞吐量、端到端平均时延及通信总能耗的多目标联合优化模型,为网络拓扑全局性能评估提供多目标协同标准;然后,采用博弈论纳什均衡结合的主客观融合权重标定法,协调主观经验与客观数据,增强方案对不同场景的指标赋权准确性;最后,设计融合灰狼优化与改进模拟退火的超启发式算法,依托灰狼算法全局搜索定位优质解区域,结合改进模拟退火动态退温策略接受次优解,实现少迭代下的全局最优与寻优精度提升。仿真验证表明,该方案可适配不同任务场景,且较其他先进启发式算法,其收敛速度与全局寻优能力均展现显著优势。

    • 刘坤昊, 张婉鑫, 朱纪洪

      优先出版时间:2026-03-23  DOI: 10.13195/j.kzyjc.2025.1157

      摘要:无人飞行器智能空战对未来战争具有颠覆性意义,其中关于机动目标跟踪的智能决策与控制研究近年来取得了巨大进展,但在应对战斗机过失速机动迅速改变飞行位置与状态的跟踪方面,仍然存在跟踪精度低甚至丢失目标的问题,难以实现导弹制导系统精确打击的应用。为有效解决该问题,提出一种基于目标运动智能决策的制导系统设计方法。该方法考虑几种典型过失速机动动作的完整过程,将其分解为小迎角飞行、快速俯仰抬头、绕速度矢量旋转、快速俯仰低头四种基本运动模式,以最小化运动建模误差为目标,通过LSTM神经网络预测目标处于四种运动模式的概率分布,并进一步采用与运动模式特征相适应的控制策略来提高跟踪精度。仿真实验结果表明,所提方法在保证不丢失过失速机动目标的同时能够有效提升目标跟踪的鲁棒性和精确性。

    • 李彦苍, 靳雯雯, 连思达

      优先出版时间:2026-03-23  DOI: 10.13195/j.kzyjc.2025.1248

      摘要:为提升优化算法在复杂函数优化场景中的性能表现,本文提出一种改进的豺优化算法(FETDOA)。该算法以豺优化算法(DOA)为基础,通过Fuch混沌映射提升初始种群均匀性与搜索覆盖,切线飞行策略在猎物吸引方向正交子空间加可控扰动以保收敛、强局部探索,缓解早熟收敛与局部停滞,改进经验交换策略(EES)强化个体信息共享、提高协同搜索效率,实现快速高精度收敛。为验证其性能,将FETDOA与八种优秀算法展开对比,并结合Wilcoxon秩和检验进行统计显著性分析。实验结果显示,在多数测试函数上,FETDOA的平均值及标准差均显著优于对比算法。最后通过3个工程案例,展示了FETDOA在工程应用中卓越的能力。综上,FETDOA在复杂函数优化中具备更强的收敛精度与稳定性,为工程优化等实际问题提供了高效的求解方案。

    • 赵东升, 赵鹏, 姚向明, 张伯男

      优先出版时间:2026-03-23  DOI: 10.13195/j.kzyjc.2025.1040

      摘要:现行列车运行标尺配置以保障线路通过能力为原则,不考虑客流分布特征的差异性,导致列车牵引能耗偏高。建立考虑客流特征的列车节能运行标尺精细化配置方法,首先基于高平峰客流分布的差异,解析列车在车站的“站停时间-客流量”以及在区间的“载客量-运行时间-牵引能耗”耦合关系;基于该耦合关系构建以列车周转牵引能耗最小化为目标的列车运行标尺配置模型。最后,以某地铁线路进行实证研究,结果显示在不改变原车底周转时间的前提下,优化后平峰时段列车周转牵引能耗降低12.71%,高峰时段列车周转牵引能耗降低6.69%,验证了该方法的节能潜力。研究成果能够为节能运行图编制提供关键参数,该方法适用于高平峰客流特征差异明显的城市轨道交通线路。

    • 杨露, 王雪松, 金可, 程玉虎

      优先出版时间:2026-03-23  DOI: 10.13195/j.kzyjc.2025.1154

      摘要:离线强化学习(ORL)依赖固定数据集进行动态决策学习,常因分布外动作引发外推误差。现有方法通常通过约束策略分布或采用保守的Q值估计来缓解该问题,但由此带来的悲观性会导致习得的策略次优。为此,本文从提升值函数估计准确性的角度出发,构造了一种Q值修正(QVC)贝尔曼算子,其以习得Q函数与行为Q函数之间的差异作为方向性信号,对Q函数更新目标进行有界修正。在此基础上,将QVC贝尔曼算子与分布内贝尔曼算子相结合,提出平衡贝尔曼算子以更好地利用分布内外数据。理论结果表明,通过平衡贝尔曼算子迭代得到的Q函数具有收敛性,且其与真实Q函数之间的误差是有界的。进一步,将平衡贝尔曼算子集成至隐式Q学习中,并在V函数更新过程中引入针对Q值高估与低估的自适应修正机制,提出基于双重值修正的离线强化学习(ORL-DVC)方法。实验结果表明,在D4RL基准的Gym-Mujoco移动控制和AntMaze导航控制任务中,ORL-DVC的平均归一化得分达到80.9和62.7,整体性能优于现有主流ORL方法,体现出更优的泛化性能。

    • 沈佳俊, 杨淏, 陈英豪, 郭方洪

      优先出版时间:2026-03-23  DOI: 10.13195/j.kzyjc.2025.1231

      摘要:当前微电网能量调度面临的挑战在于时序耦合约束导致决策空间维度显著提升,以及交流潮流方程引入非线性约束,增加了计算复杂度,使得整体优化模型具有较强的非凸性,从而大幅增加了问题的求解难度.针对上述问题,本文提出一种基于安全强化学习和物理约束梯度引导的微电网能量调度方法.该方法构建基于深度学习的动作修正安全层网络,在环境交互过程中对智能体动作进行投影,以保障动作满足物理可行性并有效提升探索效率.进一步地,将该安全层嵌入至网络训练过程,从而提升了强化学习Critic网络$Q$值估计精度以及Actor网络对物理约束的学习效率.基于IEEE 14节点模型构建的微电网电-氢耦合潮流系统实验表明,所提方法在调度决策性能上优于拉格朗日乘子法(TD3-Lag)和惩罚项法(TD3-Pen).同时与基于数值优化的安全层方法相比,保持了相近的性能表现,但部署速度提升了约三个数量级.

    • 刘丹, 付英姿, 付光辉

      优先出版时间:2026-03-23  DOI: 10.13195/j.kzyjc.2025.1299

      摘要:不平衡回归是指连续目标变量分布不平衡且焦注于稀有值预测的方法. 与不平衡分类相比, 不平衡回归的一个额外挑战是如何界定稀有值并与普通值加以区分, 这是准确预测低密度区域稀有值的基础. 针对这一挑战, 本文首先提出了一种新的稀有区域识别策略(KK-means), 该方法结合核密度估计和K-means 聚类, 能够将目标变量空间中的稀疏样本点系统性地识别并合并为连续的稀有区间. 然后, 基于KK-means, 本文提出了一种基于稀有区域识别的稀有值自助不平衡回归方法(RareBoost). RareBoost先通过标签密度比加权从识别出的稀有区间中提取信息, 并在自助采样过程中动态调整样本权重, 增强模型对稀有区域的关注, 从而在训练过程中能够更好地学习稀有值样本的特征; 然后通过Stacking元学习器集成这些具有"稀有值感知"能力的基学习器, 形成兼顾全局效率与局部精度的稀有值预测模型. 实验结果表明, RareBoost在ANLL、RMSE与$R^{2} $等关键指标上优于传统方法. 因此, RareBoost为解决不平衡回归任务提供了一个有效的工具, 并在该领域展示了强大的竞争力.

    • 张坤, 郝文轩, 张立军

      优先出版时间:2026-03-19  DOI: 10.13195/j.kzyjc.2025.0988

      摘要:随着集成电路(Integrated Circuit,IC)工艺节点的不断缩小,光刻版图中的热点问题对芯片性能和可靠性的影响日益显著。鉴于传统基于深度学习的光刻热点检测方法难以满足先进集成电路制造对检测精度及模型泛化能力的要求,本文提出了一种基于深度学习的k-Nearest Vision Transformer(kNViT)模型,用于光刻热点的精确检测。本模型采用对比归一化模块(ContraNorm Module, CNM)和k-最近邻注意力模块(kNNAttention Module, kNAM)来提升特征表示和识别精度。同时,利用光刻版图扩散模型(Photolithography Layout Diffusion Model, PLDM)生成图像,增强了数据多样性。此外,提出了电路特征感知损失函数(Circuit-Aware Loss Function, CALF),优化光刻版图扩散模型在预测噪声时的表现。通过数据增强策略,旋转和对比度调整,进一步提升模型的泛化能力。实验结果表明,kNViT模型在多个光刻版图数据集上展现出高准确率的热点检测性能。在ICCAD 2012数据集上,平均召回率达99.7%,平均准确率98%,平均精确率90.9%,F1分数95%。研究表明,kNViT模型在光刻版图热点检测任务中表现出色,可作为辅助检测工具,有效提高检测准确性和效率,具有工业设计应用潜力。

    • 葛显龙, 孟祥雯, 王博, 刘俊麟

      优先出版时间:2026-03-16  DOI: 10.13195/j.kzyjc.2025.0895

      摘要:针对城市物流配送“最后一公里”痛点和轨道资源利用不足的双重困境,结合商业住宅区人口密集引发的道路交通拥堵问题,以及地铁客运存在显著时空分布不均的特征,提出一种公路与城市轨道协同运输的立体化城市物流优化方案.通过整合地下闲置空间与地铁低峰时段运力,构建基于地铁与货车协同的城市物流网络选址-路径两阶段优化模型,第一阶段聚焦地铁货运中转站布局与资源分配优化,第二阶段基于现有线路设计地铁与货车协同配送路径.考虑到轨道运输的特殊性,设置包括客户服务时间窗、地铁剩余运能、车辆容量等约束条件,以最小化总成本为目标,并结合模型特点,设计融合自适应遗传算法与改进蚁群算法的两阶段混合求解算法.最后,以重庆市中心城区货物配送为例验证模型和算法的有效性.结果表明,相比传统配送方案,该模式可使配送距离显著缩短56.35%,网络运作成本降低30.21%,对于缓解城市物流运输难题具有积极意义.

    • 宋鑫烨, 寇立伟, 窦银科

      优先出版时间:2026-03-16  DOI: 10.13195/j.kzyjc.2025.1166

      摘要:针对由一般线性系统驱动的移动目标,研究二阶多智能体系统固定时间旋转一致性问题。在复杂环境中,考虑部分智能体因感知范围受限或通信限制而无法直接获取移动目标的位置与速度信息,基于此,设计一种基于时变坐标变换的分布式观测器,该观测器只利用智能体间的局部交互信息,使所有智能体均能在固定时间内精确估计移动目标的位置。在此基础上,设计局部固定时间输出反馈控制器,通过引入目标跟踪、旋转控制、位置一致性及速度补偿项,实现系统在无速度信息条件下的固定时间旋转一致性。随后,结合双边极限齐次性理论与李雅普诺夫稳定性理论,证明系统的固定时间稳定性。理论分析证明,所提控制器能确保所有智能体在固定时间内实现旋转一致性。最后,仿真实验验证了所提控制器的有效性。

    • 赵振华, 陈谷雨, 姜斌, 张柯

      优先出版时间:2026-03-16  DOI: 10.13195/j.kzyjc.2025.1193

      摘要:无人机编队飞行过程,会受到外界阵风、内部参数摄动、未建模动态等多源干扰以及执行器故障的影响;此外,在队形动态调整阶段,编队误差大幅变化可能会导致碰撞等安全问题。本文针对无人机编队系统受到的多源干扰、执行器故障影响以及编队误差收敛过程中的动态约束问题,提出了一种基于预设性能和广义比例积分干扰观测器的无人机主动抗干扰编队控制方法。通过引入基于双曲余切函数的新型预设性能算法,在无需编队系统初始状态信息的情况下,保证了编队误差在预设的包络线内收敛,满足了编队误差的动态约束;通过广义比例积分干扰观测器的引入,实现了编队系统中高阶时变干扰的估计与补偿,拓宽了干扰处理种类、提升了编队系统控制精度.

    • 时侠圣, 吴炜, 李中美

      优先出版时间:2026-03-16  DOI: 10.13195/j.kzyjc.2025.1243

      摘要:微电网分布式经济调度是实现系统经济运行的核心问题, 其目标旨在满足功率平衡与发电单元运行约束的前提下最小化总发电成本.不同于集中式调度策略, 分布式经济调度策略无需总控中心对所有分布式节点进行信息收集, 且可扩展性强, 便于隐私保护. 针对现有分布式经济调度算法收敛速率较慢的问题, 本文结合Nesterov 加速技术与原始-对偶框架, 提出一种新型分布式加速经济调度算法. 通过引入自适应对偶变量处理局部出力约束, 并设计包含原始变量与对偶变量的加速动力学方程. 理论分析表明, 所提算法在一般凸成本函数下能够以$O(\frac{1}{t^2})$ 的收敛速率达到全局最优解. 仿真结果表明, 所提算法在稳定性方面优于现有分布式Nesterov 经济调度算法, 能够有效实现微电网经济调度问题的快速分布式求解.

    • 陶克武, 王小敏, 邓红元, 陈勇

      优先出版时间:2026-03-16  DOI: 10.13195/j.kzyjc.2025.1002

      摘要:针对动车组运行过程中存在的集总扰动(未知时变扰动、附加阻力、单元间耦合力和基本阻力)、输入饱和及有限缓冲器行程等多重约束问题,联合人工势函数提出了一种基于多智能体理论的分布式有限时间预设性能鲁棒一致性控制器.首先,根据缓冲器行程的不同区间,提出一种新的势场力作用判断机制,并构建了基于相对速度和距离的自适应斥力势函数和引力势函数.其次,结合余弦函数和指数函数,提出一种新型的有限时间预设性能函数,有效约束了各动力单元跟踪误差的收敛边界与稳定时间.此外,引入扰动观测器和基于滤波补偿方法来处理集总扰动和输入饱和的影响.相较于现有方案,本研究的主要优势在于动车组系统的控制性能可预先得到保障,还能兼顾实际有限时间稳定性、串稳定性与动力单元安全间距保持,并具备更强的鲁棒性.最后,以CRH380A型高速动车组为研究对象,从理论分析和数值仿真两个层面验证了所提控制器的有效性与可行性.

    • 付超, 高继培, 崔凯旋, 倪文青, 薛旻, 刘卫勇

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2025.1285

      摘要:在图像和文本等多模态数据可用条件下,利用单一深度网络进行融合决策,存在可解释性和可靠性挑战.针对挑战,提出一种图像和文本数据驱动的两阶段区间决策方法,包括准则预测和准则融合两个阶段.在准则预测阶段,依据各准则上的图像特征提取需求确定深度网络集合,设计基于有放回采样的深度网络性能统计比较方法确定网络排序,进而构建网络接续组合的选择方法确定可靠的最佳组合,产生基于图像的区间数预测值.在准则融合阶段,通过文本训练集学习准则权重,进而构建基于文本验证集的优化模型学习自适应权重函数,最后利用准则权重和自适应权重函数融合各准则上的图像生成预测值,产生可解释的总体预测值.以安徽合肥某三甲医院超声部的乳腺彩超图像和文本数据为基础,将提出方法用于乳腺病灶辅助诊断,验证了方法的有效性.

    • 董久祥, 李易, 张漉麟, 许锦瑜

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2025.0996

      摘要:对于集员估计的故障诊断技术,因其在处理未知但有界不确定性方面的理论优势,已成为提升系统鲁棒性与可靠性的重要研究方向. 本文系统综述了基于集员估计的故障诊断方法,突破传统综述按时间或领域划分的范式,以集合几何表示形式为主线,将现有方法划分为区间型、椭球型、中心对称多胞形型以及其他几何体四大类,深入阐述了每类方法的基本原理、发展脉络与性能特点. 文章进一步围绕故障检测、隔离与估计三个核心环节,全面回顾了集员估计在故障诊断中的研究进展,对比分析了不同几何描述策略在计算复杂度、保守性和工程适用性方面的优劣. 在此基础上,本文系统梳理了该方法在各领域的典型应用成果,并总结了当前面临的关键挑战. 最后,文章指出了未来值得深入研究的若干方向.

    • 李新宇, 高艺平, 罗世林, 王佳钰, 张婷婷, 高亮

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2025.0935

      摘要:人形机器人是机器人领域的研究热点,其类人结构展现出了优异的人类环境适应性,能够实现复杂场景的高效作业,可以在工业、服务、救援、医疗等场景中辅助或替代人工作业,是能够对产业发展产生颠覆性影响的技术。然而,人形机器人高集成度系统设计和高动态性运动的需求,对驱动控制技术带来了全新的挑战。本文首先结合具体案例分别介绍了电机与液压两种驱动形式的人形机器人的发展历程,总结了各自的特点;其次,从驱动器和驱动控制算法上梳理了驱动技术的研究现状,着重介绍了电机驱动器、液压驱动器及其对应的控制算法;然后,阐述了人形机器人主流的运动控制方法,详细介绍了基于简化模型、基于稳定判据和基于学习策略的三种运动控制方法;最后,从人形机器人的电机驱动高功率化、“骨骼血管”一体化、电动静液作动器模块化等三个方面总结了人形机器人发展面临的挑战及发展展望。

    • 高跃庭, 桂方志, 王欢, 刘鹏程

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2025.0929

      摘要:针对复杂环境下多无人机协同路径规划问题中传统搜索算法效率低、启发式算法寻优性能差等问题,提出基于多策略改进鲸鱼算法(Multi-strategy improved whale optimization algorithm,MSWOA)的多无人机协同路径规划方法。该算法采用Sine-Cubic混合混沌映射提升初始种群质量;引入非线性收敛因子自适应调节全局探索与局部开发强度并结合自适应螺旋系数提高后期收敛精度,通过双分布扰动自适应差分变异策略提高收敛速度,最后引入思维创新策略避免算法陷入局部最优。在CEC2017测试集的29个测试函数上进行对比寻优实验,测试结果表明MSWOA具有更好的寻优性能,并进一步应用于三维复杂地形下的多无人机协同路径规划问题,验证了其寻优精度和稳定性。

    • 雒春林, 王婷一, 闫晶晶

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2025.1141

      摘要:在多区域互联电力系统中, 负荷波动易引发有功功率失衡, 需要通过调度指令(如机组投入/退出调频队列)动态调整发电机组出力. 此时, 不同发电组合的运行模式切换可由多模态切换系统刻画. 由于调度指令通常经由通信网络传输, 该过程易遭受欺骗攻击, 导致频率越限甚至机组误动作. 为解决这一问题, 本文提出欺骗攻击下的事件驱动量化负荷频率控制策略. 首先, 采用稀疏矩阵重构方法对子发电区域模型进行降维, 在保证分布式系统能控性与能观性的基础上, 建立多区域切换电力系统模型. 其次, 考虑欺骗攻击与发电模式切换的协同影响设计事件驱动传输机制. 同时, 证明存在既无攻击也无切换发生的连续时间段, 并利用该时段重构状态变量. 通过引入辅助序列构造迭代量化规则, 确保量化器始终不饱和. 最后, 从最优攻击视角出发, 给出保证多区域切换互联电网负荷频率控制系统(LFCS)指数稳定与实用稳定的充分条件. 仿真结果表明, 所提方案能在欺骗攻击下维持LFCS可靠运行.

    • 褚明慧, 霍鑫

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2025.1271

      摘要:针对目标函数梯度信息难以获取或计算成本高昂的双目标优化问题, 本文采用非交换映射设计了一种不依赖梯度信息的双目标无导数优化算法. 该算法仅利用目标函数值信息, 基于非交换映射估计双目标优化问题的综合梯度下降方向. 此外, 为解决目标间的冲突权衡问题, 并避免过度优化单一目标, 通过最小化包含惩罚函数与正则项的修正代价函数, 提出一种冲突校正的双目标无导数优化算法. 基于Lyapunov 函数证明了所提出算法对一类强凸目标函数的稳定性. 数值仿真结果表明, 与其他双目标无导数优化算法相比, 所提出的算法在目标冲突权衡方面具有更好的性能, 能有效避免收敛至Pareto 前沿端点, 为梯度信息难以获取的双目标优化问题提供了一种有效的无导数优化方案.

    • 吴斌, 刘新宇, 王华

      优先出版时间:2026-03-13  DOI: 10.13195/j.kzyjc.2026.0011

      摘要:磁悬浮传输系统在半导体、精密电子等对精度与洁净度要求高的制造产线逐渐普及,其动子调度问题是制约产线效率的核心问题。本文以最小化最大完工时间、总能耗和负载均衡为目标,建立了磁悬浮传输系统多目标动子调度的混合整数规划模型。提出一种LLM驱动的演化算子自动设计框架——LLM-EvoOp。该框架采用“思想?代码”二元表征与演化机制:在算子演化阶段,LLM基于问题描述与演化提示,通过交叉与变异型提示驱动,自动生成并迭代优化适用于调度问题结构特征的高性能遗传算子;在实例求解阶段,将演化所得算子嵌入标准NSGA?II流程,实现高效的调度求解。仿真实验表明,LLM-EvoOp是求解此类问题的高效算法。

    • 刘凡, 廖虎昌

      优先出版时间:2026-03-12  DOI: 10.13195/j.kzyjc.2025.1267

      摘要:挖掘用户生成内容中的有效信息并为用户提供个性化产品排序是数智时代电商运营管理的新方向. 现有研究在分析文本评论情感时存在偏差进而影响排序效果; 此外, 现有推荐模型未考虑用户偏好不确定性对排序结果的影响. 为弥补上述不足, 提出一种用户生成内容环境下结合深度学习与贝叶斯偏好分解的排序模型. 首先, 为减少未标注评论的情感分类偏差, 提出基于预训练大语言模型的情感分类方法, 利用BERTopic主题模型挖掘在线评论中用户关注的产品准则与关键词, 将标注数据用于LoRA微调Chinese-RoBERTa情感分类预训练模型. 其次, 利用蒙特卡洛模拟将准则偏好转换为贝叶斯先验信息, 构建不同类型的似然函数建模确定和不确定的产品偏好信息, 结合贝叶斯准则与偏好分解方法计算产品排序的分布概率, 进而为用户进行排序推荐. 最后, 通过京东平台的医疗手环排序案例验证模型的有效性. 该模型为数智时代的偏好学习与产品排序推荐提供了新视角.

    • 范龙飞, 史旭东, 黄望芽, 熊伟丽

      优先出版时间:2026-03-12  DOI: 10.13195/j.kzyjc.2025.1344

      摘要:多工况工业过程中工况改变导致的原预测模型失准,且旧工况历史数据往往不可访问,仅凭少量新工况数据难以直接建立准确的软测量模型。为此,提出了一种基于宽度学习系统的缩约核均值嵌入软测量模型复用算法,其包含训练阶段和应用阶段。在训练阶段,针对历史工况,建立基于宽度学习系统的软测量模型;设计基于核均值嵌入的缩约集,将历史工况数据映射到再生核希尔伯特空间中,保护历史工况数据隐私的同时获取其分布特征;利用模型及其对应缩约集构建模型库。在应用阶段,构建基于最大均值差异的距离度量准则,匹配模型库中最优模型实现模型复用,并动态更新模型参数以适应新工况。基于硫回收过程和炼钢过程两个工业实例,验证了所提方法的有效性与优越性。

    • 王昱, 马俨, 王冰

      优先出版时间:2026-03-12  DOI: 10.13195/j.kzyjc.2025.1139

      摘要:本文针对无人船多区域自主探索缺乏前瞻性、探索面积大、受海流影响的问题,提出一种基于滚动时域和拓扑学优化(RHTO)的自主探索方法。首先,利用滚动时域的思想将整个探索任务分解,通过当前已知信息估算全局最佳探索路径,并只执行部分路径;其次,通过边界检测和循环采样快速构建连通当前可达区域的基础路径网,配合拓扑学优化算法快速收敛得到最短路径网;最后通过评价函数计算每条路径的航行成本,使用遗传算法规划最佳探索顺序和探索路径,生成覆盖路径点作为视点引导无人船探索,最终回到起点。仿真实验结果表明采用RHTO方法相比常见的几种自主探索算法,无人船在海上多区域探索结束后,路径总长度、路径外角和以及克服洋流能耗三项指标最小,鲁棒性更好。

    • 闫书丽, 徐逸钊

      优先出版时间:2026-03-12  DOI: 10.13195/j.kzyjc.2024.1066

      摘要:在不确定复杂社交网络决策背景下, 决策者之间的风险偏好差异以及决策源之间的相互干扰对群体共识的达成存在显著影响. 针对这一问题, 本文提出了一种考虑风险偏好的量子群共识模型. 首先, 构建风险匹配函数以量化决策者之间的风险相似特性, 并结合 K-shell 算法和 Shapley 值测度节点综合影响力, 然后在此基础上结合风险匹配度计算决策者的权重. 其次, 构建了一个基于最小调整成本的考虑量子干扰的群共识模型, 考虑个体偏好与群体偏好两条路径间的干扰效应, 从而动态促进群共识的达成. 此外, 基于证据理论融合群体的属性偏好, 确定属性权重, 并计算各备选方案的优势值以进行排序. 最后, 通过低空救援的算例验证模型的有效性, 并结合对比分析, 敏感性分析与仿真分析, 评估所提出模型的鲁棒性与适用性. 研究结果表明, 本文提出的模型能够有效解决不确定决策过程中决策源之间的干扰问题, 提升群体共识的效率与质量.

    • 李建勋, 刘思雨, 张赫, 张若晨

      优先出版时间:2026-03-09  DOI: 10.13195/j.kzyjc.2025.0912

      摘要:针对当前城市电动汽车充电站选址问题中,传统方法忽视成本与服务水平的权衡关系、覆盖率未被作为刚性约束,以及复杂路网下需求时空异质性导致的全局优化困难等问题,本文提出了一种双目标优化与覆盖率约束融合的新型选址模型,并设计了改进鲸鱼优化算法(IWOA)求解帕累托最优解集。首先,将覆盖率定位为刚性约束,建立了以最大化服务水平与最小化全周期总成本为核心的双目标规划模型,该模型采用基于余弦的距离满意度函数和M/M/s排队模型量化服务水平,通过资本回收因子整合快/慢充电偏好及高峰时段修正进行成本评估,并在需求点唯一覆盖、排队系统稳态等约束下实现协同优化;其次,在算法设计上引入自适应权重控制机制、混合搜索策略及局部搜索增强,显著提升算法的全局搜索能力与收敛效率;最后,基于西安市POI数据和实际路网数据选取80个需求点、64个候选站点,通过算例分析对比了IWOA与PSO、GA等算法的性能,并构建成本-服务水平-覆盖率三维决策框架直观展示约束条件对优化目标的影响。研究结果表明,该方法在覆盖率约束0.8时实现最优权衡,服务覆盖率提升至93.6±1.7%,全周期成本降低至1224±73万元,用户平均等待时间缩短至3.3±0.4分钟。本研究能够为解决充电基础设施布局滞后问题提供系统性决策框架,对提升城市电动交通网络效能具有重要实践价值。

    • 马骏杰, 周托

      优先出版时间:2026-03-09  DOI: 10.13195/j.kzyjc.2025.1075

      摘要:本文提出了一种基于动态事件触发机制的改进分布式协同控制算法,用于实现孤岛微电网频率、电压的恢复及有功功率的精确分配。首先,在采样数据框架下,通过引入内部动态变量对传统事件触发条件进行优化,构造出具有自适应调节能力的触发阈值,系统能够有效降低触发频次,同时避免了Zeno行为的发生。其次,设计了一种基于积分算子的分布式误差预估策略,构建出具有状态预测能力的自触发机制。该机制使得事件触发判据完全克服了周期性采样的缺点,实现了在非连续通信条件下的自主决策。此外,基于Lyapunov稳定性理论对该算法进行收敛性分析。最后,通过MATLAB/Simulink搭建典型孤岛微电网仿真模型验证了所提算法的有效性。同时,与传统事件触发方法进行比较,结果表明本文方法在维持同等控制性能的前提下,有效减少了系统开销。

    • 段鑫绘, 江巧永, 林艳艳, 邓镜达, 王彬, 黑新宏

      优先出版时间:2026-03-09  DOI: 10.13195/j.kzyjc.2025.1177

      摘要:针对不平衡多模态多目标优化的等效Pareto最优解集难以找全的问题, 提出一种排斥机制驱动的多阶段 多目标演化算法. 该算法将整个演化过程划分为三个阶段并在不同阶段采用不同的环境选择方法, 以此实现在 不同的演化阶段搜索不同等效Pareto最优解集的优化任务. 具体地, 第一阶段的环境选择方法仅考虑个体在目标 空间中的收敛性, 这使得种群能够快速收敛到最易找到的等效Pareto最优解集; 第二阶段的环境选择方法采用基 于排斥机制的搜索策略, 该策略通过对靠近已找到的等效Pareto最优解集的个体进行自适应惩罚, 这有利于避免 种群对重复区域进行搜索和降低算法陷入单一等效Pareto最优解集的风险; 第三阶段的环境选择方法通过同时 兼顾个体在目标空间和决策空间中的收敛性与多样性的方式对前两个阶段获得的等效Pareto最优解集进行微 调, 以进一步提高算法的优化性能. 实验研究结果表明, 提出的算法在相同函数评价次数条件下能够找到全部等 效Pareto最优解集, 且与其它7个同类算法相比, 其在目标空间和决策空间上的综合性能具有一定的优势.

    • 朱晓晴, 刘智伟, 雷浩, 周长远

      优先出版时间:2026-03-09  DOI: 10.13195/j.kzyjc.2025.1180

      摘要:针对电力市场中发电商非合作博弈具有动态性强、信息不完全等特点, 提出一种基于软演员–评论家算法 (Soft Actor-Critic, SAC) 的独立智能体报价学习方法.首先,在截距参数化供给函数的基础上,构建以发电商长期收益最大化为目标,并考虑直流潮流约束和节点电价形成机制的电力市场出清模型,将报价函数截距作为发电商的连续决策变量;然后,基于SAC算法构建发电商独立学习框架,通过最大熵目标增强策略探索性和收敛鲁棒性,并结合市场出清结果设计基于收益反馈的状态、动作与奖励映射机制,实现各发电商在无显式通信条件下的自适应策略更新;最后,基于IEEE 3节点和30节点系统开展数值仿真.仿真结果表明,所提出的基于SAC的独立智能体方法能够有效逼近纳什均衡报价策略,具有良好的收敛特性, 并能揭示在高折扣因子条件下电力市场中可能出现的默契合谋行为.

    • 叶宝林, 苗永超, 王征

      优先出版时间:2026-03-07  DOI: 10.13195/j.kzyjc.2025.1161

      摘要:精准预测路网交通流是保障智能交通系统高效运行的基础。针对现有方法存在难以有效建模交通流数据中复杂非线性时空动态依赖关系的问题,提出一种基于增强时空Transformer(ESTformer)的交通流预测方法。该方法设计多尺度时间Transformer和增强空间Transformer分别建模交通流量序列数据之间的时间依赖关系和不同节点之间的空间依赖关系。多尺度时间Transformer构建短期门控卷积网络捕获交通流数据中的短期时间依赖关系,并引入时间多头自注意力机制捕获长期动态时间依赖关系。增强空间Transformer通过对偶变换增强键向量的特征表达能力,利用时变掩码矩阵动态更新键向量,提高了模型同时捕获节点特征和边特征的能力。在4个真实交通流数据集上的测试结果表明,与基线方法相比,所提基于ESTformer的交通流预测方法具有更优越的预测性能。相比于13种基线方法在不同数据集上表现最佳者,所提方法在12个时间步上的平均绝对误差(MAE)和均方根误差(RMSE)分别改进了1.14\%-3.88\%,0.36\%-1.78\%。

    • 杨明园, 王伟

      优先出版时间:2026-03-05  DOI: 10.13195/j.kzyjc.2025.1120

      摘要:为了提高物流配送效率, 研究一种考虑工作量均衡的车辆-无人机协同路径问题. 为了求解该问题, 首先以运营成本与车辆-无人机编队工作量均衡建立双目标混合整数线性规划模型. 其次, 提出基于模型与图强化学习驱动的多目标优化方法. 第一, 提出基于混合策略的种群初始化方法和多个局部搜索算子以有效探索解空间; 第二, 提出增强强化学习的帕累托局部搜索算法并将其作为多目标问题的局部搜索算法以进一步提高多目标方法的搜索能力. 增强点包括基于图卷积神经网络的特征提取机制和基于长短期记忆网络的策略优化方法. 特征提取机制通过捕捉车辆-无人机路径方案的空间关系, 为智能体决策增加状态表征信息; 策略优化方法通过构建交互环境模型并推演其多步虚拟轨迹提高智能体的训练样本效率. 最后, 通过参数分析和对比实验证实所提模型和算法的有效性以及算法在优化所提双目标上优于精确求解器 CPLEX 和针对此类问题的多个先进算法.

    • 顾岩, 金锋, 赵珺, 王伟

      优先出版时间:2026-03-05  DOI: 10.13195/j.kzyjc.2025.1199

      摘要:多变量时间序列分类在工业状态识别与决策支持中发挥关键作用, 但异步采样与随机缺失形成的不规则数据严重削弱了其分类精度. 基于插补的方法易引入噪声和伪影, 而直接建模又易使关键信息被稀释或扭曲. 本文提出了一种基于增强型多尺度图Transformer 的“序列-图像-图”统一建模方法. 首先,增强型多通道图像转换 将不规则序列编码为无需插补的RGB 图像, 直接利用数值动态、缺失模式与采样信息. 其次, 动态扇形图构建将图像块映射为图节点, 在局部扇形邻域内自适应建立邻接边, 以覆盖跨时间和跨变量依赖并减少冗余. 最后,自适应多尺度相对图卷积, 在邻居聚合中引入多尺度差分特征, 并结合注意力加权突出关键邻居, 从而缓解图卷积过平滑. 实验在钢铁企业高炉煤气数据及四个公开不规则基准上验证了方法在多种不规则模式下的有效性.

    • 彭自然, 杨肖阳

      优先出版时间:2026-03-05  DOI: 10.13195/j.kzyjc.2025.1052

      摘要:针对现有电动汽车实时能耗预测模型在环境感知能力、动态校准机制方面的局限,本文提出一种融合环境感知与强化学习的能耗预测模型。首先,为增强模型对复杂工况的感知能力,构建基于对比学习和耦合强化学习协同训练的路况感知算法,引入多尺度图像特征融合机制,有效提取与汽车能效强相关的环境特征,提升感知精度。其次,建立马尔科夫实时能效估计模型,并将其映射到强化学习框架,通过数据驱动更新Q函数与累积奖励,实现预测模型的主动进化与自适应优化。同时,结合场景感知的优先经验回放机制,强化对坡度突变、急加减速等关键工况的关注,进一步提升模型在复杂环境下的学习效率与泛化能力。最后,通过场景感知的优先采样机制提高训练样本质量,提高强化学习的收敛性与训练效率。。实验结果表明,该方法在多种运行工况和车型条件下均表现出优越的鲁棒性和稳定性,其MAE低于0.2%、RMSE低于0.3%、R2超过99.5%,显著优于现有的Transformer、Informer、Mamba及LSTM模型。

    • 韩佳伶, 陈芋渝

      优先出版时间:2026-03-01  DOI: 10.13195/j.kzyjc.2025.1289

      摘要:粒子群优化算法因其参数设置简单、收敛速度快等优点,被广泛应用于复杂优化问题的求解。然而,经典粒子群算法存在早熟收敛倾向与后期收敛速度减慢等局限性。本文提出了一种协同自进化的粒子群优化算法。算法采用一种新的双群协同进化策略用于提高求解收敛速度,同时为了平衡算法全局搜索和局部开发的寻优能力,本文提出了一个自进化框架,通过概率性带偏向的方向学习策略结合衰减性的混动扰动策略,有效提升了求解算法的整体性能。此外,本研究对算法边界理论进行了改进,提升了算法在大多数优化问题上的适应性。改进的算法在CEC-2017测试函数集上进行测试,验证了该算法在低、中高维复杂问题上的快速收敛能力和寻优性能。最后,将改进算法应用于多阈值图像分割的阈值求解问题,实验结果表明,改进算法有效提升了图像的分割精度和效率,验证了算法在解决现实优化问题的有效性。

    • 赵嘉, 钟劲文, 肖人彬, 李院民, 吴莉娟, 刘东晓, 翁佳桥

      优先出版时间:2026-03-01  DOI: 10.13195/j.kzyjc.2025.1110

      摘要:针对求解约束多目标优化无法平衡目标优化和约束满足的同时兼顾种群多样性和收敛性的问题,提出嵌入自适应 约束处理机制的多目标狼群算法。首先,通过自适应 约束处理机制将种群进化过程划分为学习阶段和探索阶段,学习阶段利用少量可行解和信息优良的不可行解引导种群快速收敛,探索阶段对收敛种群施加强约束,并利用非支配可行解扩散检索约束帕累托前沿,以平衡收敛性、多样性和约束满足。其次,设计精英引导策略,促进解在搜索空间中的均匀分布,提高全局搜索能力。最后,引入差分进化更新机制,通过二元锦标法筛选优势个体并实施差分变异,在保持多样性的同时加速进化。在20个约束多目标测试函数及焊接梁工程问题上的对比实验表明,MOWPA-AE不仅在约束满足与目标优化的综合性能上表现优异,也具备在实际工程优化问题中应用的可行性与推广价值。

    • 张泽辉, 吴富龙, 李帆雅, 徐晓滨, 章振杰, 邵海滨

      优先出版时间:2026-03-01  DOI: 10.13195/j.kzyjc.2025.0884

      摘要:近年来,以人体姿态信息为基础的行为识别技术正逐步应用到工人行为安全检测中。然而,在复杂工业场景下,遮挡和算力受限等问题使得现有的基于计算机视觉的人体姿态估计方法难以同时满足高精度和低复杂度的要求。因此,本文结合量子化自编码器和轻量化的ResNeSt网络,提出了一种面向复杂工业场景的人体姿态快速估计方法。特别地,本文提出了一种循环权重迁移训练方法,通过在不同尺寸的骨干网络模型之间迁移权重参数,以保证姿态估计的精度。实验结果表明,所提方法能够在复杂工业场景中准确地估计出人体姿态,相较于原始方法,模型计算量减少了4倍,为工业领域的实时姿态估计提供了一种高效、低资源消耗的解决方法。

    • 李艳辉, 石远彬

      优先出版时间:2026-02-26  DOI: 10.13195/j.kzyjc.2025.1178

      摘要:传统固定增益控制策略在多智能体系统面临时变参数不确定性时,常存在收敛速度与控制精度难以兼顾,以及鲁棒性不足的问题。为此,本文提出一种鲁棒自适应控制策略,以提升系统在参数动态变化环境下的一致性跟踪性能。首先,基于系统的固定通信拓扑,构造了图结构一致性误差,该误差包含智能体与相邻跟随者以及领导者之间的状态误差。其次,设计了一种分布式控制律,该控制律融合参数自适应律与基于全局代价函数梯度的优化机制,可以实现在线优化控制增益。此外,基于Lyapunov稳定性理论,证明闭环系统的一致最终有界性。仿真结果进一步表明,在固定通信拓扑且系统存在参数扰动的情况下,所提出策略仍能实现快速、平滑的状态收敛,有效提高了系统的跟踪性能与鲁棒性。

    • 张志瑶, 于川博, 苗栩凯, 乐明宇, 梅元元, 张蒙祺, 莫继良

      优先出版时间:2026-02-26  DOI: 10.13195/j.kzyjc.2025.1142

      摘要:全断面隧道掘进机(Tunnel Boring Machine, TBM)主轴承的运行状态直接关系到整机掘进安全与效 率, 其故障辨识至关重要. 然而, 工程中主动维护策略的实施致使状态监测数据呈现极端类别不均衡特性,故障 样本比例往往低于 1%, 难以提取稀疏故障特征, 漏检风险极高. 为此, 本文提出一种深度强化学习故障辨识模型 (DRLimb). 该方法首先将故障辨识过程建模为马尔可夫决策过程,通过双网络架构(在线 Q 网络与目标 Q 网络) 及软更新机制确保训练稳定性. 继而, 设计了非对称奖励函数, 通过为故障类样本分配更高的奖惩权重, 迫使智能 体聚焦于稀疏但关键的故障模式. 理论分析证明,将多数类奖励系数设置为类别不均衡比率,可实现类间梯度贡 献的均衡化. 在多个极端不均衡比率的 TBM 主轴承数据集上的实验表明,DRLimb 的 G-mean 值与 F1-Score 均稳 定超过 93.2%,显著优于主流不均衡学习诊断模型与基线模型.

    • 孙赫迎, 高路逸, 高远, 张文会

      优先出版时间:2026-02-26  DOI: 10.13195/j.kzyjc.2025.1029

      摘要:在航运业数字化转型的背景下,班轮企业在线上线下双渠道中差异化的超售行为改变了各渠道的舱位供需匹配关系,从而导致双渠道成本结构呈现异质性,进而增加了双渠道舱位分配的复杂性。针对这一难题,本文基于托运人对运价的不同敏感性(分为运价敏感型与运价不敏感型),构建了双渠道舱位分配和舱位定价联合优化模型。进一步,将空箱调运纳入决策框架,构建了两阶段非线性规划模型,以同步优化舱位分配量、舱位运价及空箱调运量。以中远海运的一条从远东至南非的航线作为案例进行算例和敏感性分析。结果表明,与忽略空箱调运的模式相比,考虑空箱调运可使班轮企业的期望总收益提升32%。此外,在现货市场托运人履约率、合同市场托运人置信水平、现货市场随机需求波动等参数变动情况下,考虑空箱调运的模式表现出更优的收益稳定性。本文通过对托运人类型的精细化分类,为航运数字化背景下的班轮企业运营管理提供了理论支持与决策参考。

    • 樊怡麟, 季雨昂, 秦修功, 杨方正, 李辉

      优先出版时间:2026-02-25  DOI: 10.13195/j.kzyjc.2025.1112

      摘要:三维目标检测对于提升智能系统在复杂室内环境中的感知与理解能力具有重要意义。然而,现有基于单模态点云的检测方法普遍存在语义信息不足、泛化能力受限等问题,难以有效应对室内场景中新类别目标的检测需求。针对上述问题,本文提出一种图像–点云–文本多模态融合的室内三维目标检测方法。该方法首先引入密集深度图引导的图像–点云早期融合策略,通过深度约束将图像语义特征精确映射至三维空间,有效增强点云的语义表达能力并缓解遮挡带来的空间错位问题;其次,设计混合查询引导的室内Transformer检测器,采用几何查询与可学习查询相结合的双分支查询机制,在兼顾局部目标精细建模的同时强化场景级上下文建模能力;最后,提出动态解耦3D-IoU损失增强策略,通过解耦空间梯度并根据目标尺度动态调整权重,提高新物体候选框的定位质量与发现能力。在SUN-RGBD数据集上的实验结果表明,本文方法在多项评价指标上均优于现有先进方法,验证了其在室内开放域三维目标检测任务中的有效性与鲁棒性。

    • 韦保磊, 刘宁, 马义中

      优先出版时间:2026-02-25  DOI: 10.13195/j.kzyjc.2025.1061

      摘要:灰色关联分析是多因素系统分析的重要方法, 其基于序列折线的几何形状量化因素间的关联性. 现有方法多假设序列等间隔分布而后在欧氏空间构建关联度的代数表达式, 其理论完备性尚待论证; 且忽略了序列的分布间隔、观测误差以及折线的高阶几何特征, 导致精度低和适用性受限. 为此, 本文揭示关联度代数表示的泛函分析基础, 在函数空间中探索其泛函表示及高阶多变量拓展. 首先, 引入样条光滑法构建本征函数空间; 其次, 推导关联度的有界非线性泛函表示; 最后, 设计关联度的高阶泛函拓展, 并以多变量序列为例给出关联分析算法. 以某型号坦克炮身管烧蚀磨损数据为基础, 运用所提方法聚类评估身管剩余性能, 结果表明该方法在适用范围、可解释性和准确性等方面均优于对比模型, 为武器装备健康管理提供支持.

    • 张开玉, 王浩杰, 卢迪

      优先出版时间:2026-02-14  DOI: 10.13195/j.kzyjc.2025.0943

      摘要:随着无人机技术在城市安防、交通监管和应急救援等领域的快速发展,无人机图像的目标检测与识别技术为多行业应用提供了可靠的技术支持.低空视角的目标检测任务面临小目标密集、尺度变化大、背景复杂等挑战.针对上述问题,本文提出一种改进的YOLO11无人机图像目标检测算法.首先,设计CSP-MS模块通过分层融合和异构卷积结构实现多尺度特征的表达;其次,设计特征增强多尺度特征聚合金字塔模块,通过空洞卷积与跨层融合机制提高模型对复杂场景的感知能力;最后引入轻量级动态任务对齐检测头,降低模型参数量的同时提升对小尺寸目标的检测精度.模型在VisDrone数据集上mAP0.5和mAP0.5:0.95指标分别提升10.2%和6.7%,在CODrone数据集上分别提升5.4%和3.7%,实验结果表明,改进模型在小目标、复杂背景和多尺度目标场景中均具有显著性能优势,体现出较强的泛化能力和实用价值.

    • 张欣, 赵冬旭, 马泽华, 赵丹, 袁伟, 戴欣, 田慧欣

      优先出版时间:2026-02-12  DOI: 10.13195/j.kzyjc.2025.1071

      摘要:针对高速列车走行部转向架轴箱轴承在复杂工况下运行具有不确定性与动态性,且有效故障样本稀缺导致的诊断精度低的问题,本文提出了一种基于MCWT-Li-VIT网络的故障诊断方法.首先,提出一种基于统计特征的离散型工况识别方法,采用重要的时频域特征构建了特征向量,利用综合稳定性评分函数划分阈值,提升状态数据的有效性与稳定性;其次,构建包含多种母小波的连续小波变换知识库,将一维状态信号转换为多角度、故障特征更丰富的二维时频图谱;进而,设计一种Li-ViT特征编码器,将多头注意力替换为广播注意力降低复杂度,保证识别精度同时显著提升训练与推理效率,增强在边缘设备中的实时部署能力;最后,设计基于多模态时-频特征的对比损失函数,可以有效训练MCWT-Li-VIT网络,并开发了基于余弦相似性分析的故障检测算法.采用Jetson Orin NX嵌入式板卡作为核心测试平台,通过轴承试验台数据集的验证,结果表明:该方法在仅使用正常样本训练的条件下,在复杂工况中对故障状态的检测准确率达到97.2%,能够构建高性能、高效率的特征提取网络.

    • 王通, 王寒静, 高宪文, 王儒乐

      优先出版时间:2026-02-07  DOI: 10.13195/j.kzyjc.2025.1175

      摘要:油井工况预测对于提升油井生产效率,降低故障损失至关重要,但目前油井工况预测仅能预测工况类型,无法输出所预测的工况示功图,导致现场应用受限。针对该问题,提出一种基于多分支特征融合自编码器的油井工况短期预测模型。首先,为解决示功图序列样本间图形变化趋势微弱,易受噪声和相似工况图形的影响,导致特征提取效果不佳的问题,在编码器中设计三个方向的可变形卷积分支分别关注示功图 X、Y 和 XY 方向特征。其次,为互补不同分支所提取的方向特征,设计基于空间意力的交叉融合结构,并将不同分支的融合特征进行拼接,然后使用通道注意力机制增强特征融合效果。最后,将示功图特征序列输入长短期记忆网络预测未来工况的示功图特征,并基于解码器重构示功图。通过油田生产现场的油井示功图序列进行仿真验证,结果表明本文所提方法在油井工况预测及示功图重构上均具有良好的性能。

    • 刘永康, 张严心, 柳向斌, 殷辰堃, 黄志清

      优先出版时间:2026-02-07  DOI: 10.13195/j.kzyjc.2025.1100

      摘要:针对强化学习路径规划中控制性能与安全性的权衡问题, 本文提出一种融合控制障碍函数的安全强化学习算法 RL+adpCBF. 首先, 在约束马尔可夫决策过程框架下, 引入控制障碍函数以提供安全保证, 并基于双延迟深度确定性策略梯度构建端到端的安全强化学习框架; 随后, 设计 CBFNet 网络结构, 在约束强化学习范式下加入基于控制障碍函数的安全约束, 并通过拉格朗日乘子法自适应平衡安全性与控制性能. 同时, 引入可微分 CBF 优化层, 借助先验知识在满足安全约束的前提下实现高效的梯度更新与端到端优化. 最后, 在仿真环境中对所提方法进行验证. 实验结果表明, RL+adpCBF 算法能够在保持较高控制性能的同时有效规避不安全动作, 对环境变化具备快速响应与实时策略调整能力, 显著提升了移动机器人的安全性与运行效率.

    • 张新雨, 祝欢, 任梦娇, 李文玲, 弋英民, 刘兴华

      优先出版时间:2026-02-07  DOI: 10.13195/j.kzyjc.2025.1074

      摘要:精准监测荷电状态(State of Charge, SOC)对避免电池过度充放电风险和保障锂电池的健康运行至关重要。粒子滤波因其在处理非线性非高斯系统方面的独特优势,成为估计锂电池SOC的重要方法。然而,传统重采样方法因其存在粒子多样性匮乏而难以全面覆盖真实状态的后验分布,导致状态估计精度低。为此,本文将量子旋转门引入基于Metropolis-Hastings(M-H)抽样机制的重采样方法中,提出一种量子M-H重采样方法。首先,基于量子叠加态原理,采用粒子量子化、测量坍缩和量子旋转门操作构建了基于量子旋转门的抽样分布并取代原M-H重采样机制中的高斯变异;其次,自适应选择基于量子旋转门或交叉的抽样分布生成新的粒子,并以一定概率接受或拒绝新粒子;最后,利用粒子加权求和估计SOC。通过一维单变量时间序列模型和锂电池SOC估计来验证本文方法的有效性。实验结果表明,与现有重采样方法相比,本文方法能够有效地改善重采样后的粒子质量,提高粒子滤波估计锂电池SOC的精度。

    • 王崴, 王帅航, 王庆力, 瞿珏, 刘海平

      优先出版时间:2026-02-07  DOI: 10.13195/j.kzyjc.2025.1030

      摘要:针对双向快速搜索随机树(RRT-Connect)算法在机械臂路径规划中存在的搜索效率低下、路径规划质量不高以及动态环境适应性差等核心问题,提出一种融合分层启发式引导与强化学习的机械臂路径规划算法H-RRT-C。该方法构建多策略协同优化体系:上层利用改进A*算法生成全局粗粒度路径骨架,并采用动态权重机制指导双向搜索树优先采样关键节点,有效减少随机探索的盲目性;下层引入Dijkstra局部搜索机制,依据障碍物分布密度动态调整搜索范围,实现局部路径精细化处理。同时引入双Q网络强化学习策略,设计包含路径长度、节点分布多样性及避障安全性的多目标奖励函数,以实现扩展方向的智能决策。最后,通过MATLAB仿真实验验证了该算法在各种复杂场景中的路径规划效果,并且通过ROS平台以及实体机械臂测试验证了其工程实用性。

    • 褚菲, 王建文, 马小平, 王福利

      优先出版时间:2026-02-07  DOI: 10.13195/j.kzyjc.2025.1123

      摘要:当前,随着新一代人工智能技术与先进控制理论的深度融合,复杂工业过程控制范式加速迭代,推动了复杂工业过程安全运行控制理论体系的发展和完善,也为智能控制系统规模化落地提供有力支撑. 本文立足工业智能化背景,围绕复杂工业过程“全息感知-异常诊断-自主决策-动态调控-协同优化”的一体化需求,系统梳理复杂工业过程安全运行控制相关理论方法的基本内涵与原理、关键问题与研究难点,分类总结相关进展. 在此基础上,探讨该研究方向亟待突破的关键核心问题,探讨人机共融、知识与数据联合驱动的“可解释+可信任”智能安全运行控制的可行途径,并以典型矿物加工过程为例开展相关理论成果的初步验证. 最后,对复杂工业过程安全运行控制的未来趋势进行展望.

    • 黄敏, 王庚辰, 张继良, 王庆, 宋扬

      优先出版时间:2026-02-07  DOI: 10.13195/j.kzyjc.2025.1149

      摘要:钢铁生产是国民经济的重要支柱。近年来,随着信息技术的迅猛发展,协同计划已成为提升钢铁企业运行效率与应变能力的关键手段。本文首先从采购与生产协同、生产工序间协同和生产与分销协同三个方面,对现有钢铁生产链与产业链协同计划进行了全面梳理。进而,归纳出当前钢铁生产链与产业链协同计划面临的三大挑战,即全产业链信息割裂、生产链与产业链计划协同缺乏以及产业链资源配置韧性不足。最后,展望了钢铁生产链与产业链协同计划的未来重点研究方向,即生产链与产业链协同计划优化框架、生产链与产业链全域深度感知与预测、数据驱动的多维度协同计划优化以及韧性的产业链资源配置优化。本文旨在为构建高端化、智能化和韧性化的钢铁生产链与产业链协同计划体系提供研究思路与实践参考。

    • 史宇昂, 黄炎焱, 王凯生, 翟文杰

      优先出版时间:2026-02-06  DOI: 10.13195/j.kzyjc.2025.1024

      摘要:为刻画杀伤链系统的制胜机理,针对杀伤链模型构建过程中各类作战装备性能如何向系统效能高效涌现的问题,本研究提出基于动态网络演化博弈的杀伤链系统效能涌现模型。通过构建“微观-宏观”双层次研究框架,揭示杀伤链中的各装备间通过自组织、自适应从微观性能向宏观系统效能动态涌现的内在规律。在微观层面,构建了单装备性能分析方法,形成装备的初始行为决策偏好,并将其与博弈理论相结合,通过构建传播动力学方程刻画多装备性能组合的行为决策模型;在宏观层面,基于OODA作战环理论,引入结构化Moran过程构建动态网络演化博弈规则的杀伤链效能模型,通过动态马尔可夫链和演化博弈理论更新网络拓扑结构,并设计节点度均值驱动的网络策略演化机理重构行为决策规则。建立基于演化结果的效能涌现量化指标,结合装备群体的策略选择,分析杀伤链效能变化情况。作战实例结果表明,采用性能互补以及环境适配的装备集群能够促进杀伤链内在结构的动态演化,并揭示系统效能的涌现规律,研究结果有助于指挥员快速准确地把握杀伤链的制胜机理,为作战决策提供有力支持。

    • 刘恩豪, 贾新春, 段苏娜, 李宏鹏, 李寰宇

      优先出版时间:2026-02-06  DOI: 10.13195/j.kzyjc.2025.0990

      摘要:本文研究有向图下具有有界控制增益的异构多智能体系统(HMASs)的预设时间时变编队跟踪(TVFT)问题.首先,为每个智能体提出一个预设时间切换观测器用于估计领导者的状态,该观测器是从一个基于时基生成器(TBG)项的观测器切换到另一个基于分数阶项的观测器.基于预设时间切换观测器,提出一个编队跟踪切换控制器,该控制器是从一个基于TBG反馈的控制器切换到另一个基于分数阶反馈的控制器.所提预设时间切换观测器和编队跟踪切换控制器中的切换时刻均可由用户提前任意预设.然后,使用李雅普诺夫稳定性理论,证明在所提控制器下可以使编队跟踪误差在预设切换时刻收敛到一个可调域内,并在预设切换时刻后的另一个预设时间内收敛到零.与现有的具有时变扩展函数的控制器相比,本文所提控制器可以避免无界控制增益带来的数值实现问题.最后,两个仿真示例验证了理论结果的有效性.

    • 董钰涵, 郎自强, 赵珺, 王伟

      优先出版时间:2026-02-06  DOI: 10.13195/j.kzyjc.2025.1083

      摘要:化工过程的周期操作可利用反应过程固有的非线性特性突破稳态操作性能瓶颈。然而,操作参数的合适选取和对非线性特性分析能力的不足使其在应用中受到制约。为此,近年来学者们提出了一种非线性频率响应方法,旨在通过系统输出直流分量快速判定周期操作能否提升化学反应效益。然而,由于该方法对第一原理模型的依赖和对高阶非线性特性分析能力的不足,通常只能实现定性分析。为弥补现有方法在系统定量分析和优化设计中的不足,本研究提出了一种基于数据驱动和非线性频率分析的新方法。新方法利用反应过程的输入-输出数据,结合筛选出的数值方法,构建数据驱动NFR模型代替第一原理模型,实现化工系统定量分析和优化设计,最大限度地发掘周期操作的性能提升效用。同时,针对方波周期操作下的等温CSTR和CO2-水气液平衡过程,从数值仿真和应用层面分别验证了方法的系统分析和优化设计应用潜力。

    • 曹芳, 火久元, 杨继广

      优先出版时间:2026-02-05  DOI: 10.13195/j.kzyjc.2025.1064

      摘要:延长网络生命周期是隧道无线传感网络亟需解决的核心问题,而拓扑控制在优化网络生命周期和性能方面具有关键作用。为提升隧道无线传感器网络在三维场景下的适配性与整体性能,本文提出一种融合思维创新策略(TIS)改进MOCTCM(Multi-Objective Competition of Tribes and Cooperation of Members)的分簇路由算法TIMO.首先构建三维隧道空间模型并推导最优簇头数,提出基于竞争半径与节点密度的簇头自适应分配机制,优化布局与负载.簇头选举采用TIS改进的MOCTCM算法,综合考虑剩余能量、簇内距离及信任度,路由阶段利用MOCTCM和变异系数法动态权衡总能耗与能耗方差,优化传输路径.仿真结果表明,TIMO能有效均衡网络能耗,显著延长生命周期.

    • 高国琴, 谢雅湘

      优先出版时间:2026-01-30  DOI: 10.13195/j.kzyjc.2025.1064

      摘要:为提高混联机构系统在参数摄动、摩擦力时变与外部干扰等多种不确定因素影响下的轨迹跟踪控制性能,同时考虑摩擦力的不连续性对混联机构系统轨迹跟踪性能的影响,提出一种卷积神经网络预定时间滑模控制方法.通过设计一种卷积神经网络对混联机构包含不连续摩擦力的集总不确定性进行估计.在此基础上,针对现有滑模控制的稳定时间通常难以预先给定,难以在工程中实际实现快速收敛的问题,设计一种卷积神经网络预定时间滑模控制算法,以在抑制系统受包含不连续摩擦力不确定因素影响的同时,实现系统在预定时间内快速稳定.进行MATLAB仿真实验与汽车电泳涂装输送用混联机构样机实验,验证了所提控制方法的有效性和优越性.

    • 丁圆苹, 党耀国, 王俊杰, 黄珊, 杨英杰

      优先出版时间:2026-01-30  DOI: 10.13195/j.kzyjc.2025.0991

      摘要:结合碳排放空间关联关系进行城市群碳排放量预测,对制定区域协同碳减排政策至关重要.长三角城市群碳排放量空间相关性分析表明,城市间碳排放具有显著正向空间相关关系.鉴于碳排放量的空间关联特征、非线性时间演化趋势与区域差异性,提出非线性离散时空多变量灰色预测模型(NDSTGM(1,m,N)).首先,基于引力模型推导非对称时变空间权重矩阵,并据此构建空间关联效应项提取空间关联特征.其次,设计具有差异化阶数的时间多项式项捕捉各节点变量的非线性时间演化趋势.进而,引入非等阶实数域灰色生成算子灵活挖掘数据的区域差异性.同时,基于遗传算法实现多项式阶数与非等阶生成算子的协同优化.最后,应用新模型开展长三角城市群CO2排放量预测,结果表明,该模型在不同样本量下的建模性能显著优于9种对比模型,在时空特征提取与预测精度提升方面具有显著优势.此外,预测结果显示长三角地区2025年有望实现“碳排放强度较2020年下降20%以上”的阶段性目标.

    • 邓承志, 武瑛博, 吴朝明, 孙小惟, 汪胜前

      优先出版时间:2026-01-28  DOI: 10.13195/j.kzyjc.2025.1017

      摘要:针对无人机航拍图像中因目标方向任意旋转、背景环境复杂以及目标尺寸微小等因素导致的检测精度下降问题,本文提出一种基于YOLOv12架构的轻量化无人机目标检测网络YOLO-MAT,该网络融合了旋转感知注意力与自适应特征过滤机制.本文主要工作包括:首先,提出一种多路径旋转感知注意力模块(MRAC2f),通过引入旋转不变注意力机制(RAM),增强模型对旋转目标的鲁棒特征表征能力;其次,设计一种自适应加权多尺度特征过滤融合模块(AMFF),集成双域协同注意力(DDCA)与拉普拉斯边缘增强器(LEE),在抑制浅层背景噪声的同时增强高频细节特征,并利用可学习权重实现多尺度特征的自适应融合;最后,构建一种高分辨率小目标检测头(Tiny Head),进一步提升模型对微小目标的检测性能.在VisDrone2019和NWPU VHR-10数据集上的实验结果表明,相较于基准模型YOLOv12,YOLO-MAT在模型参数量减少3.2%的同时,平均精度均值(mAP)分别提升了6.7%和9.3%,实现了轻量化设计与检测精度的有效平衡.与其他主流检测算法相比,YOLO-MAT在检测精度方面具有明显优势,为无人机实时目标检测提供了一种高效的解决方案.

    • 王坚浩, 张鹏涛, 赵晓林, 郭庆, 唐希浪

      优先出版时间:2026-01-28  DOI: 10.13195/j.kzyjc.2025.1122

      摘要:针对传统目标威胁评估仅依靠静态侦收数据、忽略目标属性犹豫度和指挥决策者意图判断(偏好信息)问题,依据不同时刻侦收数据属性值和目标属性语言变量值构建直觉模糊威胁决策矩阵,在属性权重和决策者权重完全未知情况下,提出一种新的直觉模糊扩展多属性妥协解排序(VIKOR)群决策的目标威胁评估方法.该方法首先采用综合考虑隶属度与非隶属度偏差和犹豫度的直觉模糊熵,基于熵权法和权重协调系数确定属性权重;其次设计基于犹豫度和相似度的决策者权重确定方法;最后采用可最大化群体效益且弱化个体遗憾的VIKOR多属性群决策方法实现目标威胁排序.通过无人机蜂群目标威胁评估案例验证所提方法的可行性,并利用数值实验、敏感性和对比分析验证该方法的稳定性和灵活性.

    • 刘京奇, 韩奇松, 张军国, 胡春鹤

      优先出版时间:2026-01-27  DOI: 10.13195/j.kzyjc.2025.0861

      摘要:基于安全强化学习的机器人运动规划方法在真实物理环境中展现出巨大潜力,但在复杂的风险敏感场景下,现有方法的稳定性和适应性有限,难以满足安全性要求. 鉴于此,研究一种具有时序动态演化特性的安全强化学习方法具有重要意义. 首先,构建一种基于时间连续常微分方程架构的策略网络,该网络能极大增强对非均匀时间序列数据的适应能力,提升智能体在复杂环境中的自适应性. 其次,通过自适应约束近端策略优化算法解决安全约束求解问题,实现灵活且安全的机器人运动控制. 最后,在机器人安全基准测试平台Safety-Gymnasium和自主搭建的Gazebo物理场景中进行实验测试. 结果表明,基于动态演化的安全强化学习运动规划方法在满足约束的前提下,能有效提升机器人在规划任务上的表现. 在物理场景下成功率较基线模型PPO-Lag提升了53.7%. 同时,在不同难度的物理场景中,该方法的平均奖励和成功率最高,实现了泛化场景的最优规划效果.

    • 孙肖宇, 王伟鑫, 裔扬, 章恩泽, 张天平

      优先出版时间:2026-01-27  DOI: 10.13195/j.kzyjc.2025.1062

      摘要:综合考虑水下无人航行器(UUV)的跟踪、能耗和稳定性需求, 本文提出了一种新的基于稳定约束条件的多目标粒子群优化算法(SC-based MOPSO). 首先, 设计一种干扰观测器对系统干扰进行估计. 针对状态约束问题, 基于障碍Lyapunov函数和反步法将满足系统约束、保证系统稳定性的控制器设计问题转化为控制器增益约束问题. 其次, 以系统跟踪误差、能耗、干扰观测器的观测误差和增益大小为性能指标, 建立UUV抗干扰控制问题的多目标优化模型. 随后, 将该约束问题以惩罚项的形式引入优化过程的性能指标计算中, 对控制、干扰观测增益进行优化. 最后, 通过与其他多目标优化算法以及传统线性矩阵不等式方法计算得到的增益进行对比, 本文所提出的SC-based MOPSO能够在保证状态约束的情况下取得更好的控制性能.

    • 袁姮, 孙名, 韩先平

      优先出版时间:2026-01-27  DOI: 10.13195/j.kzyjc.2025.1095

      摘要:针对图像分类任务中模型对频率特征感知不足的问题,提出一种基于频率感知卷积的图像分类网络.首先,引入傅里叶变换,设计频率感知卷积,并将其嵌入到残差分支中,以融合频率特征,增强模型对频率特征的感知能力.其次,设计了一种多分支特征选择模块,在协同提取多层次特征的同时,加强通道间的信息交互.模型利用频率感知卷积和多分支特征选择模块,可以实现对图像空域和频域的联合感知.最后,在CIFAR10、CIFAR100、SVHN、ImageNette和ImageWoof等数据集上进行实验验证.结果表明,与当前主流图像分类模型相比,所提模型在分类精度上均达到最优,验证了该方法在提升图像分类性能方面的有效性.

    • 刘长石, 陈厚吏, 马艺璇, 罗亮, 刘谋清

      优先出版时间:2026-01-21  DOI: 10.13195/j.kzyjc.2025.1069

      摘要:针对即时物流的配送效率低、费用高与超时订单较多等现实情况,设计骑手+无人机协同配送模式.综合考虑商店坐标、无人机站坐标、客户坐标与需求量、骑手单次最大接单量与无人机最大飞行距离等因素,以总配送成本最小为目标构建骑手+无人机协同配送的路径规划模型,并根据模型特性设计一种混合遗传算法求解,采用多类型算例开展实验.结果表明:本文方法能在较短时间内求解符合决策目标的骑手+无人机的配送路径规划方案,有效降低总配送成本、减少超时订单数量、降低超时惩罚成本、扩展即时物流的配送范围.

    • 王家敏, 陶文坚, 王英

      优先出版时间:2026-01-17  DOI: 10.13195/j.kzyjc.2025.1164

      摘要:针对航空复杂装备集成系统多阶段目标偏好动态变化与随机扰动实时响应的复杂调度问题,提出了一种基于NSGA-II与近端策略优化(PPO)的强化学习双向协同优化机制的多目标调度方法.通过构建“离线全局优化-在线动态决策”双向闭环,实现了调度策略的持续自进化.首先,设计基于 PPO的强化学习智能体,实时感知系统状态与扰动,动态调整时间、质量、成本的优化权重,以捕获动态偏好与扰动响应需求;其次,改进NSGA-II算法的非支配排序与拥挤度计算,将实时动态权重以偏好支配关系和加权拥挤度的形式深度嵌入进化过程,引导种群向符合当前战略偏好的Pareto区域收敛.二者通过“离线规则知识注入”与“在线学习经验反馈”双回路紧密耦合.实证研究表明,本方法在超体积(HV)指标上较传统固定权重方法提升20.1%,扰动平均恢复时间缩短41.7%,并在订单延误率、返工率及成本超支率等关键绩效指标上均显著优于对比算法.该方法对于复杂装备集成系统具有良好的通用性,核心算法可拓展至航天、船舶等复杂装备集成的智能优化问题.

    • 金宗瀚, 吴李康, 刘玉祥, 何明, 赵洪科

      优先出版时间:2026-01-14  DOI: 10.13195/j.kzyjc.2025.0833

      摘要:基于大语言模型的智能体在复杂任务的处理中表现出卓越的语言理解与深度推理潜力,然而当它在应对更加复杂的挑战时,尤其是某一特定领域内涉及到领域规则的复杂任务时,其表现得往往不尽人意.这种不足主要源于大语言模型内部中缺乏对领域中专业知识和依赖约束的显示建模,导致解决问题的过程中生成不符合逻辑或不可执行的子任务序列,进而引发规划幻觉和领域知识结构性缺失等问题.为了解决这类问题,本文提出了一种基于知识增强的复杂任务分解框架,该框架创新性地将知识图谱与思维链技术相融合,旨在以知识增强为核心,通过构建约束关系和领域知识双图谱,为大语言模型在解析复杂任务的过程中提供结构化知识约束,并结合高质量的推理路径输入,引导模型生成语义完整、逻辑合理且可执行的子任务序列.实验结果表明,在2WikiMultiHopQA、HotpotQA与MuSiQue三类多跳问答数据集上,基于不同参数规模的Qwen2.5模型里,KTD框架在所有任务和资源配置下均显著优于主流的相关Prompting策略方法,其中在1.5B低资源配置下任务准确率最高提升13.86\%,进一步表明KTD框架在缓解规划幻觉和弥补领域知识结构性缺失方面的有效性.

    • 李常平, 白雪剑, 李永明, 于昆廷, 张傲, 王硕, 王宇

      优先出版时间:2026-01-09  DOI: 10.13195/j.kzyjc.2025.1196

      摘要:针对复杂水下环境中自主水下机器人面临的实时避障与精确轨迹跟踪难题,本文提出了一种融合改进人工势场法(Artificial Potential Field,APF)与自适应视线导引法(Line-of-Sight,LOS)的自主导航方法。首先,建立了UWSim平台下的水下机器人“感知-规划-控制”仿真系统。其次,提出了一种集成局部极小值在线识别与多模式虚拟目标逃逸策略的改进人工势场法,有效解决了传统算法易陷入局部最优的问题,实现了水下机器人在三维环境的实时高效路径规划;在此基础上,设计了一种融合自适应前瞻距离与幂次趋近律的自适应LOS反步控制器,实现了控制器参数根据航行状态的自适应调整,有效抑制了抖振,提升了水下三维路径跟踪控制精度与平滑度。最后,在构建的UWSim系统中开展仿真验证,结果表明:所提出的改进人工势场的实时路径规划方法,在存在动-静态障碍物干扰的场景下仍能保持稳定规划性能,表现出良好的系统鲁棒性;相比较于传统LOS,所提出的自适应LOS反步控制方法有较强的路径跟踪能力,平均误差和均方根误差分别减少48%和14.9%,具有较好的控制精度。

    • 孟祥恒, 郭鹏, 李嘉雯, 史海超, 张志瑶, 马永敬, 孙轶杰

      优先出版时间:2026-01-08  DOI: 10.13195/j.kzyjc.2025.0857

      摘要:针对轨道车辆组装作业中多车型混线生产、工序复杂、工艺路线差异显著及制造资源高度异构带来的分布式异构柔性作业车间调度挑战,提出一种两阶段多智能体深度强化学习方法.将调度流程建模为多阶段马尔可夫决策过程,决策涵盖工件分配、工序排序和机器选择,通过奖励设计引导智能体最小化全局最大完工时间.上层智能体基于分层异构图注意力网络提取产线全局状态,实现工件在不同组装线或工区间的合理分配与负载均衡.下层智能体采用双智能体协作策略,利用基于图神经网络的编码器—解码器结构捕捉工序间前后约束及资源占用等依赖关系,实现局部优化.基于实际作业场景数据,计算验证了该方法在缩短制造周期方面的有效性,并展现出良好的泛化能力.

    • 江鹤, 郑州, 乙夫迪, 顾豪, 陈亮亮, 程德强

      优先出版时间:2026-01-08  DOI: 10.13195/j.kzyjc.2025.0868

      摘要:基于残差学习的单幅图像细节增强算法常常采用贪心搜索策略,这容易导致系统陷入局部最优解。针对这一问题,本研究提出了一种受蜂群觅食行为启发的单幅图像细节增强算法。该算法将图像块匹配过程建模为蜜蜂在二维空间中寻找高质量蜜源的行为,针对输入图像中的每个图像块派遣多只“工蜂”在参考图像中寻找最佳匹配块。通过计算候选块与原始块在上下文、边缘和纹理结构等多维特征上的差异,评估匹配质量,并结合全局最优蜜源及邻域内优秀个体的引导,实现全局与局部相结合的搜索策略。该算法引入了概率驱动的邻域参考选择机制和边界反射策略,并通过余弦函数动态调整局部与全局权重比例,从而有效提升搜索多样性与稳定性。实验结果表明,经过多轮迭代优化,该算法能够提取出结构精确且鲁棒性的细节特征,所提算法在RealSRSet、BSDS200、T91等多个公开数据集上的表现均优于现有算法。其中,在RealSRSet数据集4倍放大条件下,相较于当前流行的方法QWLS,PSNR提升8.21 dB,SSIM提升0.1569,充分体现了该算法在细节还原能力和视觉质量方面的优势。

    • 彭新东, 张云林, 俞琳荟

      优先出版时间:2026-01-07  DOI: 10.13195/j.kzyjc.2025.1081

      摘要:针对现有直觉模糊多属性决策方法存在反直觉行为及数据取值局限性,提出一种基于Lemoine点的直觉模糊SWEI多属性决策方法.首先,借鉴三角形Lemoine 点的几何思想,设计一种新的直觉模糊相似度,并完成其公理化证明;与现有直觉模糊相似度相比,该相似度不仅能够更合理地表征直觉模糊数之间的相似程度,还有效克服了公理性约束缺失与不可计算的缺陷.随后,基于该相似度进一步构造得分函数,以降低决策过程中的计算复杂度.接着,通过直觉模糊得分函数构建模糊得分矩阵,并以熵权法获得备选方案的权重信息,进而利用加权指数信息对备选方案进行排序择优.最后,通过实例仿真分析验证所提方法的有效性,并借助灵敏度分析及对比实验表明该方法具有较强的稳定性与优越性.

    • 苏航, 张滋林

      优先出版时间:2026-01-07  DOI: 10.13195/j.kzyjc.2025.1010

      摘要:为提高机械臂控制过程中的安全性,针对机械臂系统的误差约束问题提出了一种基于强化学习的自适应 控制方法.为此,将机械臂的动力学系统转化为关于跟踪误差的动态方程.然后利用一类误差转换函数,将受约束的 误差系统转换为新的不受约束系统,并基于此系统设计最优控制器.为了解决最优控制问题,利用强化学习的方法 求解系统的HJB方程,其中评价网络用于逼近系统最优值函数,执行网络用于逼近最优控制器的输出,并利用一类 正定函数来大幅简化评价-执行网络的自适应率.基于李雅普诺夫稳定性理论,证明系统所有误差信号半全局一致 最终有界.最后通过一个2自由度机械臂的仿真案例验证了该方法的有效性.

    • 于冬梅, 张梦圆, 张一鸣

      优先出版时间:2026-01-06  DOI: 10.13195/j.kzyjc.2025.0547

      摘要:随着电动汽车快速增长,充电站数量不足、分布不均及可靠性问题日益突出,成为影响使用和运营效率的关键因素。考虑到充电站选址过程中面临的潜在中断风险,本文构建了电动汽车充电站可靠性选址多目标优化模型,旨在通过最小化系统总成本、最大化用户时间满意度及平均充电站可达率,实现经济性、高效性和可达性的协同优化。利用NSGA-III求解模型,获得系统成本、用户满意度和可达率之间的Pareto最优解集。基于成都市三环内路网及POI数据开展实验,验证所提模型在实际场景中的应用潜力。通过超体积、反世代距离、均匀性与多样性指标评估算法性能,并与NSGA-II对比。同时,对中断概率和紧急情况占比进行灵敏度分析,探讨模型的稳定性与适应性。研究结果表明,所提模型和方法可有效应对充电站选址中的中断风险,增强充电网络韧性,为充电站可靠性选址提供参考。

    • 宋程, 马少杰, 贺昱曜, 雷小康

      优先出版时间:2026-01-01  DOI: 10.13195/j.kzyjc.2025.0687

      摘要:在浮力烟羽环境下,气体扩散方向的高度非稳态特征使得信息趋向算法依赖的扩散方向平稳性假设失效,导致信息熵梯度计算失准,引发粒子错误收敛和搜索效率下降。为此,本研究提出了一种非稳态气味扩散下基于指数权重调节和分层重采样的改进信息趋向溯源算法。首先,在权重归一化过程中引入指数型权重修正系数,通过指数变换有效平衡权重分布差异,减少粒子错误收敛;其次,构建基于残差信息的分层重采样模型,采用分位数分层抽样方法提升粒子集表征能力,提高源位置估计准确度;最后,建立基于接近指数-区块序列的双阈值监测机制,当监测到搜索停滞时触发位置迁移策略,有效解决局部最优困境。仿真实验表明,所提出的权重优化策略和动态重定位机制显著增强了算法在非稳态扩散环境下的鲁棒性和搜索效率。

    • 孙琳, 禹春霞, 陈萌, 李灿灿

      优先出版时间:2025-12-30  DOI: 10.13195/j.kzyjc.2025.0775

      摘要:在“双碳”目标与工业5.0理念的共同驱动下,面向可持续发展的云制造服务组合策略既契合国家战略,也满足企业的现实需求。本文提出了考虑可持续性的云制造服务组合决策模型,首先,基于三重底线原则和服务生命周期理论构建可持续性评价指标体系,并采用模糊最优最差法确定指标权重。其次,结合任务结构及物流关键因素,计算服务组合的指标聚合值并构建多目标优化模型。然后,提出基于可持续性评价的多目标人工蜂鸟算法(SE-MOAHA)求解模型,并通过综合评价方法确定最优方案。最后,以阿里云制造平台的复杂机械手制造任务为案例,验证了所提决策模型的有效性和优越性;与初始算法MOAHA及经典算法U-NSGA-III的对比结果表明,所提方法在求解质量、效率与稳定性方面均具有优势。

    • 陈盈果, 李博华, 陈名, 熊健, 白保存, 闫迪, 陈英武

      优先出版时间:2025-12-26  DOI: 10.13195/j.kzyjc.2025.0919

      摘要:针对多敏捷成像卫星任务调度问题中求解效率与调度质量难以兼顾的挑战,提出一种基于卫星优先级排序与单星集成任务调度的两阶段智能构造方法.该方法将多星调度分解为两个阶段:卫星调度序列优化与单星任务调度优化.在卫星调度序列优化阶段,综合考虑卫星可观测任务的总收益与平均可见时间窗长度对卫星进行优先级排序,提升关键资源的匹配效率;在单星任务调度优化阶段,设计融合最小插入成本与最小空闲时间准则的集成插入算法,结合调度松弛机制实现任务序列的高效构造与局部优化.实验结果表明,所提方法在不同卫星数量与任务规模下均能以秒级响应生成高收益调度方案,显著优于先进问答式与集中式算法,同时具备良好的可扩展性与实时响应能力,适用于大规模星座环境下的成像任务调度.

    • 巴智勇, 刘金朵, 袁逸萍

      优先出版时间:2025-12-26  DOI: 10.13195/j.kzyjc.2025.0944

      摘要:在求解作业车间调度问题的局部搜索算法中,邻域解的构造与评估对算法效率与可扩展性具有直接影响。针对邻域评估代价高、计算冗余性强的问题,提出一种基于松弛时间递推思想的邻域解批量近似评估方法,构建了结构化的批量评估框架,将评估复杂度降至线性级。同时,从理论上给出N7 邻域结构中两类非改善移动的判定条件,以增强邻域结构的约束性。实验结果表明,所提方法在保证估算精度的同时显著提升了搜索效率,并在禁忌搜索中取得了更优的调度性能。

    • 刘尚坤, 谢俊江, 黄景丽, 黄捷

      优先出版时间:2025-12-25  DOI: 10.13195/j.kzyjc.2025.0818

      摘要:针对存在传感器故障与非仿射故障的多智能体系统容错控制问题,本文提出一种层级预定义时间最优容错控制框架.以提升系统可靠性和收敛速度为研究目标,基于层级控制、强化学习和预定义时间稳定性理论,构建虚拟层与实际控制层的协同机制.虚拟层设计分布式最优一致性跟踪控制器,通过自适应状态观测器估计未知非线性动态,结合滑模面与演员-评论家结构求解近似最优控制策略,实现多智能体同步最优控制与能量最小化;实际控制层基于虚拟层生成的最优轨迹,设计自适应模糊预定义时间容错跟踪控制器,利用 Lyapunov 稳定性理论保证跟踪误差在预定义时间内收敛至有界集合,同时逼近传感器故障参数与非仿射故障函数.通过调整所设计控制器中的预定义参数,系统可以在期望的预定义时间内实现自适应跟踪的目标.最后,通过仿真实验验证了所提控制策略的有效性.

    • 李博文, 王臆淞, 赵铭慧, 骞晨旭, 程光权, 张雪波

      优先出版时间:2025-12-25  DOI: 10.13195/j.kzyjc.2025.0850

      摘要:复杂空中博弈场景同时面临两类核心挑战:其一,在线交互采样效率低,且高风险试错行为易导致严重后果;其二,离线数据稀缺且覆盖有限,策略对分布外状态的泛化能力不足。针对两类问题,本文提出了一种基于风险约束与保守值函数学习的离线博弈算法 CQL-Safe。其中,风险被定义为智能体在博弈对抗过程中遭受 损毁或被对手击落的概率及其相关安全威胁指标。本文首先设计了一种融合示教学习与扩散模型的数据集构建方法,有效缓解了离线强化学习数据稀缺问题;进而设计多维风险评估函数量化风险因素,并将其嵌入保守值函数学习框架,抑制分布外动作的过高估计;最后引入了拉格朗日乘子机制动态调节风险约束强度,实现了奖励最大化与安全性保障之间的自适应平衡。所提算法在多类空中博弈场景下具有较高训练效率与显著性能优势,能够在保障智能体安全的同时大幅提升策略的泛化性与有效性。

    • 荣海娜, 周泽震, 张葛祥, 刘俊, 但志宏, 张松

      优先出版时间:2025-12-25  DOI: 10.13195/j.kzyjc.2025.0854

      摘要:针对高空飞行环境模拟试验装置的进气系统在应对发动机过渡态时,表现出强非线性和模型不确定性,受未知扰动及测量噪声影响,难以快速、平稳与精确控制的问题,提出一种融合改进滑模扩张状态观测器和卡尔曼滤波的自抗扰控制方法。先设计一种变幂次趋近律以提高状态收敛速度;然后构造一种非奇异快速收敛滑模面以加速跟踪误差收敛,并推导对应的滑模非线性收敛函数;将所设计的观测器与卡尔曼滤波相融合,通过扩张状态观测器对总扰动进行观测与补偿,同时利用卡尔曼滤波抑制测量噪声,二者通过相互协同实现对扰动与噪声的双重抑制,并基于此设计自抗扰控制器。文中给出了完整的稳定性证明与仿真验证。仿真实验结果表明,基于改进滑模扩张状态观测器的自抗扰控制器在受测量噪声干扰下有比基于传统扩张状态观测器的自抗扰算法更高的跟踪精度与跟踪速度;在融合卡尔曼滤波器后,在保证跟踪性能的同时有效降低进气系统调节阀控制量摆动幅度。

    • 孙曦, 赵春晖, 张皓然

      优先出版时间:2025-12-25  DOI: 10.13195/j.kzyjc.2025.0931

      摘要:摘 要:受传感器精度、数据存储及人工标注效率等因素限制,工业场景中常常使用粗粒度的离散标签替代原本的连续的值。然而,离散标签通常会造成信息损失,导致其背后隐含的连续动态过程难以准确建模。此外,离散变量与连续变量在分布特性和信息粒度上存在差异,无法实现统一的预测。针对上述问题,提出一种基于隐连续性恢复的粗粒度离散标签混合时序预测方法(Coarse-grained Discretized Labels–Hidden Continuity Recovery,CDL-HCR)。该方法通过隐连续性恢复策略,利用可观测的离散标签推断不可观测的连续变量,从而实现对原本不可测连续变量的估计。随后,结合自监督学习机制,将恢复得到的隐连续变量与原有连续变量在统一空间中进行特征融合,以提升混合时序数据的预测精度。在线应用阶段,模型可以直接输入实时采集的混合数据进行预测。本文在真实的滚筒烘丝过程数据集上验证了所提方法,结果显示其在混合时序数据预测任务中相比于传统方法具有更高的准确性。

    • 职永然, 君萌萌, 樊慧津, 刘磊, 王博

      优先出版时间:2025-12-22  DOI: 10.13195/j.kzyjc.2025.0615

      摘要:本文研究了全球导航卫星系统(GNSS)欺骗攻击下对抗性领导者-跟随者的编队跟踪控制问题. 首先, 为获取GNSS欺骗攻击下的真实定位数据, 利用协同定位技术设计了一种基于事件的攻击检测与信号切换机制. 随后, 考虑输出测量噪声对状态估计准确性的影响,提出了一种安全状态估计器, 该估计器仅依赖采样信号,即可在GNSS欺骗攻击及输出测量噪声存在条件下实现对跟随者真实状态的连续估计, 在降低计算负担的同时提高了数据利用率. 然后结合非零和博弈论重构领导者与跟随者之间的动态交互关系, 通过利用单评价神经网络近似值函数以及改进的动态事件触发机制(DETM), 设计了跟随者的逼近最优控制策略, 保证了对对抗性领导者的稳定跟踪, 降低了通信和计算负担. 仿真研究验证了所提方法的有效性.

    • 张海洋, 鄢威, 张绪美, 梁晓磊, 江志刚, 柴麟姚

      优先出版时间:2025-12-22  DOI:

      摘要:针对因知识形态异构、复用效率低导致的再制造工艺决策严重依赖人工的难题,提出了一种显/隐性知识增强驱动大语言模型(Large Language Model, LLM)的智能决策方法。首先,分别提出基于向量嵌入和决策目标公式参数化建模的再制造工艺显/隐性知识抽取方法,构建包含工艺向量库和工艺函数库的再制造工艺知识库。其次,提出一套检索增强生成(Retrieval-Augmented Generation, RAG)策略,驱动LLM从工艺向量库中提炼再制造工艺知识,生成可行再制造工艺方案集;建立函数学习机制,通过LLM调用工艺函数库中的公式计算工艺决策目标值,确定最优再制造工艺方案。最后,以汽车发动机蜗杆再制造为例对所提方法的可行性进行验证。结果表明,本文所提方法不仅能大幅降低对工艺人员经验的依赖,更能准确生成再制造工艺方案并进行决策,显著提升了再制造工艺决策的自动化水平与可靠性。

    • 谢地杰, 李敏, 曾祥光, 任文哲, 张滔, 彭倍

      优先出版时间:2025-12-22  DOI: 10.13195/j.kzyjc.2025.0710

      摘要:针对多动态目标的自主水下航行器集群协同围捕决策与控制问题,本文提出了一种融合拍卖机制与多智能体深度强化学习的围捕算法. 该方法将围捕任务分解为目标分配和运动控制两个阶段:首先,基于最优控制理论中的配点法,综合考虑围捕态势、最短时间和最低能耗等优化目标,生成训练数据与竞标值标签. 并利用监督学习训练拍卖神经网络,实现了自主水下航行器的实时目标分配;接着,构建了分配后的个体状态空间,设计了多目标围捕奖励函数,采用多智能体柔性演员-评论家算法,优化了围捕策略. 高效、自适应的拍卖算法确保了动态复杂环境下的快速目标分配,多智能体强化学习则提升了群体的协同控制快速响应能力. 最后,开展了不同场景中的围捕实验. 实验结果表明,所提方法能够显著提高围捕策略的表现效果,在应对2、3和4个动态目标时,平均围捕成功率分别为79.04%、89.78%和90.43%,相较于基线方法,分别提升了48.41%、54.00%和53.93%,即本算法在处理不同规模围捕任务时均具有更好的效果.

    • 左磊, 马云聪, 陈囡, 闫茂德

      优先出版时间:2025-12-21  DOI:

      摘要:针对输入时延下的欠驱动车辆队列轨迹跟踪问题,重点研究车辆队列在弯道跟随过程中的横纵向稳定性情况, 提出了一种基于预设性能与时延补偿的车辆队列自适应滑模控制方法.根据路径曲率和前车状态信息,设计考虑输入时延和曲率变化的扩展间距策略,可有效提升横纵向稳定性与安全性能.通过预设性能函数将欠驱动跟踪模型进行转化,使得车辆队列的跟踪误差约束在固定范围内,并结合自适应补偿机制,提出了一种包含输入时延与位置跟踪误差的车辆队列自适应滑模控制方法.该方法确保控制系统具有较快的收敛速度和更高的稳态精度,通过Lyapunov稳定性理论证明跟随车辆固定时间稳定及队列网格稳定.最后,通过仿真实验验证所提方法的有效性与可行性.

    • 邵龙龙, 陈华友, 刘金培, 周礼刚, 水天琪, 杨静凌

      优先出版时间:2025-12-17  DOI: 10.13195/j.kzyjc.2025.0475

      摘要:乘性数据包络分析(DEA)模型是效率测量的有效工具,其依赖于分段对数线性技术,能灵活捕捉生产函数的关键生产特征(凸性、线性和凹性).然而,现有一些研究尚未考虑数据的不确定性,并未允许不确定数据的分布未知.因此,本文利用鲁棒优化方法,对决策单元输入和输出数据中的不确定性进行建模,以确保性能评估的稳定性和可靠性.基于所构建的具有乘性特征的预算不确定集,本文提出两个鲁棒乘性DEA模型,并通过对偶将其重新表述为等效的线性规划问题.为了解决效率得分无法达到1的问题,一个新的鲁棒乘性DEA模型被提出,并提供其约束违反的概率界限.本文测量中国31个省市的电力系统的运营效率,结果表明,在不确定环境下,所开发的鲁棒乘性DEA模型在效率得分方面具有较好的性能表现.

    • 韩玉兰, 刘显禄, 吴桐, 陈德澳, 兰朝凤

      优先出版时间:2025-12-17  DOI: 10.13195/j.kzyjc.2025.0813

      摘要:卷积神经网络与Transformer相结合的混合架构为进一步提升超分辨率重构效果提供了新思路而备受关注.针对现有并行结构网络特征提取与融合多为相互独立结构,忽略了异构建模路径间的层级交互与信息引导,难以兼顾底层空间细节与高层语义信息协同建模的问题,提出了基于异构特征递进融合的超分辨率重构网络.该网络逐层交替进行异构特征提取与融合,充分利用各层次信息,设计的轻量自适应特征融合模块,利用可学习的动态权重实现异构特征自适应选择式融合.本文进一步设计了多分辨率协同上下文聚合模块,构建大、中、小不同分辨率特征的多路径分支网络,通过跨分辨率信息交互,捕获上下文信息.其中,提出的渐进式三重感知残差块通过“局部-全局-通道”策略增强特征感知能力与灵活性,跨分辨率反向投影融合模块构建可学习的差分-投影架构,实现跨分辨率特征图的动态信息互补与闭环交互.实验结果表明,同当前先进的同类方法比,该方法在多个数据集上的取得最佳重构效果.

    • 张柏嘉, 王继河, 孙慧杰, 张锦绣, 吴雨瑶, 何智林, 邵茂森

      优先出版时间:2025-12-09  DOI: 10.13195/j.kzyjc.2025.0706

      摘要:为确保跨介质飞行过程的平稳性, 设计一种纵列式双旋翼跨介质无人机的切换控制方法. 该跨介质无人机在空中和水下采用两种不同的执行机构, 并且空中存在欠驱动特性, 给跨介质无人机出入水的平稳控制带来了巨大的挑战. 通过牛顿-欧拉方法, 给出了一种新型纵列式双旋翼跨介质无人机在不同介质中的动力学模型. 考虑在不同飞行阶段执行机构的切换, 基于自适应超螺旋滑模方法, 提出了一种新型的跨介质无人机姿态和高度的切换控制策略, 并设计合适的切换规则以确定控制器的切换时机. 利用李雅普诺夫稳定性理论,证明了闭环系统的渐近稳定性. 最后, 通过纵列式双旋翼跨介质无人机垂直出入水的仿真对所提控制方法进行了测试, 仿真结果验证了所设计控制器的有效性和鲁棒性.

    • 杨林云, 曹阳, 沈琴琴

      优先出版时间:2025-12-09  DOI: 10.13195/j.kzyjc.2025.0735

      摘要:针对多变量时滞阻尼累加灰色模型(TLDAGM(1,N))建模机理不明确、非线性特征挖掘不充分以及存在转换误差等问题, 本文提出一种多变量阻尼累加非线性时滞离散灰色模型. 首先, 引入线性和非线性校正项拓展模型灰信息结构, 不仅增强了对数据非线性特征的挖掘能力, 又实现了与经典GM(1,1)模型的兼容性; 其次, 通过数值积分有效避免了原模型中将时间驱动项视为灰常量以及对导数项的近似处理所引起的建模误差; 最后, 结合离散灰色建模的思想, 有效消除了微分方程到差分方程的转换误差. 选取近年来上海市高新技术产业产值数据进行实证分析, 并利用量子粒子群优化算法寻求模型的最优参数. 结果表明, 新模型的拟合和预测精度均优于TLDAGM(1,N)模型及其他几种多变量灰色模型, 且展现出良好的稳定性.

    • 宋忱, 钱惠敏, 吴大伟

      优先出版时间:2025-12-03  DOI: 10.13195/j.kzyjc.2025.0793

      摘要:近年来,图卷积网络在人体骨架行为识别领域展现卓越性能.针对现有基于图卷积的方法存在节点复杂相关性建模的局限,以及模态间互补信息利用不足的问题.为此,本文提出一种多语义动态图卷积网络(MSD-GCN).该网络为关节-骨骼融合双流架构,并行处理关节与骨骼模态数据.双流网络由多个多语义动态图卷积算子(MSD-GC)、多尺度时间卷积算子(MS-TC)和关节-骨骼跨模态对比学习模块(JB-CMCL)组成.具体而言,MSD-GC算子通过语义感知分层图(SH-Graph)重构高语义粒度分区,并行执行跨语义空间建模模块(CSSM)捕获全局关节相关性,以及局部几何建模模块(LGM)捕捉细微运动特征,实现多尺度动态特征提取.JB-CMCL则通过跨模态特征对齐和混淆样本辨别机制,引导双流网络中关节与骨骼模态的特征融合与增强,提升模型细粒度识别能力.在NTU RGB+D、 NTU RGB+D 120和Northwestern-UCLA 数据集进行广泛的实验.结果表明,所提出的组件与整体网络具有极强的性能,能够较好地识别混淆动作.与最先进的方法相比,该模型具有极强的竞争力.

    • 何乃峰, 杨忠, 卓浩泽, 许诺, 徐宏雨, 陈凯

      优先出版时间:2025-12-03  DOI: 10.13195/j.kzyjc.2025.0787

      摘要:针对动态非结构化环境中移动机器人感知不确定性与策略泛化能力不足的挑战,本文提出一种基于非对称强化学习的鲁棒自主导航策略优化框架(Robust Asymmetric Navigation, RANav)。该方法融合隐式环境估计、域随机化与非对称强化学习机制,提升机器人对动态环境的建模与决策能力。首先,构建多模态融合的隐式环境估计网络,以精确提取动态障碍物特征并提升场景表征能力;其次,引入基于行为域随机化机制,提升策略的Sim-to-Real迁移能力;最后,采用非对称近端策略优化(PPO)算法,利用特权信息优化Critic网络以提升策略学习效率。在多组仿真与真实场景实验中,RANav在导航成功率、避障鲁棒性与路径效率方面均显著优于现有方法,充分验证其在复杂非结构环境中的鲁棒泛化能力与实际部署潜力。

    • 陈梅, 王欢, 付豪杰, 周启辉, 黄欣玥

      优先出版时间:2025-12-01  DOI: 10.13195/j.kzyjc.2025.0681

      摘要:针对复杂网络中社区边界模糊、结构不均衡以及局部信息缺失等因素对社区检测准确性与鲁棒性带来的挑战, 本文提出一种基于弱边识别与有向传播机制的社区检测算法 (Community Detection algorithm based on Weak edge identification and Directed propagation mechanism, CDWD). 该算法首先识别并剔除基于最少共同邻居准则的弱边, 使潜在社区边界得以显现, 每个连通子图由此形成初始社区结构; 接着, 进一步构建有向影响图, 通过局部相似性强化社区内部的结构联系, 提升信息传递的方向性与一致性; 最后, 依据节点与候选社区之间的拓扑关联强度, 动态判定其最优归属, 确保社区划分的完整性与合理性. 实验结果表明, CDWD 在多个真实网络、合成网络及由聚类数据集构建的图结构上均优于主流基线算法. 同时, 算法参数方便设置, 便于实际应用.

    • 彭雯宇, 齐咏生, 刘利强, 苏建强, 张丽杰

      优先出版时间:2025-11-25  DOI: 10.13195/j.kzyjc.2025.0527

      摘要:针对单一传感器SLAM技术在退化环境下定位精度低、地图漂移和可靠性差等问题,本文提出一种基于R3LIVE框架的多传感器融合的SLAM算法RMF-SLAM(Refined Multi-modal Fusion SLAM)。首先,设计一种随机过程增强的运动学模型,将IMU测量作为输出建模,该方法即使在IMU测量运动饱和的情况下,也能对激烈运动进行准确定位和可靠映射;其次,构建一种基于Hessian矩阵特征值退化判别的LiDAR和视觉退化感知模块,该模块通过实时评估系统状态和传感器可靠性来动态调整不同传感器信息权重比例和筛选高价值视觉观测帧,在视觉和LiDAR均极度退化时,系统沉睡当前地图,防止定位失败,当传感器再次正常工作时重新激活沉睡地图;最后,提出一种采用全局描述符对地图进行相似性检测的方法,将相应的睡眠地图集成到当前活跃地图中,从而在系统运行完成后形成高度精确的全局地图。通过在公开数据集与经典的SLAM算法进行对比,并在私有数据集及真实场景中验证算法能有效抑制退化环境对轨迹估计和地图构建的负面影响,提升算法的精度和可靠性。

    • 李小晗, 张哲戬, 徐胜军, 孟月波, 杨玥, 武经, 苏晓杰, 陈义明(I-Ming Chen)

      优先出版时间:2025-11-25  DOI: 10.13195/j.kzyjc.2025.0696

      摘要:为提升机器人在非结构化堆叠场景中的抓取识别精度与执行稳定性,本文提出一种融合几何先验建模与姿态质量评估机制的六自由度抓取预测算法。首先,构建点云识别网络 Point-LaKan,通过增强输入点云的局部几何特征,设计由局部聚合模块与高维非线性映射模块构成的LAKAN特征提取结构,提升对堆叠抓取区域的结构表征能力。其次,设计方向向量约束下的抓取姿态估计策略,通过最小化初始与目标姿态间的空间差异,提升姿态生成的可执行性与可解释性。最后,构建融合方向约束、碰撞检测与质心评分的抓取姿态筛选机制,实现候选姿态的多因素评估与排序,增强算法在复杂环境下的执行鲁棒性。为验证算法性能,自主构建多类别堆叠物体仿真点云抓取数据集,分别在CoppeliaSim仿真平台与真实机器人系统中开展实验。结果表明,在模型参数量减少 4.69%、推理速度提升 37.19% 的条件下,抓取区域识别准确率提升了 25.26%;真实抓取成功率与任务完成率最高可提升29.40%与18.39%。

    • 郭肇禄, 赵擎宇, 杨火根

      优先出版时间:2025-11-24  DOI: 10.13195/j.kzyjc.2025.0701

      摘要:在高维多目标优化算法中,维持收敛性和多样性的平衡对算法性能尤为关键.然而,单一的支配关系难以有效维持二者的平衡.为此,提出一种基于适应性支配策略的高维多目标进化算法ADSMOEA.适应性支配策略通过融合两种在收敛性和多样性上互补的支配关系,并根据种群当前的状态选择合适的支配关系,从而维持二者的平衡.同时,为了准确评估种群的收敛状态,设计了一种角度收敛指标,通过引入目标向量夹角信息提高了种群收敛性评价的准确性,为支配关系的选择提供指导.此外,设计了一种适应性的多样性算子以维持种群的多样性.为了验证ADSMOEA的有效性,将所提出的算法与7个先进算法进行了对比实验.实验结果表明,所提出的ADSMOEA算法在解决高维多目标优化问题时具有较强的竞争力.

    • 李晓晨, 王正松, 郭戈, 韩萌

      优先出版时间:2025-11-20  DOI: 10.13195/j.kzyjc.2025.0512

      摘要:本文针对连续制药流程中的多工况、非平稳及变量间强耦合等复杂特性,提出了一种数据驱动异常监测溯源方法。该方法结合狄利克雷过程高斯混合模型(Dirichlet Process Gaussian Mixture Model, DPGMM)、变分自动编码器(Variational Autoencoder,VAE)与协整分析(Cointegration Analysis, CA)等方法的优势,旨在实现对连续制药流程的高效异常监测及溯源。首先,框架以DPGMM为工况识别的核心手段,有效解决了连续制药流程中相似工况难以区分的问题。其次,针对连续制药流程的非平稳特性及闭环控制对其变量间相关关系带来的影响,提出了融合 CA 与 VAE 的过程监测方法,有效减少了误报,提高了异常监测的准确性和可靠性。同时,通过重构数据集与绘制贡献图的方式实现了异常变量的精确定位,克服了变量间的“污染”现象。最后,通过药物连续给料-混合-双螺杆湿法制粒过程的仿真案例研究,验证了本文方法的可行性与有效性。

    • 徐志存, 谢乃明

      优先出版时间:2025-11-20  DOI: 10.13195/j.kzyjc.2025.0537

      摘要:锂电池健康状态估计作为现代能源存储技术的核心,广泛应用于电动汽车、移动设备等领域。随着使用时间的增长其性能衰减问题逐渐显现,这不仅会影响电池的存储能力,还可能引发安全隐患,因此,准确估计锂电池的健康状态显得尤为重要。经验模型是锂电池退化理论中常用的解决方法。经验模型中的双指数模型可演化推导出幂指数驱动的灰色GM(1,1,e^{lambda t})模型。在GM(1,1,e^{lambda t})模型的基础上建立状态空间模型,融合扩展卡尔曼滤波模型形成灰色扩展卡尔曼滤波模型。将所提出的灰色扩展卡尔曼滤波模型用于锂电池健康状态非线性退化估计问题。 本研究内容采用牛津大学公开的单体电池数据进行了验证,在单个电池的基础上,我们将所提出的模型用于估算 20 辆电动汽车的锂电池健康状态,以进一步验证所提出的模型在实际场景中的适用性。

    • 孙庆帅, 张英杰, 刘华亮, 李述杰

      优先出版时间:2025-11-07  DOI: 10.13195/j.kzyjc.2025.0391

      摘要:基于声信号的漏损检测方法在人工巡检中具有重要应用价值,并正逐步发展为一种新兴的远程监测手段.传统基于深度学习的漏损声信号识别方法往往受到信号预处理流程繁琐以及环境噪声干扰的限制,难以在新管网中实现良好的泛化性能,漏损检测的准确率亦有待进一步提升.针对此问题,首先针对管网声信号构建高时间分辨率和高频率分辨率下的线性谱图与对数梅尔谱图,兼顾声信号的高频与低频特征,突出短时动态变化及微弱频率特征,并以并行方式输入到卷积神经网络.最后引入并行机制的时-频注意力卷积块进行特征提取,增强对时间和频率维度的细粒度特征捕捉能力.利用真实管网声信号数据和物理仿真数据对所提方法进行漏损检测性能实验验证,结果表明,所提方法显著提高了对漏损事件的识别率,具有良好的鲁棒性和泛化能力.

    • 王语晨, 杨宝庆, 马杰, 张世轩, 郑小鹏, 刘闻

      优先出版时间:2025-11-07  DOI: 10.13195/j.kzyjc.2025.0443

      摘要:多保真高斯过程回归在应用于复杂工程系统分析时,处理高维输入易因维度灾难导致模型精度下降。现有缓解策略存在优化不稳定、特征表示不佳等局限性。针对这一问题,提出一种集成深度特征多保真高斯过程回归方法。利用集成深度神经网络将高维输入自适应地映射至低维潜在特征空间,提升表示的鲁棒性。采用梯度隔离与两阶段训练策略,将基于低保真数据的特征提取器预训练过程同后续基于固定特征的多保真高斯过程回归模型构建过程解耦,规避深度融合模型端到端优化带来的不稳定性,确保训练过程稳健高效。最后通过高维测试函数的仿真验证了方法的有效性,使用装备射程优化案例研究展示了其解决实际工程问题的应用潜力。

    • 赵嘉, 朱伟涛, 肖人彬, 李思维, 白晖峰, 谢海华, 夏志红

      优先出版时间:2025-11-05  DOI: 10.13195/j.kzyjc.2025.0656

      摘要:快速搜索密度峰值的时空聚类算法计算局部密度时,难以区分所在区域的密度差异,易引发类簇中心的选择错误;分配策略缺乏足够的时空约束,易将时间特征差异明显但空间位置相近的非密度峰值错误分配;缺乏独立的噪声识别机制,其检测效能完全依赖样本分配的准确性,样本分配偏差致噪声识别精度显著降低。针对这些挑战,提出一种共享近邻加权和隶属点分配的时空密度峰值聚类(SNMP-STDPC)算法。引入共享近邻加权策略,构建时空距离相似度矩阵,精确反映样本间的密度差异,有效提升了密度峰值选择的可靠性;结合共享近邻增强时空约束,将非密度峰值分为必然隶属点和可能隶属点,确保了样本分配的准确性;提出一种新的噪声识别机制,计算样本的异常分数并使用动态阈值检测噪声,提高了噪声识别的有效性。将SNMP-STDPC算法与当前主流时空聚类方法在模拟数据集和实际地震观测数据上进行比较,实验结果表明,SNMP-STDPC算法显著提升了模拟数据集的聚类效果,并在真实数据集上表现良好。

    • 蔡方玉, 黄宜庆, 邓雄峰, 许刚

      优先出版时间:2025-11-03  DOI: 10.13195/j.kzyjc.2025.0494

      摘要:针对多四旋翼无人机系统编队控制问题,本文提出了一种基于事件触发机制的双层串联博弈编队控制算法。该算法将多四旋翼无人机编队任务解构为期望队形构建与虚拟领导者追踪两个子任务,并以此设计多场博弈对局,构建了双层串联博弈框架。首先,在第一层博弈中具备通信能力的四旋翼无人机对通过在两场对局中的博弈交互,求解出可使双方位置与速度达到纳什均衡状态的位置策略与速度策略。其次,每架四旋翼无人机对第一层博弈中与多架四旋翼无人机对局产生的两组策略进行加权处理,生成作为第二层博弈参与变量的两个控制策略。进一步围绕各四旋翼无人机的位置误差与速度误差构建第二层博弈中的对局模型,通过博弈优化过程确定最佳增益系数,进而获取使位置误差与速度误差达到纳什均衡的最优控制策略。此外,引入事件触发机制,通过设计触发条件动态调整控制策略更新频率,降低对四旋翼无人机有限机载资源的消耗。最后,通过仿真实验与实际平台测试验证了本文算法在多四旋翼无人机编队控制中的有效性与可行性。

    • 彭娟娟, 淩初阳, 隆清琦

      优先出版时间:2025-10-27  DOI: 10.13195/j.kzyjc.2025.0669

      摘要:针对分级诊疗在线协诊三边匹配问题,本文提出了基于云模型的三边匹配决策方法,以满足医联体背景下分级诊疗在线协诊匹配的服务需求. 首先,利用BERTopic、Stanza和Textlob处理好大夫在线评论信息,获取患者对基层医生客观的匹配属性,并结合属性的偏好信息确定相应权重;其次,本文构建了多粒度概率语言非对称云模型以及相应的概率语言非对称云Bonferroin Mean聚合算子;再次,考虑基层医生和专家间的协同性、医生间的工作量均衡性以及医患匹配的稳定性等因素,构建了相应的三边稳定匹配决策优化模型,并给出了求解算法;最后,结合实际案例、灵敏度分析与比较分析验证了所提方法的可行性和稳定性,为分级诊疗在线医疗的三边匹配决策问题提供理论支撑.

    • 陈思光, 潘沭伽

      优先出版时间:2025-10-22  DOI: 10.13195/j.kzyjc.2025.0599

      摘要:为了在去中心化联邦学习场景中实现隐私保护与半监督训练的高效协同,本文提出了一种面向去中心化的零知识联邦半监督学习算法。具体地,该算法首先设计了一种反映本地数据特征的零知识特征码,通过融合Pedersen承诺与Schnorr证明,该特征码在实现客户端特征共享的同时,可保障本地数据不可恢复性与交换过程的合法性验证。其次,设计了一种高效的去中心化零知识标签传播方法,利用特征码之间的相似度引导伪标签生成,在保护隐私的前提下实现高效的标签信息传播,并通过复杂度分析验证了其计算开销显著低于同态加密方案。最后,在多个数据集上的实验证明,本文算法在不同数据分布与无标签数据配置下均优于现有基准方法,在准确率与鲁棒性方面具有显著提升。同时,通过可变聚类核心数量与网络拓扑结构的实验分析,进一步验证了聚类核心数量对性能的影响,以及算法在不同去中心化设置中的稳健性与实用性。

    • 许德智, 牟泮龙, 潘庭龙, 张清越, 叶宇剑, 花为

      优先出版时间:2025-10-22  DOI: 10.13195/j.kzyjc.2025.0204

      摘要:多电机协同控制系统的跟踪性能和同步性能是评估工业过程中安全性和可靠性的关键指标, 本研究旨在通过创新性地设计基于预设时间滑模控制方法的改进跟踪算法, 在动态不确定条件下实现多电机系统的高精度跟踪控制与同步误差最小化. 首先, 设计预设时间滑模控制器(Prescribed-time sliding model controller) 使综合误差在预设时间内收敛到零邻域, 同时设计了非线性干扰观测器(Nonlinear disturbance observer)观测系统扰动并前馈给控制器. 为了解决奇异性问题, 使用控制律切换方法使系统稳定后的控制器将不再依赖时间. 最后通过仿真和实验对比验证了该方法能够有效实现多电机系统的协同跟踪一致性.

    • 张启亮, 武建荣

      优先出版时间:2025-08-28  DOI: 10.13195/j.kzyjc.2025.0364

      摘要:随着分布式发电和微电网技术的快速发展,微电网能源交易策略对于提高清洁能源消纳和推动微电网建设至关重要.能源交易过程中的信息不完全会导致交易参与者的决策具有不确定性,进而影响能源供应的稳定性和可靠性.针对这一问题,本文基于网络演化博弈理论研究了不完全信息条件下微电网能源交易策略.首先,根据微电网和主电网运营商的策略更新规则,建立不完全信息条件下微电网能源交易的网络演化博弈模型,该模型能够有效描述交易参与者在不完全信息条件下的策略演化动态.其次,利用矩阵半张量积,得到基于网络演化博弈的微电网能源交易模型的代数形式.在此基础上,提出计算博弈均衡集合的算法和判断微电网能源交易模型收敛性的准则.最后,仿真例子验证了本文结果的有效性.通过本文提出的方法,可以有效分析不完全信息对微电网能源交易策略演化以及模型收敛性的影响.

    • 巩亮, 郑世龙, 许得杰, 耿慧琳, 周健, 惠昌武

      优先出版时间:2025-08-19  DOI: 10.13195/j.kzyjc.2025.0435

      摘要:针对道路行驶速度随时间变化且软时间窗条件下的同时配集车辆路径优化问题,以配送总成本最小化与客户满意度最大化为目标,考虑车辆载重约束等约束条件,构建时变交通下油车-电车混合车队货物配送路径优化模型。根据模型特点设计了考虑时空距离、基于Pareto非支配排序的多目标混合启发式算法,将遗传算法与变邻域搜索算法结合,增强算法的局部搜索能力。以Solomon中C101类部分客户为例进行算例分析,进行了不同规模客户点对比分析和模拟数据与真实数据对比实验。研究结果表明:与多目标协同优化遗传算法等算法相比,本文算法将总成本降低至7008.47元,降幅分别为4.59%、5.46%、6.80%、10.77%和8.41%,客户满意度提升至0.841。考虑不同情况下对参数进行灵敏度分析,合理的配送重量可将配送总成本节约69.28%,28.14%和38.61%;合理的车辆载重量可将配送成本节约31.2%和62.3%。研究成果不仅深化和拓展油电混合车队车辆路径问题的相关研究,同时本文模型和算法能够明显降低配送成本,提高企业经济效益。

    • 王福杰, 彭永岗, 李醒, 郭芳, 秦毅, 戚远航

      优先出版时间:2025-08-06  DOI: 10.13195/j.kzyjc.2025.0386

      摘要:为解决充电枪装配过程中传统强化学习算法训练样本效率低、策略不稳定和对硬件资源利用不充分的问题,提出融合事后经验回放(Hindsight Experience Replay, HER)和策略延迟更新(Delayed Policy Updates, DPU)的软演员-评论家(Soft Actor-Critic, SAC)算法.首先,建立充电枪装配模型,通过在经验回放池中引入HER,重新定义目标以生成“伪成功”经验.然后,在算法的梯度更新部分加入DPU ,通过多次更新价值网络后再更新策略网络,确保策略更新基于更稳定的价值估计.最后在使用SAC with HER-DPU 算法进行充电枪装配训练时采用双线程训练架构,将数据收集和神经网络训练解耦.实验结果表明,本文所提算法的收敛时间为33.2小时,平均装配步数为75步,相较于SAC算法,收敛时间减少了21.4小时,平均装配步数少17步,有效提高了训练的样本效率、策略稳定性和训练速度.

    • 苏永彬, 刘暾东

      优先出版时间:2025-07-15  DOI: 10.13195/j.kzyjc.2025.0001

      摘要:针对现有的基于动态运动基元的轨迹避障算法无法同时满足轨迹的特征保留性和平滑性的问题,本文提出了一种基于分段动态运动基元的轨迹平滑避障方法。该方法将障碍物区域的轨迹进行分段处理,分别构建动态运动基元模型,并在障碍物之外寻找一个融合点进行分段泛化,从而得到保留原轨迹特征的避障轨迹。在此基础上,采用基于虚拟目标点的轨迹实时平滑方法来处理过渡点的拐角,得到平滑的避障轨迹。为验证方法有效性,设计了仿真实验和实际六轴机器人的轨迹避障实验,并与现有的改进动态运动基元算法进行对比。实验结果表明,本文方法生成的避障轨迹不仅能更好地保留原轨迹的特征,而且在轨迹的平滑性上也更有优势,从而验证了该方法的有效性。

    • 王睿, 贾惟, 孙秋野, 王鹏

      优先出版时间:2025-03-28  DOI: 10.13195/j.kzyjc.2024.1492

      摘要:近年来交通运输业呈现出迅猛发展的态势。电动汽车由于可以减少环境污染并使得交通系统更加智能,得到了快速发展。然而由于电动汽车充电桩分布不均匀,导致出现了电动汽车里程焦虑问题。车-车能量互济装置(V2V)的研究成为了消除电动汽车里程焦虑的关键技术之一。V2V技术不仅可实现两辆电动汽车之间的电能传输,缓解电池续航不足与充电桩分布不均的问题,还能显著提升充电灵活性。本文对现有的车-车能量互济装置的拓扑结构和控制策略进行了全面讨论,首先分析了隔离型、非隔离型和无线传输型三类主要拓扑结构的工作原理和应用场景;进而探讨了对其线性和非线性控制策略的优缺点,并结合不同拓扑给出了优化建议。本文还扩展讨论了V2X技术的发展趋势,包括车-车(V2V)、车-家(V2H)、车-网(V2G)协同控制等多种应用场景在智能电网中的应用前景。最后讨论了V2V充电技术的商业化发展现状,商业化解决方案和面临的挑战。

展开全部目录