《控制与决策》编辑部

主管单位：中华人民共和国教育部

主办单位：东北大学

国内刊号：21-1124/TP

国际刊号：1001-0920

创刊时间：1986年

出版周期：月刊

入选中国科技期刊卓越行动计划项目

信息公告More

热文排行

友情链接

访问统计

控制与决策期刊

中国控制与决策会议

针对融合游客个性化偏好、景点实时拥挤度和通勤时间的多目标旅行路线规划问题, 提出一种基于大语言模型(LLM) 的交互式旅行方案智能生成规划器. 首先, 建立LLM 信息处理模块, 实现用户需求的识别、推理以及结构化转换; 然后, 构建基于随机森林算法的景点客流预测模块, 整合历史客流、天气、节假日等多维因素以实现精确客流预测, 继而借助LLM 信息处理模块将预测结果映射为多等级拥挤度; 最后, 构建以并行非支配排序遗传算法(PNSGA-II) 为核心的多目标旅行路线规划器, 实现旅行路线的智能规划和全局最优解搜索. 仿真实验结果表明: 相较于其他多目标优化算法, PNSGA-II 在多目标路径规划问题中展现出更优的解质量和更高的计算效率; 此外, 与其他规划器生成的方案相比, 所提出规划器在方案效果和生成效率上也均展现出显著优势.

物流配送效率及其成本优化是制造业供应链管理的核心挑战之一, 相关问题常建模为车辆路径规划问题. 易碎家电等货物在物流运输中无法堆叠, 需在车厢中平铺, 针对这一实际约束, 考虑在传统车辆路径规划模型基础上增加货物的二维装载约束, 形成带有二维装箱约束的车辆路径问题(2L-CVRP). 该问题包含路径规划与二维装箱两个子问题, 存在强约束、多极组合优化的特性. 传统精确算法及启发式方法在其大规模问题求解上存在耗时长、效率低的局限, 难以应对客户位置、需求即时变化的动态需求. 针对上述快速求解挑战, 设计一种基于强化学习及变邻域搜索协同的知识驱动强化学习求解算法, 优化2L-CVRP 的车辆行驶距离. 首先, 以车辆行驶距离为奖励设计基于注意力机制与指针网络的Actor-Critic 强化学习框架, 在此框架下采用多种启发式算法协同处理装箱约束, 改进不可行解, 生成车辆初始路径; 然后, 设计一种高效的问题知识驱动的变邻域搜索策略, 改进端到端网络得到的初始路径序列; 最后, 基于经典2L-CVRP 测试集验证所提出算法的有效性. 仿真实验表明, 相比经典启发式方法, 所提出算法在小规模实例上车辆行驶距离减少21.52%, 并更新50% 的大规模实例最优解. 同时, 所提出算法的求解速度显著优于对比算法, 大规模测例中求解效率优势更加明显, 验证了所提出算法求解2LCVRP的高效性.

: 现代战场环境下的动态传感器-武器-目标分配 (SWTA) 问题具有高动态、强对抗的特点, 传统静态分配方法难以适应战场态势的快速演化, 存在求解效率低、环境适应性差等局限. 鉴于此, 提出一种基于近端策略优化 (PPO) 的动态 SWTA 方法, 融合 OODA(观察-判断-决策-行动) 循环理论, 构建符合实际作战场景的传感器探测概率模型与武器毁伤概率模型, 通过 PPO 算法实现智能体与环境的持续交互与策略优化, 在决策过程中统筹作战效能与资源消耗. 实验结果表明, 该方法在多种弹药目标比场景下均表现出优越性能, 能够显著提升系统整体作战的效能与资源利用率. 所提出方法为动态 SWTA 问题提供了一种高效、自适应的智能决策框架, 推动了指挥决策的智能化进程, 具备较强的实际应用潜力.

针对分布式流水车间中加工时间不确定性与序列相关准备时间耦合的鲁棒调度问题, 提出一种强化学习驱动的迭代局部搜索算法(QILS). 首先, 构建以最大完工时间为目标的期望-风险鲁棒调度模型, 有效平衡调度方案的稳定性与最优性; 其次, 设计面向不确定环境的NEHUPT 启发式方法, 基于场景分析确定工件的调度优先级, 结合微调策略提升初始解的质量; 另外, 构建-learning 与迭代局部搜索算法的协同优化框架, 利用强化学习以及动态衰减方法驱动扰动策略的动态选择, 平衡算法的搜索和开发能力; 最后, 提出一种基于鲁棒贡献度的局部搜索方法, 进一步提升解的质量. 通过系统性的仿真实验及与多种先进代表性算法的对比分析结果表明, 所提出的算法在求解分布式鲁棒车间调度问题方面具有显著优势.

随着地球观测领域相关技术的高速发展, 近年来具有先进姿态调整能力的敏捷地球观测卫星已经引起了广泛的关注. 敏捷卫星任务调度具有时间依赖性切换时间, 在多星、多轨道、多需求的卫星观测场景下, 产生了复杂的时间依赖性多敏捷卫星多目标调度问题. 针对该问题, 首先, 基于问题特征和优化目标建立问题的数学规划模型; 其次, 提出一种分布式元学习协同进化框架, 包括预训练和进化搜索两个阶段, 预训练阶段通过分布式学习提高训练效率, 进化搜索阶段通过训练好的分布式学习模型实现多种群进化算子的自适应选择; 然后, 基于所提出的进化框架和问题特征, 设计多样化的进化算子和动态种群划分选择策略, 建立一种分布式元学习协同进化算法(DMCEA); 最后通过实验验证DMCEA 求解问题的有效性.

针对矩阵权重网络上一阶混杂多智能体系统的分布式优化问题, 提出一种新颖的分布式优化控制算法, 对于连续时间子系统采用了采样控制方法. 在所提出的优化控制协议下, 基于矩阵理论、Lyapunov 稳定性理论和不等式技术等方法建立了该混杂系统实现优化一致的代数条件, 并进一步推导出代数图条件. 具体而言, 如果混杂系统的采样周期满足一定条件以及每个智能体的局部代价函数为强凸时, 当拉普拉斯矩阵的零空间跨越一致性子空间或者矩阵权重图中包含正生成树时, 系统可以在全局最优解处达到一致. 最后, 通过数值仿真验证了所提出算法的有效性.

在城市物流配送行业中, 配送时间需求的变化直接干扰配送方案的制定, 影响配送效率, 给高效寻找车辆路径方案带来了挑战. 鉴于此, 提出考虑动态配送时间需求的多策略协同车辆路径优化算法. 首先, 构建一个动态车辆路径优化模型, 根据配送时间需求变化带来的影响设计约束条件, 将最短行驶距离、最小等待时间和最少车辆使用数作为优化目标; 其次, 定性分析配送时间需求的变化类型, 定量描述配送时间需求变化强度, 设计需求变化连锁影响因子, 研究动态配送时间需求综合评价指标; 最后, 构建差分进化算法进化策略库, 根据配送时间需求的变化类型和时间需求综合评价指标, 筛选重点优化客户, 设计多策略协同车辆路径优化算法. 实验结果表明, 所提出方法能够定性分析和定量表征客户配送时间需求的变化, 显著降低配送时间需求变化对配送方案的影响, 提升车辆路径优化效率.

【2026年第3期封面文章】东北大学马大中教授等：无监督域适应研究综述

在实际应用中, 标注数据的稀缺与源域、目标域的分布差异导致模型泛化性受限. 无监督域适应(UDA) 通过缩小域间分布差异, 确保模型在新的环境下性能稳定. 过去20 年, 域适应在分布对齐、特征变换等方面得到广泛研究, 但现有综述多聚焦于域不变特征学习视角, 鲜有文献从域间类别差异角度系统性总结. 鉴于此,以类别空间不一致为核心视角, 对域不变特征学习和跨域类别匹配两个技术手段展开全面综述. 首先介绍域适应中分布漂移的基本概念与数学定义, 并基于标签集差异划分为闭集、部分集、开集与通用域适应; 其次从域不变特征学习和跨域类别匹配两方面对现有方法进行全面综述, 继而阐述域适应的多种变体, 包括无源、多源、域泛化, 并首次在综述中引入时序域适应/泛化问题; 最后总结域适应在自然语言处理、计算机视觉、工业时序与推荐系统等领域的应用, 并展望未来发展方向与挑战.

【2026年第3期封面文章】中国民航大学朴敏楠副教授等：面向飞机蒙皮覆盖检测的多无人机协同任务规划

针对飞机蒙皮覆盖检测的场景下, 传统人工检测存在的作业效率低下及检测时效性约束严格等瓶颈问题, 现有研究多集中于多无人机协同作业的技术方案, 其中面向飞机蒙皮盖检测的多无人机协同任务规划(MCMP) 是描述多无人机协同检测的问题模型, 当前算法多采用启发式算法, 但其求解速度和解的质量无法满足实际要求. 为此, 将MCMP 问题建模为带有容量约束的车辆路径规划问题(CVRP), 提出两阶段的深度强化学习(TSDRL) 的求解模型: 第1 阶段根据节点数量, 利用基于注意力机制的策略网络求解最优无人机数量; 第2 阶段设计一种新的编码器-解码器结构的策略网络, 以构建每架无人机的路径. 该模型通过策略梯度训练, 能够快速求解每架无人机的高质量路径, 为了解决三维环境碰撞问题, 使用RRT*算法优化路径以满足碰撞约束. 仿真结果表明, 所提模型在计算效率与求解质量上均优于现有的深度强化学习方法和启发式算法, 并且模型具有良好的泛化性, 可应用于不同机型.

【2026年第3期封面文章】西安电子科技大学梁沨琴、魏静萱副教授等：基于多目标特征提取的双层优化决策树分类算法

高维不平衡数据广泛存在于社会生产的各个领域, 其特点是数据维度高以及数据类别的不平衡, 这种特性对传统分类算法的性能提出了极大的挑战. 不平衡的数据使得分类器偏向于多数类, 冗余特征导致分类性能的进一步下降. 对此, 首先针对冗余的高维特征提出基于多目标优化的特征提取算法, 考虑数据可分性和特征的泛化性能两个目标, 同时在目标内考虑数据的不平衡性; 其次, 提出基于双层优化的决策树分类算法, 将非叶子节点构建为双层优化的分类器, 上层搜索不同的特征组合, 下层求解该组合下的类别分界面; 最后, 在多个公开数据集上将所提出算法与其他算法进行对比实验验, 结果表明所提出算法在F-score 和G-mean 指标上明显优于其他对比算法, 验证了所提出算法的有效性.

最新录用

网络首发

热文排行

过刊浏览

2026年第41卷第5期刊出时间：2026-05-10

全选

显示方式: |

全选

显示方式: |

全选

显示模式： |

全选

展开全部目录

首页

期刊简介

编委会

作者中心

精选专辑

品牌联动

综述

多智能体系统与协同控制专栏

控制理论与控制技术

智能感知与决策

工业人工智能