摘要:针对分布式流水车间中加工时间不确定性与序列相关准备时间耦合的鲁棒调度问题, 提出一种强化学习驱动的迭代局部搜索算法(QILS). 首先, 构建以最大完工时间为目标的期望-风险鲁棒调度模型, 有效平衡调度方案的稳定性与最优性; 其次, 设计面向不确定环境的NEHUPT启发式方法, 基于场景分析确定工件的调度优先级, 结合微调策略提升初始解的质量; 另外, 构建$ Q$-learning与迭代局部搜索算法的协同优化框架, 利用强化学习以及动态衰减方法驱动扰动策略的动态选择, 平衡算法的搜索和开发能力; 最后, 提出一种基于鲁棒贡献度的局部搜索方法, 进一步提升解的质量. 通过系统性的仿真实验及与多种先进代表性算法的对比分析结果表明, 所提出的算法在求解分布式鲁棒车间调度问题方面具有显著优势.