摘要:针对机坪环境下多种类地面服务车辆的协同调度这一复杂的优化任务, 提出一种结合Transformer架构的深度强化学习算法. 首先, 依据航班地面服务流程的不同优先级, 将整个地面服务任务进行分解, 进而将原本复杂的多类型车辆调度问题转化为有先后顺序的单类型车辆调度问题; 接着, 利用Transformer架构对航班和车辆的特征进行自动提取, 通过解码器按序列逐步求解任务调度, 结合贪婪算法和蒙特卡洛模拟算法分别生成初步调度策略, 并将这些策略应用于每个子问题的求解过程中; 在此基础上, 利用深度强化学习算法对整个模型进行训练, 通过智能体与环境的交互来不断优化调度策略; 此外, 为了提升模型的鲁棒性和应对复杂情况的能力, 通过扩充真实数据集进行模型训练. 大量的实验结果证明, 基于Transformer架构的深度强化学习方法能够有效避免不同种类车辆之间的相互干扰, 并很好地应对真实环境下的航班调度需求.