摘要:现代战场环境下的动态传感器-武器-目标分配(SWTA)问题具有高动态、强对抗的特点, 传统静态分配方法难以适应战场态势的快速演化, 存在求解效率低、环境适应性差等局限. 鉴于此, 提出一种基于近端策略优化(PPO)的动态SWTA方法, 融合OODA(观察-判断-决策-行动)循环理论, 构建符合实际作战场景的传感器探测概率模型与武器毁伤概率模型, 通过PPO算法实现智能体与环境的持续交互与策略优化, 在决策过程中统筹作战效能与资源消耗. 实验结果表明, 该方法在多种弹药目标比场景下均表现出优越性能, 能够显著提升系统整体作战的效能与资源利用率. 所提出方法为动态SWTA问题提供了一种高效、自适应的智能决策框架, 推动了指挥决策的智能化进程, 具备较强的实际应用潜力.