摘要:干扰资源分配作为认知电子战的重要环节之一, 旨在干扰资源有限的情况下, 通过合理分配干扰资源达到最大的干扰效益. 针对通信、导航受限的拒止条件下, 无人机集群协同干扰多个可移动通信目标时由于环境状态空间过大以及环境非平稳导致多智能体强化学习(MARL)算法决策性能较差的问题, 提出一种基于自注意力机制的预训练自编码器(APSE), 并将其作为MARL算法的前置单元对环境状态进行特征提取和降维, 同时, 通过集中式训练分布式执行范式来降低环境非平稳对算法决策性能的影响. 在所建立无人机集群协同干扰仿真环境中的实验结果表明: 加入APSE后的MARL算法在平均奖励和干扰资源分配效能上提升明显. 其中: 多智能体近端策略优化算法MAPPO-APSE在各项指标上表现最优, 相比于MAPPO, 其在有效干扰占空比更长的情况下干扰资源消耗量降低了20 %.