摘要:围绕海上基地的攻防可看作一个多阶段序贯对抗过程, 通常可建模为不完美信息零和博弈. 针对海上基地防护安全博弈问题, 构建不完美信息序贯博弈模型, 分析博弈模型各要素; 围绕近似纳什均衡策略的快速求解, 提出可配置反事实遗憾最小化(CogCFR)算法, 利用基类CFR算法与元控制器可动态控制CFR的超参数; 以海上多个海上基地防护为试验背景, 利用CogCFR求解海上基地防护资源分配策略. 针对有限理性对手, 提出考虑约束的单侧信任域鲁棒对手利用策略更新方式. 实验结果表明: 可配置反事实遗憾最小化相比动态加权反事实遗憾最小化计算时效性更强、参数更少; 算法具有较好的应用可行性和领域泛化性, 可为序贯交互类博弈对抗问题策略求解提供参考.