北京航空航天大学 自动控制系, 北京 100083
分析了基于强化学习原理和遗传算法的序贯决策规则的自动学习方法, 从规划报偿和规则激 活度的角度讨论和研究了规则的信度分配问题, 解决了在大的状态空间中搜索和延迟评价问题,为处理 复杂的决策过程提供了一种行之有效的方法。 基于该方法实现了飞机的逃避机动策略,仿真结果表明了 该方法的有效性。
周 锐, 陈宗基.遗传算法在逃逸机动策略中的应用研究[J].控制与决策,2001,16(4):465-467