上海交通大学 自动化研究所, 上海 200030
针对模型未知时变非线性对象的控制问题, 提出一种直接的自适应控制策略。该策略基于径向 基神经网络并结合增强学习的自调节能力, 无需知道控制对象的动态特性, 而是通过在线试错在控制过 程中不断积累与问题相关的信息, 用以产生可接受的逐步优化的解。
顾冬雷, 陈卫东, 席裕庚.一种基于增强学习的自适应控制方法[J].控制与决策,2002,17(4):473-475