西安交通大学系统工程研究所 710049
刘云龙
TP181
提出一种基于PSR模型的规划算法.首先提出了状态经历的概念与发现方法,并进一步用此概念来描述系统的PSR状态.在此基础上,讨论了如何用判别分析方法,确定任意经历下的PSR状态以及如何在该过程中同时获取系统的PSR模型.从而可引入Q学习算法,用于决策当前的最优策略.算法被应用于一些标准的POMDP问题,实验结果验证了所提方法的有效性.
刘云龙;李人厚;刘建书.基于PSR模型的规划算法[J].控制与决策,2009,24(2):289-292