上海交通大学 智能工程研究所, 上海 200030
在介绍一般马尔可夫决策过程的基础上, 分析了当前主要马尔可夫过程自适应决策方法的基 本思想、 具体算法实现以及相应结论,总结了现有马尔可夫过程自适应决策算法的特点, 并指出了需要 进一步解决的问题。
李江洪, 韩正之.马尔可夫决策过程自适应决策的进展[J].控制与决策,2001,16(1):7-11