中国科学技术大学自动化系 合肥 230027
殷保群
O232
讨论一类可数半Markov 决策过程(CSMDP)在折扣代价准则下的性能优化问题.运用等价Markov过程方法, 定义了折扣Poisson方程, 并由该方程定义了α-势.于α-势,导出了由最优平稳策略所满足的最优性方程.较为详细地讨论了最优性方程解的存在性问题, 并给出了其解存在的一些充分条件.
殷保群; 李衍杰; 周亚平; 奚宏生.可数半Markov决策过程折扣代价性能优化[J].控制与决策,2006,21(8):933-936