中国科学技术大学自动化系, 安徽合肥230027
讨论一类半Markov 控制过程(SMCP) 的折扣代价性能优化问题. 通过引入一个矩阵,该矩阵可作为一个 Markov 过程的无穷小矩阵, 对一个SMCP 定义了折扣Poisson 方程, 并由这个方程定义了α2势. 基于α2势,给出了 由最优平稳策略所满足的最优性方程. 最后给出一个求解最优平稳策略的迭代算法,并提供一个数值例子以表明该 算法的应用.
殷保群, 李衍杰, 周亚平,等.半Markov 控制过程在折扣代价准则下的最优平稳策略[J].控制与决策,2004,19(6):691-694