可数半Markov决策过程折扣代价性能优化
DOI:
CSTR:
作者:
作者单位:

中国科学技术大学自动化系 合肥 230027

作者简介:

殷保群

通讯作者:

中图分类号:

O232

基金项目:


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    讨论一类可数半Markov 决策过程(CSMDP)在折扣代价准则下的性能优化问题.运用等价Markov过程方法, 定义了折扣Poisson方程, 并由该方程定义了α-势.于α-势,导出了由最优平稳策略所满足的最优性方程.较为详细地讨论了最优性方程解的存在性问题, 并给出了其解存在的一些充分条件.

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

殷保群; 李衍杰; 周亚平; 奚宏生.可数半Markov决策过程折扣代价性能优化[J].控制与决策,2006,21(8):933-936

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2005-05-13
  • 最后修改日期:2005-10-17
  • 录用日期:
  • 在线发布日期: 2006-08-20
  • 出版日期:
文章二维码