一种基于信念状态压缩的实时POMDP算法
DOI:
CSTR:
作者:
作者单位:

中南大学信息科学与工程学院 长沙 410083

作者简介:

仵博

通讯作者:

中图分类号:

TP393

基金项目:


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对求解部分可观察马尔可夫决策过程(POMDP)信念状态空间是NP难问题,提出一种信念状态空间压缩(BSSC)算法.将信念状态空间的高维压缩到低维,利用动态贝叶斯网络对状态转移函数,观察函数和报酬函数进行压缩,降低求解规模,达到实时决策的目的.对比实验表明,所提出的算法可以快速求解最优策略和最优值函数.

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

仵博;吴敏.一种基于信念状态压缩的实时POMDP算法[J].控制与决策,2007,22(12):1417-1420

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2006-09-11
  • 最后修改日期:2006-11-20
  • 录用日期:
  • 在线发布日期: 2007-12-20
  • 出版日期:
文章二维码