基于Monte Carlo 粒子滤波的POMDPs 在线算法
DOI:
CSTR:
作者:
作者单位:

1. 中南大学;深圳职业技术学院
2. 中南大学信息科学与工程学院

作者简介:

仵博

通讯作者:

中图分类号:

A

基金项目:

国家自然科学基金:基于供应链低碳化的企业行为与运营优化决策研究;教育部博士点基金项目


Online algorithm based on Monte Carlo particle filtering in POMDPs
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对部分可观察马尔可夫决策过程(POMDPs) 的信念状态空间是一个双指数规模问题, 提出一种基于Monte
    Carlo 粒子滤波的POMDPs 在线算法. 首先, 分别采用粒子滤波和粒子映射更新和扩展信念状态, 建立可达信念状态
    与或树; 然后, 采用分支界限裁剪方法对信念状态与或树进行裁剪, 降低求解规模. 实验结果表明, 所提出算法具有较
    低的误差率和较快的收敛性, 能够满足系统实时性的要求.

    Abstract:

    In order to solve the double exponential size problem of belief states space in partially observable Markov decision
    processes(POMDPs), an online algorithm based on Monte Carlo particle filtering(MCPF) is proposed. Firstly, the methods
    of particle filtering and particle projection are used to update and expand the belief states respectively, and the and-or tree of
    reachable belief states is built. Then, a branch-and-bound pruning method is proposed to prune the tree to reduce computation.
    Finally, the experiment and simulation results show that the proposed algorithm has the effectiveness in retaining the quality
    of the policies and reducing the cost of computing policies, so it can meet the requirement of a real-time system.

    参考文献
    相似文献
    引证文献
引用本文

仵博 吴敏.基于Monte Carlo 粒子滤波的POMDPs 在线算法[J].控制与决策,2013,28(6):925-929

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2012-02-13
  • 最后修改日期:2012-04-25
  • 录用日期:
  • 在线发布日期: 2013-06-20
  • 出版日期:
文章二维码