连续状态自适应离散化基于K-均值聚类的强化学习方法
DOI:
CSTR:
作者:
作者单位:

中国科学技术大学自动化系 合肥 230027

作者简介:

文锋

通讯作者:

中图分类号:

基金项目:


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分为两部分:对连续状态空间进行自适应离散化的状态空间学习,使用K-均值聚类算法;寻找最优策略的策略学习,使用替代合适迹Sarsa学习算法.对连续状态的强化学习基准问题进行仿真实验,结果表明该方法能实现对连续状态空间的自适应离散化,并最终学习到最优策略.与基于CMAC 网络的强化学习方法进行比较,结果表明该方法具有节省存储空间和缩短计算时间的优点.

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

文锋;陈宗海;卓睿; 周光明.连续状态自适应离散化基于K-均值聚类的强化学习方法[J].控制与决策,2006,21(2):143-0148

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2005-01-10
  • 最后修改日期:2005-03-05
  • 录用日期:
  • 在线发布日期: 2006-02-20
  • 出版日期:
文章二维码