连续状态自适应离散化基于K-均值聚类的强化学习方法

首页 > 过刊浏览>2006年第21卷第2期 >143-0148

连续状态自适应离散化基于K-均值聚类的强化学习方法
DOI:
                        
CSTR:
                        
作者:
                        
作者单位:中国科学技术大学自动化系 合肥 230027
作者简介:文锋
通讯作者:
中图分类号:
基金项目:

Author:

Affiliation:

Fund Project:

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

使用聚类算法对连续状态空间进行自适应离散化,得到了基于K-均值聚类的强化学习方法.该方法的学习过程分为两部分:对连续状态空间进行自适应离散化的状态空间学习,使用K-均值聚类算法;寻找最优策略的策略学习,使用替代合适迹Sarsa学习算法.对连续状态的强化学习基准问题进行仿真实验,结果表明该方法能实现对连续状态空间的自适应离散化,并最终学习到最优策略.与基于CMAC 网络的强化学习方法进行比较,结果表明该方法具有节省存储空间和缩短计算时间的优点.

Abstract:

参考文献

相似文献

引证文献

引用本文

文锋;陈宗海;卓睿; 周光明.连续状态自适应离散化基于K-均值聚类的强化学习方法[J].控制与决策,2006,21(2):143-0148

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2005-01-10
最后修改日期:2005-03-05
录用日期:
在线发布日期: 2006-02-20
出版日期:

首页

期刊简介

编委会

作者中心

精选专辑

品牌联动

引用本文

分享

文章指标

历史

文章二维码