基于强化学习的JLQ模型的直接自适应最优控制
DOI:
CSTR:
作者:
作者单位:

清华大学自动化系 100084

作者简介:

徐琰恺

通讯作者:

中图分类号:

TP13

基金项目:


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q 函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q 函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

徐琰恺;陈曦.基于强化学习的JLQ模型的直接自适应最优控制[J].控制与决策,2008,23(12):1359-1362

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2007-10-19
  • 最后修改日期:2008-02-28
  • 录用日期:
  • 在线发布日期: 2008-12-20
  • 出版日期:
文章二维码