基于策略迭代的连续时间系统的随机线性二次最优控制
CSTR:
作者:
作者单位:

1. 东北大学信息科学与工程学院,沈阳110004;
2. 沈阳师范大学计算机与数学基础教学部,沈阳110034.

作者简介:

王涛

通讯作者:

中图分类号:

TP273+.1

基金项目:

国家自然科学基金项目(61034005); 国家863 计划项目(2012AA040104); 辽宁省自然科学基金项目(201202201).


Stochastic linear quadratic optimal control for continuous-time systems based on policy iteration
Author:
Affiliation:

1. College of Information Science and Engineering,Northeastern University,Shenyang 110004,China;
2. Department of Computer and Mathematics Teaching,Shenyang Normal University,Shenyang 110034,China.

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对模型参数部分未知的随机线性连续时间系统, 通过策略迭代算法求解无限时间随机线性二次(LQ) 最优控制问题. 求解随机LQ最优控制问题等价于求随机代数Riccati 方程(SARE) 的解. 首先利用伊藤公式将随机微分方程转化为确定性方程, 通过策略迭代算法给出SARE 的解序列; 然后证明SARE 的解序列收敛到SARE 的解, 而且在迭代过程中系统是均方可镇定的; 最后通过仿真例子表明策略迭代算法的可行性.

    Abstract:

    The stochastic linear quadratic(LQ) optimal control problem is solved for stochastic linear continuous-time systems with the partly unknown parameter by using the policy iteration approach. The feasibility of the stochastic LQ optimal control problem is equivalent to the solvability of the stochastic algebra Riccati equation(SARE). Firstly, the stochastic differential equation is converted into the deterministic equation by using Itˆo formula, and the solution sequence of SARE is obtained by using the policy iteration approach. Then, convergence analysis is presented to prove that the solution sequence of SARE reaches the solution of SARE, and the proof of mean square stability of the systems in the process of iteration is also given. Finally, a simulation example is given to illustrate the feasibility of the policy iteration approach.

    参考文献
    相似文献
    引证文献
引用本文

王涛 张化光.基于策略迭代的连续时间系统的随机线性二次最优控制[J].控制与决策,2015,30(9):1674-1678

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2014-05-30
  • 最后修改日期:2014-12-17
  • 录用日期:
  • 在线发布日期: 2015-09-20
  • 出版日期:
文章二维码