基于RBF-$ Q $学习的多品种CSPS系统前视距离控制
CSTR:
作者:
作者单位:

(合肥工业大学电气与自动化工程学院,合肥230009)

作者简介:

通讯作者:

E-mail: htang@hfut.edu.cn.

中图分类号:

TP278

基金项目:

国家自然科学基金项目(61573126,71231004);中央高校基本科研业务费专项基金项目(JZ2016YYPY 0052);高等学校博士学科点专项科研基金项目(20130111110007).


Look-ahead control of multi-type products CSPS system based on RBF-$ Q $ learning
Author:
Affiliation:

(School of Electrical Engineering and Automation,Hefei University of Technology,Hefei230009,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    研究一类多品种工件到达的传送带给料加工站系统(CSPS)的前视距离(Look-ahead)优化控制问题,以提高系统的工作效率.在工件品种数增加的情况下,系统状态规模会呈现指数性增长,考虑传统$ Q $学习在面对大规模离散状态空间所面临的维数灾难,且难以直接处理前视距离为连续化变量的问题,引入了RBF网络来逼近$ Q $值函数,网络的输入为状态行动对,输出为该状态行动对的$ Q $值.给出RBF-$ Q $学习算法,并应用于多品种CSPS系统的优化控制中,实现了连续行动空间的$ Q $学习.针对不同的品种数情况进行仿真分析,仿真结果表明,RBF-$ Q $学习算法可以对多品种CSPS系统性能进行有效优化,并且提高学习速度.

    Abstract:

    This paper studies the look-ahead optimal control problem of the conveyor-serviced production station(CSPS) system for a class of varieties of parts arrival to improve the efficiency of operations. When the number of varieties of the system increases, the system state scale will show exponential growth. Considering the dimension disaster problem of traditional $ Q $-learning in the face of the large-scale discrete state and the difficulty of dealing with the look-ahead as a continuous variable directly, the RBF network is introduced to approximate the $ Q $ value function, the input of the RBF network is the state action pair, and the output is the $ Q $ value of the state action pair. The RBF-$ Q $ learning algorithm is proposed, and applied to the optimal control of multi-type products conveyor-serviced production station, realized the continuous action space $ Q $-learning. The simulation analysis is carried out for different varieties, and results show that the method can effectively optimize the processing of CSPS system and improve the learning speed.

    参考文献
    相似文献
    引证文献
引用本文

唐昊,杨羊,戴飞,等.基于RBF-$ Q $学习的多品种CSPS系统前视距离控制[J].控制与决策,2019,34(7):1456-1462

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2019-06-28
  • 出版日期:
文章二维码