基于模糊强化学习和模型预测控制的追逃博弈
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP13

基金项目:

国家自然科学基金项目(62073264).


Pursuit-evasion game based on fuzzy reinforcement learning and model predictive control
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对三维空间中智能体追逃博弈策略制定与鲁棒控制问题, 提出一种基于模糊强化学习与模型预测控制(MPC)的分层追逃博弈框架. 所提出框架结合三维空间的阿氏圆和模糊行动者-评论家学习(FACL)算法获得智能体的运动信息, 并将其用作MPC算法的参考输入来设计四旋翼无人机的控制器. 通过对四旋翼欠驱动系统模型进行解耦, 设计考虑误差系统积分项的高度、平移和姿态控制器. 通过FACL算法提供的参考信息, 有效提高了MPC算法的控制效率. 仿真和实验结果表明, 所设计的分层框架可以很好地解决三维空间追逃博弈问题.

    Abstract:

    Addressing the strategy formulation and robust control issues in the pursuit-evasion game of agents in 3D space, this paper proposes a hierarchical pursuit-evasion game framework based on fuzzy reinforcement learning and model predictive control(MPC). The proposed framework integrates the Apollonius circle in 3D space with the fuzzy actor-critic learning(FACL) algorithm to obtain the agents' motion information, which is then used as the reference input for the MPC algorithm to design the controller for quadrotor unmanned aerial vehicles. By decoupling the underactuated system model of the quadrotor, altitude, translation, and attitude controllers that consider the integral term of the error system are designed. The reference information provided by the FACL algorithm effectively enhances the control efficiency of the MPC algorithm. Simulation and experimental results demonstrate that the designed hierarchical framework can effectively solve the pursuit-evasion game problem in 3D space.

    参考文献
    相似文献
    引证文献
引用本文

胡鹏林,潘泉,赵春晖.基于模糊强化学习和模型预测控制的追逃博弈[J].控制与决策,2025,40(6):1855-1865

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-08-30
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2025-04-30
  • 出版日期: 2025-06-20
文章二维码