摘要:为了提高机械臂控制过程中的安全性, 针对机械臂系统的误差约束问题提出一种基于强化学习的自适应控制方法. 将机械臂的动力学系统转化为关于跟踪误差的动态方程, 然后利用一类误差转换函数, 将受约束的误差系统转换为新的不受约束系统, 并基于此系统设计最优控制器. 为了解决最优控制问题, 利用强化学习的方法求解系统的HJB方程, 其中评价网络用于逼近系统最优值函数, 执行网络用于逼近最优控制器的输出, 并利用一类正定函数来大幅简化评价-执行网络的自适应率. 基于李雅普诺夫稳定性理论, 证明系统所有误差信号半全局一致最终有界. 最后通过一个2自由度机械臂的仿真案例验证所提出方法的有效性.