2025, 40(5):1457-1466.
DOI: 10.13195/j.kzyjc.2024.1072
摘要:
针对冗余机械臂时间-冲击最优轨迹规划问题, 提出一种基于改进灰狼算法的最优轨迹规划器. 首先, 为了克服灰狼算法(GWO)开发与探索不平衡的局限性, 提出基于强化学习的灰狼算法(QLGWO)及其多目标版本(MOQLGWO): QLGWO使用$Q $学习指导灰狼个体基于经验和奖励选择探索或开发动作, 以实现算法局部与全局搜索的自主平衡; MOQLGWO引入存档和领导选择机制, 在搜索衡量多种优化目标的帕累托最优解的同时, 引导搜索方向朝未被探索的区域拓展, 以逼近全局最优. 然后, 使用两段五阶多项式来构造机械臂的运动轨迹, 需要搜索的解由运行时间以及中间点的关节位置、速度、加速度组成. 最后, 在12个基准函数上, 将QLGWO与GWO以及其他4种先进的元启发式算法进行对比, 并使用MOQLGWO求解9自由度冗余机械臂的时间-冲击最优轨迹规划问题. 仿真和实验结果表明: 所提出QLGWO可有效提高GWO的性能; 最优轨迹规划器能够在满足关节约束的前提下获得安全、光滑的时间-冲击最优轨迹, 其运行时间小于14 s, 冲击处于$-0.25\, {\rm rad/s}^3 \sim \rhbr 0.15\, {\rm rad/s}^3$之间.