摘要:车体质量偏心是无人自行车一个重要的性能参数, 为了降低车体质量偏心对无人自行车航向轨迹的影响, 提出一种基于有模型强化学习原理的概率推理学习优化(PILO)偏心校正方法. 该方法以车体侧向倾角(倾角速度)、车把转角(转角速度)以及车把控制力矩为输入, 以车体侧向倾角速度(倾角加速度)以及车把转角速度(车把转角加速度)为输出, 利用高斯过程回归(GPR)构建系统的概率动态模型(PDM)表征系统的不确定性动态, 并将其用于后续的状态序列预测; 将质量偏心作为车把PD控制器的一个参数, 考虑车体航向与车把转角间的运动约束, 通过车体航向角速度构造目标函数, 优化并校正系统的质量偏心参数. 设定8种不同的负载偏心开展无人自行车仿真以及物理样机实验, 结果表明: PILO系统校正的绝对误差不超过0.005 rad, 相对误差低于10 %, 且展现了一定的抗干扰能力; 与无模型的认知学习偏心优化(RLO)校正系统相比, PILO系统在参数整定难度、智能化以及容错能力等方面具有一定优势.