摘要:车体质量偏心是无人自行车一个重要的性能参数,为了降低车体质量偏心对无人自行车航向轨迹的影响,提出一种基于有模型强化学习原理的概率推理学习优化(PILO)偏心校正方法.该方法以车体侧向倾角(倾角速度)、车把转角(转角速度)以及车把控制力矩为输入,以对应时刻车体侧向倾角速度(倾角加速度)以及车把转角速度(车把转角加速度)为输出,利用高斯过程回归(GPR)构建系统的概率动态模型(PDM)表征系统的不确定性动态,并将其用于后续的状态序列预测;将质量偏心作为车把PD控制器的一个参数,考虑车体航向与车把转角间的运动约束,通过车体航向角速度构造目标函数,优化并校正系统的质量偏心参数.设定八种不同的负载偏心开展无人自行车仿真及物理样机实验,结果表明,PILO系统校正的绝对误差不超过0.005rad,相对误差不超过10%,并且展现了一定的抗干扰能力;与无模型的认知学习偏心优化(RLO)校正系统比较,PILO系统在参数整定难度、智能化以及容错能力等方面具有一定优势.