2026, 41(6):1731-1742.
DOI: 10.13195/j.kzyjc.2025.1052
摘要:
针对现有电动汽车实时能耗预测模型环境感知能力不足、动态校准机制缺失等问题, 提出一种融合环境感知与强化学习的能耗预测模型. 首先, 为增强模型对于复杂工况的感知和理解, 设计基于对比学习与耦合强化学习协同训练的路况感知算法, 并引入多尺度图像特征融合机制, 有效提取与车辆能效高度相关的环境特征, 从而提升对于非平稳工况的感知精度; 然后, 构建马尔可夫实时能效估计模型并将其映射至强化学习框架中, 引入基于折扣未来能耗的时序一致性正则项(其中$Q $函数仅用于能耗响应评估), 实现模型的自校准式优化, 从而在动态场景下显著增强预测的鲁棒性和自适应性(模型不产生控制输出); 同时, 结合场景感知的优先经验回放机制, 强化模型对坡度突变、急加减速等关键工况的识别和学习, 进一步提高复杂环境下的特征提取和模型泛化能力; 最后, 通过场景感知的优先采样策略优化训练样本分布, 提升强化学习的收敛速度和训练效率. 实验结果表明, 所提出方法在所测试的两款车型以及多种仿真工况下均表现出优越的鲁棒性和稳定性, 其MAE低于0.2%, RMSE低于0.3%, $R^2 $超过99.5%. 与现有Transformer、Informer、Mamba以及LSTM模型相比, 平均误差分别降低约40% $\sim $ 70%, 收敛速度提升约30%, 在复杂工况下能耗预测精度显著提高.