概率推理学习控制方法的不确定性来源分析及量化
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP273

基金项目:

江苏省自然科学基金项目(BK20230560);国家自然科学基金项目(62303400, 92371116, 52272369);自主智能无 人系统全国重点实验室开放课题项目(ZZKF2025-3-1);江苏省高等学校面上项目(23KJB590003);2022年度扬州市“绿扬金凤计划”优秀博士项目(YZLYJFJH2022YXBS109).


Analysis and quantification of uncertainty sources in probabilistic inference learning control
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    研究概率推理学习控制(PILCO)方法如何在决策过程中使用不确定性, 并进一步探索不确定性对PILCO优化性能的影响. 首先, 对给定策略下函数模型中不同不确定性的来源进行梳理和量化; 然后, 使用方差作为不确定性度量, 并采用总方差定律将总成本不确定性分解为两个组成部分; 最后, 引入一个金标准蒙特卡洛方案, 通过传播轨迹来近似PILCO的动力学模型, 从而分别量化成本中的随机不确定性和认知不确定性. 仿真结果表明, 当PILCO有效学习时, 它选择的是认知成本不确定性在总成本不确定性中具有高占比相关的策略.

    Abstract:

    This paper examines how the probabilistic inference for learning control (PILCO) method incorporates uncertainty into its decision-making process and investigates the impact of uncertainty on its optimization performance. First, the various sources of uncertainty within the function model under a given policy are identified and quantified. Then, variance is adopted as the measure of uncertainty, and the law of total variance is applied to decompose the overall cost uncertainty into two components. Finally, a gold-standard Monte Carlo scheme is introduced to approximate PILCO’s dynamics model by propagating trajectories, thereby enabling the separate quantification of aleatoric and epistemic uncertainties in the cost. Simulation results indicate that effective PILCO learning is associated with the selection of policies in which the epistemic cost uncertainty constitutes a high proportion of the total cost uncertainty.

    参考文献
    相似文献
    引证文献
引用本文

曹瑞,吕慧涛.概率推理学习控制方法的不确定性来源分析及量化[J].控制与决策,2026,41(2):494-504

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2025-02-13
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2026-01-17
  • 出版日期:
文章二维码