基于强化学习算法的多机器人系统的冲突消解策略
DOI:
CSTR:
作者:
作者单位:

中国科学技术大学自动化系 合肥 230027

作者简介:

陈宗海

通讯作者:

中图分类号:

TP242

基金项目:


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段, 以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标, 进行仿真研究, 并与基于全局奖赏和Q学习算法等其他9种算法进行比较. 结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突,避免死锁,提高系统整体性能.

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

任燚;陈宗海.基于强化学习算法的多机器人系统的冲突消解策略[J].控制与决策,2006,21(4):430-434

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2005-03-28
  • 最后修改日期:2005-06-14
  • 录用日期:
  • 在线发布日期: 2006-04-20
  • 出版日期:
文章二维码