一种基于操作条件反射原理的学习模型
CSTR:
作者:
作者单位:

北京工业大学 a. 电子信息与控制工程学院,b. 实验学院,北京100124.

作者简介:

黄静

通讯作者:

中图分类号:

TP273

基金项目:

国家自然科学基金项目(61075110);北京市自然科学基金项目(KZ201210005001);国家973 计划项目(2012CB720000);高等学校博士学科点专项科研基金项目(20101103110007).


A learning model based on operant conditioning principles
Author:
Affiliation:

a. College of Electronic Information and Control Engineering,b. Pilot College,Beijing University of Technology, Beijing 100124,China.

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对认知机器人的自主学习问题, 提出一种基于操作条件反射原理的学习模型(OCLM). 该模型采用状态空间、操作行为空间、概率分布函数、仿生学习机制、系统熵等进行描述, 给出状态的“负理想度”的概念, 定义了取向函数的计算方法. 运用模型对机器人避障导航问题进行仿真实验, 并对参数设置进行了讨论. 实验结果表明, 基于OCLM模型的机器人能通过与环境的交互获得认知, 成功避障到达目的地, 具有一定的自学习能力, 从而表明了模型的有效性.

    Abstract:

    Inspired by Skinner’s operant conditioning theory, an operant conditioning learning model is presented to deal with the autonomous learning problem in cognitive robotics. The model is described by nine elements, including the space set, the action set, the bionic learning function and the system entropy etc. A notion “negative ideal rate” is defined to compute the orientation function. The OCLM is applied to solve obstacle avoidance and navigation problems for mobile robots. The experiment results show that the robot based on the model can autonomously learn how to arrive at the goal in a collision-free way through interaction with the environment, and show the effectiveness of the proposed model.

    参考文献
    相似文献
    引证文献
引用本文

阮晓钢 黄静 范青武 魏若岩.一种基于操作条件反射原理的学习模型[J].控制与决策,2014,29(6):1016-1020

复制
相关视频

分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2013-04-27
  • 最后修改日期:2013-07-30
  • 录用日期:
  • 在线发布日期: 2014-06-20
  • 出版日期:
文章二维码