您的位置: 专家智库 > >

夏林锋

作品数:3 被引量:0H指数:0
供职机构:浙江大学更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术自然科学总论更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 2篇自动化与计算...
  • 1篇自然科学总论

主题

  • 2篇Q学习
  • 2篇AMD
  • 1篇学习算法
  • 1篇移动机器人
  • 1篇体系结构
  • 1篇汽车
  • 1篇主车
  • 1篇自主车
  • 1篇自主车辆
  • 1篇自主汽车
  • 1篇自主移动机器...
  • 1篇马尔可夫
  • 1篇马尔可夫决策...
  • 1篇机器人
  • 1篇POMDP
  • 1篇Q学习算法
  • 1篇部分可观察马...
  • 1篇车辆
  • 1篇车辆行驶
  • 1篇Q

机构

  • 3篇浙江大学

作者

  • 3篇夏林锋
  • 2篇金卓军
  • 2篇陈沈轶
  • 2篇钱徽

传媒

  • 1篇华中科技大学...

年份

  • 1篇2012
  • 2篇2011
3 条 记 录,以下是 1-3
排序方式:
基于AMDP-Q的自主车辆行驶策略求解
结合增广马尔可夫决策过程(AMDP),蒙特卡罗一部分可观察马尔可夫决策过程(MC—POMDP)以及Q学习,提出了AMDP—Q学习(AMDP—Q)算法。算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用...
夏林锋钱徽陈沈轶金卓军
关键词:自主车辆Q学习算法
基于AMDP-Q的自主车辆行驶策略求解
2011年
结合增广马尔可夫决策过程(AMDP),蒙特卡罗-部分可观察马尔可夫决策过程(MC-POMDP)以及Q学习,提出了AMDP-Q学习(AMDP-Q)算法.算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用最大似然状态和信念状态的信息熵作为充分统计量,其组成的空间称为增广状态空间;然后应用参考状态集离散化该空间,并利用Q学习和Shepard插值得到连续状态的转移函数和回报函数;最后使用具有知识探索性质的ε-贪婪策略进行策略选择.实验结果表明:AMDP-Q比MC-POMDP收敛速度更快.
夏林锋钱徽陈沈轶金卓军
关键词:自主汽车Q学习
基于分布式机器人体系结构的逆向增强学习技术
地面自主移动机器人技术是人工智能理论研究的重点之一。为了实现移动机器人在实际环境中完成地面自主导航任务,其使用的体系结构需要把各个功能模块有机地结合起来,常用模块有感知、融合、规划、决策、行动等。而且随着技术的不断进步,...
夏林锋
关键词:体系结构
文献传递
共1页<1>
聚类工具0