2024年7月13日
星期六
|
欢迎来到叙永县图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
夏林锋
作品数:
3
被引量:0
H指数:0
供职机构:
浙江大学
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
自然科学总论
更多>>
合作作者
钱徽
浙江大学计算机科学与技术学院
陈沈轶
浙江大学计算机科学与技术学院
金卓军
浙江大学计算机科学与技术学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
1篇
会议论文
领域
2篇
自动化与计算...
1篇
自然科学总论
主题
2篇
Q学习
2篇
AMD
1篇
学习算法
1篇
移动机器人
1篇
体系结构
1篇
汽车
1篇
主车
1篇
自主车
1篇
自主车辆
1篇
自主汽车
1篇
自主移动机器...
1篇
马尔可夫
1篇
马尔可夫决策...
1篇
机器人
1篇
POMDP
1篇
Q学习算法
1篇
部分可观察马...
1篇
车辆
1篇
车辆行驶
1篇
Q
机构
3篇
浙江大学
作者
3篇
夏林锋
2篇
金卓军
2篇
陈沈轶
2篇
钱徽
传媒
1篇
华中科技大学...
年份
1篇
2012
2篇
2011
共
3
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于AMDP-Q的自主车辆行驶策略求解
结合增广马尔可夫决策过程(AMDP),蒙特卡罗一部分可观察马尔可夫决策过程(MC—POMDP)以及Q学习,提出了AMDP—Q学习(AMDP—Q)算法。算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用...
夏林锋
钱徽
陈沈轶
金卓军
关键词:
自主车辆
Q学习算法
基于AMDP-Q的自主车辆行驶策略求解
2011年
结合增广马尔可夫决策过程(AMDP),蒙特卡罗-部分可观察马尔可夫决策过程(MC-POMDP)以及Q学习,提出了AMDP-Q学习(AMDP-Q)算法.算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用最大似然状态和信念状态的信息熵作为充分统计量,其组成的空间称为增广状态空间;然后应用参考状态集离散化该空间,并利用Q学习和Shepard插值得到连续状态的转移函数和回报函数;最后使用具有知识探索性质的ε-贪婪策略进行策略选择.实验结果表明:AMDP-Q比MC-POMDP收敛速度更快.
夏林锋
钱徽
陈沈轶
金卓军
关键词:
自主汽车
Q学习
基于分布式机器人体系结构的逆向增强学习技术
地面自主移动机器人技术是人工智能理论研究的重点之一。为了实现移动机器人在实际环境中完成地面自主导航任务,其使用的体系结构需要把各个功能模块有机地结合起来,常用模块有感知、融合、规划、决策、行动等。而且随着技术的不断进步,...
夏林锋
关键词:
体系结构
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张