公共文化服务平台

2024年7月13日星期六

|

欢迎来到叙永县图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

夏林锋: 作品数：3 被引量：0H指数：0; 供职机构：浙江大学更多>>; 发文基金：国家自然科学基金更多>>; 相关领域：自动化与计算机技术自然科学总论更多>>

合作作者

钱徽浙江大学计算机科学与技术学院
陈沈轶浙江大学计算机科学与技术学院
金卓军浙江大学计算机科学与技术学院

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

1篇期刊文章
1篇学位论文
1篇会议论文

领域

2篇自动化与计算...
1篇自然科学总论

主题

2篇Q学习
2篇AMD
1篇学习算法
1篇移动机器人
1篇体系结构
1篇汽车
1篇主车
1篇自主车
1篇自主车辆
1篇自主汽车
1篇自主移动机器...
1篇马尔可夫
1篇马尔可夫决策...
1篇机器人
1篇POMDP
1篇Q学习算法
1篇部分可观察马...
1篇车辆
1篇车辆行驶
1篇Q

机构

3篇浙江大学

作者

3篇夏林锋
2篇金卓军
2篇陈沈轶
2篇钱徽

传媒

1篇华中科技大学...

年份

1篇2012
2篇2011

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

基于AMDP-Q的自主车辆行驶策略求解: 结合增广马尔可夫决策过程(AMDP)，蒙特卡罗一部分可观察马尔可夫决策过程(MC—POMDP)以及Q学习，提出了AMDP—Q学习(AMDP—Q)算法。算法的主要思想是：首先用一个低维充分统计量表示原信念状态空间，通常使用...; 夏林锋钱徽陈沈轶金卓军; 关键词：自主车辆 Q学习算法

基于AMDP-Q的自主车辆行驶策略求解: 2011年; 结合增广马尔可夫决策过程(AMDP),蒙特卡罗-部分可观察马尔可夫决策过程(MC-POMDP)以及Q学习,提出了AMDP-Q学习(AMDP-Q)算法.算法的主要思想是:首先用一个低维充分统计量表示原信念状态空间,通常使用最大似然状态和信念状态的信息熵作为充分统计量,其组成的空间称为增广状态空间;然后应用参考状态集离散化该空间,并利用Q学习和Shepard插值得到连续状态的转移函数和回报函数;最后使用具有知识探索性质的ε-贪婪策略进行策略选择.实验结果表明:AMDP-Q比MC-POMDP收敛速度更快.; 夏林锋钱徽陈沈轶金卓军; 关键词：自主汽车 Q学习

基于分布式机器人体系结构的逆向增强学习技术: 地面自主移动机器人技术是人工智能理论研究的重点之一。为了实现移动机器人在实际环境中完成地面自主导航任务,其使用的体系结构需要把各个功能模块有机地结合起来,常用模块有感知、融合、规划、决策、行动等。而且随着技术的不断进步,...; 夏林锋; 关键词：体系结构; 文献传递

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@叙永县图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张