您的位置: 专家智库 > >

曾嘉安

作品数:2 被引量:3H指数:1
供职机构:华南理工大学更多>>
发文基金:广东省科技计划工业攻关项目国家自然科学基金广州市科技计划项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇值函数
  • 2篇函数
  • 1篇抢球
  • 1篇隶属度函数
  • 1篇模糊隶属度函...
  • 1篇机器学习方法
  • 1篇函数拟合
  • 1篇ROBOCU...

机构

  • 2篇华南理工大学

作者

  • 2篇曾嘉安
  • 1篇朱金辉
  • 1篇闵华清
  • 1篇罗荣华

传媒

  • 1篇控制理论与应...

年份

  • 1篇2011
  • 1篇2009
2 条 记 录,以下是 1-2
排序方式:
一种状态自动划分的模糊小脑模型关节控制器值函数拟合方法被引量:3
2011年
在庞大离散状态空间或连续状态空间中,强化学习(RL)需要进行值函数拟合以寻找最优策略.但函数拟合器的结构往往由设计者预先设定,在学习过程中不能动态调整缺乏自适应性.为了自动构建函数拟合器的结构,提出一种可以进行状态自动划分的模糊小脑模型关节控制(FCMAC)值函数拟合方法.该方法利用Bellman误差的变化趋势实现状态自动划分,并且探讨了两种选择划分区域的机制.汽车爬坡问题和机器人足球仿真平台中的实验结果表明新算法能有效拟合值函数,而且利用所提出的函数拟合器智能体可以进行有效的强化学习.
闵华清曾嘉安罗荣华朱金辉
关键词:值函数
RoboCup仿真足球机器人中强化学习方法研究
强化学习是一种重要的机器学习方法。当前,在复杂的多智能体环境下,研究如何应用强化学习算法是机器学习中极具挑战性的前沿课题之一,吸引了国内外众多研究人员的兴趣。RoboCup仿真足球比赛是一个典型的、复杂的多智能体系统。R...
曾嘉安
关键词:函数拟合值函数机器学习方法模糊隶属度函数抢球
文献传递
共1页<1>
聚类工具0