公共文化服务平台

共 2 条记录，以下是 1-2

全选清除导出

排序方式：

一种状态自动划分的模糊小脑模型关节控制器值函数拟合方法被引量：3: 2011年; 在庞大离散状态空间或连续状态空间中,强化学习(RL)需要进行值函数拟合以寻找最优策略.但函数拟合器的结构往往由设计者预先设定,在学习过程中不能动态调整缺乏自适应性.为了自动构建函数拟合器的结构,提出一种可以进行状态自动划分的模糊小脑模型关节控制(FCMAC)值函数拟合方法.该方法利用Bellman误差的变化趋势实现状态自动划分,并且探讨了两种选择划分区域的机制.汽车爬坡问题和机器人足球仿真平台中的实验结果表明新算法能有效拟合值函数,而且利用所提出的函数拟合器智能体可以进行有效的强化学习.; 闵华清曾嘉安罗荣华朱金辉; 关键词：值函数

RoboCup仿真足球机器人中强化学习方法研究: 强化学习是一种重要的机器学习方法。当前，在复杂的多智能体环境下，研究如何应用强化学习算法是机器学习中极具挑战性的前沿课题之一，吸引了国内外众多研究人员的兴趣。RoboCup仿真足球比赛是一个典型的、复杂的多智能体系统。R...; 曾嘉安; 关键词：函数拟合值函数机器学习方法模糊隶属度函数抢球; 文献传递

全选清除导出

共1页<1>

曾嘉安