田西兰
- 作品数:7 被引量:41H指数:3
- 供职机构:中国矿业大学信息与电气工程学院更多>>
- 发文基金:中国博士后科学基金江苏省博士后科研资助计划项目国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术机械工程电子电信更多>>
- 基于支持向量机的连续状态空间Q学习被引量:6
- 2008年
- 针对连续状态空间下的强化学习控制问题,提出一种基于支持向量机的Q学习方法.支持向量机不易陷入局部极小,且有优良的泛化性能,对系统状态-动作对的Q值进行估计计算,解决状态空间泛化中易出现的"维数灾"问题.引入滚动时间窗机制实现支持向量机的在线学习:系统实时检测得到的新数据若不包含新信息,则保持学习的样本集不变;若包含新信息,则滚动时间窗,更新样本集,从而更新支持向量机的回归模型,并对时间窗内的数据分配不同的权值以充分利用数据的信息.倒立摆平衡控制的仿真结果表明该方法能够有效解决具有连续状态的非线性系统的强化学习控制.
- 王雪松田西兰程玉虎
- 关键词:支持向量机Q学习
- 基于协同最小二乘支持向量机的Q学习被引量:21
- 2009年
- 针对强化学习系统收敛速度慢的问题,提出一种适用于连续状态、离散动作空间的基于协同最小二乘支持向量机的Q学习.该Q学习系统由一个最小二乘支持向量回归机(Least squares support vector regression machine,LS-SVRM)和一个最小二乘支持向量分类机(Least squares support vector classification machine,LS-SVCM)构成.LS-SVRM用于逼近状态-动作对到值函数的映射,LS-SVCM则用于逼近连续状态空间到离散动作空间的映射,并为LS-SVRM提供实时、动态的知识或建议(建议动作值)以促进值函数的学习.小车爬山最短时间控制仿真结果表明,与基于单一LS-SVRM的Q学习系统相比,该方法加快了系统的学习收敛速度,具有较好的学习性能.
- 王雪松田西兰程玉虎易建强
- 关键词:Q学习最小二乘支持向量机映射
- 语音识别技术在机器人控制中的应用被引量:12
- 2006年
- 研究语音识别技术在机器人控制系统中的应用及实现。分析以线性预测倒谱系数为特征矢量的模板匹配法语音识别原理,并利用VC++6.0和微软语音开发包Speech SDK设计出语音识别接口,提高了语音程序的开发效率,实现了对AS-R型移动机器人的语音控制。
- 王雪松田西兰王炜强
- 关键词:语音识别机器人控制SPEECHSDK
- 最小二乘支持向量机在强化学习系统中的应用被引量:3
- 2008年
- 将连续状态空间下的Q学习构建为最小二乘支持向量机的回归估计问题,利用最小二乘支持向量机良好的泛化以及非线性逼近性能实现由系统状态-动作对到Q值函数的映射。为了保证计算速度以及适应Q学习系统在线学习的需要,最小二乘支持向量机的训练样本是窗式移动的,即在Q学习系统学习的同时获取样本数据并进行最小二乘支持向量机的训练。小车爬山控制问题的仿真结果表明该方法学习效率高,能够有效解决强化学习系统连续状态空间的泛化问题。
- 王雪松田西兰程玉虎马小平
- 关键词:最小二乘支持向量机Q学习泛化
- 语音识别技术在机器人控制中的应用
- 本文研究语音识别技术在机器人控制系统中的应用及实现.分析以线性预测倒谱系数为特征矢量的模板匹配法语音识别原理,并利用VC++6.0和微软语音开发包Speech SDK设计出语音识别接口,提高了语音程序的开发效率,实现了对...
- 王雪松田西兰王炜强
- 关键词:语音识别机器人控制系统语音控制
- 文献传递
- 改进型模糊控制器在网络控制系统中的应用研究
- 针对网络控制系统中的网络诱导时延和丢包问题,本文提出了改进的模糊控制方案.在基本模糊控制器的基础上,加入了二级模糊控制和网络延迟补偿环节.仿真结果表明:改进型模糊控制器对大滞后系统有着很好的控制效果.
- 田西兰郭西进王贞
- 关键词:网络控制系统TRUETIME
- 文献传递
- 改进型模糊控制器在网络控制系统中的应用研究
- 2005年
- 针对网络控制系统中的网络诱导时延和丢包问题,本文提出了改进的模糊控制方案.在基本模糊控制器的基础上,加入了二级模糊控制和网络延迟补偿环节.仿真结果表明:改进型模糊控制器对大滞后系统有着很好的控制效果.
- 田西兰郭西进王贞
- 关键词:网络控制系统丢包TRUETIME