孙超
- 作品数:3 被引量:2H指数:1
- 供职机构:东北石油大学电气信息工程学院更多>>
- 发文基金:黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于混沌遗传算法的机器人路径规划方法研究
- 2011年
- 针对机器人路径规划中,应用遗传算法时容易陷入局部最优解以及收敛速度较慢等问题,设计出一种基于混沌遗传算法的路径规划方法。在基本遗传算法的基础上采用自适应调整的选择概率,并引入混沌操作,从而增强移动机器人路径规划算法的鲁棒性,解决一般遗传算法的早熟和收敛速度慢问题。经MATLAB仿真,证明该方法具有良好的避障性能。
- 任伟建刘世聪孙超
- 关键词:混沌遗传算法路径规划
- 基于T-S型模糊神经网络的机械手控制方案设计研究
- 2011年
- 机械手轨迹跟踪控制问题在机器人研究领域占有举足轻重的地位,现在已有很多控制方法,但是控制效果都不够理想。设计了基于T-S型模糊神经网络的机械手轨迹跟踪控制方案,用改进自适应遗传算法与BP算法相结合的混合学习算法来优化网络的权值。仿真试验表明,该控制方案能很好地控制机械手的轨迹跟踪,因而是可行且有效的。
- 孙超刘世聪李勇周庆殷美艳
- 关键词:机械手BP算法遗传算法
- 基于动态延迟策略更新的TD3算法被引量:2
- 2020年
- 在深度强化学习领域中,为进一步减少双延迟深度确定性策略梯度TD3(Twin Delayed Deep Deterministic Policy Gradients)中价值过估计对策略估计的影响,加快模型学习的效率,提出一种基于动态延迟策略更新的双延迟深度确定性策略梯度(DD-TD3:Twin Delayed Deep Deterministic Policy Gradients with Dynamic Delayed Policy Update)。在DD-TD3方法中,通过Critic网络的最新Loss值与其指数加权移动平均值的动态差异指导Actor网络的延迟更新步长。实验结果表明,与原始TD3算法在2000步获得较高的奖励值相比,DD-TD3方法可在约1000步内学习到最优控制策略,并且获得更高的奖励值,从而提高寻找最优策略的效率。
- 康朝海孙超荣垂霆刘鹏云