唐昊
- 作品数:196 被引量:228H指数:8
- 供职机构:合肥工业大学更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术电气工程理学电子电信更多>>
- 基于对等SAP的Q学习在机器人作业分配中的应用
- 基于强化学习,文章讨论了高速搬运系统中多个机器人的作业分配问题。针对状态空间随机器人个数增加呈指数增大这一难题,提出对等状态-行动对(State-Action Pair)概念,设计了一种改进的Q学习算法。在该算法中,每次...
- 丁丽洁唐昊周雷
- 关键词:Q学习
- 文献传递
- 多链MDP的鲁棒控制策略求解
- 2008年
- 马尔可夫决策过程(MDP)的许多优化算法一般依赖系统的转移速率,而系统参数的不确定性使得MDP的转移速率往往很难精确得知。针对一类不确定多链MDP模型,基于性能势对参数不相关和相关两种情况下的鲁棒控制问题进行了探讨,并分别给出求解系统最优鲁棒性能的策略迭代和并行遗传算法。最后,通过一个数值例子分析相关算法的有效性。
- 周雷唐昊程燕
- 关键词:性能势鲁棒控制并行遗传算法
- 一种用于传送带给料加工站系统的多目标优化控制方法
- 本发明公开了一种用于传送带给料加工站系统的多目标优化控制方法,包括:1、令k=1,初始化<Image file="DDA0001476588330000011.GIF" he="79" imgContent="drawi...
- 谭琦胡知强唐昊肖奕霖戴飞周雷杨子豪
- 一种改进的TP+LCM全贴合系统及控制方法
- 本发明公开了一种改进的TP+LCM全贴合系统及控制方法,其特征在于包括:传送带、若干个加工站点,传送带上随机分布有尺寸相同的TLCM(贴合后产品),每个站点包括加工中心、缓存库、导轨、抓手、前视传感器和投料点;系统以传送...
- 唐昊张彪王彬
- 文献传递
- 服务率可变的单站点CSPS系统优化控制
- 研究一类服务率可变的单站点传送带给料生产加工站(Conveyor-Serviced Producvion Stavion,简称为CSPS)的优化控制问题。在实际生产中,服务率可变反映了生产中劳动强度的变化,也是调整系统生...
- 庆琪琛唐昊周雷江琦
- 关键词:半MARKOV决策过程
- 文献传递
- 基于分层强化学习的电动汽车充电场站协同调峰方法
- 本发明涉及电力系统技术领域,尤其涉及一种基于分层强化学习的电动汽车充电场站协同调峰方法,该方法包括以下步骤:S1、定义充电桩的状态、充电等待车位的状态、等待车位的联合状态,根据服务电价制定单元及充电功率控制单元制定系统运...
- 唐昊方道宏李端超王正风王吉文王海伟
- 基于IDE-FLANN方法的六维力传感器动态建模研究
- 2020年
- 针对六维力传感器动态建模问题,提出了一种改进差分进化算法结合函数连接型神经网络(IDE-FLANN)的动态建模方法,该方法在继承了函数连接型神经网络(FLANN)特殊结构的基础上,进一步发展了差分进化算法(DE)的寻优建模能力,具有结构巧妙、建模能力强的特点。实验结果表明:该方法可以有效克服FLANN方法易于陷入局部最优值的缺陷,与常用建模方法相比,该方法具有建模速度快、精度高、鲁棒性强的优点。
- 汪正全唐昊孙玉香高理富曹会彬
- 关键词:六维力传感器动态建模差分进化
- 一种考虑前视距离的相容工件族的优化控制方法
- 本发明公开了一种考虑前视距离的相容工件族的优化控制方法,包括:1通过强化学习算法得到最优Q值表;2在第k+g个决策时刻,根据观察到的系统的联合状态,查找最优Q值表,得到相应的前视距离和选择加工工件族动作;3判断该决策时刻...
- 谭琦肖奕霖胡知强唐昊
- 一种基于网络架构搜索的人体运动意图识别方法
- 本发明属于生理信号处理技术领域,具体的说是一种基于网络架构搜索的人体运动意图识别方法。一种基于网络架构搜索的人体运动意图识别方法,包括以下步骤,S1、获取用于模型训练的样本数据和标签数据;S2、设定用于构建神经网络架构的...
- 唐昊王舒润王彬
- 一种基于深度强化学习的两目标单机批调度方法
- 本发明公开一种基于深度强化学习的两目标批调度方法,包括:1、给出两目标单机批调度问题模型;2、利用加权和策略将两目标单机批调度模型分解为T+1个单目标模型,并采用对分查找和二叉搜索树的思想对单目标模型的权重值进行划分,得...
- 谭琦余荣坤孙晨皓唐昊余佩遥
- 文献传递