宋天恒
- 作品数:8 被引量:0H指数:0
- 供职机构:北京化工大学更多>>
- 发文基金:国家自然科学基金北京市优秀人才培养资助国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术轻工技术与工程化学工程更多>>
- 一种基于模糊控制的再生水厂化学除磷药剂投加量方法
- 本发明涉及一种新型的实用的城市再生水厂除磷加药前馈反馈控制方法,所提出的控制方法以除磷加药模型为基础构造前馈控制环节,并将出口磷含量、进水流量和进口磷含量作为模糊系统的输入,输出控制量补偿值。补偿值的引入使得系统具有一定...
- 李大字李论通宋天恒
- 文献传递
- 强化学习问题中的正则化最小二乘策略评价算法的研究
- 策略评价和学习控制是强化学习问题中两大主要任务。其中策略评价过程是指在给定策略下,对特定起始状态之后可获得的未来奖赏折扣和的期望值做出估计。近年来,许多基于时域差分和值函数逼近的改进策略评价算法被提出,改进的内容包括提高...
- 宋天恒
- 关键词:正则化
- 文献传递
- 分布式Q学习多目标函数优化策略
- 2011年
- 将分布式Q学习算法与Pareto排序法相结合,提出了一种利用强化学习算法解决多目标优化问题的策略。该策略充分利用Q学习语句式的奖赏机制来描述问题的多重目标函数,并结合一般的Pareto排序法,在有限的迭代过程后输出可以充分接近于Pareto前沿的非支配解集。与其他智能搜索算法相比,该策略具有结构简单、无需先验知识、参数设置少的特点。测试函数优化问题验证了算法的有效性,为智能算法解决多目标优化问题提供了一种新思路。
- 宋天恒李大字高彦臣
- 关键词:Q学习算法多目标优化
- 基于交叉熵算法的无模控制器在多变量时滞系统中的应用
- 多变量时滞系统广泛存在于工业对象中,受到广泛的关注。多变量时滞系统的控制器必须同时解决多变量和时滞问题。通常用于处理多变量问题的解耦方法是建立在精确模型的基础上,但复杂工业对象难以精确建模,再加上时滞问题需要进行预估,从...
- 李大字李野宋天恒靳其兵
- 关键词:交叉熵混沌映射多变量系统
- 分批补料发酵过程多目标优化的分布式强化学习策略
- 2011年
- 发酵过程优化问题通常包含有互相冲突的多重优化目标,另外反应本身具有诸多复杂性。提出一种基于Pareto的分布式Q学习多目标策略,用以求解赖氨酸分批补料发酵过程流加速率轨迹的Pareto最优解。该策略中,Q学习算法和Pareto排序法将结合来产生非支配解集,并使之逼近真实的Pareto前沿,利用奖赏机制来描述多重目标之间的关系,并同时使用多组含有随机初始值的agent共同作用改善搜索能力。将所提出的方法应用于赖氨酸分批补料发酵过程的优化中,并与粒子群优化进行了对比,验证策略的性能。
- 李大字宋天恒靳其兵谭天伟
- 关键词:Q学习算法多目标优化
- 基于交叉熵算法的无模控制器在多变量时滞系统中的应用
- 多变量时滞系统广泛存在于工业对象中,受到广泛的关注。多变量时滞系统的控制器必须同时解决多变量和时滞问题。通常用于处理多变量问题的解耦方法是建立在精确模型的基础上,但复杂工业对象难以精确建模,再加上时滞问题需要进行预估,从...
- 李大字李野宋天恒靳其兵
- 关键词:交叉熵混沌映射多变量系统
- 文献传递
- 一种基于模糊控制的再生水厂化学除磷药剂投加量方法
- 本发明涉及一种新型的实用的城市再生水厂除磷加药前馈反馈控制方法,所提出的控制方法以除磷加药模型为基础构造前馈控制环节,并将出口磷含量、进水流量和进口磷含量作为模糊系统的输入,输出控制量补偿值。补偿值的引入使得系统具有一定...
- 李大字李论通宋天恒
- 文献传递
- 基于强化学习算法的发酵过程多目标优化
- 分批补料发酵过程的反应特点包括强非线性、时间滞后、参数时变性以及生物状态量难以实时测量等,对产物、底物和时间消耗进行直接的在线控制非常困难。因此,离线优化成为了改善各个生产指标的主要手段。另外,这种复杂的优化包含有多个不...
- 宋天恒
- 关键词:分批补料发酵过程多目标优化强化学习算法