北京大学工学院系统与控制研究中心
- 作品数:49 被引量:212H指数:11
- 相关作者:伏锋兰轶东欧阳华吴宝榆陈志福更多>>
- 相关机构:西安电子科技大学机电工程学院北京邮电大学理学院兰州交通大学机电工程学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术理学经济管理自然科学总论更多>>
- 时序网络控制被引量:4
- 2019年
- 近年来,网络科学的发展为探究复杂系统动力学提供了有效方法.复杂网络控制的研究,为我们通过外部输入控制系统状态的演化提供了新的思路.针对时序网络控制这一新的研究方向,文章首先介绍了其可控性方面相关研究现状.其次,文章梳理了在实现系统最优控制时所需考虑的控制能量及控制轨迹等相关研究结果.最后总结了该领域仍需解决的重要问题并展望了未来研究方向.
- 李阿明王龙
- 关键词:复杂系统
- 比利时巧克力系统的低阶控制器设计
- 本文研究了V.Blondel提出的"比利时巧克力镇定问题"。借助新近发展的不等式型定理机器证明的理论与方法,系统地给出了四阶及小于四阶双稳定控制器存在条件下参数δ的取值上界。通过对所得可镇定条件引入适当的扰动,得到的控制...
- 何冠男王龙夏壁灿郁文生
- 关键词:机器证明
- 文献传递
- 群体动力学与协调控制
- 本文从系统与控制的角度讨论当前群体动力学与协调控制研究中的基本问题,评述文献中常见的群体系统模型,分析群体系统的动态行为和系统关联拓扑结构之间的关系,时变拓扑与连通性、通信时滞、以及外部作用的影响等。给出在非对称耦合、时...
- 楚天广陈志福王龙谢广明
- 关键词:协调控制
- 文献传递
- 多智能体协调控制的演化博弈方法被引量:18
- 2016年
- 提出一种基于演化博弈理论的多智能体系统协调控制方法.在所建立的数学模型框架中智能体根据其自身的利益,通过局部交互,在博弈竞争中学习,自主调整其行为.根据系统整体性能的要求,通过选择合适的博弈类型、设计适宜的收益计算方法、更新进化规则等,实现对多智能体系统的控制.在演化过程中,无需指定某些特定个体的具体动力学行为,只需通过种群的自适应进化即可实现整体目标.以分工合作问题为例,详细解析所提出的控制方法,通过理论分析和仿真验证该方法可以实现多智能体系统的自适应协调控制.
- 王龙杜金铭
- 关键词:演化博弈理论多智能体系统
- 多智能体系统的性能优化被引量:6
- 2015年
- 探讨多智能体系统的性能优化及相关问题.多智能体系统性能优化问题是指给定性能评价指标,设计分布式协议或者在某类分布式协议下优化通信拓扑的边权重或设计通信拓扑图,使系统以最优的性能完成既定任务.按性能指标的评价对象,可将多智能体系统性能优化问题分为基于系统整体性能的优化和基于个体性能的优化.文章首先针对系统整体性能优化问题,分别介绍了多智能体系统的快速一致性问题和综合最优控制问题;并基于线性二次型最优控制理论,得到领航者——跟随者多智能体系统达到一致的最优拓扑是星拓扑.其次,对个体性能优化问题,介绍了利用博弈论研究这一问题的相关成果;并基于零和博弈,得到存在两个竞争性领航者的多智能体系统最优拓扑的判别条件.最后,对这一领域的未来发展趋势做出了一些展望.
- 马婧瑛郑元世王龙
- 关键词:多智能体系统最优控制博弈
- 演化动力学与合作复杂性
- 阐述了复杂系统与复杂网络研究的基本背景,指出演化博弈论是复杂系统研究的一个新方向,介绍了演化博弈论的基本概念和常用模型方法,着重探讨了自组织合作涌现的演化机制,总结展望了演化博弈论的未来的一些发展方向。
- 王龙伏锋
- 关键词:复杂系统复杂网络囚徒困境
- 文献传递
- 单饱和输入下二阶控制系统零解全局渐近稳定的充分条件被引量:5
- 2002年
- 分析了单饱和输入下控制系统的相空间分布规律并给出了具体的饱和输入下非线性控制系统的空间结构 .通过给出的空间结构与饱和输入下非线性控制系统的关系定义了不同于一般意义下的非线性系统的平衡点 ,并且对新平衡点进行了分类 .在此基础上 ,给出了二阶单饱和输入下控制系统零解全局渐近稳定的充分条件 ,同时也给出了二阶单饱和输入下控制系统闭合轨迹存在与否的判别条件 .
- 郭树理黄琳
- 关键词:零解全局渐近稳定
- 复杂动态网络上的传播行为分析 献给清华大学郑大钟教授被引量:9
- 2020年
- 随着网络科学的兴起,网络上的传播动力学引起了控制论、博弈论、系统科学、人工智能、社会学、经济学、生物学、心理学、物理学、数学和计算机科学等领域的共同关注.虽然网络上的不同传播行为具有各自的传播规律,但其传播特征总是依赖于网络结构.在实际的复杂网络化系统中,个体间的交互范围不断变化,因此,理解复杂动态网络上的传播行为需要考虑传播动力学与网络演化动力学的耦合.针对当前动态网络上的传播动力学研究主要采用Monte Carlo仿真、缺乏系统理论方法的问题,我们提出随机网络拓扑更新规则,证明该规则为可逆Markov链,并给出其稳态分布,从理论上分析动态网络上的传播动力学.利用该方法,本文以合作演化、疾病传播、疫苗接种为例,给出传播行为分析,揭示动态网络上的演化博弈策略传播行为与疾病传播行为的共性与区别,有望为复杂动态网络上的传播动力学分析提供统一的理论框架.
- 王龙武斌杜金铭魏钰婷周达
- 关键词:动态网络
- 线性系统同时镇定中广义香槟问题的解
- 2007年
- 利用复分析理论,结合Blondel的方法,对线性系统同时镇定中著名的广义香槟问题给出理论上的解答,完整地回答了Patel等人文中的未解决问题,自然包含原香槟问题的解,结合杨路等人新近发展的不等式型定理机器证明理论,给出控制器的设计方法,得到的数值例子明显改进了已有文献中的结果.
- 关强王龙夏壁灿杨路郁文生曾振柄
- 关键词:复分析机器证明
- 线性二次二人Stackelberg博弈均衡点求解:一种Q学习方法
- 2022年
- 近年来,Stackelberg博弈被广泛用于解决信息物理系统安全控制、智能电网能源管理等问题.已有的Stackelberg均衡点求解方法大多需要已知系统模型信息,而在实际应用中模型信息通常难以精确获取,这在一定程度上限制了相关理论研究成果的应用.鉴于此,本文研究了不基于系统模型的Stackelberg博弈均衡点的求解方法.具体地,本文考虑线性二次二人Stackelberg博弈,其中博弈状态演化满足线性方程,且成本函数为二次形式.博弈的两个参与者为能够预测另一个体可能响应的个体(即领导者),和根据领导者策略作出最优响应的个体(即跟随者).因为本文考虑线性形式的状态演化和二次形式的成本函数,且领导者先于跟随者采取行动,故领导者和跟随者的决策问题可建模为两层的线性二次型最优控制问题.本文按照从跟随者到领导者的原则,基于动态规划原理推导出最优控制策略.该策略被证明恰好为Stackelberg均衡策略,但其计算需使用系统模型信息.基于此策略,本文提出一种基于执行器–评价器(actor-critic)结构的Q学习算法,解决了系统动力学模型未知情况下线性二次二人Stackelberg博弈均衡点求解问题.此外,本文理论证明了所提算法能够保证系统状态、执行网络和评价网络权重估计误差一致最终有界,并通过数值仿真实验说明基于Q学习算法所得控制策略能够使系统状态稳定,且估计控制策略下的成本函数偏离均衡策略下的成本函数的幅度较小.
- 李曼秦家虎王龙
- 关键词:最优控制Q学习