安波 作品数:5 被引量:25 H指数:3 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家科技支撑计划 更多>> 相关领域: 自动化与计算机技术 理学 更多>>
不完美信息扩展式博弈中在线虚拟遗憾最小化 被引量:9 2014年 研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段:静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基于2种估计方法,提出在线博弈中虚拟遗憾最小化的算法,并在基于单牌扑克的实验中,与4种在线学习算法(DBBR,MCCFR-os,Q-learning,Sarsa)进行了对比.实验结果显示所提出的算法不仅对较弱对手的利用效果最好,还能在与4种对比算法的比赛中取得最高的胜率. 胡裕靖 高阳 安波关键词:不完美信息 基于威胁传播的复杂信息系统安全风险评估 被引量:7 2014年 为评估复杂信息系统安全风险,该文提出了一种基于资产间威胁传播的风险评估方法。该方法将复杂信息系统各资产间的威胁传播路径定义为一棵威胁传播树,通过计算威胁传播树中各结点的期望损失以及威胁传播树出现的概率来对整个复杂信息系统进行风险安全评估。为验证本文所提方法的正确性、可行性,该文选取了一个具有代表性的实例阐述了所提方法在复杂信息系统安全风险评估中的应用。通过实例分析表明基于威胁传播的复杂信息系统安全风险评估方法强调不同结点受到威胁作用概率的不同性,威胁在结点之间的传播性,并且能够提示在不同时间段的重点保护结点。比起传统的孤立结点分析方法更具客观性与准确性,能够很好地指导安全风险管理者为复杂信息系统制定合理的安全保护策略。 马刚 杜宇鸽 荣江 甘家瑞 史忠植 安波关键词:风险评估 资产 基于博弈论的重大公共活动安保策略设计算法 被引量:2 2017年 重大公共活动,比如大型赛事,由于其参与人数众多,影响力广泛,一直是恐怖分子的重要攻击目标.因此,重大公共活动的安保问题也是各国政府必须面对的一项难题.由于公共活动通常场地复杂,参与者多样,而安全部门可支配的安保资源有限,如何最大限度地利用有限的资源保障活动安全进行成为了一项极具挑战的任务.本文以博弈模型来描述重大公共活动的安保问题,该模型既考虑了公共活动本身人流量与时间相关的特点,也考虑了安全部门与潜在的恐怖分子的复杂的策略空间.基于此模型,本文研究了安保资源转移时间可忽略与转移时间不可忽略两种情况,并分别提出算法SCOUT-A(Scheduling seCurity res Ources in pUblic evenTs with no relocating delAy)和SCOUT-C(Scheduling seCurity resOurces in pUblic evenTs against Continuous strategy space)来求解安保部门的最优策略.实验证明,本文提出的算法比已有的算法为安保部门带来更好的收益. 殷越 安波 史忠植关键词:博弈论 多智能体 基于威胁传播采样的复杂信息系统风险评估 被引量:7 2015年 互联网时代的信息安全已成为全社会关注的问题之一.信息系统是信息的载体,为有效评估大规模分布式复杂信息系统的风险,构建了一种基于威胁传播采样的复杂信息系统风险评估方法.该方法考虑到威胁在复杂信息系统中传播时,对资产结点的转移状态以及资产结点发出的威胁传播边进行采样来生成威胁传播树(threat propagation trees,TPT),然后通过计算威胁传播树中各资产结点的期望损失以及威胁传播树的概率来对整个复杂信息系统进行风险评估.实验分析表明,基于威胁传播采样的复杂信息系统风险评估方法,在生成威胁传播树时具有高效的时间效率,能够对复杂信息系统进行客观准确的风险评估,且在对复杂信息系统资产结点制定安全防护策略时,能够为安全风险管理者提供较为合理的安全指导建议. 马刚 杜宇鸽 安波 张博 王伟 史忠植关键词:风险评估 智能体博弈安全理论及其应用 博弈论(game theory),有时也称为对策论,主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。在多智能体行为中,参加竞争的各方各自具有不同的目标或利益,为了达到各自的目标和利益... 史忠植 安波