王永剑
- 作品数:43 被引量:77H指数:6
- 供职机构:公安部第三研究所更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术航空宇航科学技术自然科学总论医药卫生更多>>
- 基于共群关系实现社交群体关系紧密性计算处理的方法、系统、装置、处理器及其存储介质
- 本发明涉及一种基于共群关系实现社交群体关系紧密性计算处理的方法,首先获取重点用户账号数据和给定的特定群账号数据,并对获取后的数据进行数据清洗得到重点用户账号集合以及特定类型群集合,并针对该获取的集合进行最大矩形面积模型初...
- 李超王永剑姚伟
- 文献传递
- 基于数据安全监管实现渗透测试处理的系统
- 本发明涉及一种基于数据安全监管实现渗透测试处理的系统,其中,所述的系统包括:设置有控制平面,所述的控制平面中包括:安全事件管理模块,用于负责收集和分析安全事件信息,并与渗透测试成果进行校验和安全告警,确保安全信息告警与渗...
- 吴跃顺刘俞林九川王永剑胡永涛赵宏伟姚伟朱彬袁梦婕张鑫李璐姚昕羽翁祎君包伊东张鹏
- 支持完整性检测的安全日志
- 2016年
- 随着大数据处理系统日趋复杂,软件错误、软件兼容性、管理失误甚至恶意入侵等导致的拜占庭故障对系统可用性影响日趋严重。拜占庭故障节点可能采用含糊行为欺骗正确节点,因此检测节点是否存在含糊行为是兼顾安全性和效率的一种有效手段。该文提出了一种支持完整性检测的安全日志Log-Keeper,通过创建完整性证据支持存在性和一致性检测,证明状态的完整性。为了支持分布式环境下的频繁检测,基于IndexTree实现了Log-Keeper,支持O(lbn)规模证据。测试表明,Log-Keeper创建的证据规模是AASL(authenticated append-only skip list)的25%~50%。
- 王永剑金波董健
- 基于网格的联邦数字图书馆被引量:5
- 2008年
- 介绍了一种联邦数字图书馆结构,它通过对网络中数字图书馆资源进行一定的服务封装形成数字图书馆资源仓储节点,在此基础上运用网格思想对仓储节点进行整合,形成数字图书馆资源联邦,使用户能够通过联邦门户透明地访问联邦中所有数据仓储节点中的图书馆数据资源。为了满足专业化、个性化数字图书馆建立的需求,联邦提供了以检索为基础的个性化数字图书馆实例的动态定制服务。
- 侯骏王永剑钱德沛白跃彬王克
- 关键词:数字图书馆网格
- 基于通联数据的人际关系网络构建与挖掘
- 2016年
- 网络通讯已然成为了信息时代最具代表性的产物,用户之间的社交关系也变得越来越清晰、越来越重要。文章通过模拟通联数据,利用中文分词、自然语言处理等技术构建反映人际关系的通联好友网络,并设计了一种适用于好友网络人际关系预测的多分类算法。该算法首先利用层次聚类对原始数据进行聚类并结合人工干预,确定最终类的个数,从而有效避免通联分组信息的多义词性造成的类别数过多的问题,然后以通联来往记录等信息为基础设计分类特征,最后利用在小样本下,具有复杂决策边界建模能力的支持向量机(Support Vector Machine,SVM)进行训练,得到适用于人际关系预测的分类模型,并用于未知人际关系的预测。
- 曲洋王永剑彭如香姜国庆
- 关键词:人际网络SVM
- 基于URL特征检测的违法网站识别方法被引量:8
- 2018年
- 为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽取违法网站的URL特征,从中筛选出准确率高、具有特定含义的特征作为有效的违法网站特征,并通过检测未知网站是否具有违法网站的URL特征识别出违法网站。实验结果证明,该方法能有效度量同类网站间的关联程度,结合Fast Unfolding算法能有效区分不同类型的网站。与基于URL词法特征、HTM L、语义特征的违法网站识别方法相比,其F-M easure值最高。
- 凡友荣杨涛王永剑王永剑
- 关键词:聚类
- DDGrid:一种大规模药物虚拟筛选网格
- 化合物活性筛选是创新药物研究的起点和具有决定意义的步骤,利用网格计算技术进行药物虚拟筛选能够极大提高药物筛选的有效性,同时可以大量减少新药研制的成本和时间。新药研发网格DDGrid是中国国家网格CNGrid的重要支持项目...
- 李祖华张军王永剑于坤千
- 关键词:药物筛选虚拟网络资源监控
- 文献传递
- 面向Web服务总线集成的分阶段优先级事件驱动架构
- 2009年
- 针对Web服务集成过程中分阶段事件驱动架构(SEDA)仅考虑服务集成架构的资源消耗,而对被集成的服务及由其构成的任务资源耗费考虑不足的问题,提出了分阶段优先级事件驱动架构(SPEDA).选取评价指标,通过熵权法对事件进行优先级评估,而在阶段内对优先级高的事件给予优先处理;使用非抢占式规则的排队系统构建集成任务资源消耗的数学模型,通过合理安排事件的优先等级来降低集成任务资源消耗.实验表明,SPEDA采用3个优先级别,其任务资源消耗比SEDA降低了18%,在考虑了优先级划分粒度的情况下,5个级别的集成任务资源消耗比3个级别的降低了21%.
- 吴众欣韩彪钱德沛王永剑
- 关键词:资源消耗熵权法
- 一种提供容错性保障的药物设计网格环境
- 2009年
- 针对药物虚拟筛选操作运行时间长、易出错等问题,设计并实现了药物设计网格(DDGrid),有效聚合了中国国家网格环境中闲散的资源,形成了支持高通量药物虚拟筛选的网格环境.所设计的DDGrid网格实现了基于复杂事件处理技术的有状态故障检测机制,通过持续分析节点间交互的事件流,定位可能的故障场景并触发相应的补偿操作来减少故障导致的损失,为系统提供了容错性保障.实验结果表明,有故障检测机制可以通过监测筛选任务运行情况对超时阀值进行动态调整,使得任务实际完成时间和理论完成时间之间的差值保持在10%以内,同时提高了底层计算资源的利用率.
- 王永剑任一楠陈婷黄远强于坤千栾钟治蒋华良钱德沛
- 关键词:容错复杂事件处理
- 自适应短文本关键词生成模型被引量:1
- 2022年
- 关键词抽取对文本处理影响较大,其识别的准确度及流畅程度是任务的关键。为有效缓解短文本关键词提取过程中词划分不准确、关键词与文本主题不匹配、多语言混合等难题,提出了一种基于图到序列学习模型的自适应短文本关键词生成模型ADGCN。模型采用图神经网络与注意力机制相结合的方式作为对文本信息特征提取的编码框架,针对词的位置特征和语境特征编码,解决了短文本结构不规律和词之间存在关联复杂信息的问题。同时采用了一种线性解码方案,生成了可解释的关键词。在解决问题的过程中,从某社交平台收集并公布了一个标签数据集,其包括社交平台发文文本和话题标签。实验中,从用户需求角度出发对模型结果的相关性、信息量、连贯性进行评估和分析,所提模型不仅可以生成符合短文本主题的关键词,还可以有效缓解数据扰动对模型的影响。所提模型在公开数据集KP20k上仍表现良好,具有较好的可移植性.
- 王永剑孙亚茹杨莹
- 关键词:关键词提取主题模型