张广庆
- 作品数:2 被引量:10H指数:2
- 供职机构:国防科技大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于Simhash的海量相似文档快速搜索优化方法被引量:7
- 2015年
- 相似文档搜索指检索与给定查询文档相似的文档,在大数据处理中具有广泛的应用,如近似网页检测、新闻报道聚合以及抄袭检测等。为实现海量相似文档的快速搜索,可采用Simhash指纹方法将文档映射成二进制指纹,以海明距离表达文档相似度,并通过指纹分段建立索引提高计算效率。针对传统方法在指纹分段过程中大量冗余计算影响到计算效率的问题,提出了基于顺序匹配的候选集筛选方法,以减少指纹相似性计算量和网络带宽消耗,实现快速搜索。试验表明,该方法具有较好的性能和可扩展性。
- 张广庆葛唯益贺成龙
- 基于Spark平台的海量电子对抗数据分析被引量:3
- 2015年
- 海量电子对抗(简称电抗)数据分析是雷达辐射源识别领域的一个难点问题。采用Spark平台对海量电抗数据进行分析挖掘,分析了海量电抗数据在HBase数据库中的分布式存储,以及Spark平台基本程序框架和数据处理方式,探索了海量电抗数据的分析和挖掘方法。仿真试验表明,Spark平台能够高效处理海量电抗数据,具有良好的稳定性。
- 李霄贺成龙张广庆徐欣
- 关键词:电子对抗海量数据数据分析