您的位置: 专家智库 > >

姜琨

作品数:7 被引量:12H指数:3
供职机构:国防科学技术大学计算机学院更多>>
发文基金:国家自然科学基金湖南省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇期刊文章
  • 2篇学位论文

领域

  • 6篇自动化与计算...

主题

  • 6篇索引
  • 5篇倒排索引
  • 5篇引擎
  • 5篇搜索
  • 5篇搜索引擎
  • 3篇查询
  • 2篇索引结构
  • 2篇查询处理
  • 1篇对齐
  • 1篇隧道技术
  • 1篇索引压缩
  • 1篇爬虫
  • 1篇去噪
  • 1篇主题爬虫
  • 1篇主题漂移
  • 1篇主题搜索
  • 1篇主题搜索引擎
  • 1篇阈值
  • 1篇网页
  • 1篇网页去噪

机构

  • 6篇国防科学技术...
  • 2篇西安交通大学
  • 1篇西安理工大学
  • 1篇西北核技术研...

作者

  • 6篇姜琨
  • 4篇杨岳湘
  • 3篇宋省身
  • 2篇江宇
  • 1篇林俊鸿
  • 1篇江宇

传媒

  • 1篇计算机应用研...
  • 1篇小型微型计算...
  • 1篇中文信息学报
  • 1篇计算机工程与...

年份

  • 1篇2020
  • 2篇2017
  • 2篇2015
  • 1篇2011
7 条 记 录,以下是 1-6
排序方式:
倒排索引查询处理技术被引量:5
2015年
介绍索引系统的基本结构以及经典查询处理方式DAAT和TAAT,给出在AND和OR两种布尔查询下的查询处理算法实现细节。分析结果表明,在海量索引规模查询的情况下,DAAT索引遍历方式要优于TAAT索引遍历方式,OR查询和AND查询的性能差距进一步加大,基于TREC WT2G和GOV2的多组实验验证了分析的结论。指出下一步在海量索引规模下搜索引擎查询处理研究的方向。
林俊鸿姜琨杨岳湘
关键词:搜索引擎倒排索引查询处理
倒排索引压缩算法研究综述被引量:3
2020年
不断增长的互联网网页信息和成千上万的用户查询请求给搜索引擎的索引更新和查询访问带来了前所未有的实时性挑战.高效的索引压缩算法能够降低索引数据的存储和传输开销,加快处理器对索引数据的处理速度,因此能直接影响搜索引擎系统的查询性能.首先,概述了倒排索引中倒排链表所包含的d-gap和freq整数序列的存储结构,并依据压缩码字的对齐方式对倒排索引压缩算法进行分类;其次,详细阐述了当前流行的字对齐压缩算法,并总结了Simple、Frame of Reference(FOR)、Optimized Chunk Splitting(OCS)等几类典型的倒排索引压缩算法;之后,综述了倒排索引压缩算法的SIM D并行化研究,即采用SIMD指令集中Shuffle数据置换和垂直布局存储来加速算法对d-gap整数序列的并行处理性能.然后,针对压缩倒排索引的随机访问问题,综述了通常采用的自索引技术和原始序列压缩算法两种策略.最后,对倒排索引压缩算法在搜索引擎系统中的应用进行了分析和总结并对未来倒排索引压缩算法可能的研究方向进行了探讨和展望.
姜琨姜琨宋省身宋省身
关键词:搜索引擎
主题搜索引擎中的爬取技术研究
随着互联网的迅速发展,网络资源的信息量也急剧增长。人们发现使用普通搜索引擎搜索主题信息的及时性和准确性越来越不理想。主题搜索引擎由于只采集与某一特定领域相关的信息,以构筑某一主题的Web信息资源库为目标,因而具有很高的实...
姜琨
关键词:主题爬虫网页去噪主题漂移隧道技术
文献传递
倒排链表多层自索引结构的分析与设计
2017年
在大型搜索引擎的查询处理过程中,对索引文件的顺序遍历将导致响应时间过长,自索引结构能够有效解决上述问题。为了进一步缩短查询时间,通过对当前索引文件自索引结构的分析,设计了倒排链表的多层自索引结构。此结构以定长元组为单位,使用迭代的方法提取数据段同步点形成上层自索引;在此基础上,实现了索引压缩与查询系统。基于TREC GOV2数据集的测试结果表明,该系统的各项性能指标均优于不采用自索引结构的查询系统,在不影响结果精度的情况下使检索效率得到大幅提升。
江宇姜琨宋省身杨岳湘
关键词:搜索引擎倒排索引
基于阈值的快速启动Top-k查询处理算法
2017年
Top-k查询是搜索引擎领域广泛应用的技术之一,该算法从海量数据中返回最符合用户需求的前k个结果,在执行时能避免对大部分无关文档的打分处理。Top-k查询虽然极大提升了查询性能,但其存在的慢启动问题并未得到有效解决。为此,该文首先提取倒排索引的静态Top-k信息,再动态计算针对具体查询词项的初始阈值,在此基础上,结合MaxScore和WAND算法,提出了快速启动的Top-k查询处理算法。实验结果表明,该方法能够有效解决上述问题,具有良好的性能。
江宇江宇宋省身杨岳湘
关键词:倒排索引
搜索引擎中的索引压缩和查询问题研究
随着互联网技术的飞速发展和互联网应用的不断普及,互联网资源成为当前规模最大、内容最丰富、使用最广泛的信息来源。为了有效地从这些海量数据中检索到需要的信息,搜索引擎已经成为向用户提供快速资源定位的最好技术手段。然而,不断增...
姜琨
关键词:搜索引擎倒排索引查询性能
共1页<1>
聚类工具0