搜索到2034篇“ 倒排索引“的相关文章
一种基于倒排索引的实时内存检索的性能优化系统
本发明的技术方案提供了一种基于倒排索引的实时内存检索的性能优化系统。采用本发明所公开的技术方案后,在高频率的写操作的业务中,在1亿条数据量的情况下下多字段组合查询(OR和AND),接口的平均响应时间在10ms以下。本发明...
张伟简梦雯王勇波
一种数据库中集成倒排索引的方法、系统和介质
本申请涉及一种数据库中集成倒排索引的方法、系统和介质,其中,该方法包括:对于预设数据库中的每一个Level File数据分区分别设置对应的倒排索引;在预设数据库的内存缓冲区的数据被写入Level File数据分区的过程中...
朱启伟
基于数据库倒排索引的北斗网格空间索引方法和装置
本公开实施例提供一种基于数据库倒排索引的北斗网格空间索引方法和装置,所述方法包括:获取目标查询范围,确定所述目标查询范围对应的北斗网格集合;对所述北斗网格集合中的每一个北斗网格,基于GIN倒排索引,在关系型数据库中确定该...
杨光辉张建学王焰辉张敬亮
向量数据库的倒排索引构建方法与相关产品
本发明提供了一种向量数据库的倒排索引构建方法与相关产品,其中上述方法包括:构建倒排索引,其至少包括:对各向量进行聚类以得到设定数量个聚类簇;判断所述向量数据库中的向量是否发生变化;若是,则获取构建所述倒排索引之后的向量变...
韦丹妮王建华
可调倒排索引
示例方法和系统针对倒排索引。根据一些示例,倒排索引是基于源数据和排放列表阈值来生成的。倒排索引包括一个或多个受限排放列表。每个受限排放列表具有对应于排放列表阈值的最大尺寸。该方法可以包括接收搜索查询,该搜索查询包括标识一...
T·莱格勒
基于CRF的分区倒排索引压缩算法
2024年
倒排索引是大型搜索引擎的核心数据结构,本质是倒排列表中整数序列的集合。倒排索引压缩可以有效减少倒排索引所占空间,提高对关键词的检索效率。本文提出的基于条件随机场(CRF)的分区倒排索引压缩算法主要关注域值分区的分区方式。该算法对序列进行预分区,并且使用条件随机场对预分区进行标注并重组,有效减少了压缩时间。根据分区类型,该算法使用相应的编码方式,进一步减少了压缩后的空间占用。与其他倒排索引压缩算法进行对比实验分析,结果表明本文算法在压缩率上超过目前一些域值分区的算法,并且在解压时间上与其他域值分区算法相当。该算法在时间和空间上取得了较好的平衡。
王子琛瞿有利
关键词:倒排索引数据压缩条件随机场搜索引擎
基于倒排索引的正则路径查询算法被引量:1
2024年
对于图数据上的正则路径查询(regular path query, RPQ)问题,其使用正则表达式定义图中两个节点之间的约束。针对现有的RPQ在图上遍历匹配方法效率低下这一问题,提出一种基于倒排索引的RPQ算法,在图上构建标签的倒排索引,匹配过程中快速检索标签的相应倒排列表。设计的IRPQ算法将查询转化为面向倒排列表的查询计划树,经过优化以减少冗余列表合并操作。在真实数据集上进行了实验,其结果表明,IRPQ及其优化算法相比现有方法显著提高了查询性能。
夏秀峰孙翔天孙尧邓国鹏朱康邱涛
关键词:倒排索引
一种基于倒排索引的相似文本获取方法
本发明公开一种基于倒排索引的相似文本获取方法,对已有文本建立倒排索引,主要包括文档预处理、构建单词词典、构建倒排列表以及构建倒排索引过程;输入待查询文本,经过预处理后,得到查询词项列表,然后根据BM25计算公式分别计算每...
费涛包兴王迪沈红马凯强于梓洋孙长中
一种倒排索引的优化方法、装置及电子设备
本发明公开了一种倒排索引的优化方法、装置及电子设备,该方法包括:基于倒排链中的文档编号对词语进行排序;基于词语排序和所述倒排链构建词语和文档的二维空间;在所述二维空间中,获取坐标点的密集度大于或等于区间阈值的高密度块;获...
刘伟李京昊谢远江许静芳
基于HBase数据库的倒排索引混合压缩方法
本发明涉及基于HBase数据库的倒排索引混合压缩方法,首先对倒排索引数据进行分块处理,将索引按照一定的规则划分为多个块。然后,对每个块进行压缩处理,采用不同的压缩算法对不同类型的数据进行压缩。通过对不同类型的数据采用不同...
陈东亮杜秀龙李亚辉陈磊田国言韩强

相关作者

刘晓光
作品数:128被引量:133H指数:5
供职机构:南开大学
研究主题:磁盘阵列 重复数据删除 RAID 网络存储系统 倒排索引
王伟平
作品数:263被引量:597H指数:14
供职机构:中国科学院信息工程研究所
研究主题:数据流 文本 电子装置 网络 客户端
杨建武
作品数:179被引量:0H指数:0
供职机构:北京大学
研究主题:文档 网页 抽取 句子 文本
杨育彬
作品数:163被引量:549H指数:12
供职机构:南京大学
研究主题:图像 特征提取 图像超分辨率 图像分类方法 图像检索
王刚
作品数:164被引量:183H指数:7
供职机构:南开大学
研究主题:磁盘阵列 快照 网络存储系统 网络存储 重复数据删除