郝强
- 作品数:1 被引量:3H指数:1
- 供职机构:北京邮电大学计算机学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于SolrCloud的网络百科检索服务的实现被引量:3
- 2015年
- 网络百科是一部在线百科全书,为用户提供了资源丰富、内容详实的网络查询工具。网络百科检索服务是基于Solr Cloud搭建的检索平台,服务部署在集群上,具有集中式的信息配置、自动容错、近实时搜索和查询时自动负载均衡的特点。本文介绍了Solr Cloud平台的搭建方案,结合数据特点设计了索引结构,增加了中文分词器和中文词表,提高了在创建索引和检索索引过程中的中文分词效果。在Solr Cloud平台基础上,本文根据搜索引擎原理提出了搜索引擎优化方案,进一步提升了搜索效果。通过在创建索引时对关键字段设置多颗粒度分词模式,在检索索引时对不同颗粒度分词设置不同的权重,提高检索效果;通过挖掘数据内在的引用关系为文档质量评分,提高优质文档在搜索结果中的排名。实验数据表明,优化方法对网络百科检索服务效果有很大的提升。
- 郝强高占春
- 关键词:计算机软件搜索引擎优化SOLRCLOUD中文分词