高阳
- 作品数:1 被引量:1H指数:1
- 供职机构:中国人民大学信息学院更多>>
- 相关领域:自动化与计算机技术更多>>
- FusionDB:基于分布式查询引擎和HDFS的SPARQL查询处理系统被引量:1
- 2015年
- 近年来,互联网上的RDF三元组数量增长迅速,传统的单机SPARQL查询处理技术已不能满足实际需要.现有的分布式SPARQL查询处理系统可以分为2类,基于Hadoop的,或是基于数据库集群的.前者主要采用Map?Reduce来处理查询,效率较低;后者则继承了传统数据库集群的缺陷,可扩展性较差.提出一个新颖的SPARQL查询处理系统FusionDB.该系统采用分布式查询处理引擎和HDFS,这样既可以受益于传统的分布式数据库技术,如分布式连接、流水线、负载均衡等,又从新兴的Hadoop技术中得到了良好的容错能力和高可扩展性.为了进一步加速查询处理的效率,FusionDB还在HDFS文件上增加了注入式索引.实验表明,相比于传统的系统,FusionDB在性能上具有明显的优势.
- 高阳何龙侯佳佳陈晋川杜小勇
- 关键词:SPARQL查询重写HDFS索引