王波涛
- 作品数:12 被引量:43H指数:2
- 供职机构:东北大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术航空宇航科学技术更多>>
- PCPIR-V:基于Spark的并行隐私保护近邻查询算法被引量:2
- 2016年
- 针对面向大数据的隐私保护查询效率低问题,利用CPIR保护程度高,实现了基于Spark的并行CPIR空间近邻查询隐私保护算法PCPIR-V,提出了基于Row和Bit的并行策略,同时提出并实现了基于聚类的PCPIR-V的缓存优化技术。利用均匀分布、高斯分布和真实数据对PCPIR-V进行了测试验证,在40个核心范围内,PCPIR-V具有良好的扩展性,PCPIR-V缓存优化技术计算时间与朴素PCPIR-V时间相比,平均减少了20%。
- 邓诗卓姚继涛王波涛陈月梅袁野李艳辉王国仁
- 关键词:SPARK基于位置服务
- 基于区域覆盖的移动对象索引的设计与实现
- 对移动对象索引频繁更新问题进行了研究,提出了一种基于区域覆盖的空间索引结构虚拟网格四分树(VGQ),通过索引移动对象所在的区域而非移动对象本身来减少由于移动对象位置改变引起的索引结构的改变,并给出了近似连续范围查询算法及...
- 王波涛陈贺马俊喜连川优王国仁
- 关键词:空间索引虚拟网格查询算法
- 文献传递
- 基于Storm的连续范围查询优化技术被引量:1
- 2017年
- 移动大数据环境下,传统基于位置服务LBS技术面临来自系统扩展性、性能等方面的挑战。首先针对LBS应用的特点,提出了基于Storm的查询框架。然后结合基于Storm的LBS查询框架,设计并实现了并行连续范围查询算法,优化查询性能。针对分布式环境中的一致性问题,设计使用基于ZooKeeper的分布式锁服务,保证查询结果的正确性。进一步,针对基于Storm并行连续范围查询算法中存在访问数据库开销较大的问题,提出了基于TimeCacheMap的缓存优化算法及两种缓存策略,减少了访问数据库的开销,提高了查询效率。
- 王波涛赵凯利常立东李睿黄山李静李响
- 关键词:TWITTERSTORM并行查询处理优化技术
- 分组移动对象的区域偏离监视算法
- 2010年
- 以大量可分组移动对象的区域偏离监视问题为研究背景,扩展了基于区域覆盖的空间索引结构——虚拟网格四分树,提出了一种新的索引结构VGQ_G。基于VGQ_G,实现了区域偏离监视算法RDMA;给出了监视算法的性能对比实验。实验结果表明,在移动对象数量足够大的时候,设计的监视算法比朴素的监视算法在响应时间上提高了一个数量级。
- 李佳佳王波涛陈东喜连川优王国仁
- 关键词:空间索引
- 非结构化数据管理关键技术及应用
- 王国仁王波涛孙永佼赵大哲周勇赵相国杨金柱张峰刘庆利
- 随着大数据时代的到来,非结构化数据管理技术在国民经济各领域的应用需求日益突出,根据权威部门预测,非结构化数据应用具有近万亿美元市场规模。虽然与国外相比,国内大数据市场起步较晚,且存在非结构化数据管理核心技术缺乏等问题,但...
- 关键词:
- 关键词:数据管理非结构化数据
- 动态的分布式环境下Top-k查询计算
- 分布式Top-k查询计算在多媒体近似匹配、网络监控、文档检索和Web数据搜索等技术中具有重要意义.分析分布式Top-k查询计算算法性能的重要标准是网络延迟和带宽消耗.早期的算法主要研究在集中式的环境中,提供有效地处理分布...
- 王斌杨晓春王国仁王波涛
- 关键词:TOP-K直方图BLOOMFILTER分布式环境
- 文献传递
- 动态的分布式环境下Top-k查询计算被引量:1
- 2007年
- 分布式Top-k查询计算在多媒体近似匹配、网络监控、文档检索和Web数据搜索等技术中具有重要意义.分析分布式Top-k查询计算算法性能的重要标准是网络延迟和带宽消耗.早期的算法主要研究在集中式的环境中,提供有效地处理分布式Top-k查询计算.然而,在动态的、分布式环境中,这些方法还显得不够成熟.因此,提出了一种在网络查询过程中建立的树形拓扑结构,利用直方图统计信息和Bloomfilter数据压缩技术,有效地执行局部优化,及在中间节点(peer)进行部分结果的合并,最终得到全局处理的Top-k查询计算方法(称做TTC算法).这种算法不仅降低了网络延迟,有效地支持动态变化的分布式环境,而且减少网络带宽的消耗.实验结果表明,TTC算法在全局带宽的消耗和网络的响应时间上效果非常显著.
- 王斌杨晓春王国仁王波涛
- 关键词:TOP-K直方图BLOOMFILTER分布式环境
- 基于区域覆盖的移动对象索引的设计与实现
- 对移动对象索引频繁更新问题进行了研究,提出了一种基于区域覆盖的空间索引结构虚拟网格四分树(VGQ),通过索引移动对象所在的区域而非移动对象本身来减少由于移动对象位置改变引起的索引结构的改变,并给出了近似连续范围查询算法及...
- 王波涛陈贺马俊喜连川优王国仁
- 关键词:空间索引
- 文献传递
- MapReduce优化技术综述被引量:31
- 2013年
- 作为一种处理大数据的并行编程模型,MapReduce由于其良好的可扩展性、可用性、容错性,得到了学术界和工业界的关注。针对MapReduce在应用领域中的不足,已经存在大量的优化技术。介绍了MapReduce框架,比较了现存的MapReduce列存储、索引、连接、迭代计算、科学计算及调度算法方面的优化技术,分析了MapReduce技术研究的挑战性问题,指出了未来研究方向。
- 黄山王波涛王国仁于戈李佳佳
- 关键词:MAPREDUCE索引迭代调度算法
- 不确定移动对象的查询处理技术研究综述被引量:4
- 2013年
- 由于数据采集设备不精确,移动对象延迟更新和隐私保护等原因,移动对象的不确定性普遍存在。在传统数据库中增加概率维,使得对象表达、查询定义、查询处理以及最终结果的呈现,都与传统方法不同,基于确定数据的移动对象查询处理技术无法进行有效处理。因此,基于不确定对象的查询处理技术受到越来越多的关注,成为当前数据库领域的研究热点问题之一。讨论了不确定对象查询面临的挑战;从查询定义、剪枝策略和算法等角度,分别对基于不确定移动对象的范围查询、最近邻查询、反最近邻查询和轨迹查询的研究现状进行了详细的介绍和对比;探讨了今后的研究重点和发展趋势。
- 李佳佳王波涛王国仁黄山
- 关键词:不确定数据范围查询最近邻查询反最近邻查询