国家自然科学基金(90920303)
- 作品数:3 被引量:58H指数:2
- 相关作者:叶振超沈春辉魏宝刚杜晨阳鲁伟明更多>>
- 相关机构:浙江大学更多>>
- 发文基金:国家自然科学基金国家科技支撑计划中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于MapReduce的分布式近邻传播聚类算法被引量:54
- 2012年
- 随着信息技术迅速发展,数据规模急剧增长,大规模数据处理非常具有挑战性.许多并行算法已被提出,如基于MapReduce的分布式K平均聚类算法、分布式谱聚类算法等.近邻传播(affinity propagation,AP)聚类能克服K平均聚类算法的局限性,但是处理海量数据性能不高.为有效实现海量数据聚类,提出基于MapReduce的分布式近邻传播聚类算法——DisAP.该算法先将数据点随机划分为规模相近的子集,并行地用AP聚类算法稀疏化各子集,然后融合各子集稀疏化后的数据再次进行AP聚类,由此产生的聚类代表作为所有数据点的聚类中心.在人工合成数据、人脸图像数据、IRIS数据以及大规模数据集上的实验表明:DisAP算法对数据规模有很好的适应性,在保持AP聚类效果的同时可有效缩减聚类时间.
- 鲁伟明杜晨阳魏宝刚沈春辉叶振超
- 关键词:近邻传播聚类分布式计算MAPREDUCE数据划分聚类融合
- 空间约束特征组合与选择的中国剪纸识别被引量:1
- 2011年
- 针对中国剪纸识别中存在底层形状特征难以表达高层语义这一"语义鸿沟"问题,提出基于空间约束特征组合与选择的中国剪纸分类识别方法.首先结合空间金字塔模型和上下文相关直方图提取剪纸形状特征,从而得到具有空间信息底层特征;然后通过AdaBoost对所提取的形状特征进行组合和选择,以进一步获取剪纸图像的区别性特征;最终实现剪纸图像的识别.
- 邵健王霏
- 关键词:ADABOOST
- SSH:基于稀疏谱哈希的图像索引
- 针对图像数据高维特性所产生的相似度计算困难问题,本文在传统谱哈希(spectral hashing)图像索引方法基础上,引入稀疏主成份算法求取图像视觉单词降维后内嵌子空间,使得图像高维索引结果全局可解释,这一方法被称为稀...
- 张啸邵健吴飞庄越挺
- 关键词:哈希索引
- 文献传递
- 基于稀疏非负矩阵分解的图像检索
- 社会化标签日益流行,用户可在不同网站标注不同媒体,如在Flickr标注图片。不同网站的标注信息可视为不同来源数据集。用户所加标签受噪音、歧义性和主观性等影响而难以反映被标注对象的全部内容,因此对用户标注进行处理成为一个热...
- 马帅吴飞杨易邵健
- 关键词:图像检索
- 文献传递