陈敏
- 作品数:9 被引量:28H指数:3
- 供职机构:北京科技大学经济管理学院更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于密度的并行聚类算法被引量:9
- 2010年
- 为满足大规模空间数据库的聚类需求,面向计算机集群,提出一种基于密度的并行聚类算法。该算法根据数据库分布特征进行数据分区,在每一个节点上对数据块并行聚类,在主节点上合并聚类结果。实验结果表明,该算法的计算速度随着节点数的增多呈线性增加,具有较好的延展性。
- 陈敏高学东栾绍峻郗玉平
- 关键词:并行聚类计算机集群数据库延展性
- 基于排序思想的高维稀疏数据聚类被引量:2
- 2010年
- 针对CABOSFV聚类算法对数据输入顺序的敏感性问题,提出融合排序思想的高属性维稀疏数据聚类算法,通过计算首次聚类中两两高属性维稀疏数据非零属性取值情况确定所需要计算差异度的集合组合,减小了算法复杂度。应用结果表明,该方法能提高CABOSFV聚类的质量。
- 祝琴高学东武森陈敏陈华
- 关键词:排序
- 基于Vague集的时间序列聚类算法
- 2010年
- 在区间值时间序列的基础上,重点讨论了区间值时间序列的聚类算法。对于区间个数相等的Vague集,提出了Vague集之间的相似度量。分析了传统模糊聚类方法,特别是基于模糊等价矩阵的聚类方法和编网法聚类方法的不足,根据编网法的思想,设计了区间值时间序列Vague集聚类快速算法,降低了计算复杂度。
- 栾绍峻陈敏崔巍
- 关键词:相似度量VAGUE集聚类算法
- 并行DBSCAN聚类算法被引量:1
- 2010年
- 本文针对DBSCAN算法在计算速度方面的瓶颈,提出了一种新的基于内存的并行DBSCAN算法:合理划分数据库,各个处理器并行聚类,之后合并聚类结果,可以达到很好的聚类结果效果和计算效率。通过对一台双核计算机的实验,发现实验速度可以提高50%左右。
- 陈敏高学东
- 关键词:聚类DBSCAN算法
- 时间序列周期模式挖掘的周期检测方法被引量:7
- 2009年
- 周期是时间序列的重要特征之一,用于精确描述时间序列并预测其发展趋势。在现有周期模式挖掘算法中,周期长度由用户事先定义,忽略了噪声的存在。在ERP度量和时间弯曲算法的基础上,提出一种新的周期长度检测方法。该方法可以在时间轴上实现弯曲,包括延伸和平移。它受噪声干扰的影响较小,实验结果表明其性能优于原有周期检测算法。
- 王阅高学东武森陈敏
- 关键词:时间序列数据挖掘动态时间弯曲
- 一种新的并行聚类算法
- 为了进一步提高计算效率,提出一种面向计算机集群的并行聚类算法。首先合理划分数据块,之后由集群中的节点并行聚类,最后合并聚类结果。这期间采用动态负载平衡和异构的通讯方式。实验证明该并行算法不仅能得到正确的聚类结果,并能够大...
- 陈敏郗玉平
- 关键词:计算机集群并行聚类算法聚类结果
- 文献传递
- 集群系统中的FP-Growth并行算法被引量:8
- 2009年
- 针对FP-Growth算法面临大规模数据库时空效率不高的问题,提出一种面向计算机集群的并行算法。采用投影方法直接寻找频繁项的条件数据库,将挖掘条件数据库的工作分化成若干独立的子任务,分配到集群中的节点上并行实现,由中央节点汇总结果并输出。结果证明,该算法不仅能够提高计算速度,解决数据库规模过大时内存溢出的情况,且具有良好的延展性。
- 陈敏李徽翡
- 关键词:FP-GROWTH算法计算机集群
- 面向计算机集群系统的FP-Growth算法的并行计算被引量:1
- 2009年
- FP-Growth是频繁模式挖掘的经典算法,能够在不产生候选集的情况下生成所有的频繁模式,效率与Apri-ori算法相比有巨大提高,然而FP-Growth算法在挖掘频繁模式过程中需要递归构建大量的条件FP-tree,并分别针对这些条件FP-tree进行挖掘,时间及空间效率不高,在实际应用中存在很大局限性。计算机集群是由多台普通计算机设备通过特定方式结合在一起构成的并行处理系统,属于分布式计算环境,具有计算能力强大、性价比高、灵活等优势。本文提出一种面向计算机集群的并行挖掘算法Gridify FP-Growth,该算法以FP-Growth为基础,通过任务划分的形式,将计算任务分配到计算机集群中各个计算节点上执行,充分利用各个节点的计算资源,最后汇总各节点的计算结果。实验证明Gridify FP-Growth算法不会牺牲计算的准确性,并可以大幅度缩短计算时间,有效缓解计算大规模数据库时的内存压力。
- 陈敏
- 关键词:并行计算计算机集群