何洪德
- 作品数:3 被引量:1H指数:1
- 供职机构:西安科技大学计算机科学与技术学院更多>>
- 发文基金:陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于分布式的频繁闭合模式挖掘算法
- 2012年
- 为提高数据挖掘效率,提出了一种基于分布式的频繁闭合模式挖掘算法——PFCI-Miner.该算法采用任务分布的主从方式,其中主处理器通过发送提出的前缀路径表(PrePthx)将挖掘任务合理划分,而从处理器借助提出的存储树(Trac-tree)挖掘局部频繁闭合模式,最后由主处理器挖掘出全局频繁闭合模式.此外,采用星形拓扑结构,使数据通信只存在于主处理器与从处理器之间,而各从处理器之间无数据通信且不需要同步.在由3台PC机构成的分布式环境下,对合成与蘑菇数据集的实验表明,PFCI-Miner较DP-FP算法、AFCIM算法和DFCIM算法的执行效率分别平均提高了43.66%、42.17%、53.48%和51.86%、47.62%、62.78%.
- 杨君锐张敏何洪德
- 关键词:关联规则数据挖掘频繁闭合模式
- 关联规则挖掘算法的研究
- 数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。关联规则挖掘是数据挖掘研究领域中的一个重要分支,其主要是研究和发现实际应用中数...
- 何洪德
- 关键词:数据库理论频繁模式树
- 分布式全局最大频繁项集挖掘算法被引量:1
- 2012年
- 提出一种分布式全局最大频繁项集挖掘算法(DMFI),该算法含局部挖掘与全局挖掘2个阶段。提出一个基于FP-tree的改进频繁模式树(IFP-tree)来存储数据信息。在局部挖掘阶段,先在各站点上分别建立该模式树,并使用有序方式存储频繁项目,然后,通过对各局部数据库的扫描,挖掘出局部最大频繁项集。在全局挖掘阶段,利用各局部数据库生成的最大频繁项集以及利用组通信播报消息的方式,从而挖掘出全局最大频繁项集的集合。对算法的实现以及在多种情况下进行测试。研究结果表明:DMFI算法具有较好的性能。
- 杨君锐何洪德杨莉李海文薛萍
- 关键词:数据挖掘关联规则分布式挖掘最大频繁项集