朱孟杰
- 作品数:3 被引量:2H指数:1
- 供职机构:哈尔滨理工大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金黑龙江省海外学人科研资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于改进FP-树的最大项目集挖掘算法被引量:1
- 2009年
- 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FP-growth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP-树,存在时空效率不高的问题。于是结合改进的FP-树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP-树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP-树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。
- 谢志强朱孟杰杨静
- 关键词:数据挖掘关联规则最大频繁项目集频繁模式树
- 基于改进FP-树的最大频繁项目集研究
- 数据挖掘是当今人工智能和数据库研究方面最富活力的领域之一。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则挖掘则是数据挖掘的一个最主要研究内容,而如何提高挖掘算法的效率是关联规则数据挖掘的核心问题。
...
- 朱孟杰
- 关键词:数据库数据挖掘最大频繁项目集频繁模式树
- 文献传递
- 基于FP-Tree的敏感性关联规则隐藏的研究被引量:1
- 2009年
- 敏感性关联规则的隐藏是最大程度地保持原始数据集的其他特征,保证敏感规则不被挖掘出来.针对已有的基于对原始数据集中事务修改的方法产生大量I/O操作的问题,提出了基于频繁模式树(FP-tree)的敏感性关联规则隐藏的方法.该方法首先利用FP-tree存储了与事务数据库相关的全部信息,减少了产生和测试候选集耗费的大量时间;再利用改进的频繁模式树(IFP-tree)是单向的,快速挖掘出最大频繁项目集,确定敏感性关联规则;然后删除敏感关联规则对应的频繁项目集,更新IFP-tree项目集节点和相应的项目头表的计数,对更新的IFP-tree反向挖掘生成新的不包含敏感关联规则的事务数据库.实例和理论分析表明,该方法是正确和高效的.
- 谢志强朱孟杰杨静
- 关键词:数据挖掘频繁模式树