国家自然科学基金(79970092)
- 作品数:40 被引量:777H指数:16
- 相关作者:孙志挥杨明吉根林朱玉全宋余庆更多>>
- 相关机构:东南大学南京师范大学安徽工程大学更多>>
- 发文基金:国家自然科学基金国家科技型中小企业技术创新基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于网格上近似的大规模数据集离群点检测算法GROUT被引量:7
- 2003年
- 通过对数据集中离群点分布特性的分析,给出离群点的解析定义,并在度量意义下采用数据空间网格化方法实现对密集数据主体的过滤,从而构造了在时间和空间上均具有极高效率的离群点检测算法。
- 李存华孙志挥陈耿
- 关键词:离群点检测
- 基于离群点检测的图形图象噪声滤除算法被引量:6
- 2003年
- 图形图象噪声过滤与修正,在媒体制作、图象分析与信息提取中起着十分重要的作用.虽然基于小波变换的算法能够对高斯噪声进行较好的滤噪处理,但对于随机分布于图象中的各种非高斯噪声仍没有普遍适用的滤噪方法.为了对这种随机分布于图象中的噪声进行有效的检测与滤除,采用对数字图象像素进行解析化描述的方法,从离群点检测的角度给出噪声的定义,并在此基础上构造了相应的图象噪声检测与滤除算法.实验结果表明,这一新方法对图象类型具有广泛的适应性和较好的噪声滤除效果,在大规模图形图象处理应用中具有实用价值.
- 李存华孙志挥
- 关键词:离群点检测噪声过滤图象分析媒体制作数字图象
- 一种有效的关联规则增量式更新算法被引量:16
- 2001年
- 关联规则是数据挖掘中的一个重要研究内容。目前已经提出了许多用于高效地发现大规模数据库中的关联规则的算法,而对已发现规则的更新及维护问题的研究却较少。文章提出了基于频繁模式树的关联规则增量式更新算法,以处理事务数据库中增加了新的事务数据集后相应关联规则的更新问题,并对其性能进行了分析。
- 朱玉全孙志挥
- 关键词:数据挖掘关联规则增量式更新算法数据库
- Web挖掘研究综述被引量:55
- 2001年
- 1引言今天Web已成为信息发布、交互及获取的主要工具,Web上的信息量正以惊人的速度增加着,人们迫切需要能自动地从Web上发现、抽取和过滤信息的工具.同时,近年来,由于电子商务的快速发展,许多公司借助Internet进行在线交易,企业管理者需要分析大量的在线交易数据,从而发现用户的兴趣爱好及购买趋势,为商业决策风险投资等提供依据.具体来讲,当我们与Web交互时,常面临如下问题: 1.查询相关信息.这是查询触发的过程,我们希望从Web上找到关于VC++编程指南的书,关于申办奥运会的信息,甚至关于爱滋病的报道等等.可以用搜索引擎如Yahoo Sohu等进行关键字查找,然而,今天的搜索引擎都有两个严重问题:低查准率会返回很多不相关的结果;低查全率有很多相关的文档找不到.
- 宋爱波董逸生吴文明孙志挥
- 关键词:数据挖掘数据库WEB信息检索
- 一种基于FP-tree的最大频繁项目集挖掘算法
- 1引言关联规则是由Agrawal等人首先提出的一个重要的KDD研究课题,它反映了大量数据中项目集之间有趣的关联或相关联系。发现频繁项目集是关联规则挖掘应用中的关键技术和步骤。近年来,在频繁项目集的算法研究中先后出现了Ap...
- 朱玉全孙志挥宋余庆陈耿
- 关键词:FP-TREE
- 文献传递
- 基于频繁模式树的关联规则增量式更新算法被引量:123
- 2003年
- 研究了大型事务数据库中关联规则的增量式更新问题 ,提出了一种基于频繁模式树的关联规则增量式更新算法 ,以处理最小支持度或事务数据库发生变化后相应关联规则的更新问题 。
- 朱玉全孙志挥季小俊
- 关键词:频繁模式树关联规则增量式更新算法数据挖掘数据库
- Web挖掘技术研究被引量:24
- 2002年
- 对Web挖掘技术作了全面论述,介绍了Web挖掘的分类和应用,给出了Web数据模型,探讨了Web内容挖掘、Web结构挖掘以及Web日志挖掘的基本思想和方法。
- 吉根林孙志挥
- 关键词:数据挖掘数据对象数据模型WEB日志挖掘
- 关系数据库中限制性关联规则挖掘的优化
- 自从R.Agrawal等人提出关联规则的概念和Apriori算法以来,人们在这方面进行了深入的研究,对Apriori算法作了多种改进,提出了AprioriTID,AprioriHybrid等算法。但
- 张仲楠孙志挥
- 关键词:关系数据库关联规则数据挖掘
- 频繁项目集的快速增量式更新算法被引量:6
- 2003年
- 提出了频繁项目集的快速增量式更新算法(FIUA),主要考虑最小支持度发生变化时频繁项目集的更新情况.FIUA在最坏的情况下仅需扫描数据库一遍,且无需生成候选项目集,有效地节约了存储空间,提高了频繁项目集的更新效率.
- 杨明孙志挥宋余庆陈耿
- 关键词:频繁项目集频繁模式树数据挖掘数据库
- 一种基于分布式数据库的全局频繁项目集更新算法被引量:8
- 2002年
- 在算法FMAGF的基础上 ,提出了一种基于分布式数据库的全局频繁项目集更新算法———UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况 .UAGFI在最坏的情况下仅须扫描各局部数据库一遍 ,并利用已挖掘的结果 ,可避免传送某些原全局频繁项目对应的条件频繁模式树 ,从而降低网络通讯代价 .实验结果表明 。
- 杨明孙志挥吉根林
- 关键词:数据挖掘分布式数据库全局频繁项目集频繁模式树