国家科技成果重点推广计划(2003EC000001)
- 作品数:36 被引量:197H指数:8
- 相关作者:杨炳儒宋威徐章艳张伟张克君更多>>
- 相关机构:北京科技大学北华大学广西师范大学更多>>
- 发文基金:国家科技成果重点推广计划国家自然科学基金教育部科学技术研究重点项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理建筑科学更多>>
- 一种基于双库协同机制的入侵检测系统被引量:3
- 2005年
- 基于数据挖掘的入侵检测是当前入侵检测技术的重要研究方向,但大多数基于数据挖掘的入侵检测系统都采用传统的数据挖掘算法,性能不够令人满意。论文结合知识发现的双库协同机制,对该机制在入侵检测系统中的应用作了深入的探讨,提出了一种高效的入侵检测系统的模型。
- 常辉辉金玮杨炳儒
- 关键词:入侵检测数据挖掘网络安全双库协同机制
- 一种多标准决策树剪枝方法及其在入侵检测中的应用被引量:2
- 2007年
- 为提高决策树的适用性,以决策树在入侵检测中的应用为背景提出一种多标准的剪枝方法,使决策树程序能在参数调整后适应不同的应用.给出了用于描述决策树不同性能的一些参量,如稳定性、复杂度、分类能力等,用户可以根据具体情况对向量各分量的权重进行调整,逐步得到满足要求的决策树.实验结果表明,该算法能够根据入侵检测系统的具体需要,快速地构建相应的决策树,从而程序可被用于不同情况.该方法把由程序员决定决策树变成了由用户决定决策树,程序更通用,结果更合理.
- 李卫东宋威李欣杨炳儒
- 关键词:入侵检测决策树剪枝稳定性复杂度
- 面向语义的精简化多关系频繁模式发现方法被引量:2
- 2008年
- 多关系频繁模式发现能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。有别于主流基于归纳逻辑程序设计技术的方法,提出了基于合取查询包含关系的面向语义的精简化多关系频繁模式发现方法,具有理论与技术基础的新颖性,解决了两种语义冗余问题。实验表明,该方法在可理解性、功能、效率以及可扩展性方面具有优势。
- 杨炳儒张伟钱榕
- 关键词:多关系数据挖掘
- 概率逻辑模型与学习研究进展被引量:1
- 2007年
- 近年来,概率逻辑学习研究取得了很大进展,已经提出各种不同的形式化方法和学习方法,包括概率关系模型(PRMs)、贝叶斯逻辑程序(BLPs)、逻辑贝叶斯网络(LBNs)和随机逻辑程序(SLPs)等。文章重点介绍了贝叶斯网络与一阶逻辑的结合,并以PRMs、BLPs和LBNs为例,描述了基于贝叶斯网络的概率逻辑模型(PLMs)的知识表示方法,给出了此类PLMs一般使用的参数估计方法和结构学习方法,并给出了建议的研究方向。
- 徐光美杨炳儒张伟宁淑荣
- 关键词:概率关系模型
- 抽样技术在序列模式增量更新中的应用被引量:2
- 2006年
- 在这篇文章中,我们提出了一种应用抽样的技术于序列挖掘的算法。这个方法能在原始数据库和更新后的数据库之间评价序列模式的变化。评价了序列模式的变化我们能决定何时使用精确的挖掘算法或增量算法:如果变化达到一定程度,就使用精确的方法以挖掘新的序列模式;如果变化比较小,则在一定的可信度情况下,就使用原来的模式,且误差能控制在一定的范围内。
- 郭志勇杨炳儒王璐
- 关键词:数据挖掘
- 基于联合提取特征的粗糙集文本分类技术研究被引量:5
- 2007年
- 重点研究了文本的特征提取,通过对互信息和2χ统计的研究,根据其各自的缺陷,提出了一种新的特征提取算法——联合特征提取算法(CEFA)。通过CEFA可以提取出更具代表性的特征项,利用粗糙集优越的约减性构造文本分类系统,提取决策规则,对文本进行分类。实验表明该方法分类准确度较高。
- 杨彦闯杨炳儒张克君
- 关键词:文本分类粗糙集互信息
- 快速求正区域的渐增式方法研究被引量:2
- 2006年
- 正区域是粗糙集理论中的核心概念之一,提高计算正区域算法的效率对于其相关算法的效率有重要的影响。本文提出了一种求正区域的渐增式方法,它能有效地去掉求正区域算法中的一些冗余运算,其计算正区域的时间复杂度为,替换掉该算法的一部分将得到一个属性约简算法,它是高效而往往能满足用户需求的,比较适用于大型数据集。理论结果和实验表明,该方法确实能高效地计算出正区域。
- 刘作鹏张颖超杨炳儒
- 关键词:粗糙集决策表属性约简
- 基于索引数组与集合枚举树的最大频繁项集挖掘算法被引量:4
- 2007年
- 由于其内在的计算复杂性,挖掘密集型数据集的全部频繁项集非常困难,解决方案之一是挖掘最大频繁项集。集合枚举树是最大频繁项集挖掘算法中常用的数据结构,最大频繁项集的挖掘过程也可以看作是集合枚举树的搜索过程。为缩小集合枚举树的搜索空间,采用宽度优先和深度优先相结合的混合搜索策略,提出了一种新的最大频繁项集的挖掘算法Index-MaxMiner。该算法首先设计了索引数组这种新的数据结构,并给出了一个基于二进制位图技术的索引数组的计算方法。通过为每个频繁项增加包含索引,Index-MaxMiner利用一次宽度优先搜索得到了候选最大频繁项集,使集合枚举树的第一层结点个数大幅度减少。然后在候选最大频繁项集中通过深度优先搜索,得到全部最大频繁项集,从而实现了集合枚举树的跳跃式搜索,大大缩小了搜索空间。实验结果表明,该算法可有效提高最大频繁项集的挖掘效率。
- 宋威杨炳儒徐章艳侯伟
- 关键词:数据挖掘关联规则最大频繁项集索引数组集合枚举树
- 多关系频繁模式发现研究被引量:8
- 2007年
- 频繁模式发现是数据挖掘的重要任务之一。现实数据通常存储于由多个关系组成的关系数据库中。传统的频繁模式发现方法只能直接完成单一关系中的模式发现,如果要完成多关系数据的挖掘,会产生操作复杂性和信息丢失等问题。多关系数据挖掘是当前数据挖掘研究中快速发展的重要领域之一。多关系频繁模式发现方法能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。本文首先归纳多关系频繁模式发现方法的发生历史背景,其次分析总结多关系频繁模式发现方法,最后提出了多关系频繁模式发现将来发展需重点解决的问题和面临的挑战。
- 张伟杨炳儒钱榕
- 关键词:多关系数据挖掘归纳逻辑程序设计
- 利用数据挖掘方法分析客户生涯价值被引量:4
- 2005年
- 针对客户生涯价值分析这一客户关系管理系统的重要问题,在分析已有工作的基础上,经过多级数据归约,提出了多商品配送企业适合工程计算的客户生涯价值公式。进而对客户进行了高速聚类挖掘,找出了客户群的特点,对公司有针对性地制定客户策略起到了一定的指导作用。
- 李卫东宋威杨炳儒
- 关键词:数据挖掘聚类分析数据归约