您的位置: 专家智库 > >

江晶晶

作品数:2 被引量:5H指数:1
供职机构:北京交通大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金北京市自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇数据流
  • 2篇贝叶斯
  • 1篇数据挖掘
  • 1篇懒惰
  • 1篇基于数据
  • 1篇基于数据流
  • 1篇贝叶斯分类
  • 1篇贝叶斯分类算...

机构

  • 2篇北京交通大学

作者

  • 2篇王志海
  • 2篇江晶晶
  • 1篇原继东
  • 1篇孙艳歌

传媒

  • 1篇软件学报
  • 1篇计算机科学

年份

  • 2篇2017
2 条 记 录,以下是 1-2
排序方式:
一种基于数据流模式表示的半懒惰式分类算法
2017年
依据从大规模数据中抽取的模式来建立分类模型是模式挖掘的重要研究问题之一。一种可行的方法是根据模式集合建立贝叶斯分类模型。然而,目前基于模式的贝叶斯分类模型大多是针对静态数据集合的,通常不能适应于高速动态变化与无限的数据流环境。对此,提出一种数据流环境下基于模式发现的贝叶斯分类学习模型,其采用半懒惰式学习策略,针对分类实例在不断更新的频繁项集合上建立局部的分类模型;为加快流数据处理的速度,提出了结构更为简单的混合树结构,同时提出了给定项限制的模式抽取机制以减少候选项集的生成;对数据流中模式抽取不完全的情况,使用平滑技术处理未被抽取的项。大量实验分析证明,相较于其他数据流分类器,所提模型具有更高的分类正确率。
江晶晶王志海原继东
关键词:数据流贝叶斯
基于显露模式的数据流贝叶斯分类算法被引量:5
2017年
基于模式的贝叶斯分类模型是解决数据挖掘领域分类问题的一种有效方法.然而,大多数基于模式的贝叶斯分类器只考虑模式在目标类数据集中的支持度,而忽略了模式在对立类数据集合中的支持度.此外,对于高速动态变化的无限数据流环境,在静态数据集下的基于模式的贝叶斯分类器就不能适用.为了解决这些问题,提出了基于显露模式的数据流贝叶斯分类模型EPDS(Bayesian classifier algorithm based on emerging pattern for data stream).该模型使用一个简单的混合森林结构来维护内存中事务的项集,并采用一种快速的模式抽取机制来提高算法速度.EPDS采用半懒惰式学习策略持续更新显露模式,并为待分类事务在每个类下建立局部分类模型.大量实验结果表明,该算法比其他数据流分类模型有较高的准确度.
杜超王志海江晶晶孙艳歌
关键词:数据流贝叶斯数据挖掘
共1页<1>
聚类工具0