江苏省普通高校研究生科研创新计划项目(CX08B098Z)
- 作品数:2 被引量:2H指数:1
- 相关作者:屠莉陈崚包芳更多>>
- 相关机构:扬州大学江阴职业技术学院南京大学更多>>
- 发文基金:江苏省教育厅自然科学基金江苏省普通高校研究生科研创新计划项目江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 流数据上的频繁项挖掘算法
- 2011年
- 提出了一种流数据上的频繁项挖掘算法(SW-COUNT)。该算法通过数据采样技术挖掘滑动窗口下的数据流频繁项。给定的误差ε,SW-COUNT可以在O(ε-1)空间复杂度下,检测误差在εn内的数据流频繁项,对每个数据项的平均处理时间为O(1)。大量的实验证明,该算法比其他类似算法具有较好的精度质量以及时间和空间效率。
- 屠莉陈崚
- 关键词:数据流频繁项采样技术数据挖掘
- 挖掘滑动窗口中的数据流频繁项算法被引量:2
- 2012年
- 滑动窗口是一种对最近一段时间内的数据进行挖掘的有效的技术,本文提出一种基于滑动窗口的流数据频繁项挖掘算法.算法采用了链表队列策略大大简化了算法,提高了挖掘的效率.对于给定的阈值S、误差ε和窗口长度n,算法可以检测在窗口内频度超过Sn的数据流频繁项,且使误差在εn以内.算法的空间复杂度为O(ε-1),对每个数据项的处理和查询时间均为O(1).在此基础上,我们还将该算法进行了扩展,可以通过参数的变化得到不同的流数据频繁项挖掘算法,使得算法的时间和空间复杂度之间得到调节.通过大量的实验证明,本文算法比其它类似算法具有更好的精度以及时间和空间效率.
- 屠莉陈崚包芳
- 关键词:数据流频繁项