杨霞霞
- 作品数:4 被引量:6H指数:2
- 供职机构:兰州交通大学电子与信息工程学院更多>>
- 发文基金:兰州市科技发展计划项目更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 时间序列相似性度量的研究
- 2009年
- 时间序列的相似性度量是时间序列数据挖掘研究中的一个重要问题,是进行序列查询、分类、预测的一项基础工作。寻求一种好的度量对提高挖掘任务的效率和准确性有着至关重要的意义。目前从事这方面的研究除了少许理论论述外,几乎都采用一种固定的方法,即提出具体要求并提供实验数据。然而,大多数实验方法不是使用范围有限就是侧重点不同。为了提供一个比较全面的实验验证,用1NN分类算法进行了大量的时间序列交叉验证实验,重新评估了其中的弹性度量,并使用不同应用领域的28个时间序列数据集进行比较,结果表明,该方法具有更高的准确性。
- 杨霞霞闫光辉刘利松杜琳娜
- 关键词:时间序列数据挖掘
- 时间序列的快速相似性搜索改进算法被引量:2
- 2010年
- 针对时序数据进行相似性挖掘方法的研究,提出一种寻找已知序列的所有相似性子序列的方法,用该方法对数据模拟,结果表明该算法提高了查询性能。
- 刘利松闫光辉黄宬杨霞霞
- 关键词:时间序列数据挖掘
- 一种改进的KNN中文文本分类算法被引量:3
- 2010年
- 提出了一种基于投影寻踪改进KNN中文文本分类方法,与现有的中文文本分类算法相比,该方法具有较高的计算效率。给出了具体实现过程并将其用于文本分类中,实验证明了该算法用于文本分类的有效性及其高效率。
- 杜琳娜闫光辉杨霞霞刘利松
- 关键词:文本分类KNN降维
- 基于Z-ordering的多重分形维数及多重分形谱算法被引量:1
- 2009年
- 分形维数的高效求解是分形理论应用与实践的关键问题,传统分形维数计算方法由于时空复杂性高已成为当前分形技术应用的一个主要瓶颈。借鉴Z-ordering索引技术的思想,设计并实现了一种改进的多重分形维数计算方法ZBMFD(Z-orderingBased Multifractal dimension Algorithm),该方法扫描数据集一遍建立底层网格结构,通过动态修改网格坐标编码递推实现低层网格到高层网格之间的动态映射并计算数据集的分形维数。在实际数据集的实验表明算法在保持O(N×logN)时间复杂性的基础上,降低了分形维数算法的空间复杂性,且计算结果精度与已有算法相当,拓广了分形技术在当前高维、海量数据处理等领域的应用。
- 闫光辉马志程刘利松杜琳娜杨霞霞
- 关键词:分形分形维数多重分形谱