姜力争
- 作品数:9 被引量:1H指数:1
- 供职机构:北京大学信息科学技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学更多>>
- 数据立方体上的虚拟视图机制
- 繁琐复杂的分析过程是OLAP面临的主要问题.当前的解决方法由于与具体的分析任务相关而存在不足.在数据立方体中引入虚拟视图机制解决了这个问题.一个虚拟视图是从原始实事表衍生出来的逻辑数据集合.给出了数据立方体上的虚拟视图的...
- 张德辉唐世渭杨冬青马秀丽姜力争
- 关键词:OLAP数据立方体虚拟视图
- 文献传递
- 相关模式挖掘方法研究
- 从知识发现概念的最初提出开始,数据挖掘理论和技术在短短十年左右的时间里得到了迅速发展。人们通过数据间的相关性经常会得到非常有意义的新知识,发现数据集中的相关模式是若干研究领域(如统计学,机器学习和数据挖掘)的一项重要研究...
- 姜力争
- 关键词:数据挖掘知识发现
- 数据立方体切片的核心聚类分析方法
- 对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之...
- 姜力争杨冬青唐世渭马秀莉张德辉
- 关键词:数据挖掘聚类数据立方体切片
- 文献传递
- 数据立方体切片的核心聚类分析方法
- 2006年
- 对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之处,而点对敏感聚类模型(pair-wise cluster)算法复杂度是NP难的问题而设计.核心聚类模型将数据集合中的点划分为若干不相交的核心点集和边界点集,同一核心点集内任意点对的相似度大于阈值σ,而不同核心点集的点对相似度小于阈值σ.核心聚类模型挖掘出的核心点集是紧密类簇,并且具备良好的分类性质.由于采用了局部优化算法,核心聚类模型的算法复杂度为O(n2),较点对敏感的最大相关成员簇聚类模型大大降低.同时,可以通过核心点集和边界点集构造最大相关成员簇的上界,这就在一定程度上保证了核心聚类模型结果的完备性.实验和分析对比说明核心聚类模型具有较高的算法效率,可扩展性强,结果表示合理,能够很好地解决现实应用问题.
- 姜力争杨冬青唐世渭马秀莉张德辉
- 关键词:数据挖掘聚类数据立方体切片
- OLAP分析中一种有效的下钻路径裁减技术
- 2007年
- OLAP技术为企业数据分析提供了极大的便利。然而,复杂的多维结构导致了复杂的下钻路径组合,从而使得用户的数据分析效率低下。解决OLAP分析中用户的探查路径过于复杂冗长是OLAP面临的主要问题之一,但是当前的研究成果大多由于与特定的分析任务相关而不能完全解决该问题。本文提出了一种与分析任务无关的下钻路径裁剪方法。该方法从多维数据结构本身出发将无效的下钻从分析过程中裁剪掉,从而达到了简化分析过程的目标。本文采用向量夹角法评估下钻操作的有效性,并给出了对应的高效下钻路径裁剪算法。该算法以有序的实事表为输入,只需一次扫描即可完成裁剪过程。实验结果证明了本文方法的可行性、高效性、抗稀疏性和抗偏斜性。
- 张德辉唐世渭杨冬青马秀丽姜力争
- 关键词:向量夹角
- 中国高等院校规模效益分析
- 姜力争
- 数据立方体上的虚拟视图机制
- 繁琐复杂的分析过程是OLAP面临的主要问题.当前的解决方法由于与具体的分析任务相关而存在不足.在数据立方体中引入虚拟视图机制解决了这个问题.一个虚拟视图是从原始实事表衍生出来的逻辑数据集合.本文给出了数据立方体上的虚拟视...
- 张德辉唐世渭杨冬青马秀丽姜力争
- 关键词:OLAP数据立方体虚拟视图
- 文献传递
- 数据立方体切片的核心聚类分析方法
- 对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之...
- 姜力争杨冬青唐世渭马秀莉张德辉
- 关键词:数据挖掘聚类数据立方体切片
- 文献传递
- 一种在OLAP中保持聚类挖掘结果的有效方法
- 传统的数据挖掘技术如分类、聚类、关联和异常点发现等技术与OLAP技术的结合通常采用的方法是分类、聚类、关联和异常点发现的结果即为任务的终点和目标.然而事实上,在实际需求中用户不仅仅需要分类、聚类等数据挖掘的结果,还进一步...
- 张德辉唐世渭杨冬青马秀莉姜力争
- 关键词:OLAP聚类挖掘等价类
- 文献传递