重庆市教育委员会科学技术研究项目(KJ070802)
- 作品数:5 被引量:20H指数:4
- 相关作者:吕佳席光文隆功伦更多>>
- 相关机构:重庆师范大学重庆三峡学院更多>>
- 发文基金:重庆市教育委员会科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大最小距离和动态隧道的聚类算法被引量:4
- 2010年
- 针对K-means聚类算法对初值敏感和易陷入局部最小值的缺陷,提出了一种基于最大最小距离和动态隧道的聚类算法。该算法首先利用最大最小距离法来优选初始聚类中心以避免由于聚类中心过于随机而导致其分布较为集中的情形,以提高划分初始数据集的效率。动态隧道法具有全局寻优能力,利用钻隧过程可跳出局部极小点得到更小值点,再由K-means聚类算法对其迭代优化,如此反复直至得到全局极值。实验结果表明了该算法的可行性和有效性。
- 吕佳
- 关键词:聚类非凸函数
- 基于Delaunay三角剖分密度度量的聚类算法被引量:4
- 2009年
- 针对K-means聚类算法无法正确识别非凸形状簇的缺陷,提出一种基于Delaunay三角剖分密度度量的聚类方法,利用Delaunay三角剖分图的最近性、邻接性等优良特性来反映数据自身特点并进行密度度量,同时以混沌优化方法实现聚类目标函数的全局优化,达到全局最小解。实验结果证明,基于Delaunay三角剖分密度度量方式的聚类算法能发现任意非凸形状簇。
- 吕佳
- 关键词:聚类DELAUNAY三角剖分混沌优化
- 基于改进分类模型的文本分类系统实现被引量:4
- 2009年
- 提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类。针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类。通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的。
- 吕佳
- 关键词:文本分类系统特征词特征提取算法遗传算法KNN算法
- 基于关联规则的虚拟主机网站日志挖掘被引量:1
- 2007年
- 网站日志记录了用户的浏览行为,通过挖掘网站日志,可以分析用户行为,为优化网站结构提供有价值的数据.但是很多虚拟主机网站没有日志记录功能,这给日志挖掘带来了极大的不便.本文介绍一种生成日志的方法,并利用关联规则算法对其进行日志挖掘,发现用户的访问模式,帮助网站改进页面结构.
- 隆功伦席光文
- 关键词:日志挖掘关联规则虚拟主机APRIORI
- 文本分类中基于方差的改进特征提取算法被引量:7
- 2007年
- 特征提取算法TFIDF是文本分类中常用的衡量特征权重的算法,但该算法没有考虑特征词在类间和类内的分布情况,导致算法无法反映特征词在分布比例中量上的差异。为此,引入方差来描述特征词在类间和类内的分布情况,并利用方差来修正TFIDF权重。仿真实验结果表明,同传统TFIDF算法相比,改进TFIDF算法能得到更好的分类结果。
- 吕佳
- 关键词:文本分类特征提取