江西省教育厅科学技术研究项目(GJJ11609)
- 作品数:2 被引量:8H指数:1
- 相关作者:冷明伟陈晓云谭国律文平更多>>
- 相关机构:上饶师范学院兰州大学更多>>
- 发文基金:江西省教育厅科学技术研究项目江西省教育厅青年科学基金江西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于主动数据选取的半监督聚类算法
- 2012年
- 利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点。但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低。基于主动学习技术研究标签数据选取,提出了一个新的半监督聚类算法。该算法结合最小生成树聚类和主动学习思想,选取包含信息较多的数据点作为标签数据,使用类KNN思想对类标签进行传播。通过在UCI标准数据集和模拟数据集上的测试,结果表明提出的算法比其他算法在处理多密度、不平衡数据集时有更高精度且稳定的聚类结果。
- 文平冷明伟陈晓云
- 关键词:数据挖掘半监督聚类标签数据最小生成树不平衡数据集
- 基于小样本集弱学习规则的KNN分类算法被引量:8
- 2011年
- KNN及其改进算法使用类标号已知的数据集Dl对类标号未知的数据集Du进行类别标志,如果Dl中的数据数量过少,将会影响最后的分类精度。基于小样本弱学习规则的KNN分类算法旨在提高基于小样本集的KNN算法的分类精度,它首先对Dl中的数据对象进行学习,从中选取一些数据,利用学到的标签知识对其进行类别标号,然后将其加入到Dl中;最后利用扩展后的Dl对Du中的数据对象进行类别标志。通过使用标准数据集的测试发现,该算法能够提高KNN的分类精度,取得了较满意的结果。
- 冷明伟陈晓云谭国律
- 关键词:标签数据