王艳兵
- 作品数:3 被引量:22H指数:2
- 供职机构:山东大学计算机科学与技术学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于决策树和粗糙集的分类方法研究
- 数据挖掘是利用分析工具从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中、事先未知、潜在有用的信息和知识的过程,建立数据间关系模型,用其做出预测,从而为决策者 提供辅助。决策树是一种常用的分类模型,并...
- 王艳兵
- 关键词:数据挖掘决策树ID3算法粗糙集
- 文献传递
- 基于粗糙集分类算法研究与实现被引量:6
- 2008年
- 数据挖掘是人工智能中知识发现的重要组成部分,而分类又是一种主要的应用形式。ID3算法是数据挖掘中经典的决策树分类算法,ID3算法具有抗噪声能力差的缺点。通过对分类和粗糙集理论的研究,将可变精度粗糙集理论的思想应用在计算属性信息熵时设定阈值上,以放宽属性选择的要求,从而对经典的ID3算法作了相应的改进。改进后的ID3算法(称之为VPID3算法)可在一定程度上降低噪声对系统分类的干扰,提高了有数据有噪声情况下的分类精度。另外根据该算法设计并实现了一个分类器,并通过实验检验了该算法的性能。
- 李勃王艳兵姚青
- 关键词:数据挖掘决策树粗糙集ID3
- 基于可变精度的ID3改进算法被引量:16
- 2006年
- ID3算法是数据挖掘中经典的决策树分类算法,该算法具有抗噪声能力差的缺点。通过对ID3算法的研究,依据可变精度粗糙集理论的思想,采用在计算属性信息熵时设定阈值的方法,以放宽属性选择的要求,从而对经典的ID3算法做了相应的改进。改进后的ID3算法(VPID3)可在一定程度上降低噪声对系统分类的干扰,使分类结果更加符合实际要求。最后通过举例,说明了改进算法的可行性。
- 王艳兵赵锐姚青
- 关键词:数据挖掘决策树粗糙集ID3