曹艳
- 作品数:2 被引量:3H指数:1
- 供职机构:北京信息科技大学计算机学院更多>>
- 发文基金:国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于均衡分类的脑卒中风险预测模型被引量:1
- 2015年
- 为解决不均衡脑卒中数据分类偏倚问题,提出一种基于均衡分类的脑卒中风险预测模型,其主要算法是基于不均衡数据的分类算法SMOTE&PAM-means+C4.5。使用智能型过抽样技术SMOTE生成新的少数类数据;使用聚类算法PAM-means对多数类数据进行聚类,将相似样本聚到一簇后,对各簇按比例进行抽样,形成新的多数类数据;使用C4.5算法对新的多数类和少数类数据形成的均衡数据集进行分类。实验结果表明,该模型可以有效解决分类结果偏倚问题,降低少数类数据分类误差,提高分类准确度,为脑卒中风险的准确预测提供依据。
- 曹艳殷旭
- 关键词:C4.5算法K-MEANS聚类算法PAM算法不均衡数据脑卒中
- 一种基于粗糙集属性约简的C4.5算法被引量:2
- 2014年
- C4.5算法是通过信息增益率选择相关属性,其约简性能较差,得到的分类结果较复杂,部分数据甚至会因过度拟合形成虚假规则。为了解决这个问题,提出一种新的改进算法RSC4.5,其主要思想是在C4.5的基础上结合粗糙集理论,先对属性进行约简,然后使用C4.5算法中的信息增益率对约简后的数据集进行二次选择后分类。研究结果表明,改进的算法分类准确度提高8.23%,同时分类结果的复杂度明显降低,泛化性能较好,更有利于实际应用。分类结果说明宁夏农村地区日常生活中影响高血压的因素主要是年龄、血脂和日均畜禽肉类食用量,为有效干预高血压疾病的预防治疗提供数据支持。
- 曹艳殷旭
- 关键词:粗糙集属性约简C4.5算法高血压