储尚军
- 作品数:1 被引量:4H指数:1
- 供职机构:河北经贸大学更多>>
- 发文基金:河北省自然科学基金河北省科技计划项目河北省教育厅科研基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于信息粒度的不完备信息系统空值补齐算法被引量:4
- 2011年
- 在现实世界中,不完备信息系统大量存在的,信息系统中空值的存在大大增加了信息表的不确定性,信息表无法产生更多潜在的有价值规则.处理不完备信息表的一种做法是先将空值补齐再提取规则,常用的空值补齐算法通常都是根据同属性其他值出现的频率高低估计空值,但是此方法不一定能保证规则的一致性.本文提出一种基于信息粒度的空值补齐方法GRCC,首先根据定义的信息粒度选择信息粒度最大的列,然后由相容类产生空值的属性值范围,最后利用MDL准则确定遗漏项的属性值,如此逐列进行填充直到完成全部信息表的补齐.经过实验,GRCC算法补齐的信息表比其它补齐方法产生的信息表产生更多高可信度和高支持度的规则,降低了信息表的不确定性.
- 张霞储尚军许鸣珠
- 关键词:不完备信息系统信息粒度相容类最小描述长度