王锋
- 作品数:29 被引量:121H指数:7
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术历史地理更多>>
- 基于改进启发式遗传算法的属性约简方法
- 粗糙集理论是在上世纪八十年代由波兰数学家Pawlak提出的一种处理模糊和不确定问题的数学理论。它能够分析出隐藏在数据中的事实,而且不需要提供任何关于数据的附加信息。粗糙集理论已经在许多领域获得了成功的应用,例如知识发现、...
- 王锋
- 关键词:遗传算法粗糙集属性约简
- 长江华溪蟹鳃形态学的初步研究
- 998年3~6月,利用解剖学和组织学方法,对长江华溪蟹Sinopotamon yangteskiense的鳃进行了初步研究, 目的是为了搞清楚十足目甲壳动物短尾派鳃的结构与功能的关系,了解溪蟹既可以水生也可以陆生的原因,...
- 王兰张小民孟红霞王锋
- 关键词:甲壳动物长江华溪蟹形态学
- 面向动态混合数据的多粒度增量特征选择算法
- 2025年
- 在大数据时代,样本规模以及维数的动态更新和变化极大地增加了计算负担,在这些动态数据中,大多的数据样本并不以单一的数据取值形式存在,而是同时包含符号型数据和数值型数据的混合型数据.为此,学者们提出了许多关于混合数据的特征选择算法,但现有的算法大多只适用静态数据或者小规模的增量数据,无法处理大规模动态变化的数据,尤其是数据分布不断变化的大规模增量数据集.针对这一局限性,通过分析动态数据中粒空间以及粒结构的变化和更新,基于信息融合机制,提出了一种面向动态混合数据的多粒度增量特征选择算法.该算法重点讨论了动态混合数据中的粒空间构建机制、多数据粒结构的动态更新机制以及面向数据分布变化信息融合机制.最后,通过与其他算法在UCI数据集上的实验结果进行对比,进一步验证了所提算法的可行性和高效性.
- 王锋姚珍梁吉业
- 关键词:信息融合
- 基于信息熵的半监督特征选择算法被引量:15
- 2018年
- 诸多实际应用中,由于确定数据集的类信息通常比较"昂贵",因此研究者只能为其中很少量的数据标记类信息。针对上述"少量标记数据问题",文中基于粗糙集理论和信息熵的概念,提出了一种基于信息熵的粗糙特征选择算法。通过分析给定数据集上有标记数据集和无标记数据的信息熵,重新定义了整个数据集上的信息熵。在此基础上定义了半监督意义下基于信息熵的特征重要度,设计了一种基于信息熵的可有效处理含有少量标记数据的半监督粗糙特征选择算法。实验结果进一步验证了所提算法的可行性和高效性。
- 王锋刘吉超魏巍
- 关键词:信息熵
- 面向缺失数据的动态特征选择被引量:2
- 2018年
- 随着数据获取工具的快速发展,实际获取到的数据通常是动态更新的,且更新的速度也越来越快.数据集的动态更新通常有三中类型,即数据规模的更新、维数的更新和数据取值的更新.为此,本文针对含有缺失数据的数据集,通过讨论和分析信息熵随数据变化的更新机制,设计了一种基于信息熵的动态特征选择算法.算法中以信息熵的变化作为特征重要度的度量,进而给出了含有缺失数据的数据集中特征选择结果随数据取值变化的动态更新策略.实验结果进一步验证了新算法的可行性和高效性.
- 王锋宋鹏
- 关键词:缺失数据信息熵
- 非完备信息系统的相容类快速计算被引量:6
- 2009年
- 经典粗糙集理论是建立在完备信息基础上的,然而现实中,由于各种原因,很多信息系统是非完备的。相容关系是非完备信息系统的核心概念之一,如何高效地计算相容类对提高各相关算法的性能至关重要。针对非完备信息系统中求解相容类计算耗时过大的缺陷,提出了一种求解相容类的快速计算方法。实验结果也进一步表明,该方法能够有效地降低计算耗时,在效率上较现有方法有显著提高。
- 王锋梁吉业钱宇华
- 关键词:相容类
- 以互补条件熵为启发信息的正域属性约简被引量:2
- 2013年
- 属性约简是一种特殊的特征选择方法,是粗糙集理论中的核心内容之一。正域约简是一类常见的启发式的约简方法,它通常采用前向贪婪搜索策略产生候选的属性子集,以相对正域作为启发信息和停止条件。根据互补条件熵的随划分的变化规律,分四种情况分析了约简过程中某个属性加入属性子集后,相对正域和互补条件熵的变化,并在此基础上提出了一种以互补熵为启发信息的正域属性约简方法。实验分析表明,新方法与传统的正域约简算法相比,可以得到属性数量更少且决策性能非常接近的约简,同时可以有效地提高约简计算效率。
- 魏巍陈红星王锋
- 关键词:粗糙集属性约简正域
- 一种动态置信度的跨域行人重识别方法及系统
- 本发明公开一种动态置信度的跨域行人重识别方法及系统,涉及行人重识别领域,该方法包括利用源域训练集预训练ResNet‑50网络;确定当前模型在源域测试集的mAP;并利用mAP估计当前模型在目标域无标签数据集上的置信度;利用...
- 魏巍孙智豪李琳郭少杰王锋
- 一种序决策表的特征选择算法
- 2010年
- 本文基于序意义下优势类的概念,提出了序决策表的一种条件依赖度,从而给出了序决策表中属性重要度的定义。在此基础上,设计了一种序决策表的特征选择算法,并通过实例分析对算法进行了有效性检验。
- 马楠楠梁吉业王锋钱宇华
- 面向非完备决策表的正向近似特征选择加速算法被引量:26
- 2011年
- 正向近似是刻画目标概念组成结构的一种有效方法.文中针对非完备决策表现有特征选择算法计算耗时过大的缺陷,提出了一种基于正向近似的通用特征选择加速算法.该算法不仅对候选属性具有保序性,而且通过在特征选择过程中减少样本数据的规模来降低计算耗时,加速特征选择过程.实验结果进一步验证了加速算法的有效性和高效性.特别指出的是,随着属性的增多和数据量的增大,加速算法的性能通常会更好,可有效应用于海量数据的特征选择.
- 钱宇华梁吉业王锋
- 关键词:粗糙集