中央高校基本科研业务费专项资金(2012211020209) 作品数:6 被引量:65 H指数:5 相关作者: 丁立新 胡庆辉 何进荣 李照奎 万润泽 更多>> 相关机构: 武汉大学 桂林航天工业学院 河南大学 更多>> 发文基金: 中央高校基本科研业务费专项资金 国家自然科学基金 河南省科技攻关计划 更多>> 相关领域: 自动化与计算机技术 更多>>
基于矩阵指数变换的边界Fisher分析 被引量:7 2014年 边界Fisher分析是一种经典的有监督线性降维方法,被广泛用于高维数据的模式分类.由于边界Fisher分析算法中涉及到矩阵求逆的运算,在数值计算中会产生矩阵的奇异性问题,尤其当样本的个数小于样本的维数时,导致所谓的"小样本问题".采用主成分分析方法对样本数据进行预处理可以克服奇异性问题,然而可能会损失样本的某些判别信息.针对此不足之处,根据矩阵指数的非奇异性,对边界Fisher分析中的散度矩阵进行矩阵指数变换,从而克服了矩阵求逆中的奇异性问题.理论分析表明,该方法等价于零空间上的边界Fisher分析,有效利用了类内散度矩阵的零空间上的信息,因此其判别能力得到了增强.数据可视化和人脸识别实验表明,该方法可以有效挖掘样本中潜在的判别特性,提高分类性能. 何进荣 丁立新 崔梦天 胡庆辉关键词:小样本问题 矩阵指数 人脸识别 数据挖掘 基于边界判别投影的数据降维 被引量:16 2014年 为了提取具有较好判别性能的低维特征,提出了一种新的有监督的线性降维算法——边界判别投影,即,最小化同类样本间的最大距离,最大化异类样本间的最小距离,同时保持数据流形的几何形状.与经典的基于边界定义的算法相比,边界判别投影可以较好地保持数据流形的几何结构和判别结构等全局特性,可避免小样本问题,具有较低的计算复杂度,可应用于超高维的大数据降维.人脸数据集上的实验结果表明,边界判别分析是一种有效的降维算法,可应用于大数据上的特征提取. 何进荣 丁立新 李照奎 胡庆辉关键词:数据降维 特征提取 人脸识别 分类器集成算法研究 被引量:25 2015年 分类器集成作为机器学习算法设计的一种重要策略,具有高泛化性能的优点,已广泛应用于遥感、生物信息、图像处理等领域,逐渐成为研究热点.以三种常用的集成方法bagging、boosting和stacking为线索,分别从算法思想、算法评价、算法改进与变种、算法应用等角度进行探讨,为构建高准确率分类器集成系统建立指导.最后,对分类器集成算法的未来发展方向进行了展望. 周星 丁立新 万润泽 葛强关键词:分类器集成 泛化性能 多样性 BAGGING BOOSTING STACKING 高维数据空间的性质及度量选择 被引量:9 2014年 高维数据分析是机器学习和数据挖掘研究中的主要内容,降维算法通过寻找数据表示的最优子空间来约减维数,在降低计算代价的同时,也提高了后续分类或者聚类算法的性能,从而成为高维数据分析的有效手段。然而,目前缺乏高维数据分析的理论指导。对高维数据空间的统计和几何性质进行了综述,从不同的角度给出了高维数据空间中"度量集中"现象的直观解释,并讨论了通过度量选择的方式来提高经典的基于距离度量的机器学习算法在分析高维数据时的性能。实验表明,分数距离度量方式可以显著提高K近邻和Kmeans算法的性能。 何进荣 丁立新 胡庆辉 李照奎关键词:高维数据 维数灾难 基于数据块的多变量时间序列相似性度量 被引量:1 2016年 针对现有经典的时序数据相似性度量方法共同主成分分析(CPCA)和二维奇异值分解(2DSVD)中存在无法保存时序数据集合中蕴涵的某些重要局部特征的问题,提出了基于数据分块方式的CPCA方法和2DSVD方法。该算法首先对原始多变量时间序列数据进行分块处理,然后对分块得到的子矩阵采用CPCA、2DSVD进行特征提取,从而得到代替原始模式的低维新模式,最后在低维空间中利用最小距离法构建分类器对多变量时间序列进行分类。EEG数据分类实验证明了所提方法的有效性。 翟彦青 丁立新 周考关键词:多变量时间序列 分块 L_p范数约束的多核半监督支持向量机学习方法 被引量:8 2013年 在机器学习领域,核方法是解决非线性模式识别问题的一种有效手段.目前,用多核学习方法代替传统的单核学习已经成为一个新的研究热点,它在处理异构、不规则和分布不平坦的样本数据情况下,表现出了更好的灵活性、可解释性以及更优异的泛化性能.结合有监督学习中的多核学习方法,提出了基于Lp范数约束的多核半监督支持向量机(semi-supervised support vector machine,简称S3VM)的优化模型.该模型的待优化参数包括高维空间的决策函数fm和核组合权系数m.同时,该模型继承了单核半监督支持向量机的非凸非平滑特性.采用双层优化过程来优化这两组参数,并采用改进的拟牛顿法和基于成对标签交换的局部搜索算法分别解决模型关于fm的非平滑及非凸问题,以得到模型近似最优解.在多核框架中同时加入基本核和流形核,以充分利用数据的几何性质.实验结果验证了算法的有效性及较好的泛化性能. 胡庆辉 丁立新 何进荣关键词:支持向量机 拟牛顿法 多核学习