国家重点基础研究发展计划(2013CB329502)
- 作品数:54 被引量:636H指数:10
- 相关作者:丁世飞史忠植厉力华马刚张博更多>>
- 相关机构:中国科学院中国矿业大学杭州电子科技大学更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术医药卫生电子电信生物学更多>>
- 鲁棒的加权孪生支持向量机
- 2015年
- 基于局部信息的加权孪生支持向量机(WLTSVM)借用类内及类间近邻图分别表示类内样本的紧凑性和类间样本的分散性,克服孪生支持向量机(TWSVM)欠考虑训练样本间相似性的缺陷,并且在一定程度上降低二次规划求解的计算复杂度。然而,WLTSVM仍不能充分刻画类内样本潜在的局部几何结构,并且存在对噪声点敏感的风险。基于以上不足,提出一种鲁棒的加权孪生支持向量机(RWTSVM)。与WLTSVM相比,RWTSVM的优势在于:选用热核函数定义类内近邻图权值矩阵,可以更好地刻画类内样本潜在的局部几何结构及蕴含的鉴别信息;用类间近邻图选取边界点,同时结合类内近邻图使得超平面远离边界点中权重较大的样本,降低算法对噪声点敏感的风险。人造数据集和真实数据集上的测试结果验证算法RWTSVM的有效性。
- 花小朋丁世飞
- 关键词:鲁棒性
- 元数据存储库系统中违背良格式约束潜在操作的推理
- 2016年
- 存储库系统的元数据组织方式呈现出分层、多级并且动态变化的复杂结构;存储库系统标准对确保良格式约束规定得并不充分,上述2个原因使得确保基于元对象设施(meta object facility,MOF)建立的元数据存储库系统的状态不违背良格式约束成为一个令人棘手的问题.提出了一种能够自动推断可能违背良格式约束的潜在操作的方法.首先定义了一组比MOF的构造活动更精确和灵活的MOF内部活动并建立了二者之间的对应关系;接着研究了如何推断可能违背约束条件的内部活动;最后通过比对与这些内部活动相对应的构造活动是否在操作规范中出现,研究了如何推断违背约束条件的潜在操作,该方法可以用于约束检测领域.由于可以剔除许多无关的检测,该方法可以有效地提高良格式约束检测的效率.此外该方法对约束设计领域也有一定的参考价值.
- 赵晓非高阳史颖欢史忠植
- 关键词:元对象设施
- 基于AP二次聚类的神经网络集成算法研究被引量:3
- 2015年
- 为了提高个体神经网络精度及差异度进而提高神经网络集成(Neural Network Ensemble,NNE)的泛化性能,提出了一种基于二次聚类的神经网络集成方法。首先对所有样本进行聚类,得到第一次聚类样本子集;然后对每一类样本子集进行二次聚类,得到每一子类的样本子集,通过Affinity Propagation(AP)聚类使得"类内相似,类间相异"的准则最大化,类内样本能够反映真实的数据分布;最后按照排列组合的方式,从二次聚类的每个样本子集中选取一类样本构成训练集来构造一个个体神经网络。这样从不同类中选择样本集构造的个体神经网络差异性较大,既能使数据的规模较小,又能反映真实的数据分布,用这种方法产生的个体神经网络进行集成具有较高的性能。仿真实验表明,该方法能够取得较好的性能。
- 李辉丁世飞
- 关键词:AFFINITY神经网络集成
- 基于邻域粗糙集约减的谱聚类算法被引量:1
- 2013年
- 谱聚类算法是近年来机器学习领域的研究热点,它基于代数图论,可以有效地解决很多实际问题.但是传统的谱聚类算法无法很好地处理高维数据,容易受到噪声和不相关属性的干扰.为了降低计算复杂度,同时减弱噪声数据和冗余属性对聚类的负面影响,提出了一种基于邻域粗糙集约减的谱聚类算法(NRSR-SC).该算法将信息熵引入到邻域粗糙集中,在保持样本区分能力的前提下,去除冗余的属性,保留对聚类贡献最大的属性;然后基于约简后的属性集合,计算样本点之间的相似度,构造相似性矩阵和拉普拉斯矩阵;最后利用谱方法得到最终的聚类结果.实验表明,NRSR-SC算法在处理高维数据时,具有较强的抗干扰能力,其运行效率和准确率都有明显改善.
- 贾洪杰丁世飞
- 关键词:邻域粗糙集信息熵属性约简谱聚类
- 基于再生核希尔伯特空间的In-Silico基因网络重构
- 2013年
- 针对逆向工程的评估与方法交流(Dialogue for Reverse Engineering Assessments and Methods,DREAM)第四次竞赛(DREAM4)中In-Silico基因调控网络(Challenge2)的重构问题,作者提出一种基于再生核希尔伯特空间的统计独立性度量方法(Hilbert-Schmidt independence criterion,HSIC)。该方法不要求数据符合某种特定的分布,约束条件少,是一种非参数计算统计独立性的方法。对10规模的In-Silico基因网络,HSIC方法的受试者工作特征曲线面积(area under receiver operating characteristic curve,AUROC)比常微分方程(ordinary differential equation,ODE)方法和格兰杰因果关系(granger causality,GC)方法分别高了16%和7%,比动态贝叶斯网络(dynamic bayesian network,DBN)方法和非线性动态系统(nonlinear dynamic systems,NDS)方法中的最好算法分别高了2.4%和1.4%。对100规模的In-Silico基因网络,HSIC方法的AUROC分别超出ODE及GC方法 16%和14.2%,超出DBN和NDS方法中的最好算法5%和1.4%。实验表明,HSIC方法具有基因调控网络重构的可行性与可靠性,并且对In-Silico网络的重构准确率要优于目前经典的基因调控网络建模方法。
- 金丽艳韩斌厉力华祝磊樊双喜
- 关键词:基因调控网络再生核希尔伯特空间独立性
- Twin Support Vector Machines Based on the Mixed Kernel Function
- The efficiency and performance of the Twin Support Vector Machines(TWSVM) are better than the traditional supp...
- Fulin WuShifei Ding
- 基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测被引量:1
- 2013年
- 蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法。该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息。实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%。与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率。
- 郑斌厉力华
- 基于结构信息的多生支持向量机模型与算法研究
- 孪生支持向量机在机器学习领域有着广泛的应用,其主要目的是用来解决二分类问题,是多分类问题在现实生活中是最为常见的。因此研究人员对孪生支持向量机进行改进,提出了许多不同策略的多分类孪生支持向量机用于解决多分类问题。多生支持...
- 史颂辉
- 关键词:结构化信息参数选择
- 文献传递
- 基于空间FCM与MRF方法的乳腺MRI序列三维病灶分割研究被引量:15
- 2014年
- 针对乳腺DCE-MRI病灶分割,提出一种空间FCM聚类与MRF随机场相结合的三维分割方法。首先,对MRI图像进行空间FCM粗分割,提取病灶粗轮廓。然后,在其基础上进行MRF精分割,并结合病灶三维信息:用相邻切片分割结果对应标号矩阵初始化MRF精分割标号场,同时用该张切片粗分割所得隶属度矩阵对MRF精分割进行参数自适应调整。用该方法与空间FCM、水平集、模糊MRF方法对50例MRI数据进行分割对比实验,得到良、恶性病灶分割重叠率分别为76.4%、75.5%;相比于空间FCM的68.7%、69.5%,水平集的70.8%、72.6%以及模糊MRF的72.9%、73.6%有明显提升。对所有175例MRI数据分割结果进行非监督评价,得到良、恶性病灶区域均匀性均大于0.92;区域内差异性良性病灶92%小于150、恶性病灶98%小于150;区域间差异性良性病灶87%大于0.25、恶性病灶90%大于0.3。综上表明,该方法具有较高的分割精度。
- 张承杰厉力华
- 多生支持向量机及其优化方法研究
- 孪生支持向量机是一种用以解决二分类问题的机器学习方法。然而在实际问题中,人们所面临的大多是多分类的情况。因而研究者们把孪生支持向量机扩展到多分类的情况下,形成了多种不同类型的多分类孪生支持向量机。多生支持向量机是一种最近...
- 安悦瑄
- 关键词:粒子群优化算法
- 文献传递