国家自然科学基金(61375059) 作品数:14 被引量:67 H指数:6 相关作者: 冀俊忠 吴晨生 赵学武 杨翠翠 吴金源 更多>> 相关机构: 北京工业大学 北京市科学技术情报研究所 南阳师范学院 更多>> 发文基金: 国家自然科学基金 北京市博士后工作经费资助项目 国家重点实验室开放基金 更多>> 相关领域: 自动化与计算机技术 生物学 医药卫生 更多>>
基于边权重信息深度网络嵌入的PPIN功能模块检测 被引量:1 2023年 现有基于网络嵌入的蛋白质相互作用网络(PPIN)功能模块检测方法通常仅对蛋白质节点信息进行网络嵌入,并未对蛋白质间的边权重信息进行网络嵌入,导致蛋白质功能模块检测质量不理想。针对该问题,提出一种基于边权重信息深度网络嵌入的PPIN功能模块检测方法。结合PPIN的拓扑结构以及基因本体的属性信息,通过图注意力网络的注意力系数来衡量蛋白质间的一阶边权重信息,基于邻域聚合对蛋白质的一阶边权重信息进行嵌入。利用长短期记忆网络的遗忘门和输入门来衡量蛋白质间的高阶边权重信息,并对蛋白质的高阶边权重信息进行嵌入。根据网络嵌入得到的低维向量,通过核心附属聚类算法挖掘出核心团并添加附属蛋白质,从而获得最终的蛋白质功能模块。在Collins、Gavin和Krogan蛋白质数据集上的实验结果表明,该方法相较于基于核心附属聚类的蛋白质功能模块检测等方法在准确率和F1值上最高提升了18.1和12.9个百分点。 李泽水 冀俊忠 杨翠翠关键词:蛋白质相互作用网络 网络嵌入 基于类别加权和方差统计的特征选择方法 被引量:11 2014年 为提高不均衡文本分类的准确率和稳定性,提出了一种基于类别加权和方差统计的联合特征选择方法.首先,基于类别文档数大小对特征选择的影响,给出了一种类别加权策略以强化小类别的特征;其次,在探究特征类别区分能力的基础上,设计了类别方差统计策略来凸显含有丰富类别信息的特征;最后,将2种策略相融合,实现了一种联合特征选择的新算法.在Reuters-21578和复旦大学语料这2个不均衡语料上的实验都表明:该算法有效,特别是在小类别的分类效果上远远好于IG、CHI和DFICF等流行的通用算法. 冀俊忠 吴金源 吴晨生 杜芳华关键词:文本分类 不均衡数据集 基于信息融合的中文微博可信度评估方法 被引量:9 2016年 针对中文微博信息的特点及这些特点的可测量性和实际任务,系统地梳理了中文微博信息可信度测量指标,并将其进行了谱系化分析,提出一个基于信息融合的中文微博可信度评估框架CCM-IF。首先,为本质不同的三个异构特征:文本内容、信息作者与信息传播使用了不同的度量方式;其次,基于决策层可信度的模糊认知特点,采用了多维证据理论进行特征融合;最后,收集了新浪微博两个真实数据集进行了一系列实验。实验结果表明,与传统信息检索排序方法平滑语言模型(LMJM)相比,CCM-IF符合用户需求的信息占比提高了10%~20%。因此,作为一个静态质量评估指标,CCM-IF可直接用于微博检索排序、垃圾微博过滤等实际任务。 高明霞 陈福荣关键词:信息融合 证据理论 基于引导素更新和扩散机制的人工蜂群算法 被引量:6 2013年 人工蜂群算法是一种新型的搜索算法,其机理是通过模拟蜂群采蜜过程中体现出的智能行为来实现对问题的求解.在现有的蜂群算法中,蜂群间的信息交流仅使用单一的行为通信(跳舞),蜂群间的协作存在明显不足,影响了蜂群算法的求解性能.根据真实蜜蜂多模式传递信息的客观事实,通过引入基于引导素的化学通信方式,提出一种新的更忠实反映蜂群信息传递的蜂群算法,并应用于多维背包问题(MKP)的求解.新算法将行为通信和化学通信相融合,利用引导素的更新和扩散机制使蜂群能够更好地进行协作.MKP的仿真实验结果表明新算法优于传统的ABC算法.与其他一些元启发式搜索算法的比较同样显示了新算法的有效性. 冀俊忠 魏红凯 刘椿年 尹宝才关键词:蜂群算法 多维背包问题 基于特征映射的半监督文本分类算法 被引量:5 2016年 针对已标记数据与未标记数据分布不一致可能导致半监督分类器性能降低的不足,提出了一种基于特征映射的半监督文本分类算法.首先通过不同的特征选择方法,分别在训练集的已标记数据、未标记数据以及测试集数据中选取各自的特征集,并初始化特征的权值;在此基础之上,分别建立已标记数据与未标记数据、已标记数据与测试集数据、未标记数据与测试集数据之间的映射函数,并利用这3个特征映射函数重新计算特征的权重;最后利用期望最大比(expectation maximization,EM)算法进行半监督文本分类.在标准数据集上的实验结果表明:提出的算法是有效的. 杜芳华 冀俊忠 赵学武 吴晨生关键词:特征映射 半监督学习 文本分类 融合时序保持特征和蚁群聚类的动态PPI网络复合物识别 被引量:6 2017年 由于蛋白质的相互作用是动态变化的,因此使用常规检测方法从静态PPI网络数据中识别蛋白质复合物具有一定的局限性.本文结合时序基因表达数据,提出了一个基于时序功能保持特征和蚁群聚类的复合物检测算法.算法首先根据相邻时刻的子网结构,选出在相邻时刻都具有表达活性的种子节点集合.然后结合复合物的保持特征,构建一组与前一时刻复合物集合具有功能相似性的初始蛋白质簇集合,并利用蚁群聚类的拾起、放下规则,完成对其他蛋白质的聚类,从而形成最终的复合物.实验结果表明使用时序功能保持特征可以提高复合物预测的准确性,与其他方法相比,新算法在精度方面也具有较好的性能. 赵学武 程新党 吕嘉伟 刘向娇关键词:蛋白质复合物 蚁群聚类 基于流形正则化极限学习机的文本分类算法研究 被引量:5 2019年 基于极限学习机的文本分类方法在对输入的文本特征进行随机映射时,会呈现一种非线性的几何结构,利用最小二乘法无法对其进行求解,影响文本的分类性能。为此,引入一种新的流形正则化思想,提出基于极限学习机的改进算法。利用拉普拉斯特征映射保持输入文本特征的几何结构。基于样本的类别信息对样本点之间的距离进行修正,优先选择类别相同的样本点,以改善分类性能。在Reuters和20newsgroup数据集上的实验结果表明,与正则化极限学习机算法、AdaBELM算法等相比,该算法分类性能较好,F1-measure值可达91.42%。 庞皓明 冀俊忠 刘金铎 姚垚关键词:文本分类 流形正则化 特征映射 基于蝙蝠算法的蛋白质网络功能模块检测 2019年 为了得到更好的蛋白质功能模块,揭示蛋白质的功能,利用蝙蝠算法对蛋白质相互作用网络(PPINs)进行功能模块检测.每个蝙蝠个体所在的位置代表一种候选的功能模块划分,将PPIN中每个蛋白质节点与其所有邻居节点组成邻居有序表,采用在邻居有序表中随机游走的编码方式进行种群的初始化;在种群优化过程中,设计定向局部扰动、随机扰动、基于距离和频率的自适应变异、自然选择4种寻优机制来进行解的随机优化.在5个不同规模的酵母菌PPIN数据集上,将所提出方法与6种经典算法进行对比实验.结果表明,所提出方法检测到的功能模块中有较多模块与标准模块相匹配,并且所提出算法在覆盖率、召回率、灵敏度、正的预测率、准确度评价指标上均表现突出,验证了所提出方法的有效性. 徐嘉豪 冀俊忠 杨翠翠关键词:自适应变异 自然选择 基于花授粉算法的蛋白质网络功能模块检测方法 被引量:1 2018年 揭示未知蛋白质功能是后基因时代蛋白质组学中的核心内容之一,运用群集智能思想识别蛋白质相互作用网络(protein-protein interaction netw ork,PPIN)中的功能模块已经成为该领域的一个研究热点。提出一种基于花授粉算法(flow er pollination algorithm,FPA)的蛋白质相互作用网络功能模块检测方法(FPA for functional module detection in PPIN,FPA-FM D)。采用随机游走的方式对种群中的每个花粉进行编码,并利用花授粉算法特有的自花授粉和异花授粉机制优化种群,其中自花授粉采用重组策略和取优策略,异花授粉采用基于Levy机制的变异策略和基于差异度的自适应变异策略,4种策略分别从不同角度推进了种群的进化。在3个公共数据集上的仿真试验表明:与其他6种经典算法相比,本研究提出的算法的整体性能优良而且在F度量和准确度两项综合指标上具有绝对优势。 吴红岩 冀俊忠关键词:蛋白质相互作用网络 自花授粉 异花授粉 基于栈式循环神经网络的血液动力学状态估计方法 被引量:2 2020年 利用fMRI数据准确地估计血液动力学状态,能得到一种更接近神经元层面的大脑活动的客观表示,这将促进人们对大脑运行机理的深刻理解,推动脑认知的进一步发展.迄今为止,人们已经提出了许多血液动力学状态估计方法.然而,这些方法大都只考虑了相邻时刻血液动力学状态之间的关系,忽视了更深层次的时序特征.而对模型参数先验信息的需求也使一些方法在实际应用中受到了限制.为此,本文提出了一种基于循环神经网络的血液动力学状态估计新方法.首先,利用血液动力学模型中非线性函数的反函数建立BOLD信号与血液动力学状态之间的映射关系,并构建模型的反演过程.然后,采用一种堆叠三个RNN模块的栈式神经网络结构来拟合这种映射关系,使其能够以BOLD信号作为输入,得到血液动力学状态的估计值.最后,在仿真数据上验证新方法的性能.实验结果表明:与一些代表算法相比,新方法能够更合理地提取fMRI数据中的时间特性,有效地拟合BOLD信号与血液动力学状态之间的动态非线性关系. 姚垚 冀俊忠关键词:循环神经网络 功能磁共振成像 神经元活动