国家自然科学基金(60603054) 作品数:14 被引量:31 H指数:4 相关作者: 王正华 王勇献 董蕴源 朱云平 张振慧 更多>> 相关机构: 国防科学技术大学 军事医学科学院 并行与分布处理国防科技重点实验室 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 国家高技术研究发展计划 更多>> 相关领域: 生物学 自动化与计算机技术 理学 医药卫生 更多>>
基因调控网络的模块化组织研究 被引量:4 2008年 基因调控网络表现的是大量基因受到转录因子的调控而最终转录翻译为蛋白质进而实现生物功能的复杂信息,是人们理解生物过程和基因功能的重要内容。为了理解基因调控网络中的调控机理,网络的拓扑结构及其组织方式是极其重要的研究内容之一。它不仅能说明网络的局部特征,并且能揭示调控网络的构造方法,同时还能对调控信号通路进行全面系统的分析。调控网络可分为4层结构:调控元件、Motif、模块和整个网络。当前,这种层次结构受到人们越来越多的认可。文中重点讨论motif和模块两层,比较分析了近年来对网络组织结构的多方面研究内容,阐述了各个研究结果与结论具有的生物学意义,并指出了其中存在的问题。在此基础上,文中还针对这些问题提出了可能存在的研究方向,并展望了基因调控网络模块化组织的研究前景。 王正华 刘齐军 朱云平关键词:基因调控网络 网络模块 模块化组织 基于分组重量编码的蛋白质功能预测 被引量:1 2007年 从蛋白质序列出发,采用分组重量编码(Encoding Based on Grouped Weight,简记EBGW),并结合最近邻居算法对蛋白质功能进行预测。对酵母(Saccharomyces cerevisiae)蛋白质的1826条序列进行预测,整体预测准确率与其他基于序列信息的蛋白质功能预测方法相当。实验结果表明基于EBGW编码方案的新方法可有效地应用于蛋白质功能预测。 王秀鹤 王正华 王勇献 张振慧关键词:分组重量编码 蛋白质功能预测 一种基于KEGG数据库重构代谢网络的新方法 被引量:6 2010年 从代谢物、酶和生化反应信息重新构建正确的代谢网络是各项代谢网络相关研究非常关键的第一步。针对以往重构方法存在的数据难以及时更新、数据有冗余、获取数据慢等问题,本文采用分而治之的递归策略,提出了一种基于KEGG数据库自下而上重构全物种代谢网络的新方法。与以前的方法相比,本方法的优点在于:使用KEGG的Web服务获取数据,以保证数据的准确性和及时更新;依靠KEGG/PATHWAY库的数据选择机制选取数据,以保证构建网络的数据无冗余;整个方法基于Java实现,保证程序的跨平台通用性;通过构建MySQL本地数据库将远程数据本地化,大大降低数据读取的时耗。评估结果显示,该方法不仅能够保证重建网络数据的准确性和及时更新,而且有效地提高了多物种多次重构情况下的网络重构效率。 周婷婷 容健锋 王正华 董蕴源 王勇献 朱云平关键词:代谢网络 网络构建 WEB服务 MYSQL 一种预测细胞凋亡蛋白的亚细胞定位的新方法 被引量:3 2007年 细胞凋亡蛋白对生物体的发育、维持内环境稳定及人们理解细胞凋亡机制非常重要。文中提出了一种新的蛋白质序列特征提取方法—三肽离散源方法。计算了蛋白质序列中紧邻三联体的出现个数,利用离散增量极小化对凋亡蛋白进行定位预测;同时推广了张春霆等提出的内容平衡精度指数,使其能评估任意类的分类问题。实验结果表明:在凋亡蛋白定位预测研究中,三肽离散源方法在提高总体预测精度的同时,能够较好的解决样本不均衡问题;而内容平衡精度指数能比传统的总体预测精度更准确的评估预测算法的预测能力,有效的反映预测算法对样本不均衡问题的相容能力。 张振慧 王勇献 王正华关键词:亚细胞定位 为何在蛋白质相互作用网络中伪hub没有致命性?(英文) 2014年 在系统生物学中,中心性-致命性法则的机制至今仍是一个有争议的问题。但是,在蛋白质-蛋白质相互作用网络中,存在很多伪hub,它们并不具有致命性。为了解释这一现象,作者提出了三个新的度量标准:n-neighbor、n-ip和n-ibep,并从拓扑和功能两方面将伪hub与致命性hub进行比较,发现两者所有的区别都具有统计学意义。实验结果显示伪hub具有更高的进化速率,参与了较少的子图且倾向于与非致命性蛋白质发生相互作用。 董蕴源 王勇献关键词:致命性 大规模代谢网络分解的生物信息学研究 被引量:3 2008年 随着大规模分子相互作用数据的不断涌现,生物学网络方面的研究正日益得到重视。代谢网络处于生物体的功能执行阶段,其结构组成方式不仅反映了生物体的功能构成,也直接影响代谢工程中的途径分析和研究。作为代谢网络研究的重要环节,实现网络的合理分解不仅对于基因组范围内分子网络的结构和功能研究具有重要意义,也是代谢工程的途径分析和优化得以顺利进行的前提之一。在回顾代谢网络宏观结构和拓扑特征研究成果的基础上,通过对现有分解方法的深入分析,指出缺乏合理且有针对性的模型评估准则是目前网络分解研究中亟待解决的问题之一。今后的研究趋势在于如何整合更多的信息和发展更先进的分析方法,建立更合理的模型,并进一步拓展网络分解的应用范围。 王正华 周婷婷关键词:生物信息学 代谢网络 啤酒酵母、秀丽线虫和大肠杆菌蛋白质相互作用网络的近似二分模式分析 被引量:2 2008年 在深入分析啤酒酵母、秀丽线虫和大肠杆菌的蛋白质-蛋白质相互作用(PPI)网络模式的基础上,针对近似二分模式的挖掘,改进已有模型并提出了二分系数这一评价标准.实验结果表明,在相同条件下,所提出的模型比先前的模型效果略好,可以有效地挖掘出PPI网络中的近似二分模式. 董蕴源 王正华 王勇献利用基于Normal矩阵的谱平分法挖掘酵母蛋白质相互作用网络中的社团 被引量:4 2008年 蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络是生物网络的重要组成部分,也是后基因组时代的热点研究问题。揭示PPI网络中的社团结构,对于理解其复杂相互作用的结构和动态特征,了解活体细胞的结构和功能都有很大作用。但目前对于PPI网络结构的分析带有很强的试探性,还没有成熟可靠的方法。传统的谱平分法需要预先知道社团的个数,为了克服这一缺点,在无向无权的PPI网络中使用改进后的基于Normal矩阵的谱平分法,得到了55个有生物学意义的社团。实验结果表明:尽管PPI网络中的社团结构不是很明显,基于Normal矩阵的谱平分法依然可以有效地挖掘出其中具有生物学意义的社团结构。 董蕴源 王正华 王勇献关键词:PPI网络 社团结构 谱平分法 使用多特征联合变量的支持向量机方法预测外膜蛋白 被引量:1 2008年 外膜蛋白(Outer Membrane Proteins,OMPs)是一类具有重要生物功能的蛋白质,通过生物信息学方法来预测OMPs能够为预测OMPs的二级和三级结构以及在基因组发现新的OMPs提供帮助。文中提出计算蛋白质序列的氨基酸含量特征、二肽含量特征和加权多阶氨基酸残基指数相关系数特征,将三类特征组合,采用支持向量机(Support Vector Machine,SVM)算法来识别OMPs。计算了包括四种残基指数的多种组合特征的识别结果,并且讨论了相关系数的阶次和权值对预测性能的影响。在数据集上的十倍交叉验证测试和独立性测试结果显示,组合特征识别方法对OMPs和非OMPs的识别精度最高分别达到96.96%和97.33%,优于现有的多种方法。在五种细菌基因组内识别OMPs的结果显示,组合特征方法具有很高的特异性,并且对PDB数据库中已知结构的OMPs识别准确度超过99%。表明该方法能够作为基因组内筛选OMPs的有效工具。 邹凌云 王正志 王勇献关键词:外膜蛋白 相关系数 支持向量机 基于相互作用的蛋白质功能预测 被引量:4 2007年 蛋白质功能预测是后基因时代研究的热点问题。基于相互作用的蛋白质功能预测方法目前应用比较广泛,但是当"伙伴蛋白质"(interacting partners)数目k较小时,其预测准确率不高。从蛋白质相互作用网络入手,结合"小世界网络"特性,有效解决了k较小时预测准确率不高的问题。对酵母(Saccharomyces cerevisiae)蛋白质的相互作用网络进行预测,当k≤4时其预测准确率比相同条件下的GO(global optimization)方法有一定提高。实验结果表明:该方法能够有效的应用于伙伴蛋白质数目较小时的蛋白质功能预测。 王正华 王秀鹤 王勇献 张振慧关键词:蛋白质功能预测 蛋白质相互作用 小世界网络