王志刚 作品数:19 被引量:50 H指数:4 供职机构: 中国医学科学院北京协和医学院基础医学院基础医学研究所 更多>> 发文基金: 国家自然科学基金 国家科技支撑计划 国家科技基础性工作专项 更多>> 相关领域: 医药卫生 自动化与计算机技术 理学 生物学 更多>>
基于大规模人群调查的心电数据库的构建 被引量:4 2010年 建立基于大规模人群调查的心电数据库是心电研究中一项重要的基础性工作。本研究依据"中国人生理常数调查研究和数据库"的心电数据,建立了一个以10s十二导联同步心电信号为主要内容的关系型数据库。该数据库包含波形数据、心电可视化图形、多类心电测量数据、诊断结果、人口学信息和基本健康资料,并提供便捷的数据查询、更新和管理服务。目前该数据库记录的样本总量已达25821人,人口覆盖我国四省15个县市,涉及多个民族。该数据库的建立为心电信息学的研究提供了丰富的资源。 杨啸林 张靖 徐铖 王志刚 李心雅 韩少梅 朱广瑾 张正国关键词:心电图 数据库 药物化学结构在线分析系统 2012年 高通量的筛选药物结构数据库,可以辅助药物设计。该文从DrugBank数据库获取4 886种药物的化学结构信息,建立了一个免费的在线药物化学结构分析平台。基于Tanimoto系数预先计算了药物两两化学结构相似性矩阵作为后台数据,从而提高了高通量药物结构分析的速度。该平台实现了药物通用名、商品名和别名的检索,药物化学结构相似性搜索查看及其聚类分析可视化的功能。应用该系统进一步验证了与相同靶蛋白关联的药物,其化学结构更相似的结论。本文系统可通过http://122.70.220.99/bme的Drug and Disease访问。 王志刚 陈鑫 谢丽芳 彭屹 张正国关键词:药物筛选 正常人短时心率变异性指标在长时序列中的分布特性及其年龄的影响 被引量:3 2019年 无创的心率变异性(HRV)检测所反映的自主神经状态可受生理、病理和心理等因素影响。提出研究短时HRV分析指标在长时序列中的分布特性,并探讨在正常人中随年龄可能发生的变化。将THEW中Normal子数据库中年龄大于18岁的Holter数据(n=177)分为5个年龄组(18≤y≤25,n=35;2555,n=23)。利用5 min的滑动窗口、2.5 min的步长,计算每个滑动窗的RR间期均值(MRRI)、LF/HF和短时分形尺度指数(α1),然后基于长时序列,分别计算MRRI和LF/HF,以及MRRI和α1这两种配对的Spearman相关系数,并在各组内统计相关性良好人数的百分占比。然后,以具有正常作息时间和数据长度为筛选标准,从177名正常人中筛选出93名250.05)),但在其他时段这些参数则可能存在显著差异。随着可穿戴技术的发展,长时心率序列(RR间期序列)的可获得性大幅度提高,该研究结果对于拓展长时序列的HRV分析方法可提供新的思路。 潘越 王志刚 张正国 彭屹关键词:自主神经系统 动态心电图 年龄 本体支持的生物医学领域元数据异质性与可兼容性研究 被引量:1 2019年 利用本体支持数据元素的表示,是提升元数据机器可理解性的重要手段。采用生物医学通用数据元素数据库caDSR中的数据,评价相关的数据元素之间的语义异质性,并利用机器学习对元数据可兼容性进行判别。首先,从caDSR中选取60对通用数据元素,涉及人口学、生活方式、既往病史和实验室测量等方面。依据ISO/IEC 111179标准抽提数据元素的必要组分,利用NCIT的本体支持,就每对关联数据元素的相似度进行评价。依据数据元素内部各组分的语义相似度,利用支持向量机,对数据元素间的可兼容性做出预测,其准确度超过80%。研究结果显示,目前在caDSR数据库中,对于元数据的定义存在较大的异质性,这些异质性在数据元素的概念域尤其集中。虽然如此,通过机器学习的方法,还是能够依据现有的数据元素的定义实现数据可兼容性的自动判断。研究所建立的方法,对于优化数据元素构建流程、丰富数据标准化工具具有一定的应用价值。 张璐璐 杨晟 史涪仁 潘虹洁 王志刚 杨啸林关键词:元数据 本体 支持向量机 药物功能模式相似度及其聚类 被引量:3 2011年 对现有已知药物的功能模式进行分析,可以帮助发现其可能的新应用,指导联合用药或预测药物的未知毒副作用。提出将药物化学结构信息和GO注释信息结合,分析药物功能模式相似度。药物化学结构和GO注释信息下载自DrugBank数据库,其中GO注释信息包括生物过程、分子功能和细胞定位等3个分支。计算现有4886种药物的功能模式相似度,并对其进行聚类分析。基于Tanimoto系数计算药物化学结构相似度,基于语义分析计算药物GO注释中3个分支的相似度。分别使用Logistic回归、算术均值、几何均值将上述4个药物相似度结合,得到反映多方信息的复合相似度。将一种药物与所有其他药物的相似度向量作为该药物的特征谱,对药物进行层次聚类。使用药物解剖学、治疗学及化学分类(ATC)的标准评价不同的相似度和聚类结果。结果显示:药物化学结构相似度与基于GO的3个分支的相似度均线性相关,表明药物的结构信息能在一定程度上反映功能信息;Logistic回归复合相似度能够很好地反映两个药物是否属于同一个ATC分类;基于GO注释生物过程分支语义相似度和几何均数复合相似度聚类结果与ATC分类第一层次强关联。所提出的方法结果可靠,可望用于辅助药物发现和预测不良反应。 王志刚 陈鑫 谢丽芳 杨啸林 张正国关键词:药物发现 相似度 聚类 基于语义的疾病表型相似性 被引量:1 2012年 已知一种药物可用于治疗某疾病,则该药物可能对与该疾病具有相似表型的其他疾病有疗效。因此,大规模地计算疾病表型相似性可辅助发现的疾病新的治疗方法。我们从OMIM下载了3742种疾病的表型信息,从Mesh词库下载13721个关联解剖学和疾病症状的注释词。我们将以上的Mesh词逐一在3742种疾病的表型信息文本中搜索,得到每种疾病涉及的Mesh词汇列表,进而基于语义分析的方法系统地计算了疾病表型的两两相似性矩阵。我们发现疾病关联生物通路最多的有肿瘤生物通路,胰岛素信号通路,肥大心肌病通路和细胞粘附通路等。随疾病对表型相似度的增加,其更涉及相同KEGG生物通路的概率亦增加,证明了本文方法的可靠性。疾病表型相似性可作为疾病在基因水平相似性的补充,有望为药物发现研究提供一条新途径。 王志刚 谢丽芳 陈鑫 杨啸林 彭屹 张正国关键词:语义 乳腺影像数据库及其纹理特征的机器学习分类 妇女乳腺肿瘤近几年增加很快,由于目前没有有效的预防措施,疾病的治疗和生存率的提高取决于早期诊断。乳腺X线影像筛查的普遍实行有助于早发现,但巨大的工作量会影响医生读片的准确率。虽然双医生读片验证可提高准确率,但成本太高。本... 王志刚 翟天野 张正国关键词:数据库 文献传递 FAIR准则与生物医学数据标准应用服务 被引量:10 2020年 2016年,科学数据管理的指导原则——FAIR准则被提出,即科学数据应具有可查询(Findable)、可获取(Accessible)、可互操作(Interoperable)并且可重利用(Reusable)等性质。自从该准则提出以来,受到国际广泛认可。通过FAIR准则的实施,将提升机器自动化发现和使用数据的能力,并提升其重利用的可能。在数据建设过程中,需要有完善的数据标准系统、数据标准实施工具与资源以及数据质量评价准则作为实现FAIR准则的支撑。 杨啸林 杨晟 潘虹洁 王哲 王志刚 何勇群关键词:可互操作 元数据 以短时心率变异性反映充血性心力衰竭患者自主神经活动的改变 被引量:11 2016年 基于短时心率变异性(HRV)分析,探讨充血性心力衰竭(CHF)患者自主神经活动的变化和影响。选用THEW数据库中正常人子数据库作为正常对照组(n=189),对于Physio Net中两个CHF子数据库的样本(n=44),按照NYHA等级,将NYHA I-II级划分轻度CHF组(n=12),NYHA III-IV级为重度CHF组(n=32)。对每一个Holter记录选取日间和夜间安静态各5 min的RR间期(RRI)序列,分别进行时域、基于AR模型的频域和去趋势波动(DFA)分析。在正常组、轻度CHF组和重度CHF组等三组中,CHF患者日间的短时分形尺度指数((α1)d)两两比较均有显著性差异,并存在下降趋势(依次分别为1.35±0.21、1.03±0.29和0.81±0.29),反映心率动力学从分形特性转向更随机化的结构。同时,日间HFn((HFn)d)在三组间的两两比较中均存在显著性差异,并存在上升趋势(依次分别为23.89%±12.78%、37.22%±11.24%和56.30%±15.28%),表明CHF导致交感神经和迷走神经交互作用趋于消失。利用夜间RRI(RRIn),(HFn)d和(α1)d等3个指标进行Fisher线性判别,区分正常人和CHF患者的灵敏性和特异性分别为90.91%和92.06%,而区分轻度和重度CHF患者的灵敏性和特异性分别为84.38%和100%。所进行的研究将HRV非线性方法与传统方法相结合评估自主神经状态,为监测CHF病情或观察治疗效果等潜在的临床应用提供了依据。 刘红夺儿 湛萍 王志刚 彭屹关键词:心率变异性 充血性心力衰竭 自主神经系统 以线性参数模型和信息分解方法评价QT变异性对心率变异性的响应 被引量:2 2018年 自主神经系统(ANS)的平衡对于规避与心脏相关的疾病风险具有重要意义。本课题运用频域的线性参数模型和非线性信息分解方法,分析QT变异性(QTV)对于心率变异性(HRV)的响应,揭示心脏自主神经的调节状态。使用来自THEW数据库的Holter数据,选用其中的正常组(Normal,n=186)和高心律失常和心源性猝死风险组(ESRD,n=41)进行对比。提取昼夜安静态各5 min RR间期(RRI)和相对应的QT间期(QTI)序列,计算频域参数QTV与HRV相关的百分占比(LR)和信息分解的RRI对于QTI的可预测性(PI),并结合RRI序列的时域、频域和符号动力学分析,探讨QTV对于HRV的响应在两组人群中可能的差异和发生机制。对于LR和PI,Normal组均表现出显著的昼夜差异,而ESRD组则均不存在,反映出ESRD组ANS交互作用的缺失。两组间同时段同指标对比时,低频段LR无显著差异,而在高频段,Normal组的LR值均显著小于同时段ESRD组的LR值(白天:18.36%±17.38%vs 39.37%±23.80%,P<0.05;夜晚:28.63%±18.77%vs 42.31%±21.97%,P<0.05);Normal组夜晚的PI显著大于ESRD组夜晚的PI(0.310±0.155 vs 0.236±0.131,P<0.05),而在白天无显著差异。研究表明,线性参数模型和基于信息分解的非线性预测对自主神经活动的敏感性不同;高心律失常和心源性猝死风险人群中HRV对QTV的调控呈复杂度降低的特点。 李晨曦 潘越 王志刚 张正国 彭屹关键词:自主神经系统