刘红蕾
- 作品数:11 被引量:24H指数:3
- 供职机构:首都医科大学生物医学工程学院更多>>
- 发文基金:国家自然科学基金北京市优秀人才培养资助更多>>
- 相关领域:医药卫生自动化与计算机技术文化科学更多>>
- 基于Skip-gram词嵌入算法的结构化患者特征表示方法研究被引量:6
- 2019年
- 目的基于表示学习中的Skip-gram词嵌入算法,寻找能够克服电子病历中结构化特征的高维性并在语义层次上表示特征的方法。方法本文的数据来源于北京市某三甲医院的电子病历系统,从中提取患者的结构化特征,包括疾病、药物和实验室指标,其中实验室指标通过正常值范围离散化;利用Skip-gram算法,将电子病历中离散型患者特征(疾病和药物)和离散后的连续型患者特征(实验室指标)嵌入到同一个低维实数向量空间中。通过t-SNE降维可视化方法显示低维实数空间中特征向量的关系,并与特征向量间的余弦距离计算结果相互印证,从而评价特征表示的有效性和揭示特征向量间的潜在联系。结果患者特征的低维实数向量既降低了患者特征的维度,又很好地表征了特征间的潜在联系,临床含义相关的特征表示成的低维实数向量也很相近。结论基于Skip-gram算法将患者结构化特征表示成低维实数向量取得了较好的效果,为解决EMR数据表示的高维性以及结构化特征间潜在关系分析提供一种思路。
- 黄艳群王妮刘红蕾刘红蕾巍岚费晓璐
- 关键词:电子病历自然语言处理
- 基于住院病案首页的慢阻肺患者住院人数影响因素分析
- 2018年
- 目的探讨慢性阻塞性肺疾病(慢阻肺)住院人数的时间变化趋势及其与空气质量的关系。方法收集大连市2002年-2015年所有二级及以上医院的住院病案首页数据,分析不同性别、年龄、合并症程度的慢阻肺患者住院人数时间趋势,以及住院人数与当地空气质量的关系。结果不同性别、年龄、合并症程度的慢阻肺患者住院人数均呈增长趋势,男性患者、60岁及以上患者、无合并症患者住院人数的增长明显高于相应其他人群;慢阻肺住院人数随季节更替有明显变化,春冬两季住院人数高于夏秋两季;随着空气质量的变差,2002年-2007年、2008年-2012年、2013年-2015年间慢阻肺住院人数均有显著上升趋势,P值分别为<0.001、0.040和<0.001。结论应提高对男性及老年人群的慢阻肺防治力度,并加强对慢阻肺合并症的治疗。春冬两季是慢阻肺的高发季,应重点监测预防,保护易感人群。积极改善空气质量控制污染,减少慢阻肺的住院人数。
- 王妮刘红蕾陈卉
- 关键词:住院病案首页慢性阻塞性肺疾病空气质量
- 基于半监督学习的患者相似性度量研究被引量:4
- 2020年
- 目的对数据类型多样的电子病历数据开展基于半监督学习的患者相似性度量研究,评估其可行性和有效性,并为后续个性化研究提供相似患者队列。方法对来自真实世界的电子病历数据,首先特异性计算特征相似性(年龄、性别、疾病、实验室检查),结合专家标注的部分监督信息构成标签集,在标签集中有监督地学习出最优距离度量。然后计算标签集与无标签集数据间的马氏距离,对无标签集中的每个样本,找出与其距离最近的标签集样本,并将其相似性分值作为该无标签样本的患者相似性预测值。最后将学习出的患者相似性作为聚类时评估患者亲疏程度的指标,并与基于传统欧氏距离和余弦距离的聚类结果进行比较。结果较欧氏距离和余弦距离,基于半监督学习出的患者相似性的聚类结果中,患者相似程度更高,聚类效果更好。结论对电子病历数据开展基于半监督学习的患者相似性度量研究是有效的。
- 王妮黄艳群刘红蕾刘红蕾魏岚费晓璐魏岚
- 关键词:半监督学习聚类分析电子病历
- 基于美国住院病人样本的脑血管疾病预后影响因素研究进展被引量:2
- 2018年
- 住院病案首页是数据质量较高的一类医疗大数据,具有巨大的数据挖掘价值。但是目前国内对住院病案首页的利用还主要停留在简单数据统计汇总上。美国的全国住院病人样本的结构和内容与我国的住院病案首页非常相似,很多研究利用其中包含的丰富信息进行多种疾病的预后影响因素分析。本文对利用该数据库进行脑血管疾病的预后研究进行调查,分别从人口学指标、手术、合并症和其他因素等方面进行综述,期望对国内开展基于住院病案首页的类似研究提供思路。
- 黄艳群张慧王妮刘红蕾陈卉
- 关键词:住院病案首页脑血管疾病预后影响因素
- 医学生“数据库语言”课程的线上线下融合教学模式探索被引量:1
- 2021年
- 在后疫情时代,采用线上线下混合教学模式进行医学生的“数据库语言”课程的教学探索,利用多种教学途径有机地融合,提高医学生的利用数据库技术解决实际问题的能力,促进复合型医务人才的培养。
- 武文芳陈卉王洪夏翃周震刘红蕾杜菁
- 关键词:医学生
- 基于美国全国住院病人样本的心血管疾病研究进展
- 2018年
- 美国全国住院病人样本数据库是一个开放的住院患者数据库,我们检索和阅读了2000~2017年利用该数据库进行心肌梗死、心肌病、心力衰竭和先天性心脏病等心血管疾病的流行病学趋势及预后研究的文献,分别从对疾病的发病率、死亡率、住院率等指标进行综述,以望对国内利用类似大数据开展心血管疾病相关研究提供思路。
- 张慧黄艳群王妮刘红蕾陈卉
- 关键词:心血管疾病影响因素
- 面向医学生的《计算机网络技术》课程教学改革研究被引量:1
- 2017年
- 本研究对《计算机网络技术》课程的教学内容和考核方式进行探索,包括合理删减教学内容,相比于知识点的记忆更加侧重对于知识框架的建立和动手能力的培养,同时补充医学信息检索、网络安全等内容,并将传统的考核方式改为小组期末大作业的形式。通过教学改革,提高了医学生的动手能力,利用网络资源进行医学专业学习的能力以及应对不安全网络环境的能力,提高了医学生的计算机应用水平。
- 王宇武博刘红蕾陈卉
- 关键词:计算机网络医学生计算机教学改革
- 利用患者相似性建立个性化糖尿病预测模型被引量:5
- 2019年
- 利用患者相似性筛选不同规模的研究队列,分别建立基于Logistic回归、决策树和BP神经网络的糖尿病个性化及非个性化预测模型,探讨基于患者相似性的个性化与非个性化疾病预测模型性能差异,以及基于不同机器学习算法的个性化预测模型性能差异。
- 黄艳群王妮张慧刘红蕾张慧刘红蕾费晓璐
- 关键词:糖尿病
- 基于任务驱动法的医用计算机基础课程教学策略的研究
- 2024年
- 本文探讨了任务驱动法在大学医用计算机基础课程教学中的应用。首先,分析了任务驱动法的理论基础,探讨了其与医用计算机教学的结合方式。接着,本研究对现行计算机基础课程教学模式的局限性进行了深入分析,并指出了学生学习动力与参与度的问题以及教学资源和设施的现状与挑战。进一步地,论文提出了一套基于任务驱动法的教学策略,包括教学内容与医学任务的有效整合、增强学生主动学习的策略以及评估与反馈机制的构建。最后,文中详细阐述了基于任务驱动法的教学实施策略,包括实施步骤、课程案例分析以及教学效果的评估与改进措施。本研究旨在为改善大学医用计算机基础课程教学质量提供理论与实践指导。
- 朱丛敏杨煜清杨秋英刘红蕾陈卉
- 关键词:任务驱动法教学策略教学模式学生学习动力
- 中文影像学报告中的命名实体识别研究被引量:3
- 2020年
- 目的探索对中文影像学报告进行命名实体识别的方法,特别是条件随机场算法的识别效果。方法随机收集98份腹部CT影像学报告。与影像学专家共同确定报告中影像所见部分的5类实体部位、形态、大小、密度和增强,并进行人工标注。将98份报告按7∶3的比例随机分为训练集样本和测试集样本,使用条件随机场中的三种特征模板进行命名实体识别,并比较识别结果。结果98份CT影像学报告的影像所见共32332个汉字及字符,训练集23224字,测试集9108字。分别利用3种条件随机场特征模板时,实体的总体识别结果F1值平均0.9487,实体大小的识别的F1值最高达0.9818。结论条件随机场算法在中文影像学报告的命名实体识别任务中具有很高的准确性,所识别的实体可用于进行后续信息提取等自然语言处理任务。
- 张志强徐岩黄艳群王妮杨正汉杨正汉陈卉
- 关键词:自然语言处理条件随机场命名实体识别信息提取