范云满
- 作品数:27 被引量:170H指数:6
- 供职机构:中国医学科学院北京协和医学院医学信息研究所更多>>
- 发文基金:中国科学院西部之光基金国家自然科学基金中央级公益性科研院所基本科研业务费专项更多>>
- 相关领域:医药卫生自动化与计算机技术文化科学更多>>
- 面向技术演化分析的多主路径方法研究被引量:36
- 2015年
- [目的/意义]基于当前技术演化分析方法的发展现状,提出一种能够在微观层次上突出既定领域中主要技术发展脉络的多主路径方法。[方法/过程]将专利文本挖掘和动态规划方法应用于专利引文网络,以路径上所有专利对的语义相似度总和最优作为启发策略进行路径搜索,以获取若干能够分别聚焦于特定主题的主路径,供研究者总览既定技术领域中主要技术主题的发展脉络及其相互关系。[结果/结论]实证结果表明,将该方法应用于硬盘驱动器磁头领域,可以有效抽取其中主要技术主题的演化轨迹。
- 陈亮杨冠灿张静范云满
- 关键词:文本挖掘动态规划硬盘驱动器
- 面向医学数字资源长期保存的信息包封装模式研究
- 2021年
- 阐述3种典型的信息包封装模式基本原理并对3种模式进行对比分析。结合医学数字资源长期保存需求,提出面向语义化的医学数字资源封装模式,为长期保存仓储关联数据的形成、长期保存规划中的保存管理提供基础支撑。
- 范云满田丙磊杨晨柳王蕾姚宽达方安王茜
- 基于文献耦合的相似文献推荐算法实现被引量:2
- 2018年
- 在调研并总结相似文献推荐算法的基础上,提出一种基于文献耦合的相似文献推荐算法。分别采用离线式算法和在线式算法进行实现,从算法难度、复杂度、所需计算资源等方面进行对比分析,指出在线式算法更具有优势。
- 范云满方安陈凌云
- 基于LDA与新兴主题特征分析的新兴主题探测研究被引量:63
- 2014年
- 本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题.
- 范云满马建霞
- 关键词:主题模型主题特征
- 基于主动学习的中文电子病历命名实体识别研究被引量:2
- 2020年
- 目的:开展基于主动学习的中文电子病历命名实体识别研究,旨在优化机器学习模型,并降低标注成本。方法:分析比较信息熵、语料长度以及随机查询3种不同算法,采用CCKS 2018 CNER评测语料,识别病历文本中的解剖部位、手术、药物、独立症状、症状描述5类实体。结果:在字数成本节约方面,基于熵的方法相比基于长度的方法节省了41%的字数;在语料成本节约方面,基于熵的算法相比随机抽样节省了46%的语料。结论:基于信息熵的主动学习方法通过选择待选标注集中最不确定的语料进行标注,可显著减少对标注语料的依赖,降低人工标注成本。
- 胡佳慧赵琬清方安范云满
- 关键词:命名实体识别信息熵
- 面向OAI-PMH协议的西太平洋地区医学索引数据服务设计与实践被引量:3
- 2019年
- 介绍西太平洋地区医学索引(WPRIM)系统在实现OAI-PMH协议,提供数据服务过程中面临且必须解决的3个问题,制定WPRIM元数据规范、WPIRM数据分组策略,以及基于网络带宽自适应的resumptionToken生成策略的基本方法,目前已在OAI-PMH官方网站上通过协议验证并实现数据服务注册。
- 范云满方安王蕾
- 关键词:西太平洋地区医学索引OAI-PMH协议元数据规范
- 医学大数据长期保存的技术策略分析
- 本文面对数据资源大数据的情形,提出了医学大数据面临的长期保存的问题。医学大数据的长期保存技术策略,本文将其分为现有的长期保存技术方法和医学数字资源的保存技术方法。现有的长期保存技术方法,着重通用性,面向一般的数字资源,包...
- 范云满
- 关键词:云服务
- 一种基于序列推荐的合作关系预测方法、装置及电子设备
- 本发明提供一种基于序列推荐的合作关系预测方法、装置及电子设备,涉及数据预测领域。在进行合作关系预测时,通过时间嵌入描述作者对应的文本随时间的动态变化情况,通过作者高阶嵌入考虑作者与合作者的历史合作关系,通过内容嵌入表征文...
- 刘辉张燕舞范云满王军辉张玢肖宇锋方安 侯宇
- 基于Hadoop/HBase的药物基因组数据云存储实践研究
- 本文首先分析了生物医学大数据的特点,从理论方面和数据查询对比试验两个方面,对比分析了以Oracle为代表的传统的关系数据库和以HBase为代表的NoSQL数据库在解决大数据问题各自采用的技术以及各自的优势与不足.接下来以...
- 范云满洪娜钱庆方安
- 文献传递
- 全球肿瘤疫苗临床转化现状分析被引量:2
- 2021年
- 目的了解全球肿瘤疫苗领域的临床转化现状。方法采集ClinicalTrials.gov中全球肿瘤疫苗相关临床试验数据,利用文献计量学方法,从数量与时间变化趋势、国家分布、申办者分布及构成、临床试验机构分布、研究类型与方法、临床试验分期和适应证等角度分析肿瘤疫苗临床试验注册现状。结果全球肿瘤疫苗相关临床试验共1772项,主要开展于美国(1102项),申办者以企业、高校及科研院所为主。其中,绝大多数为实验性研究(1740项),且大多处于临床试验Ⅰ期和Ⅱ期;临床试验最常见的适应证为黑色素瘤(448项)、淋巴瘤/白血病(347项)和乳腺癌/肿瘤(347项)。截至检索日期(2021年1月28日),按临床试验注册数量,中国尚处于第二梯队(102项)。结论全球肿瘤疫苗领域临床转化日趋活跃,但大多数疫苗离正式上市尚早。
- 卢岩范云满杨潇逸张婷欧阳昭连
- 关键词:肿瘤疫苗文献计量学