范少萍
- 作品数:43 被引量:235H指数:9
- 供职机构:中国医学科学院北京协和医学院医学信息研究所更多>>
- 发文基金:国家自然科学基金中央级公益性科研院所基本科研业务费专项国家社会科学基金更多>>
- 相关领域:文化科学医药卫生自动化与计算机技术理学更多>>
- 学科背景知识在医学文本特征抽取中的应用被引量:1
- 2017年
- 分析目前科技文献文本特征抽取方法研究现状,将基于背景知识的TF-IDF方法应用到医学文本特征抽取中,在4个医学领域中进行试验对比,结果表明该方法在抽取词汇数量较少时可以显著提高抽取效果,在对文本集合中通用词的过滤及重要特征词的识别方面明显优于使用通用IDF的TF-IDF方法。
- 赵迎光范少萍安新颖
- 关键词:文本挖掘TF-IDF特征抽取知识发现
- 知识网格环境下个性化信息服务研究
- 知识网格集成了网格的高性能科学计算以及语义网解决资源语义的功能,不仅提供异构语义资源的共享能力,还具有基于语义资源的知识服务的应用能力。然而,网络技术的迅速发展,使人们逐步被淹没在知识的汪洋中。各种信息服务越来越提倡个性...
- 范少萍
- 关键词:数字图书馆知识网格信息服务个性化需求
- 文献传递
- 基于多维特征识别的医学领域前沿知识发现研究框架被引量:3
- 2016年
- 为了及时发现并准确识别前沿知识,辅助科研人员及决策者更好地开展相关工作,根据现有研究成果,确定了前沿知识的多维度特征(生命周期特征、普遍认可性、权威性、创新性和学科交叉性)及其测度方法,提出了医学领域前沿知识发现的研究框架,并对框架中的关键问题进行了解读,以期为后续医学领域开展前沿知识探测研究提供参考。
- 范少萍安新颖赵迎光
- 关键词:前沿知识
- 论学科信息学的兴起与发展被引量:39
- 2015年
- 随着数据密集型科学研究新范式的出现与日臻发展,科学研究日益成为数据驱动的知识发现活动,D.science(数据驱动的科学)时代来临。以数据计量分析为核心的一系列专门学科领域的“学科信息学”获得了快速发展和应用,有关的概念、技术和方法等已经得到了相应学科领域的认可。同时,支撑专门领域学科信息学发展的信息分析和应用的一般性知识体系不断完善,为一般学科信息学的产生奠定了坚实的基础。本文基于科学研究新范式的时代背景,提出一个全新的概念——“学科信息学”(SubjectInformatics)。文章首先从分析专门学科信息学出发,介绍了学科信息学的缘起,总结了一般学科信息学的内涵;其次,明确了学科信息学的主要研究内容、学科体系及其关键技术与方法;最后,重点剖析了学科信息学在促进学科知识创新和知识发现、催生数据科学兴起与应用、推动知识计算理论与方法发展以及促进学科情报分析与战略研究计算化、定量化发展等方面所起的作用。本研究对发展学科信息学理论体系、完善学科信息学研究内容、促进学科信息学发展应用、推动知识创新以及发展领域知识发现研究等具有重要意义。
- 张志强范少萍
- 关键词:大数据知识发现
- 撤销论文对学术期刊的影响分析被引量:18
- 2014年
- 近年来,因存在学术不端行为或诚实性错误的论文不断被发现或揭露,为了降低其对学术期刊的负面影响,学术期刊对发现的、已发表的、存在问题的论文普遍采取"撤销"的处理方式。这一举措对学术期刊会产生哪些方面的影响?本文借鉴学术期刊的评价方法与标准,从学术层面、社会道德层面、经济利益层面和可持续发展4个层面12个子层面,较为全面地定性化剖析撤销论文对学术期刊的主要影响。以期为学术期刊特别是国内学术期刊如何正确理性地对待和处理有问题的论文提供有益的参考,从而保障学术期刊及其刊载论文的严谨性、科学性,促进期刊根据时代发展要求及读者需求不断完善管理机制,使其朝着更加和谐健康可持续的目标发展。
- 范少萍张志强
- 医学领域前沿主题识别方法研究被引量:14
- 2018年
- 前沿主题识别一直是学科领域与图书情报领域关注的重点,特别是数据密集型科学新范式的到来,更突出了前沿主题识别研究的重要性与必要性。本文关注医学领域文献特色,根据前沿主题所具有的新颖性、创新性、学科交叉性和高关注度特征,设计各个特征计算方法,其中,创新性特征结合医学领域主题词表,采用基于语义相似度的创新性特征计算方法。利用领域实例,确定前沿主题识别方法中各特征的权重。通过实验,说明本文所提方法的有效性。本文所提前沿主题识别方法对医学领域发现更有意义的研究主题具有一定的参考价值。
- 范少萍安新颖晏归来李勇
- 关键词:语义相似度识别方法
- 国内外共词分析研究的文献计量分析被引量:26
- 2013年
- 以研究共词分析法的文献为研究对象,以国外的"ISI Web of Science"和国内CNKI(学术期刊数据库)两个较为大型数据库作为数据来源,利用文献计量方法对共词分析相关文献的增长与分布、学科分布、被引分析、作者分布、高频关键词进行分析。以期对共词分析的深入研究与广泛应用提供借鉴与参考。
- 范少萍李迎迎张志强
- 关键词:共词分析学科分布被引分析
- 中国卫生与健康科技创新指数构建与评价研究被引量:4
- 2020年
- 目的分析我国卫生与健康科技创新现状和趋势,构建中国卫生与健康科技创新指数,测算卫生与健康科技创新发展情况.方法探讨卫生健康科技创新的内涵和范围,设计卫生与健康科技创新指数,从创新资源、创新产出和创新环境维度构建评价指标体系.结果测算得到2011-2017年我国卫生与健康科技创新指数总指数和分指数,设定2011年基数为100,则2017年中国卫生与健康科技创新指数值为201.73.结论利用多级指标,将各项反映科技创新基本特征的指标转化为综合反映科技创新水平的总指数,可用于监测卫生与健康科技创新总体发展情况及各创新环节情况.
- 钟华范少萍李勇安新颖
- 基于统计与语义的主题新颖性探测方法研究
- 文献主题的新颖性探测已成为情报研究工作中的主要工作之一,本文关注到基于统计的主题相似度计算方法仅表示主题在文献集的统计分布情况而忽略主题间语义间的信息,而基于语义的主题相似度计算方法仅考虑主题的语义信息而忽略主题在文献集...
- 范少萍安新颖逯万辉李勇
- 关键词:文献主题语义分析统计分布
- 基于局部线性判别嵌入算法的中文文本分类研究
- 2014年
- 流形学习算法作为一种非线性降维方法,目标是发现嵌入在高维数据空间中的低维流形结构,并给出一个低维表示。文章尝试将流形学习算法应用于中文文本分类领域,利用局部线性判别嵌入方法对所选文本数据集进行特征降维。然后,分别利用K近邻分类器(KNN),支持向量机分类器(SVM)对文本进行分类实验。实验结果证明该方法是有效可行的,进一步验证了中文文本空间向量数据符合流形分布。
- 范少萍李迎迎郑春厚
- 关键词:流形学习文本分类