国家自然科学基金(71373260) 作品数:21 被引量:301 H指数:11 相关作者: 马建霞 范云满 鲍玉芳 刘静 王文娟 更多>> 相关机构: 中国科学院大学 中国科学院文献情报中心 中国科学院 更多>> 发文基金: 国家自然科学基金 中国科学院西部之光基金 广东省自然科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 农业科学 医药卫生 更多>>
Jfactor及其与传统文献计量指标的关系 2015年 [目的/意义]研究基于开放式引文数据库提出的新型期刊评价指标Jfactor以及其与传统文献计量学指标的关系,分析Jfactor的特点,并对我国期刊评价提出启示。[方法/过程]结合统计学方法,利用SPSS软件对高能物理领域期刊的指标数据进行相关性分析,主要包括Jfactor与impactfactor、5-yearimpactfactor、eigenfactorscore,同时将指标之间作比较研究。[结果/结论]相关分析结果表明,Jfactor与impactfactor相关性最强,其次是5-yearimpactfactor,与eigenfactorscore的相关性相对最弱。相对于impactfactor,Jfactor的计算数据更加透明,而且充分考虑了开放数据对论文引用的影响,对我国期刊评价具有重要的研究价值。 鲍玉芳 马建霞诺贝尔奖与科学家论文数量、被引频次的相关性——基于2000-2010年诺贝尔化学、物理学获奖者的实证研究 被引量:13 2015年 通过统计2000~2010年诺贝尔化学、物理学奖获奖者从其出生年至今的所有Web of Science发文数据,包括论文发表量与被引频次,在化学、物理学的学科差异基础上,对这两个指标进行分析,发现:(1)科学家在获奖之前都经过大量积淀;(2)获奖者在获奖前大多数拥有被引频次很高的论文;(3)获奖之后有论文再发表;(4)获奖之后所发论文的被引频次没有显著增大;(5)物理化学两个学科的发文量与被引频次都没有直接关联。 鲍玉芳 马建霞关键词:诺贝尔奖 被引频次 失效专利的主题挖掘与应用分析——以2007—2016年镜头失效专利为例 被引量:9 2017年 [目的/意义]研究基于失效专利的数据,以相机和望远镜的镜头相关专利为例,从主题聚类的角度研究该领域中技术的节点并分析高频主题的技术成熟度;通过案例对专利失效的原因和应用过程中的侵权问题进行分析,为技术应用和创新提供思路。[方法/过程]使用LDA模型对失效专利的主题进行分析,计算得到主题出现的频率和主题之间的相似性,进而分析主题相关技术的成熟度;通过案例分析对比专利失效的原因以及应用中侵权的情况,归纳规避侵权的方法。[结果/结论]LDA模型能够很好地发现失效专利中的技术主题,文章使用的失效专利分析方法与侵权规避过程能够为企业进行技术市场重定位和技术应用创新提供一定的参考。 袁慧 马建霞关键词:LDA模型 主题聚类 技术成熟度 基于LDA的科研项目主题挖掘与演化分析——以NSF海洋酸化研究为例 被引量:12 2017年 [目的/意义]基于当前对科研项目的研究主要以数据统计和计量分析为主,以NSF资助的海洋酸化相关研究的项目数据为例,从项目主题的角度研究科研立项的重点和演化,并对未来投入趋势加以预测。[方法/过程]使用LDA主题模型对该研究的主题进行分析,计算主题强度分析演化过程,统计NSF申请书项目与支撑发表的核心论文主题强度之间的相关性,进而分析NSF海洋酸化项目的主题发展趋势。[结果/结论]发现LDA模型可以很好的发现海洋酸化的主要研究主题,且NSF资助的科研项目与支撑发表论文的主题演化规律具有一致性。使用的方法对科研资助机构资助的项目从主题的角度进行分析,研究国家科研机构资助项目的主题布局和变化趋势,对国家科技部门或机构的项目发展部署和规划具有一定的参考和支撑作用。 王文娟 马建霞关键词:LDA 海洋酸化 基于知识图谱的领域新兴主题研究现状分析 被引量:13 2013年 发现和追踪领域新兴主题是研究人员发现和追踪本领域内最新研究趋势和研究方向的一个重要途径。新兴主题探测可以探测、识别、发现这些新兴趋势和新兴主题。本文对ISI Web of Science数据库中收录的关于新兴主题研究的文献进行收集,然后从文献计量学的角度进行定量分析;利用CiteSpaceⅡ对国家、机构、作者的合作关系做出对应的知识图谱;并对共被引文献的关键节点文献进行了研读和分析;最后利用CiteSpaceⅡ生成的本研究领域中的研究主题聚类图、时序图对研究内容及现状进行了分析和预测。 范云满 马建霞 曾苏关键词:引文分析 知识图谱 命名实体情报挖掘方法研究及其在图书馆中的发展 被引量:5 2017年 各学科领域内相关命名实体情报挖掘是文本处理的重要方法之一。精确的相关命名实体情报挖掘是后续实体关系、事实抽取或文本分类等工作的基础。本文梳理和总结了命名实体的定义及特征,对基于不同方法的命名实体情报挖掘方法和系统研究现状进行了剖析,指出了命名实体情报挖掘在自然语言处理、图书馆知识管理及其他领域的应用,最后从构建命名实体资源库、研究不依赖资源库的算法和知识获取的自动化研究等方面提出了建议。 袁慧 马建霞关键词:信息抽取 信息检索 知识管理 基于BiLSTM-IDCNN-CRF模型的生态治理技术领域命名实体识别 被引量:16 2021年 在生态治理技术领域中,有大量的文献数据没有得到充分的开发与利用。提出基于字嵌入的BiLSTM-IDCNN-CRF模型,结合BiLSTM网络和IDCNN网络获取到的不同粒度的特征。在生态治理技术数据集中取得的F1值为0.7207,均高于现有主流模型取得的成绩。实验验证了字嵌入方法的有效性和模型的性能,同时也为其他文本书写规范不统一且专业性较强的领域命名实体识别提供了思路。 蒋翔 马建霞 马建霞关键词:命名实体识别 自然语言处理 神经网络 基于LDA与新兴主题特征分析的新兴主题探测研究 被引量:63 2014年 本文尝试基于LDA主题模型探测文档集中的新兴主题.本文采用主题的新颖度、发文量指标,并引入被引量,得到新兴主题的特征指标,在此基础上对主题在进入成熟阶段前各个时期的特征进行了分析.并提出了针对上述新兴主题探测指标,基于LDA主题模型抽取文档的语义主题词,利用文档-主题矩阵建立主题和文档的映射,得到主题的新颖度指标和发文量指标、被引量指标,并形成新兴主题探测表格和探测曲线VDP,从而探测出新兴主题,并对新兴主题VDP与基线VDP距离的发展趋势进行预测,根据拟合的曲线对其进行分析,得到最值得关注的新兴主题. 范云满 马建霞关键词:主题模型 主题特征 引文文本分类与实现方法研究综述 被引量:16 2016年 [目的 /意义]对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程]总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果 /结论]目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。 王文娟 马建霞 陈春 张凌波关键词:引文分析 3D打印技术在口腔医学中的应用相关专利分析 被引量:4 2021年 目的:把握全球3D打印技术在口腔医学中的应用专利研发态势,为我国相关技术研发和专利布局提供参考。方法:本文利用专利分析的方法,采用智慧芽专利分析平台,结合人工标引和统计,对全球3D打印技术在口腔医学中的应用专利进行系统分析。结果:3D打印技术在口腔医学领域应用的专利呈快速增长态势,中、美、韩在该领域专利申请量较多。中国市场受到国外机构重视。口腔假体制造、植牙工具、口腔正畸是3D打印技术在口腔医学领域应用的热点领域。SLA、DLP、SLM技术是3D打印技术应用于口腔医学领域发展较快的技术。3D打印的过程、产品、数据处理方面也是近年来备受瞩目的领域;3D打印的材料、由金属粉末制造工件或制品所用的专用设备的专利布局刚刚兴起。结论:3D打印技术在口腔医学领域应用正在兴起,并具有较大潜力,中国在该领域的专利申请量最大,但质量有待提升。业界应加强国外重点机构新技术的监控研究和预警,围绕核心产品,既要注重原创性较高的发明专利的申请,也要有实用新型专利的布局,在3D打印的过程、产品、数据处理、相关材料和制备设备等方面全面布局专利,全方位保障核心产品的安全生产。促进产学研合作,提升专利质量。做好国外专利的布局,以专利走出去保障企业市场走出去。 张凌波 任利玲关键词:口腔医学