刘伙玉
- 作品数:5 被引量:47H指数:4
- 供职机构:南京大学信息管理学院更多>>
- 发文基金:国家自然科学基金江苏省社会科学基金国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- h指数、g指数、累积影响因子实证分析——以图书情报学期刊为例被引量:11
- 2013年
- 以CSSCI数据库中1998-2011年的引文数据为基础,对18种图书情报学期刊的h指数、g指数、累积影响因子进行实证分析。对h指数、g指数、累积影响因子的准确定义及计算方法等进行概述;计算出18种期刊h指数、g指数、5年累积影响因子的值,对三者进行比较,分析三种指标的特点、作用及其相关性,认为h指数、g指数、累积影响因子都具有较强的评价期刊学术影响力的能力,相关性强,三者优势互补,不可替代。
- 刘伙玉杨宇菲
- 关键词:H指数G指数
- 基于CNKI的图书、情报学与档案学学科文献半衰期分析被引量:23
- 2015年
- 引用半衰期与被引半衰期是讨论文献、学科、期刊老化的重要指标。文章以学科分类号为划分标准,以图书馆学、情报学与档案学为研究对象,讨论分析上述各学科的学科引用半衰期和学科被引半衰期特点,以及影响半衰期大小的相关因素。在图书馆学、情报学与档案学学科半衰期实证数据基础上,进一步分析了学科引用半衰期和学科被引半衰期间的内在相关性。
- 刘伙玉
- 关键词:情报学档案学被引半衰期引文分析
- 面向论文相似性检测的数据预处理研究被引量:5
- 2015年
- 【目的】探究论文相似性检测中数据预处理的数据问题及相关方法。【方法】对数据进行细致的分析,采用基于规则的方法、基于统计的方法、基于语义的方法进行预处理。【结果】揭示论文相似性检测中原始数据存在的数据质量问题,并在此基础上给出数据预处理模型。【局限】语料规模有限,且暂未考虑对语料中图表内容的预处理。【结论】数据预处理有助于提高论文相似性检测结果的准确性;有效结合基于规则、统计、语义的三种方法有助于提高数据预处理效果。
- 刘伙玉王东波
- 关键词:抄袭检测数据预处理数据质量数据清洗
- 多特征下的科研论文段落自动划分与构成要素识别研究被引量:1
- 2015年
- 本文为科研论文的结构化处理提供了一种有价值的方法。本文采用条件随机场模型,综合原始语料中科研论文的局部与整体特征,使用复杂特征模板对段落进行自动划分以及对构成要素进行自动识别。在开放测试中,F值最高分别达88%和92%。同时本文对CRFs和ME在段落自动划分与构成要素识别实验中进行了比较分析,认为CRFs在付出更大的时间复杂度的代价下,其处理效果明显优于ME。
- 刘伙玉王东波苏新宁
- 关键词:条件随机场CRFS段落划分
- 基于多特征时间抽取模型的食品安全事件演化序列生成研究被引量:7
- 2017年
- 为了更深入地挖掘食品安全事件中的特征和规律,本文提出了食品安全事件时间演化序列自动生成方法。首先从食品安全事件的时间构成、时间表达式左右边界特征、时间常用词三方面分析了食品安全事件时间的表达特征。基于时间表达式的多种特征,采用基于条件随机场模型的方法对时间表达式进行识别,F值最高达90%。然后以含有时间表达式的"句"为单位,将一个事件分为多个"时间-事件"的组合,最后采用基于时间戳的逆向匹配法生成事件时间演化序列。该方法可用于分析食品安全事件的发展脉络与特征,以期为政府实施食品安全事件监控提供理论与技术支撑。
- 王东波叶文豪吴毅刘伙玉苏新宁苏新宁
- 关键词:食品安全时间序列条件随机场时间戳