张巍
- 作品数:2 被引量:16H指数:1
- 供职机构:北京文献服务处更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于加权投票的术语自动识别方法被引量:16
- 2011年
- 术语自动识别目的是获取领域术语表中未登录的规范化词汇,是信息抽取、文本挖掘等领域中的重要任务。近年来,利用统计方法抽取术语取得了一定进展,出现了C-Value、NC-Value、TermExtractor等有效方法。但是,对各种统计指标进行加权投票的方法研究较少。该文首先从大量已知术语中收集术语的词性模板,并借之抽取候选术语,接着利用了统计指标加权投票对这些候选术语进行排序。在IEEE 2006-2007电子工程领域文献上的实验结果表明,加权投票方法比任一单独指标的识别效果更好。
- 游宏梁张巍沈钧毅刘挺
- 关键词:投票算法信息抽取文本挖掘
- 一种基于加权投票的术语自动识别方法
- 术语自动识别是获取领域术语表中未登录的规范化词汇的方法,并且是信息抽取、文本挖掘等领域的重要任务。近年来,基于统计分析的术语抽取方法取得了一定进展,出现了C-Value、NC-Value、TermExtractor等有效...
- 张巍游宏梁张吉才
- 关键词:投票算法信息抽取文本挖掘
- 文献传递