您的位置: 专家智库 > >

赵小宝

作品数:1 被引量:7H指数:1
供职机构:北京理工大学计算机学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇迭代
  • 1篇迭代算法
  • 1篇对偶
  • 1篇对偶原理
  • 1篇信息熵
  • 1篇中文
  • 1篇新词识别
  • 1篇词语
  • 1篇词语搭配
  • 1篇搭配

机构

  • 1篇北京理工大学

作者

  • 1篇张华平
  • 1篇赵小宝

传媒

  • 1篇计算机工程

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
基于迭代算法的新词识别被引量:7
2014年
新词识别是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来较大困难。受对偶原理的启发,提出一种基于迭代算法的新词识别算法。对目标语料进行分词和词性标注,通过两遍扫描进行字符串统计并提取重复模式。结合词语结构的特征,迭代使用重复模式互信息、左(右)熵,左(右)邻右(左)平均熵等特征进行新词识别,获得候选新词列表。利用中文词语搭配库对候选新词列表进行最后一次过滤得到最终新词列表。实验结果表明,利用该方法进行新词识别,P@10值达到100%,P@100值提高至90%,左(右)邻右(左)平均熵可在一定程度上提高新词识别的准确率。
赵小宝张华平
关键词:对偶原理新词识别迭代算法信息熵
共1页<1>
聚类工具0