您的位置: 专家智库 > >

罗彦彦

作品数:2 被引量:24H指数:1
供职机构:大连理工大学电子科学与技术学院计算机科学与工程系更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...

主题

  • 2篇随机场
  • 2篇条件随机场
  • 2篇中文
  • 2篇分词
  • 1篇信息处理
  • 1篇隐马尔可夫模...
  • 1篇随机场模型
  • 1篇条件随机场模...
  • 1篇中文分词
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇中文自动分词
  • 1篇自动分词
  • 1篇最大熵
  • 1篇最大熵模型
  • 1篇马尔可夫
  • 1篇马尔可夫模型
  • 1篇计算机
  • 1篇计算机应用
  • 1篇S模

机构

  • 2篇大连理工大学

作者

  • 2篇罗彦彦
  • 1篇黄德根

传媒

  • 1篇中文信息学报

年份

  • 2篇2009
2 条 记 录,以下是 1-2
排序方式:
CRFs模型下的中文自动分词研究
中文自动分词是中文信息处理的一项重要的基础性任务,是机器翻译、问答系统、自动文摘等技术的基础,也是实现中文搜索引擎所必须的关键技术之一。然而由于汉语自身的复杂性,分词问题一直是中文自然语言处理的难题。 本文在...
罗彦彦
关键词:最大熵模型条件随机场模型
文献传递
基于CRFs边缘概率的中文分词被引量:23
2009年
将分词问题转化为序列标注问题,使用CRFs标注器进行序列标注是近年来广泛采用的分词方法。针对这一方法中CRFs的标记错误问题,该文提出基于CRFs边缘概率的分词方法。该方法从标注结果中发掘边缘概率高的候选词,重组边缘概率低的候选词,提出FMM的奖励机制修正重组后的子串。在第四届SIGHAN Bakeoff中文简体语料SXU和NCC上进行闭式测试,分别在F-1值上达到了96.41%和94.30%的精度。
罗彦彦黄德根
关键词:计算机应用中文信息处理中文分词
共1页<1>
聚类工具0