您的位置: 专家智库 > >

中央高校基本科研业务费专项资金(DUT10RW202)

作品数:6 被引量:30H指数:3
相关作者:黄德根马建军李泽中万如刘海霞更多>>
相关机构:大连理工大学大连民族学院更多>>
发文基金:中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 6篇中文期刊文章

领域

  • 5篇自动化与计算...
  • 2篇语言文字

主题

  • 3篇机器翻译
  • 3篇翻译
  • 2篇歧义
  • 2篇中文
  • 2篇CRF
  • 1篇登录
  • 1篇动词
  • 1篇短语
  • 1篇短语研究
  • 1篇一体化
  • 1篇义类
  • 1篇英语
  • 1篇英语动词
  • 1篇语义
  • 1篇语义类型
  • 1篇语义模式
  • 1篇语义信息
  • 1篇支持向量
  • 1篇支持向量机
  • 1篇随机场

机构

  • 6篇大连理工大学
  • 1篇大连民族学院

作者

  • 5篇黄德根
  • 2篇马建军
  • 1篇孙晓
  • 1篇万如
  • 1篇张瑶
  • 1篇刘海霞
  • 1篇李泽中

传媒

  • 3篇大连理工大学...
  • 1篇计算机工程
  • 1篇中文信息学报
  • 1篇大连理工大学...

年份

  • 1篇2012
  • 2篇2011
  • 3篇2010
6 条 记 录,以下是 1-6
排序方式:
基于SVM和CRF的双层模型中文机构名识别被引量:14
2010年
提出了一种基于支持向量机(SVM)和条件随机场(CRF)的双层模型进行中文机构名识别的方法.第一层模型采用CRF识别简单机构名,并将识别结果传至第二层辅助下一步的识别;第二层采用基于驱动的方法,将SVM和CRF结合进行复杂机构名的识别;最后将两层的识别结果合并,并通过一个后续处理对置信度较低的识别结果进行修正.大规模真实语料的开放测试表明,精确率达到94.83%,召回率达到95.02%,证明了该方法的有效性.
黄德根李泽中万如
关键词:机构名识别
英语功能名词短语研究及其应用被引量:1
2012年
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义.
马建军黄德根
关键词:机器翻译基本名词短语
语义信息与CRF结合的汉语功能块自动识别被引量:4
2011年
为了构建汉语功能块自动识别系统,该文利用条件随机域模型对经过正确词语切分和词性标注处理的汉语句子进行功能块边界识别和功能信息标注处理,通过在特征提取阶段优化组合丰富的上下文特征,得到功能块识别的精确率、召回率和F1-measure值分别为85.84%、85.07%和85.45%。在此基础上,该文引入由词义聚合关系将汉语单词组织起来的《同义词词林》作为语义资源,把其中的语义信息作为特征加入到功能块的识别过程,缓解了数据稀疏以及歧义问题对识别结果造成的影响,使得上述三个性能指标分别提高到86.21%、85.31%和85.76%。
刘海霞黄德根
关键词:语义信息歧义结构
基于最长次长匹配分词的一体化中文词法分析被引量:3
2010年
针对当前大多数词法分析系统"流水线"式处理方式存在的不足,提出一种一体化同步词法分析机制.在最长次长匹配分词的基础上,在切分有向图中增加词性信息和候选未登录词节点,并拓展隐马尔可夫模型,在切分有向图内同步完成分词、歧义消解、未登录词识别和词性标注等词法分析任务.实现了分词与词性标注的一体化、未登录词识别与分词的一体化以及不确定词性未登录词处理的一体化.一体化机制使词法分析中各步骤实现真正意义上的同步完成,充分利用上下文词法信息提高整体精度并保证了系统的高效性,避免了各步骤间的冲突.开放测试表明,系统综合测试的F值为98.03%.
孙晓黄德根
关键词:中文词法分析未登录词
基于语义模式的英语动词汉译
2011年
英语动词正确汉译是机器翻译的难点。为此,提出一种基于动词语义模式库、固定句式库和变量库的英语动词汉译算法。介绍语义模式的提取方法,构建常用动词的语义模式库、固定句式库和变量库,归纳动词语义模式的3种结构形式:V语义模式,VO相邻语义模式和VO非相邻语义模式。动词语义模式库由上述3种结构形式对应的模式库构成。实验结果表明,该方法能有效解决英语常用动词的汉译问题。
张瑶黄德根
关键词:机器翻译语义类型动词语义模式
基于规则和统计的机器翻译方法歧义问题比较分析被引量:9
2010年
文章通过对SYSTRAN和GOOGLE两个机译系统90句商务英语英汉翻译译文的比较分析,从词义歧义和句法歧义两方面,研究基于规则(RBMT)和基于统计(SMT)两种机器翻译方法的消歧处理的优与劣。研究表明,基于统计方法词义消歧强于基于规则方法,而句法消除歧义能力相当。词义歧义问题主要集中在动词多义词和名词多义词,而句法歧义问题则集中在定语、状语和从句。动词与介词搭配,名词与介词搭配作定语和状语,以及具有商务内涵的动词和名词,成为机器翻译的难点。
马建军
关键词:机器翻译句法歧义SMT
共1页<1>
聚类工具0