您的位置: 专家智库 > >

谢军

作品数:13 被引量:4H指数:1
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 6篇专利
  • 4篇会议论文
  • 3篇期刊文章

领域

  • 5篇自动化与计算...
  • 3篇语言文字

主题

  • 11篇翻译
  • 7篇机器翻译
  • 6篇统计机器
  • 6篇统计机器翻译
  • 5篇依存
  • 4篇语言
  • 4篇目标语
  • 4篇目标语言
  • 4篇句法树
  • 4篇标语
  • 3篇短语
  • 3篇源语
  • 3篇源语言
  • 3篇上下文
  • 3篇上下文信息
  • 3篇篇章
  • 3篇向量
  • 3篇向量空间
  • 3篇向量空间模型
  • 3篇翻译方法

机构

  • 13篇中国科学院
  • 1篇苏州大学
  • 1篇加州大学

作者

  • 13篇谢军
  • 12篇刘群
  • 7篇吕雅娟
  • 5篇孟凡东
  • 3篇熊皓
  • 3篇林守勋
  • 2篇姜文斌
  • 2篇陈宏申
  • 1篇姚建民
  • 1篇王星
  • 1篇赵红梅
  • 1篇涂兆鹏
  • 1篇于惠

传媒

  • 3篇中文信息学报

年份

  • 2篇2017
  • 3篇2014
  • 3篇2013
  • 2篇2012
  • 2篇2011
  • 1篇2008
13 条 记 录,以下是 1-10
排序方式:
中文分词和词性标注的在线重排序方法
主流的中文分词与词性标注方法将分词和词性标注问题看成是序列标注问题,通常利用局部特征训练判别式模型。该方法取得了很好的效果,但是与词、词性相关的全局特征并没有被充分的利用。为了更好的处理分词和词性标注的歧义,传统的重排序...
孟凡东谢军刘群
一种基于句法树的规则抽取及翻译方法
本发明提供一种基于句法树的规则抽取方法,包括:1)对于源语言成分句法树,源语言依存句法树,目标语言串以及源语言与目标语言间的词语对齐关系的四元组,在源语言依存句法树中找出并标记与源语言成分句法树中的成分短语节点相对应的依...
谢军孟凡东吕雅娟刘群
文献传递
第四届全国机器翻译研讨会(CWMT2008)评测报告(公开版)
1概述为了全面了解国内外机器翻译技术的现状,促进机器翻译技术的研究,根据惯例,第四届全国机器翻译研讨会(CWMT2008)于2008年10月8日到10月22日继续了组织统一的机器翻译评测,以推进参评单位的实质性交流和机器...
赵红梅谢军吕雅娟刘群
文献传递
依存树到串模型中引入双语短语的三种方法
2014年
依存树到串模型使用基于HDR片段的翻译规则。HDR片段是由中心词及其所有依存节点组成的树片段。这种翻译规则可以较好地捕捉语言中的句子模式和短语模式等组合现象,但在捕捉非组合现象(如习惯用语或固定搭配)方面存在不足。这类非组合现象易于由短语捕捉。为了更好地改善依存树到串模型的性能,本文提出了三种引入双语短语的方法,分别为引入句法短语、引入泛化句法短语及引入非句法短语。实验结果表明,同时使用句法短语、泛化句法短语及非句法短语时,可以将依存树到串模型的性能显著提高约1.0BLEU值。
谢军刘群
关键词:统计机器翻译
一种基于依存句法树的翻译规则抽取方法和翻译方法
本发明提供基于依存句法树的翻译规则抽取方法及翻译方法,将翻译调序关系直接表示于源端为中心词及其所有修饰成分组成的依存句法树片段、目标端为串的翻译规则中,从而使翻译规则可以明确地指导翻译过程。通过这种方法抽取的翻译规则,可...
谢军米海涛刘群
文献传递
基于依存树的统计机器翻译方法及系统
本发明提供一种基于依存边转换的统计机器翻译方法,根据从双语语料库中抽取的转换规则,将源语言句子的依存树中每条依存边转换为对应的目标语言短语依存边,并对所得到的目标语言短语依存边进行拼接,以生成目标语言端译文。该方法结合依...
陈宏申谢军孟凡东姜文斌刘群
文献传递
基于篇章上下文的统计机器翻译方法
上下文信息对于统计机器翻译(SMT)中的规则选择是很重要的,但是之前的SMT模型并没有充分利用上下文信息。在本文中,我们提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先我们利用向量空间模...
于惠谢军熊皓吕雅娟刘群林守勋
关键词:统计机器翻译上下文信息向量空间模型
文献传递
一种基于分类的平行语料选择方法被引量:4
2013年
大规模高质量双语平行语料库是构造高质量统计机器翻译系统的重要基础,但语料库中的噪声影响着统计机器翻译系统的性能,因此有必要对大规模语料库中语料进行筛选。区别于传统的语料选择排序模型,本文提出一种基于分类的平行语料选择方法。通过少数句对特征构造差异较大的分类器训练句对,在该训练句对上使用更多的句对特征对分类器进行训练,然后对其他未分类句对进行分类。相比于基准系统,我们的方法不仅缩减40%训练语料规模,同时在NIST测试数据集合上将BLEU值提高了0.87个百分点。
王星涂兆鹏谢军吕雅娟姚建民
关键词:统计机器翻译
基于篇章上下文的统计机器翻译方法
2013年
上下文信息对于统计机器翻译(Statistical Machine Translation,SMT)中的规则选择是很重要的,但是之前的SMT模型只利用了句子内部的上下文信息,没有利用到整个篇章的上下文信息。该文提出了一种利用篇章上下文信息的方法来提高规则选择的准确性,从而提高翻译的质量。首先利用向量空间模型获得训练语料的文档和测试集中文档的相似度,然后把相似度作为一个新的特征加入到短语模型中。实验结果表明,在英语到汉语的翻译工作中,该方法可以显著提高翻译质量。在NIST-08和CWMT-08两个测试集上BLEU值都有显著的提高。
于惠谢军熊皓吕雅娟刘群林守勋
关键词:统计机器翻译上下文信息向量空间模型
基于依存树的统计机器翻译方法及系统
本发明提供一种基于依存边转换的统计机器翻译方法,根据从双语语料库中抽取的转换规则,将源语言句子的依存树中每条依存边转换为对应的目标语言短语依存边,并对所得到的目标语言短语依存边进行拼接,以生成目标语言端译文。该方法结合依...
陈宏申谢军孟凡东姜文斌刘群
文献传递
共2页<12>
聚类工具0