曹杰
- 作品数:3 被引量:4H指数:1
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 面向科技文献的机器翻译关键技术研究
- 吕雅娟米海涛姜文斌冯洋苏劲松蔡舒王志洋曹杰
- 科技文献自动翻译具有重要的研究意义和实用价值。该项目以统计机器翻译技术为基础,研究了适合科技文献翻译的机器翻译关键技术和方法。主要研究内容包括三个方面:句子骨干翻译模板的自动获取;传统语言学知识和统计机器翻译模型的融合策...
- 关键词:
- 关键词:机器翻译语言学自适应方法
- 统计机器翻译系统中传统词典的应用研究
- 词典是翻译系统中的重要资源,本文研究了将传统词典应用在统计机器翻译中的方法,包括在训练部分词典加权到语料中使用和解码部分引入词典特征融入log-linear模型来使用。本文还提出了一种词典匹配算法,使得实用的统计机器翻译...
- 曹杰任志祥吕雅娟刘群
- 关键词:统计机器翻译词典自然语言理解
- 文献传递
- 利用上下文信息的统计机器翻译领域自适应被引量:4
- 2010年
- 统计机器翻译系统用于翻译领域文本时,常常会遇到跨领域的问题:当待翻译文本与训练语料来自同一领域时,通常会得到较好的翻译效果;当领域差别较大时,翻译质量会明显下降。某个特定领域的双语平行语料是有限的,相对来说,领域混杂的平行语料和特定领域的单语文本更容易获得。该文充分利用这一特点,提出了一种包含领域信息的翻译概率计算模型,该模型联合使用混合领域双语和特定领域源语言单语进行机器翻译领域自适应。实验显示,自适应模型在IWSLT机器翻译评测3个测试集上均比Baseline有提高,证明了该文方法的有效性。
- 曹杰吕雅娟苏劲松刘群
- 关键词:统计机器翻译领域自适应上下文信息