袁琦
- 作品数:13 被引量:37H指数:4
- 供职机构:中国电子信息产业发展研究院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信语言文字更多>>
- 三元组可比语料库自动剖析技术研究与应用
- 2012年
- 国内外基于语料库的翻译研究主要集中在翻译共性、翻译规范、译者风格和翻译培训等涉及翻译理论和翻译实践方面的研究;提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研究。从工程可实现性考虑,创新性地提出了建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信息检索等自然语言处理应用的目标。
- 袁琦肖健宋金平朱姝万缨许亮
- 使用三元组可比语料库改进和发展机器翻译系统
- 目前,国内外基于语料库的翻译研究主要集中在翻译共性、翻译规范、译者风格和翻译培训等涉及翻译理论和翻译实践方面的研究;本文提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研...
- 肖健袁琦宋金平
- 文献传递
- 面向多引擎融合技术的统计后编辑方法研究被引量:1
- 2015年
- 本文介绍了我单位研发的机器翻译系统融入统计后编辑方法后实现串行结构多引擎融合技术,该方法的目的是解决翻译领域适应性的问题,矫正规则为主导的系统翻译结果,提高翻译译文的质量。其中包括提取系统生成的译文作为源语言构建中文平行语料库,然后采用统计的方法训练翻译模型和语言模型,抽取短语表和N-gram文本用于统计后编辑翻译引擎的解码。文中给出了该方法综合性能评价,最后给出下一步工作设想。
- 李响胡小鹏袁琦
- 关键词:翻译模型语言模型
- 三元组可比语料库自动剖析在情报智能处理中的研究与应用
- 2012年
- 文章提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研究。从工程可实现性考虑,创新性地提出建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信息检索等自然语言处理应用的目标。
- 王毅肖健袁琦宋金平李强
- 关键词:机器翻译
- 中间语言转换过程中的增强处理被引量:3
- 2005年
- 在基于中间语言的多语信息交流平台中,确保自然语言表述的信息内容能正确地转换为相应的中间语言表示非常重要。作者在引入子语言后,将源语转换和目标语生成过程结合起来,人机交互的界面处理既提升了源语信息转换的准确性,又提高了目标语生成的自然度,从而进一步增强了多语信息交流平台的可行性。
- 熊文新袁琦
- 关键词:中间语言交互操作
- 构建和剖析中英三元组可比语料库被引量:5
- 2014年
- 由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,提出构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双语资源,实现改进和发展机器翻译等自然语言的处理应用。
- 胡小鹏袁琦耿鑫辉朱姝
- 关键词:语言迁移
- 基于混合策略的汉英双向机器翻译系统的设计被引量:2
- 2006年
- 本文对于机器翻译方法中的基于规则的方法、基于模板的方法及基于实例的方法进行了比较;对于完全句法分析和浅层句法分析方法也进行了分析。然后介绍了将上述方法结合起来的汉英双向机器翻译系统的设计思想及工作流程。基于混合策略的目的是为了提高汉英双向机器翻译系统的译文质量。实验结果表明,本文提出的设计思想对于机器翻译译文质量的提高具有良好的效果。基于模板及实例方法对于译文质量提高的贡献率为:口语为15%,篇章翻译为10%。
- 孙广范宋金平袁琦
- 关键词:翻译模板浅层分析机器翻译
- 机器翻译中规则和模板的协调方法研究被引量:3
- 2006年
- 本文讨论了机器翻译中的基于规则、基于翻译模板及转换模型的特点,分别比较了它们的优点和不足。同时讨论了协调基于模板方法与基于转换模型方法的合理途径。针对研制机器翻译系统的需要设计了将这几种方法有机地结合起来的算法。将本文提出的协调方法在汉英双向机器翻译系统中应用,取得了较好的实验结果。通过采用模板和去掉模板分别进行翻译实验,结果表明基于模板方法对于译文质量提高的贡献率分别为:口语为12%,篇章翻译为8%。
- 孙广范宋金平袁琦
- 关键词:翻译模板机器翻译
- 中英可比语料库中翻译等价对抽取方法研究被引量:9
- 2007年
- 回顾了语料库分类及可比语料库中翻译等价对抽取方法研究的历史。根据从可比语料库中提取翻译等价对所依据的基本假设:一个语言中一个词在对应到另外一种语言时其与周围词之间的共现搭配关系仍然被保持,采用双向等价对获取计算然后求交集、词加权因数TF(iw)*IDF(i)值计算、上下文词的词性信息利用的方法来提高翻译等价对提取正确率。描述了翻译等价对抽取实验步骤,并对实验结果进行了简要分析。实验结果表明上述方法可以有效提高翻译等价对计算结果的正确率。最后提出了需要进一研究的问题。
- 孙广范宋金平袁琦肖健单玉秋
- 关键词:可比语料库
- 多语信息交流平台的中间语言系统及支撑环境设计被引量:1
- 2006年
- 探讨了中间语言充当多语信息交流平台基础架构的必要性和可行性,介绍了一个基于中间语言的多语信息处理平台的总体设计和实现策略。讨论了如何在构建中间语言系统过程中引入子语言、受限语言技术,中间语言系统在网络环境下的XML实施,以及系统实施过程中的多引擎处理策略和学习反馈模块等支撑环境建问题,最后给出了一个示例在系统平台中运行的过程。
- 熊文新宋柔袁琦
- 关键词:中间语言支撑环境