姚建民
- 作品数:16 被引量:54H指数:4
- 供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于内容相似度的文摘自动评测方法及其有效性分析被引量:8
- 2006年
- 为进行快速、可重复地自动文摘评测,提出利用文本余弦相似度评价自动文摘系统的方法,研究了不同项权重选取策略对评测结果的影响。对比了多个英文单文档、多文档自动文摘系统的人工评测和自动评测结果,证明余弦相似度方法能够较有效地区分不同文摘质量的系统。统计相关分析表明该自动评测方法和人工评测存在较高的一致性。评测结果对比表明基于tf-idf词权重信息的余弦相似度方法改善了缺少评测语料的多文档文摘自动评测的质量。
- 张妹赵铁军赵华姚建民
- 关键词:相似度
- 基于评价的英语句法结构消歧和自我评价的规则校正被引量:2
- 2002年
- 句法结构歧义是句法分析过程中最主要也是最难解决的问题之一 .使用了一种组合型的概率评价函数解决英语句法分析过程中所面临的结构歧义问题 ,综合考虑了句法分析时的结构特性和上下文信息 .并使用基于规则的句法分析后校正机制对错误的分析结果进行进一步的校正 .组合型的概率评价函数为更精细的句法分析提供了一个可以扩充的统计模型 ,这种方法也可以适用于其它语言的句法分析 .实验结果表明 ,这种方法具有较高的精确率和召回率 .
- 孟遥赵铁军李生姚建民
- 关键词:句法分析
- 基于目标语词汇组合合理性评价的译文选择模型被引量:1
- 2003年
- 机器翻译使用计算机实现自然语言的翻译功能 ,是计算机技术在语言学领域的新兴应用和研究 其中 ,源语言词汇的译文选择直接决定机器翻译的质量 ,是人们关注的难题 基于目标语词汇组合合理性评价的模糊分类模型试图以语言学和模糊数学为理论基础 ,尝试解决歧义词的译文选择问题 将该模型用于英汉机器翻译系统的译文选择实验 ,具有良好的译文选择性能 ,它的优势还在于可以同时为全句范围内的所有歧义词选择译文 。
- 张晶李生姚建民赵铁军
- 关键词:机器翻译
- 机器翻译评价方法的实现及翻译系统聚类
- 五十年来,研究者提出了多种人工和自动化的机器翻译质量评价方法利用不同语言特征评价译文的质量。本文选择常用的自动和人工评价方法对6个翻译系统进行了实验。把分数归一化之后,利用系统聚类的方法获得了6个翻译系统的系统图及类间距...
- 姚建民赵铁军李生
- 关键词:系统聚类
- 文献传递
- 汉语分词在机器翻译评价中的影响
- 机器翻译评价对机器翻译系统的发展有重要的推动作用。本文针对目前流行的IBM提出的机器翻译自动评价方法,探讨了分词信息对于外汉机器翻译评价的影响。实验结果证明在评测汉语译文中用汉语分词方法将提高自动评测的准确度。
- 徐冰姚建民杨沐昀赵铁军
- 关键词:分词
- 文献传递
- 基于标志词的EBMT翻译单元抽取方法
- EBMT技术的关键问题之一是如何能取得较好的翻译单元。传统的方法有通过双语语料的词语对齐来取得对译片断,也有通过对句子的分析(如依存分析),根据句子分析结果来获取翻译单元。然而词语对齐或句子分析结果都存在一定误差,这对翻...
- 刘海洁时晓升姚建民李生
- 文献传递
- 掺杂钾钠铌酸锶钡二波耦合增益特性的研究
- 姚建民
- 基于混合策略的英语基本名词短语识别——边界统计和词性串规则校正相结合的策略被引量:4
- 2004年
- 基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法。该方法把基本名词短语识别分成主次分明的两部分,边界统计作为主要部分能够正确识别出大部分基本名词短语,词性串规则作为辅助手段在对前者识别出的基本名词短语进行核对和校正的同时还对边界统计方法遗漏的基本名词短语进行再回收。此方法中,词性串规则弥补了边界统计无法顾及基本名词短语内部组合规律的缺点,提高了精确率和召回率。采用此方法,基本名词短语识别的精确率达到96.22%,召回率97.59%,Fβ=196.90%,F值超出了目前报道的最好结果。
- 梁颖红赵铁军姚建民于浩徐冰
- 关键词:基本名词短语识别英语语块
- 英汉机器翻译评价研究
- 该文的研究内容包括四个主要方面:一是在总结现有评价方法的基础上,探讨一些主流评价方法在英汉机器翻译评价中是否适用,分析这些方法的优缺点,为进一步的研究开发打下基础;二是探索适用于我们的应用背景的英汉机器翻译评价方法,并在...
- 姚建民
- 关键词:句子相似度
- 文献传递
- 翻译评价方法的区分度分析被引量:1
- 2005年
- 首先简单介绍了目前被广泛应用的两种翻译评价方法BLEU和NIST,然后着眼于它们对翻译系统实际水平的区分程度,参考教育测量领域中的方法,提出了区分度的概念,并通过实验阐明了基于区分度的性能分析方法。实验结果表明这种性能分析方法能够有效地反映出BLEU方法和NIST方法在区分程度上的优劣。
- 迟悦姚建民赵铁军李生
- 关键词:机器翻译性能分析区分度