国家科技支撑计划(2007BAH05B02-05) 作品数:10 被引量:6 H指数:1 相关作者: 张全 缪建明 韦向峰 池毓焕 臧翰芬 更多>> 相关机构: 中国科学院 中国科学院研究生院 装甲兵工程学院 更多>> 发文基金: 国家科技支撑计划 中国科学院知识创新工程青年人才领域前沿项目 中国科学院声学研究所知识创新工程项目 更多>> 相关领域: 自动化与计算机技术 文化科学 语言文字 更多>>
利用语句结构信息的机器翻译自动评测初探 2010年 机器翻译评测对机器翻译有着极其重要的意义,它对翻译系统性能的提高做出了很大的贡献,同时促进了机器翻译的发展。本文在HNC机器翻译策略的基础上,对翻译语料的句类转换和句式转换做了初步的研究,并利用句类转换和句式转换的理论,建立了基于句类信息的自动评测的打分机制。 丁泽亚 张全 缪建明 池毓焕 臧翰芬关键词:句类转换 句式转换 面向汉英机器翻译的大句范式初探 在大句的范围内小句的组织结构会呈现某些特定的模式,即大句范式。而范式的运用存在着语种间的有无或常用罕用之别,需要在翻译时予以变换。本文初步探讨了汉英机器翻译面临的几个常用大句范式,描述其辨识特征,并提出转换规则,以期对现... 池毓焕 李颖关键词:汉英机器翻译 文献传递 基于汉语字义基元化的新词处理分析 2010年 现代汉语中具有"字义基元化,词义组合化"的特点,本文根据这一特点,从汉字动态组合形成新词的角度,对汉语中新词语的释义进行了分析。通过对比词典收录的词语义项和新词语释义,发现字义在网络环境出现的新词中有了拓展。针对这些义项进一步分析发现,字义的核心语义内容没有发生根本的变化,而是表述对象的拓展。本文以组成网络新词比较活跃的"裸"字为例进行了具体说明,研究结果有助于汉语新词处理。 张全 袁毅关键词:新词语 词汇语义 语义分析 基于HNC理论的汉语辅语义块自动辨识研究 被引量:2 2009年 全自动的语义分析一直是自然语言处理的主要目标之一,通过深层语义的分析,自然语言可以转化为形式语言。因此,可以实现人机之间的交互。为达到此目的人们在语义分析和标注方面做了长期的努力。本文在借鉴前人工作的基础上,为提高辅语义块的自动识别,进行了大量的语料分析,总结提出了比较有效的计算机处理规则。经真实文本实验测试,利用这些规则处理,可以达到较好的准确率和召回率。 臧翰芬 韦向峰 张全现代汉语句群处理研究的进展 2009年 句群是HNC对段落、篇章处理时在句子和段落之间加上的一个过渡层次,句群的理解结果直接影响篇章理解的准确率。本文结合HNC理论对现代汉语句群处理的最新研究成果,对句群的形式化框架进行了详细地阐述,最终形成了句群处理结果的新方式。最后,通过真实语料的验证,证明这一表述方式有效且可行。 缪建明 张全关键词:语境 句群 面向英汉机器翻译的英语特征语义块处理 被引量:1 2010年 针对当前英汉机器翻译软件未能充分理解源语句的问题,基于概念层次网络理论(hierarchical network of concepts,HNC理论),详细分析了在语句理解中起重要作用的英语特征语义块,分类讨论了其核心部分构成特点,并提出了相应的计算机处理算法。与在线机器翻译结果的比较表明,该算法对源语句进行了更加深入的分析与理解,能够为英汉机器翻译提供技术支持。 董凌冲 李颖 池毓焕关键词:英汉机器翻译 自然语言处理 句类分析 面向智能搜索的文本语义概念计算 被引量:1 2011年 面对互联网上的海量信息资源,搜索引擎已经成为重要的工具。使搜索引擎具备更高的智能,为用户提供更好的服务已经成为这一领域发展的趋势。语义计算是实现智能搜索的重要环节。本文在介绍概念层次网络(HNC)语义计算的基础上,探讨了在搜索中引入HNC语义计算增强搜索智能的处理模式。同时作为一项处理电子文本的基础技术,HNC语义计算的应用不止在智能搜索,它在诸如计算社会学等新兴学科中扮演着重要角色,还为保证网站信息安全发挥重要的作用。 张全 袁毅关键词:智能搜索 信息检索 语义计算 汉语块扩句的自动分析 2010年 块扩句是一类概念预期知识十分明确的句子。基于概念层次网络理论介绍了块扩句对应的块扩句类,总结了能够激活块扩句类的典型块扩动词。根据块扩动词的概念知识得到句子的特征语义块及块扩句类,依据块扩句类的知识对句子进行检验后可给出句子句类的分析结果。在已有的句类分析系统的基础上对真实语料中的块扩句进行了自动分析,实验表明正确率达到了71.29%,错误主要来自特征语义块动词辨识、动词多句类代码等。正确分析块扩句将有助于解决汉语句子的多动词处理难点。 韦向峰 张全关键词:句类 句类分析 一种基于概念关联式的词义消岐方法 被引量:1 2010年 词义排岐是自然语言处理中最关键也是最困难的问题之一,至今仍没有得到完全有效的解决。在研究HNC表达汉语知识的基础上,提出了一种基于概念关联式的汉语词义消歧方法,用于处理汉语的歧义字段。该方法综合了词语概念的层次性、网络性、结构性特征,用一种统一的表示式来规范这类特征,解决了多个不同概念之间的知识关联表示问题。实验对20个汉语高频多义词进行了测试,平均正确率为94%,验证了该方法的有效性。 缪建明 张全关键词:HNC理论 HNC句群处理研究新进展 句群是比语句更高一级的语言单位,句群的理解结果直接影响篇章的理解结果。给出形式化的句群处理框架、制定相关的句群处理规则,成为了自然语言处理研究,尤其是基于语义的自然语言处理,亟需解决的一项重要问题。本文在HNC语境观的指... 缪建明 张全关键词:语境 句群 文献传递