江苏省社会科学基金(06JSBYY001)
- 作品数:6 被引量:21H指数:3
- 相关作者:曲维光张霄军李斌石民于丽丽更多>>
- 相关机构:南京师范大学北京大学陕西师范大学更多>>
- 发文基金:国家自然科学基金江苏省社会科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- “像”的明喻计算被引量:8
- 2008年
- 汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的标志(比喻词)成为计算机自动识别的基础类型。该文着力于典型的比喻词"像"的比喻义及相关比喻成分的自动识别。首先,人工标注了1 586句语料,分析了明喻句的基本特点。然后,使用最大熵模型对"像"的比喻义和非比喻义进行分类,开放测试F值达到了89%。最后,用条件随机场模型识别出比喻的本体、喻体和相似点,F值分别达到了73%、86%和83%。
- 李斌于丽丽石民曲维光
- 关键词:计算机应用中文信息处理
- 面向自动文摘的文本结构划分被引量:3
- 2008年
- 文本结构划分是自动文摘研究中的一个关键阶段,也是自然语言处理领域的重要课题.本文通过构建段落向量空间模型,提出一种综合考察相邻段落相似度和连续段落平均相似度的意义段划分方法,使文摘内容更加全面,结构更加平衡.实验结果表明,该方法能够较有效地反映文章的内容结构,对有子标题组织和无子标题组织的文章均适用;由于考虑了总起段,使得文本结构划分更加合理,为自动文摘系统的后续工作打下坚实的基础.
- 朱荷香曲维光卢俊之李素建邵艳秋
- 关键词:文本结构自动文摘向量空间模型
- 基于多分类器集成的古代汉语词义消歧
- 本文首先分析了古代汉语词义义项特点,考察了词义消歧的难点,确定出面向汉语信息处理的词语义项区分遵循的原则和方法。然后在现有的词义消歧理论基础上,采用机器学习的方法,选择合适的特征,使用高效率的NaiveBayes、RFR...
- 于丽丽丁德鑫曲维光陈小荷石民
- 关键词:中文信息处理古代汉语词义消歧分类器集成
- 文献传递
- 基于词频和语义信息的组合型歧义消解
- 组合型歧义切分是汉语自动分词的难点之一。本文挖掘歧义字段上下文的相对词频信息和语义信息,建立语境计算模型。首先基于相对词频比,建立RFRUM模型,其次采用类似K近邻的分类思想,利用知网,建立语义相似度计算模型,最后尝试两...
- 丁德鑫曲维光于丽丽陈小荷李惠
- 关键词:中文自动分词语境信息语义计算
- 文献传递
- 超大规模语料库精加工技术研究被引量:3
- 2009年
- 在对现有词法标注器标注质量考察分析的基础上,本文提出语料库精加工的方法。利用这些方法,对从《人民日报》社购得的1998年上半年样例语料重新进行校对,从中排查并修改了5万余处切分和词性标注的错误或不一致,提高了样例语料的质量。本文提出的基于上下文词语相对词频比之和RFR_SUM的消歧模型,具有很好的分类效果。利用重新校对过的样例语料作为训练数据,再利用RFR_SUM模型对400余种常见歧义现象的消解进行训练,并将所得到的模型应用于超大规模语料的精加工,也取得良好的效果。
- 曲维光唐旭日俞敬松
- 国内外隐喻知识库建设综述被引量:6
- 2008年
- 就国外的几个隐喻知识库,包括Master Metaphor List、Sense-frame、MetaBank、Metalude、Hamburg Metaphor Database、ATT-Meta以及国内的隐喻句库的建设进行综述,并对上述隐喻知识库作了简单评述。最后提出了一种建立面向计算的大规模汉语隐喻知识库构建的设想。
- 张霄军曲维光
- 关键词:隐喻知识库自然语言理解
- 基于分类器集成的兼类词消歧研究被引量:2
- 2010年
- 兼类词词性消歧是中文词性标注的难点之一.本文集成了支持向量机、条件随机场、最大熵等3种分类模型,对兼类词词性消歧进行研究.以1998年1月份已标注《人民日报》为实验语料,对410个常见的兼类词进行开放测试,平均精度达到89.69%,取得了较好的效果.
- 张一哲曲维光刘金克孙玉霞
- 关键词:支持向量机条件随机场最大熵分类器集成
- 基于语法功能匹配的汉语句法分析算法
- 本文以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源, 实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息...
- 卢俊之陈小荷曲维光王东波陈锋丁德鑫
- 关键词:句法分析
- 文献传递
- 隐喻研究与隐喻知识库建设
- 2008年
- 隐喻研究是"非字面义"研究的热点,计算研究方法是隐喻研究的新视野,而隐喻知识库则是隐喻计算研究的基础资源。本文介绍了几个国外的几个隐喻知识库,包括(1)Sense-frame;(2)MetaBank;(3)Metalude,并对上述隐喻知识库做了简单评述。最后提出了一种建立面向汉英双语隐喻计算研究的大规模双语隐喻知识库构建的设想。
- 张霄军曲维光
- 关键词:隐喻知识库自然语言理解