杨军玲
- 作品数:4 被引量:21H指数:2
- 供职机构:山西大学数学科学学院更多>>
- 发文基金:山西省自然科学基金山西省青年科技研究基金山西省科技攻关计划项目更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 自动获取汉语词语搭配被引量:16
- 2006年
- 作为一种词汇现象,词语搭配在自然语言处理的许多领域具有重要的应用。本文对4种词语相关性度量和3种词语结构分布度量分别进行了比较分析,并提出了一种基于互信息与熵融合的获取词语搭配的方法。实验结果表明:在同现频率较高情况下,互信息、Cosine系数、x2测试和似然比测试4种相关性度量对搭配判定有大致相同的效果;在度量词语的结构分布方面,熵要优于方差和离散度。本文所提方法依赖度量指标少,阈值容易选取,且与其他已有的方法具有同等效果。
- 王素格杨军玲张武
- 关键词:计算机应用中文信息处理词语搭配互信息
- 汉语动词词语搭配自动获取方法研究
- 在自然语言处理领域中,句法分析是实现语言“理解”的必然环节,也是公认的一个重点和难点。面向依存文法的句法分析方法主要是通过获取句子的核心动词及其所支配的词语搭配,进而分析句子内词语之间的依存关系,以建立依存句法树。依存语...
- 杨军玲
- 关键词:粗糙集信息熵最大熵模型自然语言处理语料库
- 文献传递
- 基于最大熵模型与投票法的汉语动词与动词搭配识别被引量:5
- 2007年
- 提出一种基于最大熵模型和投票法的汉语动词与动词搭配识别方法.该方法通过组合目标动词与候选搭配词的上下文词性信息以及关联程度的统计信息构成5种复合特征模板,然后利用最大熵方法获得它们对应搭配识别器,最后采用最好搭配识别器占优的投票法构造组合识别器.实验结果表明,同时包含上下文词性信息和统计信息的识别器优于单纯包含上下文词性信息或统计信息的识别器,但最好搭配识别器占优的组合识别器效果更佳.
- 王素格杨军玲张武
- 关键词:搭配最大熵模型特征函数投票法