何径舟
- 作品数:4 被引量:38H指数:1
- 供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
- 发文基金:北京市自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于特征自动选取的汉语词义消歧
- 自然语言处理的许多问题都可以归结为分类问题,汉语词义消歧是一类典型的分类问题。在分类问题中,特征的选择至关重要。通常情况下,特征的选择由人工直接确定,这样的选取方式,要求选取者对于分类问题本身和机器学习模型的特点都有比较...
- 何径舟王厚峰
- 关键词:汉字处理汉语词义词义消歧数理语言学
- 文献传递
- 半指导分类与特征选择方法在中文词义消歧和情感词分析中的应用
- 自然语言处理的很多问题都可以归结为分类问题,机器学习是解决分类问题的重要途径。本文以自然语言处理的两种典型问题——词义消歧和动态情感词分析为例,研究了机器学习方法在处理分类问题时几个重要因素的影响:分类模型、语料和特征选...
- 何径舟
- 关键词:词义消歧
- 基于特征自动选取的汉语词义消歧
- 自然语言处理的许多问题都可以归结为分类问题,汉语词义消歧是一类典型的分类问题。在分类问题中,特征的选择至关重要。通常情况下,特征的选择由人工直接确定。这样的选取方式,要求选取者对于分类问题本身和机器学习模型的特点都有比较...
- 何径舟王厚峰
- 关键词:词义消歧
- 文献传递
- 基于特征选择和最大熵模型的汉语词义消歧被引量:38
- 2010年
- 词义消歧是自然语言处理中一类典型的分类问题.在分类中,特征的选择至关重要.通常情况下,特征是由人工选择的,这就要求特征选取者对于待分类的问题本身和分类模型的特点有深刻的认识.分析了汉语词义消岐中特征模板对消歧结果的影响,在此基础上提出一套基于最大熵分类模型的自动特征选择方法,包括针对所有歧义词的统一特征模板选择和针对单个歧义词的独立特征模板优化算法.实验结果表明,使用自动选择的特征,不仅简化了特征模板,而且提高了汉语词义消歧的性能.与SemEval2007:task#5的最好成绩相比,该方法分别在微平均值MicroAve(micro-average accuracy)和宏平均值MacroAve(macro-average accuracy)上提升了3.10%和2.96%.
- 何径舟王厚峰
- 关键词:最大熵模型汉语词义消歧