魏程
- 作品数:2 被引量:37H指数:2
- 供职机构:北京航空航天大学经济管理学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 中文分词算法研究被引量:33
- 2008年
- 当前搜索引擎技术被广泛的应用,这使得全文检索技术和中文分词技术的研究逐渐深入。本论文致力于研究中文分词算法,通过实验对分词原理做出比较,对分词算法、词典对分词质量的影响做出判断和评估,并设计了分词原型比较实验,比较测评了当前流行的中文分词方式:中科院分词模块和最大正向匹配法模块。
- 刘件魏程
- 关键词:中文分词
- 一种四维向量空间模型的Web新闻文本分类方法被引量:4
- 2010年
- 文本分类研究逐渐成为网络文本挖掘的研究热点,针对中文文本进行自动分类的研究也在逐渐升温。针对新闻文本的特殊性,在文本分类中经典的向量空间模型的基础上,提出了一套改进的四维向量空间模型及自适应追踪策略,进而提高了新闻文本分类的效果。实验结果表明,算法可以使传统空间向量模型的分类性能由81.5%提高至92.49%,证明算法是有效的。
- 魏程刘鲁翟铭
- 关键词:文本挖掘文本分类向量空间模型