您的位置: 专家智库 > >

卫华

作品数:1 被引量:1H指数:1
供职机构:河海大学计算机与信息学院更多>>
发文基金:中央高校基本科研业务费专项资金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本
  • 1篇文本分类
  • 1篇建模方法

机构

  • 1篇河海大学

作者

  • 1篇夏建华
  • 1篇韩立新
  • 1篇卫华

传媒

  • 1篇计算机技术与...

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
基于Word2fea模型的文本建模方法被引量:1
2016年
文本聚类在数据挖掘和机器学习中发挥着重要作用,该技术经过多年的发展,已产生了一系列的理论成果。传统向量空间模型的文本建模方法存在维度高、数据稀疏和缺乏语义信息等问题,然而仅仅引入词典的文本建模部分解决了语义问题却又受限于人工词典词量少、人工耗力大等多种问题。文中借鉴主题模型的思想,提出一种以word2vec算法得到词向量为基础,词聚类的类别为主题,结合文本中主题的频率、分布范围、位置因子等特征以获得文本在类别空间上的特征向量,完成文本建模的方法 word2fea。将其与两种文本建模方法 VSM和word2vec_base进行比较,实验结果表明该方法能够明显提高文本分类准确率。
卫华韩立新夏建华
关键词:文本分类
共1页<1>
聚类工具0