您的位置: 专家智库 > >

中央高校基本科研业务费专项资金(ycx13014)

作品数:1 被引量:4H指数:1
相关作者:加羊吉于洪志徐涛更多>>
相关机构:西北民族大学更多>>
发文基金:中央高校基本科研业务费专项资金国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇断句
  • 1篇信息处理
  • 1篇统计量
  • 1篇文本表示
  • 1篇向量
  • 1篇向量空间
  • 1篇向量空间模型
  • 1篇藏文文本
  • 1篇藏文信息
  • 1篇藏文信息处理

机构

  • 1篇西北民族大学

作者

  • 1篇徐涛
  • 1篇于洪志
  • 1篇加羊吉

传媒

  • 1篇计算机工程

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
基于改进卡方统计量的藏文文本表示方法被引量:4
2014年
藏文文本表示是将非结构化的藏文文本转换为计算机能够处理的数据形式,是藏文文本分类、文本聚类等领域特征抽取的前提。传统的藏文文本表示方法较少考虑特征项之间的关联度,容易造成语义损失。为此,结合向量空间模型,提出一种新的藏文文本表示方法。提取文本中词频统计TF-IDF值较高的部分词项作为对比词项,对藏文文本进行断句处理,以每个句子作为一个语境主题,利用卡方统计量计算文本中词项与对比词项的关联程度。实验结果表明,与传统的向量空间模型相比,该方法能更准确地表示藏文文本。
徐涛于洪志加羊吉
关键词:藏文信息处理文本表示向量空间模型
共1页<1>
聚类工具0