国家自然科学基金(61103095)
- 作品数:2 被引量:16H指数:1
- 相关作者:熊璋欧阳元新罗建辉袁满赵海更多>>
- 相关机构:北京航空航天大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国际科技合作与交流专项项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 用于RFID中间件的主存数据库索引结构被引量:1
- 2012年
- 根据EPC Global标准,提出了基于RFID数据特征的网格索引结构.该索引结构针对RFID应用场景设计,不仅能实现高效的插入、查询以满足实时性的需求,还能够提高内存的利用率,节省内存.与传统索引相比,提出的索引结构能够完全适用于真实的RFID应用场景,实现条件查询、范围查询等其他传统索引很难实现的操作.可以减少内存消耗,提升条件查询,范围查询的速度.实验结果证明基于RFID数据特征的网格索引不但在插入效率上不亚于传统索引,而且在条件查询,范围查询的效率远远高于其他传统索引结构,并且内存占用率也具有一定优势.
- 赵海欧阳元新熊璋
- 关键词:内存数据库数据结构索引结构RFID中间件T树
- 一种基于频繁词集的短文本特征扩展方法被引量:15
- 2014年
- 为了解决向量空间模型(VSM)对短文本内容表示能力不足的问题,提出了一种基于频繁词集的特征扩展方法.定义了单词间的共现关系和类别同向关系,通过计算单词集的支持度和置信度,挖掘出具有相同类别倾向的频繁词集,并将其作为短文本特征扩展的背景知识库.对于短文本中的每个原始单词,从背景知识库中查找包含有该单词的频繁词集,将其作为扩展特征加入原特征向量中.搜狗语料集上的实验结果表明,置信度和支持度对背景知识库的规模有较大的影响,但是扩展过多的特征存在冗余性,对分类效果没有进一步的提升.基于频繁词集构建的短文本背景知识库可以作为有效的扩展特征;当训练文本数较为有限时,特征扩展对支持向量机SVM的分类效果有显著的提升.
- 袁满欧阳元新熊璋罗建辉
- 关键词:频繁项目集