您的位置: 专家智库 > >

国家重点实验室开放基金(2012072011)

作品数:1 被引量:8H指数:1
相关作者:于淼杨文川刘健更多>>
相关机构:北京邮电大学更多>>
发文基金:国家重点实验室开放基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇时间复杂度
  • 1篇数组
  • 1篇中文
  • 1篇分词
  • 1篇分词词典
  • 1篇复杂度
  • 1篇TRIE树

机构

  • 1篇北京邮电大学

作者

  • 1篇刘健
  • 1篇杨文川
  • 1篇于淼

传媒

  • 1篇计算机工程与...

年份

  • 1篇2013
1 条 记 录,以下是 1-1
排序方式:
基于双数组Trie树的中文分词词典算法优化研究被引量:8
2013年
基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于双数组Trie树结构的改进算法iDAT,在原始词典初始化时优先处理分支多的节点,并在初始化之后对base数组中的空序列的下标值做Hash,Hash表中存放空序列之前的所有空序列个数之和,而后运用iDAT算法进行插入。本算法借鉴了单模式匹配的Sunday算法中的跳跃思想,在适当增加空间开销的基础上,降低了Trie树在动态插入过程中的平均时间复杂度,在实际操作过程中有着良好的性能。
杨文川刘健于淼
关键词:TRIE树时间复杂度分词词典
共1页<1>
聚类工具0