郑妍
- 作品数:4 被引量:0H指数:0
- 供职机构:东北大学更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于内容的文本分割关键技术
- 一般而言,稍长的文本往往都会涉及几个主题或同一主题的多个方面,如果能够自动划分出文本的这种语义结构,将语义段落作为基本处理单元,则会极大的改善传统文本处理技术以篇章作为基本处理单元的现象,对文本的分析可以从原来的篇章级别...
- 郑妍
- 关键词:自然语言处理文本分割动态规划LSA
- 文献传递
- 基于二维动态规划的文本分割模型
- 本文提出一种全局优化的文本分割模型,其中设计了基于语段内部词汇相似度、语段间词汇相似度和语段长度的分割方式评价函数,并采用二维动态规划来寻找全局最优解。模型基于如下假设:语段内部词汇相似度越大,语段间词汇相似度越小,语段...
- 叶娜郑妍朱靖波张斌
- 关键词:文本分割
- 文献传递
- 基于Bootstrapping的领域多词串自动获取
- 在构建领域知识库过程中,领域多词串比词携带了更多的语义信息,对于文本的主题分析和文本的内容分析明显的效果。本文首先利用C-Value方法从大规模无标注的真实语料中获取大量的多词串,然后采用Bootstrapping的机器...
- 郑妍肖桐朱靖波
- 关键词:文字处理
- 文献传递
- 基于Bootstrapping的领域多词串自动获取
- 在构建领域知识库过程中,领域多词串比词携带了更多的语义信息,对于文本的主题分析和文本的内容分析明显的效果。本文首先利用C-Value方法从大规模无标注的真实语料中获取大量的多词串,然后采用Bootstrapping的机器...
- 郑妍肖桐朱靖波
- 关键词:领域知识BOOTSTRAPPINGC-VALUE
- 文献传递