福建省教育厅B类科技/社科项目(JB09054)
- 作品数:3 被引量:1H指数:1
- 相关作者:徐超王萌李春贵何婷婷更多>>
- 相关机构:福建师范大学广西科技大学华中师范大学更多>>
- 发文基金:福建省教育厅B类科技/社科项目国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种概念同现模型的多文档文摘研究
- 2011年
- 本文提出了一种概念同现模型的多文档自动文摘方法。该方法使用HowNet进行概念获取,建立概念向量空间模型,利用词汇的吸引与排斥现象和概念同现频率建立概念同现模型,并使用概念同现模型计算各概念的权重,利用建立的概念向量空间模型计算句子权重,根据句子权重和相似度情况产生文摘。使用改进的ROUGE-N评测方法、主题词覆盖(TWC)、高频词覆盖率(HFWC)作为评测指标对系统产生的文摘进行评测,结果显示这些方法是有效的。
- 王萌徐超李春贵何婷婷
- 关键词:自动文摘HOWNET
- 基于局部主题关键句抽取的多文档自动文摘方法
- 2013年
- 文档自动文摘是自然语言处理一个研究热点。本文提出了一种基于局部主题关键句抽取的多文档自动文摘方法。首先,将文档集合中的每篇文档划分为若干个局部主题,然后对不同文档中的局部主题进行聚类分析,最后从局部主题聚簇中间抽取所需要的文摘句。实验证明了该方法的有效性。
- 徐超王萌
- 关键词:多文档自动文摘主题划分
- 基于子主题区域划分的多文档自动文摘方法被引量:1
- 2011年
- 为解决词频矩阵的词频维数过大和矩阵过于稀疏的问题,提出一种子主题区域划分的多文档自动文摘方法。使用知网进行概念获取,建立概念向量空间模型,代替传统的词频向量空间模型。在概念向量空间模型的基础上,利用一种改进的层次分割法对文档集合进行子主题划分,从各个子主题中抽取出满足一定数量的句子作为文摘。实验结果验证了该方法的有效性。
- 王萌徐超李春贵何婷婷
- 关键词:自动文摘知网概念向量空间模型