郭海蓉
- 作品数:3 被引量:4H指数:2
- 供职机构:西南科技大学计算机科学与技术学院更多>>
- 发文基金:博士科研启动基金四川省教育厅资助科研项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于增量图聚类的动态多文档摘要算法被引量:2
- 2016年
- 目前的动态文摘方法几乎都基于文档批处理机制,无法适应实际应用中表现为不稳定数据流的文档数据,因此无法满足实时更新摘要的需求。针对上述问题,提出了一种基于K近邻句子图模型的动态文本摘要方法。根据K近邻规则构建一个双层句子图模型,用基于密度划分的增量图聚类方法对句子进行子主题划分,最后结合时间因素提高句子新颖度来抽取动态文摘。该方法能基于文档数据流增量式地抽取动态文摘,实现文摘内容的实时更新。在TAC2008和TAC2009的update summarization数据集上的实验结果显示了该方法在动态文摘抽取上的有效性。
- 郭海蓉张晖赵旭剑李波杨春明
- 关键词:K近邻
- 一种基于改进K-means的动态文摘提取方法被引量:2
- 2015年
- 随着互联网的发展和Web2.0的应用,网络信息呈现出越来越明显的动态演化性,传统的静态文摘方法不能很好地反应文摘的动态变化和新颖性,难以满足人们对于摘要获取效率的要求,动态文摘技术成为新的研究热点。提出一种基于改进K-means算法的动态文摘提取和更新方法。为了减小聚类结果对初值的依赖性,提高聚类的稳定性,采用聚类中心的搜索算法获得较优的初始聚类中心。它能解决使用传统聚类方法进行动态文摘提取中存在的重复计算问题,并能保持较高效率。在TAC2008上的实验证明,该方法生成的动态文摘效果较好、算法效率高。
- 郭海蓉张晖赵旭剑李波杨春明
- 关键词:K-MEANS增量聚类TAC
- 增量聚类在动态多文档摘要中的研究与应用
- Web2.0时代出现的论坛、博客、新闻和在线评论等新媒体每天产生海量文档信息,因此需要一种高效的方法提取文档重要内容,去除冗余信息,将简洁,精炼的内容呈现给读者。为了帮助读者们获取他们感兴趣事件的最新动态,实现更快的实时...
- 郭海蓉
- 关键词:增量聚类抽取算法