苗家
- 作品数:3 被引量:9H指数:1
- 供职机构:山东大学计算机科学与技术学院更多>>
- 发文基金:山东省自然科学基金山东省科技攻关计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于HITS算法的blog文摘方法
- blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合blog评论获取blog文章的主要内容是许多基于blog的应用所要面临的难题。以往提出的文摘方法大多是针对多文档文摘的通用方法,并未考虑blog文章的特...
- 苗家马军陈竹敏
- 关键词:BLOGHITS
- 文献传递
- 一种基于HITS算法的Blog文摘方法被引量:9
- 2011年
- Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临的难题。以往提出的文摘方法大多是针对多文档文摘的通用方法,并未考虑Blog文章的特殊性,无法有效地结合评论来处理文章。该文通过分析Blog的特点提出了一种新的结合评论信息的Blog文摘方法。该方法首先基于特征计算出评论的权重,然后结合图模型使用HITS算法得到正文句子权重,进而得到文摘句。通过在凤凰博客数据集上的实验表明,该文方法在ROUGE测度上优于以往方法。
- 苗家马军陈竹敏
- 关键词:BLOGHITS
- Blog文档的自动文摘方法研究
- 随着因特网的高速发展、信息爆炸时代的延展,人们对于信息的获取又有了新的需求。人们不再仅仅满足于由新闻媒体、信息门户等网络信息实体所展示的文章或多媒体信息,而是更加倾向于同网络中其他用户的信息交流、分享与互动。随着这种需求...
- 苗家
- 关键词:BLOGHITS
- 文献传递