国家自然科学基金(60973053)
- 作品数:2 被引量:5H指数:2
- 相关作者:王厚峰更多>>
- 相关机构:北京大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于层次聚类的网络新闻热点发现
- 网络新闻热点发现的主要目的是从海量互联网数据中发现人们感兴趣的热点话题。在已有研究中,主要采用基于单篇报道的增量聚类方法。本文则提出一套针对单日新闻进行层次聚类,发现每日热点,再对热点进行增量聚类的框架。在对每日新闻的层...
- 彭楠赟王厚峰凌晨添
- 关键词:特征选取层次聚类
- 文献传递
- Build Chinese Emotion Lexicons Using a Graph-based Algorithm and Multiple Resources
- <正>For sentiment analysis,lexicons play an important role in many related tasks.In this paper,aiming to build ...
- Ge Xu
- 文献传递
- 文本摘要中的句子抽取方法研究
- 抽取式摘要是从正文中按照一定策略抽取重要句子组成摘要。本文提出了一种句子抽取方法。基本思想是将句子的抽取看作序列标注问题,采用条件随机场模型对句子进行二类标注,根据标注结果抽出句子以生成摘要。由于不在摘要中的句子的数量远...
- 张龙凯王厚峰
- 关键词:文本摘要句子抽取条件随机场
- 文献传递
- 计算语言学歧义消解研究——兼介绍北京大学计算语言学教育部重点实验室被引量:3
- 2010年
- 本文介绍了近年来计算语言学歧义消解中的典型方法以及重点研究问题,并简要介绍了北京大学计算语言学教育部重点实验室的发展情况以及目前的重点研究方向。
- 王厚峰
- 关键词:歧义消解计算语言学
- 基于机器学习方法与搜索引擎验证的缩略语预测
- 在自然语言中广泛使用的缩略语是重要的新词来源之一,成为了自然语言处理的一大问题。本文研究了从完整形式预测缩略语形式的方法。首先,使用CRF模型对完整形式预测,形成一定量的缩略候选,再利用搜索引擎得到的结果信息对各候选依次...
- 焦妍王厚峰
- 关键词:缩略语CRF模型
- 文献传递
- 商品品牌名称挖掘
- 百度百科包含了大量的实体和丰富的链接与分类关系,在中文领域含有大量人类知识。在商品品牌名称抽取的挖掘中,我们提出了发现新的品牌名称的基于图模型的半指导方法。利用百度百科中词条间的相关关系和开放分类,我们使用不同的准则计算...
- 何正焱王厚峰
- 关键词:半监督学习图算法
- 文献传递