您的位置: 专家智库 > >

万富强

作品数:4 被引量:15H指数:2
供职机构:北京大学更多>>
发文基金:国家自然科学基金国家社会科学基金北京市重点实验室开放基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 3篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇句际关系
  • 3篇汉语
  • 1篇英文
  • 1篇语料
  • 1篇语料库
  • 1篇语言学
  • 1篇语义
  • 1篇语义分析
  • 1篇语义相关
  • 1篇语义相关度
  • 1篇识别方法
  • 1篇数理语言学
  • 1篇自动识别
  • 1篇自动识别方法
  • 1篇先验
  • 1篇先验概率
  • 1篇显性
  • 1篇相关度
  • 1篇相关度计算
  • 1篇相似度

机构

  • 4篇北京大学
  • 1篇北京信息科技...

作者

  • 4篇万富强
  • 3篇吴云芳
  • 1篇吕学强
  • 1篇石静
  • 1篇徐艺峰

传媒

  • 2篇北京大学学报...
  • 1篇中文信息学报

年份

  • 1篇2016
  • 1篇2014
  • 2篇2013
4 条 记 录,以下是 1-4
排序方式:
基于中文维基百科的词语语义相关度计算被引量:9
2013年
语义相关度计算在信息检索、词义消歧、自动文摘、拼写校正等自然语言处理中均扮演着重要的角色。该文采用基于维基百科的显性语义分析方法计算汉语词语之间的语义相关度。基于中文维基百科,将词表示为带权重的概念向量,进而将词之间相关度的计算转化为相应的概念向量的比较。进一步,引入页面的先验概率,利用维基百科页面之间的链接信息对概念向量各分量的值进行修正。实验结果表明,使用该方法计算汉语语义相关度,与人工标注标准的斯皮尔曼等级相关系数可以达到0.52,显著改善了相关度计算的结果。
万富强吴云芳
关键词:语义相关度先验概率
汉语并列复句的自动识别方法被引量:6
2013年
针对汉语句际关系中分布最广泛的并列复句,提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算,使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法,在广义并列关系上进行评测。最后将其中3种方法进行集成,并取得了较为理想的效果。
吴云芳石静万富强吕学强
关键词:并列复句句际关系句子相似度
汉语句际关系自动分析
句际关系分析是篇章分析在句子层级的微观体现,在机器翻译、信息检索等自然语言处理领域发挥着重要作用。目前汉语篇章分析体系匮乏,句际关系自动分析技术还不成熟。本文借鉴英文修辞结构理论和宾州篇章树库,制定了一套新的汉语篇章分析...
万富强
关键词:汉语句法句际关系数理语言学
基于排序方法的汉语句际关系树自动分析(英文)
2016年
提出一种自动分析汉语小句级句际关系树的新方法。在修辞结构理论体系下,构建一个汉语句际关系标注语料库。不同于传统的只关心相邻两个单元的方法,提出一种类排序模型(SVM-R),自动构建汉语句际关系的树结构,旨在把握相邻3个单元之间的关联强度。实验结果表明,所提出的SVM-R模型对句际关系树的分析显著优于传统方法。最后提出并验证了丰富的、适合于汉语句际关系分析的语言特征。
吴云芳万富强徐艺峰吕学强
共1页<1>
聚类工具0