张金鹏
- 作品数:6 被引量:12H指数:2
- 供职机构:昆明理工大学更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金云南省科技厅科研基金更多>>
- 相关领域:自动化与计算机技术一般工业技术金属学及工艺更多>>
- 基于跨语言语料的汉泰词分布表示被引量:2
- 2015年
- 词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果,然而在跨语言词汇的分布表示上国内外研究很少,针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督学习扩展等方式在中文语料中嵌入泰语的互译词、同类词、上义词等,学习出泰语词在汉泰跨语言环境下的分布。实验基于学习到的跨语言词汇分布表示应用于双语文本相似度计算和汉泰混合语料集文本分类,均取得较好效果。
- 张金鹏周兰江线岩团余正涛何思兰
- 基于LM算法的领域概念实体属性关系抽取被引量:4
- 2014年
- 针对非结构化自由文本中关系模式比较复杂,关系抽取性能不高的问题,该文提出了利用BP神经网络的优化算法-LM算法,对非结构化自由文本信息中的领域概念实体属性关系进行抽取。首先对语料进行预处理,然后利用CRFs模型对领域概念的实例、属性和属性值进行实体识别,然后根据领域中各类关系的特点分别进行特征提取,构造BP神经网络模型,利用LM算法抽取相应关系。和适用于二分类问题的SVM相比,人工神经网络优化算法自主学习能力强,识别精度高,更适用于多分类的问题。通过几组实验表明,该方法在领域概念实体属性关系抽取方面取得了良好的效果,F值提高了12.8%。
- 刘丽佳郭剑毅周兰江余正涛邵发张金鹏
- 关键词:BP神经网络LM算法
- 汉泰双语新闻话题发现方法研究
- 随着互联网+大数据时代的到来和经济全球化的进程加快,全球互联网用户数量猛增,国与国之间普通民众通过互联网获取新闻实时热点成为一种常态,在一段时期内不同语言的用户可以通过本国的语言获取本国有关的资讯,但想要了解其它国家的新...
- 张金鹏
- 关键词:汉语泰语
- 文献传递
- 基于跨语言语料的汉泰词分布表示
- 词汇的表示问题是自然语言处理的基础研究内容。目前单语词汇分布表示已经在一些自然语言处理问题上取得很好的应用效果。然而在跨语言词汇的分布表示上国内外研究很少,本文针对这个问题,利用两种语言名词、动词分布的相似性,通过弱监督...
- 张金鹏周兰江线岩团余正涛何思兰
- Al/Zn层状复合板退火工艺对界面行为影响的研究
- 金属层状复合材料作为一种性能优异的金属复合材料,在如今的社会建设中,凭借其能够结合多种金属材料性能的特点,即便在诸多种类的建材中也扮演着不可忽视的角色。本文通过固液铸造复合法制备了Al/Zn层状复合金属板粗坯,再通过热轧...
- 张金鹏
- 关键词:钛扩散层
- 基于实体消歧的中文实体关系抽取被引量:6
- 2014年
- 针对开放文本中中文实体关系抽取的一词多义问题,提出一种基于实体消歧的中文实体关系抽取方法。首先,从知网中挖掘出具有潜在语义关系的实体对,并利用贝叶斯分类的语义消歧方法实现从知网到维基百科的实体映射,以获取高质量的关系实例;然后,根据这些关系实例抽取出其对应文本中共现的句子实例,构建基本的抽取模式;最后通过模式合并的方法生成新模式,再使用新模式来抽取新实例。实验结果表明,该方法与没有进行语义消歧和模式合并的方法相比准确率有所提高。
- 邵发黄银阁周兰江郭剑毅余正涛张金鹏
- 关键词:关系抽取贝叶斯分类维基百科