孟凡东
- 作品数:30 被引量:5H指数:1
- 供职机构:北京交通大学更多>>
- 发文基金:中央高校基本科研业务费专项资金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 机器翻译装置和方法
- 本发明公开了一种机器翻译装置和方法,涉及自然语言处理领域。装置包括:源语言输入单元,输入源语言语句;源语言分析单元,进行词法分析和句法分析得到句法结构,并为句法结构中的节点赋予属性特征;任意格判定模型存储单元,存储任意格...
- 徐金安孟凡东陈恰潘栩达珍孟庆辰
- 文献传递
- 异种语料融合方法:基于统计的中文词法分析应用被引量:5
- 2012年
- 基于统计的中文词法分析往往依赖大规模标注语料,语料的规模和质量直接影响词法分析系统的性能。高覆盖率、高质量的语料资源非常有限,而且适用于不同领域的语料往往具有不同的分词和词性标注标准,难以直接混合使用,从而导致既有资源未能充分利用,分词精度下降等问题。针对该问题,该文提出了简单有效的异种语料的自动融合方法,并通过实验验证了提案方法的有效性、较强的实用性以及对多种语料融合的可扩展性。
- 孟凡东徐金安姜文斌刘群
- 关键词:词法分析
- 一种摘要生成模型的训练方法及相关装置
- 本申请公开一种摘要生成模型的训练方法及相关装置;方法包括:初始生成模型包括编码器、融合器和解码器,将第一批量样本中第一样本文本、第一样本图像和第一样本摘要输入编码器,编码输出第一文本向量、第一图像向量、第一对象向量和第一...
- 梁云龙孟凡东徐金安陈钰枫
- 数据处理方法、装置、计算机可读介质及电子设备
- 本申请属于人工智能技术领域,具体涉及一种数据处理方法、数据处理装置、计算机可读介质以及电子设备。本申请实施例中的数据处理方法,包括:获取源端输入样本以及与所述源端输入样本相关联的目标输出样本;对源端输入样本进行编码处理得...
- 刘宜进孟凡东徐金安
- 文本处理、装置、存储介质及设备
- 本申请公开了一种文本处理、装置、存储介质及设备,属于人工智能技术领域。方法包括:获取待处理文本,对待处理文本执行向量化处理得到共享特征向量;分别对共享特征向量执行与方面词抽取任务对应的第一编码处理、与观点词抽取任务对应的...
- 梁云龙孟凡东张金超周杰徐金安陈钰枫
- 文献传递
- 中文分词和词性标注的在线重排序方法
- 主流的中文分词与词性标注方法将分词和词性标注问题看成是序列标注问题,通常利用局部特征训练判别式模型。该方法取得了很好的效果,但是与词、词性相关的全局特征并没有被充分的利用。为了更好的处理分词和词性标注的歧义,传统的重排序...
- 孟凡东谢军刘群
- 异种语料融合方法:基于统计的中文词法分析应用
- 基于统计的中文词法分析往往依赖大规模标注语料,语料的规模和质量直接影响词法分析系统的性能。高覆盖率、高质量的语料资源非常有限,而且适用于不同领域的语料往往具有不同的分词和词性标注标准,难以直接混合使用,从而导致既有资源未...
- 孟凡东徐金安姜文斌刘群
- 关键词:词法分析
- 文献传递
- 摘要模型训练方法、摘要生成方法、计算设备和介质
- 提供了摘要模型训练方法、摘要生成方法、计算设备和介质。摘要模型用于生成文本摘要,所述训练方法包括:获取训练数据集,所述训练数据集包括的每个训练数据包括文本样本、图片样本以及对应的摘要样本,对于每个训练数据,基于所述训练数...
- 梁云龙孟凡东徐金安陈钰枫
- 基于依存树的统计机器翻译方法及系统
- 本发明提供一种基于依存边转换的统计机器翻译方法,根据从双语语料库中抽取的转换规则,将源语言句子的依存树中每条依存边转换为对应的目标语言短语依存边,并对所得到的目标语言短语依存边进行拼接,以生成目标语言端译文。该方法结合依...
- 陈宏申谢军孟凡东姜文斌刘群
- 文献传递
- 2011全国机器翻译研讨会计算所系统描述
- 本文介绍了中国科学院计算技术研究所自然语言处理研究组参加2011年全国机器翻译研讨会机器翻译评测的情况。今年我们参加了所有领域的九项评测任务。使用了基于语言学句法.基于形式句法、基于短语等三类统计翻译模型的单系统,以及基...
- 刘凯王志洋于惠孙萌宋林峰李佳正何晋一孟凡东刘洋吕雅娟刘群
- 关键词:机器翻译
- 文献传递