您的位置: 专家智库 > >

东北大学自然语言处理实验室

作品数:84 被引量:156H指数:8
相关作者:姚天顺王会珍陈文亮朱慕华吴宏林更多>>
相关机构:新疆大学信息科学与工程学院中国刑警学院文件检验技术系更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金教育部科学技术研究重点项目更多>>
相关领域:自动化与计算机技术语言文字政治法律自然科学总论更多>>

文献类型

  • 56篇会议论文
  • 28篇期刊文章

领域

  • 67篇自动化与计算...
  • 15篇语言文字
  • 3篇政治法律
  • 1篇天文地球
  • 1篇电子电信
  • 1篇交通运输工程
  • 1篇一般工业技术
  • 1篇文化科学
  • 1篇自然科学总论

主题

  • 26篇机器翻译
  • 26篇翻译
  • 14篇中文
  • 14篇文本分类
  • 12篇统计机器
  • 12篇统计机器翻译
  • 9篇语言处理
  • 9篇自然语言
  • 8篇自然语言处理
  • 7篇人名消歧
  • 7篇消歧
  • 6篇聚类
  • 6篇抽取
  • 5篇对齐
  • 5篇语料
  • 5篇支持向量
  • 5篇支持向量机
  • 5篇向量
  • 5篇向量机
  • 4篇信息处理

机构

  • 84篇东北大学
  • 12篇教育部
  • 5篇施乐公司
  • 3篇中国刑事警察...
  • 3篇沈阳雅译网络...
  • 1篇新疆大学
  • 1篇中国刑警学院
  • 1篇澳门大学
  • 1篇微软公司

作者

  • 17篇朱靖波
  • 11篇王会珍
  • 7篇肖桐
  • 6篇朱慕华
  • 4篇张俐
  • 4篇陈文亮
  • 4篇王虹
  • 3篇姚天顺
  • 2篇罗海涛
  • 2篇李强
  • 2篇张斌
  • 1篇宋国龙
  • 1篇李超
  • 1篇李超
  • 1篇胡明涵
  • 1篇陈如山
  • 1篇于清
  • 1篇张冬冬
  • 1篇李天宁
  • 1篇魏刚

传媒

  • 17篇中文信息学报
  • 4篇第四届全国学...
  • 3篇第六届全国信...
  • 3篇第三届学术计...
  • 3篇第五届全国青...
  • 3篇全国第八届计...
  • 2篇计算机学报
  • 2篇中国司法鉴定
  • 2篇第三届学生计...
  • 1篇电脑编程技巧...
  • 1篇计算机研究与...
  • 1篇北京大学学报...
  • 1篇厦门大学学报...
  • 1篇小型微型计算...
  • 1篇软件学报
  • 1篇刑事技术
  • 1篇第二届HNC...
  • 1篇第二届全国信...
  • 1篇第七届全国机...
  • 1篇第一届全国信...

年份

  • 2篇2023
  • 1篇2020
  • 4篇2019
  • 4篇2018
  • 3篇2017
  • 1篇2016
  • 2篇2015
  • 1篇2014
  • 1篇2013
  • 3篇2012
  • 9篇2011
  • 14篇2010
  • 2篇2009
  • 11篇2008
  • 2篇2007
  • 8篇2006
  • 10篇2005
  • 5篇2004
  • 1篇2003
84 条 记 录,以下是 1-10
排序方式:
基于谓词驱动模板的汉日机器翻译方法
本篇文章通过对汉语中谓词以及结构辅助词的分析研究提出了一种基于谓词驱动模板的机器翻译方法。谓词驱动模板方法将谓词以及结构辅助词固化在模板中,实现句子级的结构精确匹配,从而在模板库中找到最适合的翻译模板进行翻译。根据汉语中...
陈晴姚天顺张俐姜涛石磊李彦丹肖桐
关键词:谓词
文献传递
基于领域类别信息C-value的多词串自动抽取
文本的多词串抽取是自然语言处理领域一项重要的研究内容,其中C-value是目前广泛应用的多词串抽取方法。然而C-value方法不能有效利用领域类别信息,即使文本的领域类别已知或者容易获得。针对这种情况,本文提出了一种多类...
李超王会珍朱慕华张俐朱靖波
关键词:领域信息
文献传递
面向文本分类的多类别SVM组合方式的比较
支持向量机是性能良好的二类分类模型,适用于处理文本分类问题。但支持向量机无法直接用于处理多类分类问题。本文考察了四种流行的多类支持向量机方法,包括one-against-rest,pair-wiseMax-win,DDA...
朱慕华朱靖波陈文亮
关键词:文本分类
文献传递
基于多层次特征集成的中文实体指代识别被引量:3
2007年
实体指代识别(Entity Mention Detection,EMD)是识别文本中对实体的指代(Mention)的任务,包括专名、普通名词、代词指代的识别。本文提出一种基于多层次特征集成的中文实体指代识别方法,利用条件随机场模型的特征集成能力,综合使用字符、拼音、词及词性、各类专名列表、频次统计等各层次特征提高识别性能。本文利用流水线框架,分三个阶段标注实体指代的各项信息。基于本方法的指代识别系统参加了2007年自动内容抽取(ACE07)中文EMD评测,系统的ACE Value值名列第二。
张海雷曹菲菲陈文亮任飞亮王会珍朱靖波
关键词:计算机应用中文信息处理条件随机场模型
基于多阶段的中文人名消歧聚类技术的研究
人名消歧任务被很多的研究者看作为一个聚类任务,任务是将指向实际生活中同一个人的文档聚为同一个类。本文针对人名消歧任务提出一种新的文档聚类策略,该策略采用多阶段的聚类方式来对多个文档进行聚类,并对各种特征在每个阶段中对系统...
关键词:人名消歧聚类算法
文献传递网络资源链接
基于Bootstrapping的文本分类模型
本文提出一种基于Bootstrapping 的文本分类模型,该模型采用最大熵模型作为分类器,从少量的种子集出发,自动学习更多的文本作为新的种子样本,这样不断学习来提高最大熵分类器的文本分类性能。文中提出一个权重因子来调整...
陈文亮朱慕华朱靖波姚天顺
关键词:文本分类最大熵模型
文献传递
利用1-m词对齐信息改善统计机器翻译性能
词对齐是目前主流的统计机器翻译系统必备的模块,而IBM模型是词对齐最常用的模型,但是IBM模型不允许源语到目标语的一对多词对齐,这一限制在像汉英翻译这样频繁出现一对多对齐现象的任务中,影响了翻译系统的性能。 本...
陈如山肖桐朱靖波
关键词:文字处理数理语言学
文献传递
基于序列相交的短语译文获取
短语译文获取技术是基于实例机器翻译系统EBMT中的核心技术之一,短语译文获取技术的性能直接影响到EBMT的性能。当前主要的短语译文获取方法过于依赖词对齐结果,只能从词对齐库中得到短语译文结果:有些方法利用句法分析结果,存...
王辰宋国龙吴宏林张俐刘绍明
关键词:EBMT
文献传递
面向新闻领域的主谓关系识别
本文提到的主谓关系,专指一个名词和动词经常共现,并且在语义上能够同时构成一个句子的主语和谓语的这样一种关系。本文提出了一种统计结合启发性规则和句法信息的方法来分析主谓关系。实验表明,该方法跟传统的统计方法相比较,F1值得...
杨旭肖桐张俐
关键词:汉字处理词汇关系语义识别数理语言学
文献传递
基于条件随机场的中文命名实体识别特征比较研究
命名实体识别任务主要是识别文本中的人名、地名、机构名等实体。基于条件随机场的命名实体识别是目前常用方法。特征是影响命名实体识别性能的重要因素,由于命名实体识别任务中可用到的特征及其组合很多,因此选取合适的特征是提高性能、...
张祝玉任飞亮朱靖波
关键词:命名实体识别条件随机场特征选取
文献传递
共9页<123456789>
聚类工具0