尹存燕
- 作品数:39 被引量:408H指数:10
- 供职机构:南京大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理语言文字更多>>
- 一种基于深度对齐矩阵分解模型进行学术论文推荐的方法
- 本发明公开了一种基于深度对齐矩阵分解模型进行学术论文推荐的方法,包括:分别通过两个非线性多层感知器,将用户和论文以及论文和单词映射到相同维度的低维特征空间;通过最大化同一篇论文的两种低维表示向量之间的相似度,在两个非线性...
- 戴新宇戴瑾黄书剑张建兵尹存燕陈家骏
- 文献传递
- 利用外部信息的神经机器翻译方法
- 本公开涉及利用外部信息的神经机器翻译方法,包括:接收源端源语言的文字序列作为源端输入;接收目标语言的文字序列作为外部信息输入;根据源端输入和外部信息输入,生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻...
- 黄书剑郑在翔戴新宇张建兵尹存燕陈家骏
- 文献传递
- 自然语言信息抽取中的机器学习方法研究被引量:21
- 2005年
- 信息抽取是一种用于处理各种类型文本文档的非常有效的方法,然而建立一个文本信息抽取系统却是非常困难和耗费时间的。近年来,基于统计的机器学习方法在信息抽取领域的研究受到了广泛关注。本文深入探讨了当前自然语言信息抽取领域广泛采用的几种非常有效的统计学习方法,比较分析了各种方法的统计推断过程和学习算法及其优缺点,讨论了各种统计学习方法所面临的训练语料匮乏问题的主要解决方法,并指出了今后进一步研究的方向。
- 周俊生戴新宇尹存燕陈家骏
- 关键词:自然语言信息抽取机器学习方法统计学习
- 基于层叠条件随机场模型的中文机构名自动识别被引量:138
- 2006年
- 中文机构名的自动识别是自然语言处理中的一个比较困难的问题.本文提出了一种新的基于层叠条件随机场模型的中文机构名自动识别算法.该算法在低层条件随机场模型中解决对人名、地名等简单命名实体的识别,将识别结果传递到高层模型,为高层的机构名条件随机场模型实现对复杂机构名的识别提供决策支持.文中为机构名条件随机场模型设计了有效的特征模板和特征自动选择算法.对大规模真实语料的开放测试中,召回率达到90.05%,准确率达到88.12%,性能优于其它中文机构名识别算法.
- 周俊生戴新宇尹存燕陈家骏
- 关键词:中文机构名识别条件随机场
- 一种混合逐点策略和成对策略的文本排序方法
- 本发明公开了一种混合逐点策略和成对策略的文本排序方法,涉及一种在对句子,句法树等样本排序的过程中更好地利用样本之间的差异信息的排序方法,包括:逐点排序阶段,成对排序阶段。逐点排序阶段对样本进行打分并做第一次排序,并筛选出...
- 黄书剑王琦戴新宇张建兵尹存燕陈家骏
- 基于语料库及树型结构模式匹配的汉语句法自动分析方法
- 本发明公开了一种基于语料库及树型结构模式匹配的汉语句法自动分析方法,该方法在对汉语标注语料库进行深度分析与完全切分的基础上,根据从语料库中抽取出的句法模式和相应的语义搭配关系,与待处理句进行模式匹配与模式转换处理,并经过...
- 陈家骏张亮戴新宇尹存燕
- 文献传递
- 中日双语平行语料库的自动构建技术研究
- 对于跨语言的统计自然语言处理研究来说,双语语料库可谓是研究工作的基础。双语语料库的规模、覆盖面、质量等直接影响一个统计模型或是算法的效果。此外,在跨语言的自然语言处理研究中,双语翻译知识有着重要的实用价值,翻译知识的获取...
- 尹存燕
- 关键词:信息挖掘网络平台
- 一种基于元规则的自然语言生成规则解释技术被引量:1
- 2006年
- 结合一个基于规则的日汉机器翻译系统,给出了自然语言生成规则的一种解释技术.该技术着眼于汉语生成规则语言的表达能力、自然性以及可扩充性,在实现中采用了基于元规则的方法,可以很方便地对规则语言进行扩充;另外,元规则的描述主要采用了自动机模型.所述的原则和技术也适用于一般的基于规则的自然语言处理系统.
- 孙明欣尹存燕戴新宇陈家骏
- 关键词:机器翻译规则语言元规则自动机
- 利用外部信息的神经机器翻译方法
- 本公开涉及利用外部信息的神经机器翻译方法,包括:接收源端源语言的文字序列作为源端输入;接收目标语言的文字序列作为外部信息输入;根据源端输入和外部信息输入,生成源端源语言文字序列的译文作为目标端输出。本公开提供的神经机器翻...
- 黄书剑郑在翔戴新宇张建兵尹存燕陈家骏
- 文献传递
- 公文流转系统的授权机制被引量:15
- 2002年
- 该文针对政府公文流转系统中特有的用户权限管理需求,提出了一种授权机制。该机制综合应用了RBAC和OMG的RAD工具的思想,实现了静态授权和动态授权。
- 尹存燕刘祎李振东谢俊元
- 关键词:办公自动化系统公文流转系统授权机制用户权限管理