国家自然科学基金(60503071)
- 作品数:12 被引量:64H指数:5
- 相关作者:穗志方刘耀邵艳秋吴云芳曲维光更多>>
- 相关机构:北京大学南京师范大学哈尔滨工业大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学语言文字电子电信更多>>
- 网络信息传播技术控制的微观控制模式研究
- 2006年
- 结合控制理论,集相关信息技术于一体,把网络信息传播的技术控制作为一个完整的体系进行分析,并依据各种网络技术控制对象和特点的不同,构建出多种同构模式。在此基础上,探讨了微观控制模式———标记语言的特点、组成及发展,从管理学的角度重新审视标记语言,从而把它上升为一种控制模式进行研究,并对其在网络信息传播技术控制中的作用和意义进行了探讨。避免了以技术看技术的片面性,使相关专业人员对该问题的理解能够进一步深入与完善,从而对网络信息及网络传播控制有一个整体的把握。
- 刘耀王锦贵
- 关键词:控制模式网络信息传播信息组织
- 领域Ontology自动构建研究
- 利用自然语言处理(NLP)理论和技术方法对已有公认领域知识,如专业叙词表、专业辞典、专业教材或权威著作等进行重构利用;借助领域专家知识,实现了基于网络的知识采集与加工;建立起受限文本的Ontology自学习机制,从而实现...
- 刘耀穗志方胡永伟冀铁亮
- 关键词:领域本体自然语言处理叙词表知识工程
- 文献传递
- 基于词汇语义特征的中文语义角色标注研究被引量:7
- 2009年
- 语义角色除了受句法结构限制之外,同词汇的语义特征也有着紧密的内在联系。对于一些仅依靠句法分析不能很好解决的角色标注问题,如句法结构相同的两个成分所对应的角色分别为完全不同的施事、受事角色的情况,可以通过引入一些词汇语义特征来进行处理。该文基于北京大学的语义词典CSD,引入了配价数、主客体语义类等词汇语义特征来进行语义角色标注研究。10折交叉验证的结果显示,通过引用词汇语义特征,所有角色标注的总体评价F值比单纯使用句法特征上升了1.11%,而其中Arg0和Arg1角色标注的F值达到93.85%和90.60%,比仅使用句法特征进行角色标注分别提高了1.10%和1.26%。
- 邵艳秋穗志方吴云芳
- 关键词:语义分析语义角色标注句法分析语义词典
- 语言学与统计方法结合建立汉语动词SCF类型集被引量:3
- 2007年
- 动词子语类框架(Subcategorization Frame以下简称SCF)在句法分析、语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建立了获得普遍共识的子语类框架类型集。而汉语方面还没有标准的动词子类框架类型集。本文提出一种语言学知识与统计方法相结合的汉语动词子语类框架类型集的半自动获取方案。初步建立起既符合统计结果又基本符合语言学理论的汉语动词子语类框架类型集。实验证明,加入语言学理论的子语类框架类型集降低了对语料的依赖程度,比完全由分析语料产生的类型集更完备。
- 冀铁亮孙薇薇穗志方
- 关键词:计算机应用中文信息处理
- 面向自然语言理解的汉语虚词研究
- 当进行自然语言理解研究时,首先把指称概念的实词放在首要地位是理所当然的,但虚词在句子、谈话、篇章中表达意义的作用也不能轻视。本文探讨虚词在汉语理解研究中的价值及其研究方法,倡议建设与北大计算语言学研究所的其他语言知识库可...
- 俞士汶朱学锋刘云
- 关键词:自然语言理解现代汉语虚词
- 文献传递
- 基于语境计算模型的汉语词义消歧(英文)
- 2006年
- 提出利用相对词频(Relative Word Frequency,RWF)来评估词语之间搭配强度。基于相对词频,提出语境计算模型,用于对汉语文本词义进行消歧。选择3个常用多义词进行试验,结果验证了该方法的有效性。
- 曲维光陈小荷董宇穗志方
- 关键词:词义消歧
- 一种结合术语部件库的术语提取方法被引量:19
- 2006年
- 术语是知识体系的核心成员,术语提取技术是大规模本体工程自动或半自动构建、扩充的关键技术之一。文章首先介绍了现有的一些术语提取技术,并在此基础上探讨了一种结合术语部件库的术语提取方法,并对这种方法的优点和未来的工作进行了分析。
- 何燕穗志方段慧明俞士汶
- 关键词:本体
- 生成语法50年:从科学重构的观点看被引量:3
- 2009年
- 在描述性科学向重构性科学转型大背景下,对转换生成语法的发展历史作一个批评回顾,并对生成语法发展的内在逻辑进行梳理。文章讨论了生成语法在短语结构语法、词汇投射理论以及最简方案框架下的人类语言重构方案,以及词典作为词语知识信息库在语言重构中的重要作用。
- 何卫
- 网络信息传播的技术控制模式研究被引量:6
- 2007年
- 本文对网络信息传播的技术控制的含义与范畴进行了分析,并在对技术控制的分类研究现状进行了分析总结的基础上,打破学科界线,集相关信息技术于一体,把网络信息传播的技术控制作为一个完整的体系进行分析,并依据各种网络技术控制对象和特点的不同,结合控制理论,构建出多种同构模式,进行评价与比较,并归纳总结各种控制模式之间的关系,提出了发展趋势。旨在对网络信息及网络传播控制有一个整体的把握,为网络信息传播的技术控制理论体系的建设和网络信息有效控制与利用,打下一个良好的理论基础。
- 刘耀王锦贵
- 关键词:网络传播信息组织
- 基于依存句法分析的汉语韵律层级自动预测技术研究被引量:7
- 2008年
- 不同的韵律层级可以将文本划分成适合朗读与理解的韵律组块,从而保证合成语音能够以自然的节奏表现出来。目前对韵律层级预测所采用的特征绝大多数是较为浅层的特征,如词性、词长等,但这些浅层特征对有的韵律层次如韵律短语的预测能力比较弱。实际上,句法结构同韵律层级之间有着非常紧密的联系,二者相互影响,相互制约。本文根据依存句法分析的结果,抽取出若干同韵律层级相关的深层句法特征对韵律层级进行预测。实验证明,其中内弧跨度和内弧类型等特征,对浅层特征较难解决的类似韵律短语这种中间层次的韵律单元划分问题,可以起到很大的提高作用,使韵律短语标注的综合F值提高了11%。
- 邵艳秋穗志方韩纪庆吴云芳
- 关键词:计算机应用中文信息处理语音合成句法结构依存分析