詹卫东
- 作品数:63 被引量:512H指数:14
- 供职机构:北京大学中国语言文学系更多>>
- 发文基金:教育部人文社会科学重点研究基地度重大研究项目国家重点基础研究发展计划国家自然科学基金更多>>
- 相关领域:语言文字自动化与计算机技术文化科学更多>>
- 服务于汉英机器翻译的双语对齐语料库和短语库建设
- 机器翻译研究是一项十分具有挑战性的课题,机器翻译系统的翻译质量不但依赖于机器翻译方法和语言计算模型的创新性研究,也有赖于服务于机器翻译的语言资源的建设和积累,本文描述了服务于汉英机器翻译翻译的双语对齐语料库以及汉英双语短...
- 常宝宝詹卫东柏晓静吴云芳张化瑞
- 关键词:机器翻译汉英翻译
- 文献传递
- 以“计算”的眼光看汉语语法研究的“本位”问题被引量:11
- 2005年
- 本文认为并非只有作为“实体”的“语法单位”才能充当“本位”,从“计算”的角度看,汉语语法研究真正需要解决的问题是如何从功能角度对各种语法成分进行分类,以及如何构建语法成分之间的组合规则系统,而不是选择哪一个“语法单位”作为“本位”。
- 詹卫东
- 关键词:汉语语法语法单位语法体系本位
- “NP+的+VP”偏正结构在组句谋篇中的特点被引量:40
- 1998年
- 本文对“NP+的+VP”偏正结构的使用情况作了一番考察,概括了它的句法语义语用特点。在此基础上分析了两个跟“NP+的+VP”偏正结构相关的歧义格式,给出了排歧办法。
- 詹卫东
- 关键词:偏正结构语义关联歧义格式谓词性成分谓语动词
- 大数据时代的汉语语言学研究
- 2017年
- 意大利哲人尼可罗·马基亚维利(NiccolbMachiavelli)有句名言:“风景画家要描绘山峦之美,需先置身卑谷”。要思考今天这个时代如何去做语言学的研究,恐怕也应该跳出语言学自身的藩篱,放眼环顾我们身处的社会环境和学术生态,从时代进步的节奏和邻近相关学科的发展脉络中,或可反观语言学的律动轨迹,把握未来的方向。
- 詹卫东
- 关键词:大数据时代
- "现代汉语语义词典"的开发与应用
- "现代汉语语义词典"是一部面向汉英机器翻译系统的语言知识库,它以数据库文件形式收录了5万余条现代汉语的实词,不仅给出了每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制.目的是为计算机语义自动分...
- 王惠詹卫东俞士汶
- 关键词:语义词典现代汉语计算词典学中文信息处理机器翻译
- 文献传递
- “现代汉语语义词典”的结构及应用被引量:27
- 2006年
- “现代汉语语义词典(SKCC)”是一个面向汉英机器翻译的大规模汉语语义知识库,它以数据库文件形式收录6.6万余实词,不仅给出每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制。目的是为计算机语义自动分析、词义消歧等任务提供强有力的支持。本文介绍这部语义词典的结构、内容,并以实例说明这部词典可有效地解决翻译系统中的词汇歧义(WSD)问题。
- 王惠詹卫东俞士汶
- 关键词:语义词典词义消歧词汇语义学自然语言处理
- 范围副词“都”的语义指向分析被引量:39
- 2004年
- 本文针对计算机处理的需要,从实际语料出发,较全面地考察了副词“都”的义项区分及其判定;分析了表“总括”义的“都”的语义指向的逻辑意义;“都”能指向哪些句法成分,不能指向哪些成分,以及判定“都”的语义指向的一般原则;“都”跟其他状语性成分的位置关系以及“都”形成的状中式 vp 构成“的”字结构的能力。
- 詹卫东
- 关键词:语义指向范围副词句法规则词义排歧
- 基于高斯混合模型的现代汉语构式成分自动标注方法被引量:3
- 2020年
- 现代汉语构式成分自动标注作为文本自动标注任务之一,其最大的困难在于,当不存在标注语料作为训练数据时,如何从生语料中挖掘不同类型的构式成分相关的知识并进行标注,特别是面对构式序列在句中的边界难以判断的情况。该文试图借助高斯混合模型聚类方法,结合句中每一个字的位置特征与构式形式本身的语言学特征,融合正则表达式匹配结果信息,挖掘句子中的构式实例序列,并对构式内部成分进行自动标注。相较于仅基于正则表达式匹配和词性匹配的自动标注结果,该方法的F1分别至少提高了17.9%(半凝固型构式)、19.3%(短语型构式)、14.9%(复句型构式)。
- 黄海斌常宝宝詹卫东
- 关键词:高斯混合模型数据挖掘
- 精细化的中文词性标注评测集的研制
- 2020年
- 该文提出了一套精细化的中文词性标注评测体系。该文的工作重点在于确立其中的评测项目以及每个项目所对应的词例,提出了比对、归类、合取的方法;依此,该文初步建立了规模为5873句、涵盖了2326项词例和70个评测项目的评测试题集,并用这套试题集对几个常见的开源词性标注程序进行了评测。最后,该文指出了精细化评测体系将评测项目和评测语料联系起来的好处——在传统体系中,两者是分开的。该文从评测项目的价值和评测语料的组织性两个方面阐述了该文的评测体系相对于传统评测体系的优势,并指出了利用该文提出的评测体系改进被测程序的方法。
- 唐乾桐常宝宝詹卫东
- 关键词:词性标注语言资源
- 从短语到构式:构式知识库建设的若干理论问题探析
- 构式语法(construction grammar)在汉语语法学界已引起持续的关注,但在自然语言处理领域,将构式语法理论应用到计算机自动句法语义分析中的研究还很少见。本文提出构建现代汉语构式知识库的语言工程任务,讨论了构...
- 詹卫东
- 关键词:构式知识库