搜索到35篇“ 机械分词“的相关文章
- 使用机械分词与特征扫描实现对甲骨卜辞的切分被引量:2
- 2013年
- 依据甲骨文语法及甲骨文词典对甲骨卜辞进行切分,是建立甲骨文语料库实现计算机辅助甲骨文考释的前提和基础.针对甲骨卜辞的切分,采用机械分词与特征扫描相结合的中文分词技术对200条比较完整的卜辞进行切分实验,将只使用机械分词和结合了特征扫描的两种方法进行比较.结果表明,采用机械分词与特征扫描相结合,实现甲骨卜辞的切分的正确率和效率都较高.
- 陆公正开金宇
- 关键词:甲骨卜辞分词技术机械分词LUCENE
- 智能化中文机械分词组件的设计
- 2009年
- 分词是计算机系统对自然语言处理的第一步,分词的方法与准确率将显著影响自然语言的处理效果。在分析机械分词技术的基础上,提出构建智能化机械分词组件的思想,论述构建智能化中文分词组件的基本思路与方法,指出智能化中文机械分词组件在中文信息处理领域中的应用前景。
- 齐忠琪
- 关键词:中文处理机械分词组件设计
- 基于机械分词与统计学的新词识别研究被引量:6
- 2005年
- 分词是所有中文信息处理工作的基础,也是汉语信息处理的难点之一,如何识别文中出现的新词更成为当前研究的重点之一。本文综合利用几种传统的机械分词方法,加上统计学的方法,提出了一种从文献中抽取新词的新方法。
- 梁刚
- 关键词:未登录词统计学新词分词汉语信息处理
- 基于改进PATRICIA树词典的中文机械分词算法的研究与应用
- 邹龄芳
- 关键词:分词词典
- 一种基于张量的多维印章数据处理方法
- 本发明属于张量计算技术领域,公开了一种基于张量的多维印章数据处理方法,包括:步骤S10、获取合同样本文件,自动检测合同样本文件中所需信息材料;步骤S20、抽取合同样本文件中所需信息材料;步骤S30、根据步骤S20获取的所...
- 张宏俊李鹏王汝传徐鹤杨书鑫史德胜叶昊
- 一种基于张量的多维印章数据处理方法
- 本发明属于张量计算技术领域,公开了一种基于张量的多维印章数据处理方法,包括:步骤S10、获取合同样本文件,自动检测合同样本文件中所需信息材料;步骤S20、抽取合同样本文件中所需信息材料;步骤S30、根据步骤S20获取的所...
- 张宏俊李鹏王汝传徐鹤杨书鑫史德胜叶昊
- 基于统计和基于词典的中文分词方法
- 本发明提供了一种基于统计和基于词典的中文分词方法,结合基于统计和基于词典的分词方法,形成一个分词系统。一种基于统计和基于词典的中文分词方法,包括以下步骤:S1.输入需要待分词语句;S2.对本句话进行原子分词;S3.对输入...
- 李晓瑜尹青山冯落落冯卫森李沛高明王建华
- 一种SCD文件中装置快速匹配模板库类型的方法及系统
- 一种SCD文件中装置快速匹配模板库类型的方法及系统。通过解析当前变电站的SCD模型文件获取装置名称和装置描述,使用中文机械分词对装置描述进行切分,切分后的词和SCD虚回路标准模板库中的类型匹配,从而为后续SCD文件的虚回...
- 张锋乔利红姚凯韩伟刘尧王博张震吴莉李惠民
- 用于从用户的自然语言输入中提取关键元素的方法
- 本发明涉及一种用于从用户的自然语言输入中提取关键元素的方法,包括下列步骤:根据第一语义知识库对用户的第一自然语言输入进行语义匹配以识别所述第一自然语言输入的总体语义;选择限定知识库;通过确定所述限定知识库中与所述总体语义...
- 王溪华郝新利
- 文献传递
- 报表查询方法、装置、计算机设备及存储介质
- 本发明涉及数据查询领域,本发明公开了一种报表查询方法、装置、计算机设备及存储介质,所述方法包括:通过获取待查询报表信息;运用机械分词算法和MMSeg算法,通过关键字提取模型对获取的待查询报表信息进行分词和关键字识别处理,...
- 赵安宁徐孙杰吕兴
- 文献传递
相关作者
- 骆正清

- 作品数:113被引量:1,059H指数:13
- 供职机构:合肥工业大学管理学院
- 研究主题:层次分析法 基本养老保险 实证研究 国有企业 渠道供应链
- 陈增武

- 作品数:18被引量:95H指数:3
- 供职机构:浙江大学计算机科学与技术学院计算机科学与工程学系
- 研究主题:机械分词 汉语 HYPERTEXT 超文本 CTS
- 李鹏

- 作品数:207被引量:12H指数:2
- 供职机构:南京邮电大学
- 研究主题:无线传感器网络 RFID 卫星网络 物联网 网络
- 徐鹤

- 作品数:209被引量:100H指数:6
- 供职机构:南京邮电大学
- 研究主题:RFID 标签 对等计算 无线传感器网络 数据结构
- 开金宇

- 作品数:22被引量:34H指数:3
- 供职机构:上海大学计算机工程与科学学院
- 研究主题:WEB服务 可靠性分析 机械分词 实时数据库 WEB服务系统