北京邮电大学信息工程学院智能科学技术研究中心
- 作品数:4 被引量:13H指数:2
- 相关机构:华北电力大学电气与电子工程学院电子与通信工程系华北电力大学电气与电子工程学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于Boot Strapping的中文实体关系自动生成被引量:3
- 2006年
- 针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关系的特征词。在此基础上,利用最近邻居的原则,进而生成更多的抽取模板。丰富了知识库,为分析二元实体关系奠定基础,使得生成复杂的消息模板成为可能,同时极大地减轻手工建立模板的复杂度,有利于系统进行移植。
- 张素香李蕾秦颖钟义信
- 关键词:BOOT
- 实体关系的自动抽取研究
- 针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、...
- 张素香文娟秦颖袁彩霞钟义信
- 关键词:实体关系抽取
- 文献传递
- 实体关系的自动抽取研究被引量:10
- 2006年
- 针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地设计了9个特征,尽可能全方位地描述文实体的真实情况.搭建了实验所需的系统框架,实现了实体关系的自动抽取.实验结果表明:该方法能够有效地解决实体关系的自动生成问题.
- 张素香文娟秦颖袁彩霞钟义信
- 关键词:极大熵BOOTSTRAPPING实体关系抽取评测
- 基于自由文本的中文实体关系抽取研究
- 针对信息抽取技术发展状况,本文基于信息抽取技术的发展历史,总结了目前世界上主要的信息抽取系统主要使用的相关技术和方法,分析它们的优缺点.在此基础上,结合全信息理论和机器学习,提出了基于全信息中文实体关系抽取模型,并对各个...
- 张素香李蕾钟义信
- 关键词:全信息中文实体关系抽取命名实体识别BOOTSTRAPPING自由文本信息抽取
- 文献传递