赵琦
- 作品数:7 被引量:99H指数:5
- 供职机构:中国科学院国家科学图书馆更多>>
- 发文基金:国家社会科学基金国家科技支撑计划更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 非结构化文本中内容对象抽取的技术方法综述被引量:1
- 2008年
- 近年来,知识抽取技术在非结构化文本的处理中起到很重要的作用.文章在对当前知识抽取的相关文献、系统和项目分析研究的基础之上,提出了当前知识抽取研究中的主要抽取内容对象的分类,并对这些主要内容对象抽取的相关技术方法进行综述.主要总结了Web对象识别和集成、术语识别和抽取、主题发现和识别、概念层次关系的抽取、非概念层次关系的抽取、事实抽取、观点抽取和倾向识别等7种内容对象抽取的技术方法.并在此基础之上,对未来知识抽取的发展趋势进行了分析.该文为2008年第9期本期话题'知识抽取'的文章之一.
- 张智雄吴振新赵琦洪娜徐健刘建华
- 关键词:知识抽取术语抽取主题发现关系抽取数字图书馆
- 从ACE会议看信息抽取技术的发展趋势被引量:14
- 2008年
- 介绍ACE测评会议的概况及其发展轨迹。在此基础上,结合ACE测评会议的测评任务、参加队伍、测评语料、测评结果等变化,分析信息抽取的发展现状,并对信息抽取的发展趋势进行探讨。
- 赵琦刘建华冯浩然
- 关键词:ACE信息抽取
- 主题发现技术方法研究被引量:11
- 2009年
- 介绍了主题发现的技术思路,同时分析了主题发现的相关核心技术及典型应用系统,最后提出了主题发现待解决的一些问题。
- 赵琦张智雄孙坦许雁冬
- 关键词:主题发现主题聚类本体
- 数字资源长期保存:当前进展和最佳实践——2007年数字资源长期保存国际会议(iPRES2007)综述被引量:26
- 2007年
- 系统而全面地回顾iPRES2007数字资源长期保存国际会议,从数字资源长期保存的战略计划与基础设施、相关管理问题、技术研究与实践、认证与评估、教育与培训5个方面介绍研究和实践的进展情况,深入分析并总结已有的经验和教训,并就面临的问题和下一步发展进行探讨。
- 吴振新刘建华张玫赵琦向菁
- 关键词:数字资源
- 当前知识抽取的主要技术方法解析被引量:22
- 2008年
- 对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。
- 张智雄吴振新刘建华徐健洪娜赵琦
- 关键词:知识抽取本体
- 文本可视化及其主要技术方法研究被引量:25
- 2008年
- 文本可视化是通过对文本资源的分析,发现特定信息,并利用计算机技术将其以图形化方式呈现来的一种方法。通过分析文本可视化典型系统,分析现今的文本可视化的特点。并从基于词汇、基于篇章、基于时间序列、基于主题领域4种不同的文本可视化方式入手来分析其的主要技术方法。最后探讨文本可视化如何在信息环境下发挥作用。
- 赵琦张智雄孙坦
- 关键词:知识表示主题发现
- 基于网络信息实现科研机构研究侧写的技术方法研究
- 研究侧写(Research Profiling)是一套基于大规模文献信息资源进行领域态势分析的重要技术方法,在基于文献计量的情报研究中已经得到了广泛应用。当前网络上存在着的海量、开放、动态的信息资源,是重要的情报分析信息...
- 赵琦
- 关键词:数据挖掘网络信息