王颖
- 作品数:3 被引量:5H指数:1
- 供职机构:兰州大学更多>>
- 相关领域:自动化与计算机技术更多>>
- 应用于中文人名搜索引擎的Web信息提取技术研究
- Web信息提取是指从Web文档中自动提取出所需信息的过程。本文研究Web信息提取并应用于面向主题的搜索引擎中,这里的主题是针对于中文人名的查找。
本文主要的工作是针对有关Web上中文人名的信息...
- 王颖
- 关键词:信息提取搜索引擎
- 文献传递
- 基于信息提取的面向行业应用文本分类算法
- 目前,传统文本分类算法都是脱离自然语言语意的.该文使用信息抽取进行了中文文本分类的研究,提出了补偿式信息抽取的主题文本分类算法(CIETC),通过分类补偿文档属性,达到行业文档分类的目的.实验中,以将关于一个人名的所有网...
- 郭峰徐玉生陈晓云王颖
- 关键词:文本分类信息提取面向主题自然语言理解
- 文献传递
- 基于信息提取的面向行业应用文本分类算法被引量:4
- 2005年
- 目前,传统文本分类算法都是脱离自然语言语意的。该文使用信息抽取进行了中文文本分类的研究,提出了补偿式信息抽取的主题文本分类算法(C IETC),通过分类补偿文档属性,达到行业文档分类的目的。实验中,以将关于一个人名的所有网络文档自动分类为例,验证了这种面向行业的C IETC分类器的分类性能。结果表明:该方法的分类准确率要优于B ayes方法,与KNN方法相当;该方法是一种可行的面向行业细分文本分类方法。
- 郭峰徐玉生陈晓云王颖
- 关键词:文本分类信息提取面向主题自然语言理解