王秋红
- 作品数:2 被引量:1H指数:1
- 供职机构:中国海洋大学更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”山东省优秀中青年科学家科研奖励基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 极小化标注的海洋文献复杂分类
- 文本自动分类是数据挖掘和机器学习中非常重要的研究领域,本文将文本自动分类技术应用于海洋信息处理,主要研究通过机器学习的方法解决海洋文献分类问题。随着海洋科学和信息技术的发展,海洋科学领域的文献资料大量涌现,使得对其的检索...
- 王秋红
- 关键词:海洋文献文本自动分类系统性能
- 一种基于Co-Training的海洋文献分类方法被引量:1
- 2010年
- 使用有监督机器学习方法进行海洋文献的分类往往存在人工标注量太大的缺点,针对这个问题,提出利用半监督机器学习中的协同训练(Co-training)方法来实现减小人工标注量的目标。该方法从2个View分别训练不同的分类器,在此基础上,根据少量有标注文档从大量无标注文档中获取有用信息,通过协同训练来提升2个分类器的性能,并训练出最终分类模型。实验结果表明,在人工标注仅2篇文献的条件下,该方法最终的分类性能十分接近需人工标注1 500多篇文献的有监督分类器。这说明将Co-training方法应用于海洋文献分类可以大大减小人工标注量,并有着较为良好的分类性能。
- 徐建良姜亦宏张巍王秋红
- 关键词:海洋文献文本分类半监督学习