郭俊军
- 作品数:3 被引量:2H指数:1
- 供职机构:东北农业大学更多>>
- 发文基金:国家级星火计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术农业科学更多>>
- 面向主题的网页资源采集系统的研究与实现
- 随着互联网技术的飞速发展,人类步入了互联网时代,各种资源以互联网为载体进行汇聚、整合,形成了一个庞大的信息库。在浩如烟海的信息资源中,如何快速、准确、高效地获取所需信息是亟待解决的问题。 搜索引擎作为信息检索的工具,成...
- 郭俊军
- 关键词:搜索引擎主题信息
- 文献传递
- 大豆主题网页资源采集系统的研究被引量:1
- 2014年
- 农业专业搜索引擎对特定主题的农业信息进行检索,其信息量多、精确度低。针对此现状,以开源搜索引擎Nutch为技术框架,对大豆主题网页资源采集系统进行了研究与设计。以大豆信息为主题,研究了主题相关度判别技术,借鉴BM25F模型的分域思想、基于向量空间模型,提出了大豆主题相关度判别算法。在Nutch中引入IKAnalyzer中文分词工具包,实现了大豆主题相关度的判别。实验结果表明,该算法能够显著地提高大豆主题网页资源采集的准确率。
- 郭俊军孟繁疆张喜海魏紫京
- 关键词:网页抓取主题相关度农业搜索引擎
- 基于农业信息搜索引擎分类器的设计与实现被引量:2
- 2014年
- 为了能够在大量的农业信息中快速准确地提取出有利于农业生产的有用信息,为精准农业提供科学的理论依据,研究了农业信息搜索引擎,叙述了农业信息分类原理,对各算法分类效果进行实验数据比对。同时,选取符合农业实际情况的朴素贝叶斯分类器,分析算法实现,完成了算法设计,实现了该农业信息搜索引擎分类器。研究发现:朴素贝叶斯分类器在对农业信息分类时精度较高,是一种可靠有效的分类器。
- 魏紫京孟繁疆郭俊军
- 关键词:农业信息搜索引擎分类器