您的位置: 专家智库 > >

张环

作品数:1 被引量:5H指数:1
供职机构:山东师范大学信息科学与工程学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇爬虫
  • 1篇主题爬虫
  • 1篇维基百科
  • 1篇相似度
  • 1篇相似度计算
  • 1篇RA
  • 1篇PH
  • 1篇T-G

机构

  • 1篇山东师范大学

作者

  • 1篇刘乃文
  • 1篇段会川
  • 1篇张环

传媒

  • 1篇计算机工程与...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
基于T-Graph算法的主题爬虫研究被引量:5
2014年
为解决传统主题爬虫抓取特定领域的网页信息效率低下问题,在分析主题爬虫算法T-Graph的基础上,提出一种改进的T-Graph主题爬虫算法。利用维基百科的相关知识,采用语义分析的特征项提取算法提取特征项,在词的语义层次上对文本进行相似度计算,且综合考虑了网页中不同位置文本的权重问题。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法效果更好。
张环刘乃文段会川
关键词:主题爬虫维基百科相似度计算
共1页<1>
聚类工具0