您的位置: 专家智库 > >

通信与信息系统北京市重点实验室资助项目(35304536)

作品数:1 被引量:16H指数:1
相关作者:张彦超李勇沈波刘云更多>>
相关机构:北京交通大学更多>>
发文基金:通信与信息系统北京市重点实验室资助项目高等学校科技创新工程重大项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇对象模型
  • 1篇信息抽取
  • 1篇信息抽取技术
  • 1篇舆情
  • 1篇网络舆情
  • 1篇文档
  • 1篇文档对象
  • 1篇文档对象模型
  • 1篇WEB信息
  • 1篇WEB信息抽...
  • 1篇WEB信息抽...
  • 1篇XPATH
  • 1篇抽取
  • 1篇抽取技术

机构

  • 1篇北京交通大学

作者

  • 1篇刘云
  • 1篇沈波
  • 1篇李勇
  • 1篇张彦超

传媒

  • 1篇北京交通大学...

年份

  • 1篇2009
1 条 记 录,以下是 1-1
排序方式:
基于自动生成模板的Web信息抽取技术被引量:16
2009年
在网络舆情分析中,人们迫切需要自动化的工具在海量信息中抽取所需要的信息,以供进一步分析利用.针对此问题,提出了基于自动生成模板的Web信息抽取方法,可以消除网页噪声,快速有效地抽取所需的网页信息.该方法通过解析器将Web文档解析成文档对象模型,根据用户需求建立抽取规则,采用自动生成模板机制,并依据模板的抽取规则对网页信息进行抽取.实验证明,该抽取方法具有较高的召回率和准确率.
张彦超刘云李勇沈波
关键词:信息抽取文档对象模型XPATH网络舆情
共1页<1>
聚类工具0