2025年2月10日
星期一
|
欢迎来到叙永县图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
李爱玲
作品数:
1
被引量:9
H指数:1
供职机构:
西安电子科技大学计算机学院软件工程研究所
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
贺智平
西安电子科技大学计算机学院软件...
徐学洲
西安电子科技大学计算机学院软件...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
信息熵
1篇
页面
1篇
主题信息
1篇
WEB
1篇
WEB页
1篇
WEB页面
1篇
抽取
1篇
抽取方法
机构
1篇
西安电子科技...
作者
1篇
徐学洲
1篇
李爱玲
1篇
贺智平
传媒
1篇
计算机工程与...
年份
1篇
2007
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
一种基于信息熵的Web页面主题信息抽取方法
被引量:9
2007年
提出了一种剪枝信息熵增较大结点的信息抽取方法。通过对HTML文档解析来构造DOM树,根据配置过滤掉不需处理的相关内容并建立语义模型树,最后对熵增超过阈值的结点进行剪枝并输出抽取的主题信息页面,初步实验结果验证了用这种方法进行Web页面信息抽取的有效性。方法的数学模型简单可靠,基本不需要人工干预即可完成主题信息抽取。可应用于Web数据挖掘系统以及PDA等移动设备的信息获取方面。
贺智平
徐学洲
李爱玲
关键词:
WEB
抽取
信息熵
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张