2025年1月15日
星期三
|
欢迎来到叙永县图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
冯艳卉
作品数:
4
被引量:10
H指数:2
供职机构:
苏州大学计算机科学与技术学院
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
朱巧明
苏州大学计算机科学与技术学院
洪宇
苏州大学计算机科学与技术学院
姚建民
苏州大学计算机科学与技术学院
颜振祥
苏州大学计算机科学与技术学院
唐伟
苏州大学计算机科学与技术学院
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
期刊文章
1篇
学位论文
1篇
会议论文
领域
4篇
自动化与计算...
主题
4篇
网页
3篇
语料
3篇
平行语料
2篇
引擎
2篇
搜索
2篇
搜索引擎
2篇
索引
2篇
网页识别
2篇
WEB挖掘
1篇
信息挖掘
1篇
语料库
1篇
语料库构建
1篇
数据挖掘
1篇
平行语料库
1篇
自动抽取
1篇
自动构建方法
1篇
网页获取
1篇
关系抽取
1篇
WEB技术
1篇
WEB数据挖...
机构
4篇
苏州大学
作者
4篇
冯艳卉
3篇
姚建民
3篇
洪宇
3篇
朱巧明
2篇
颜振祥
1篇
唐伟
传媒
2篇
中文信息学报
年份
1篇
2013
1篇
2012
1篇
2011
1篇
2010
共
4
条 记 录,以下是 1-4
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
网页中商品“属性—值”关系的自动抽取方法研究
被引量:7
2013年
商品属性及其对应值的自动挖掘,对于基于Web的商品市场需求分析、商品推荐、售后服务等诸多领域有重要的应用价值。该文提出一种基于网页标题的模板构建方法,从结构化网页中抽取完整的商品"属性—值"关系。该方法包含四个关键技术:1)利用商品网页标题构建领域相关的属性词包;2)基于预设分隔符细化文本节点;3)结合领域商品属性词包获取种子"属性—值"关系;4)结合网页布局信息和字符信息来筛选与构建模板。该文的实验基于相机和手机两个领域展开,获得94.68%的准确率和90.57%的召回率。
唐伟
洪宇
冯艳卉
姚建民
朱巧明
关键词:
WEB数据挖掘
基于搜索引擎的双语混合网页识别新方法
本文提出了一种从搜索引擎返回的结果网页中获取双语网页的新方法,该方法分为两个任务。第一个任务是自动地检测并收集搜索引擎返回的结果网页中的数据记录。该步骤通过聚类的方法识别出有用的记录摘要并且为下一个任务即高质最双语混合网...
冯艳卉
洪宇
颜振祥
姚建民
朱巧明
关键词:
WEB挖掘
平行语料
文献传递
基于搜索引擎的双语混合网页识别新方法
被引量:3
2011年
该文提出了一种从搜索引擎返回的结果网页中获取双语网页的新方法,该方法分为两个任务。第一个任务是自动地检测并收集搜索引擎返回的结果网页中的数据记录。该步骤通过聚类的方法识别出有用的记录摘要并且为下一个任务即高质量双语混合网页的验证及其获取提供有效特征。该文中把双语混合网页的验证看作是有效的分类问题,该方法不依赖于特定领域和搜索引擎。基于从搜索引擎收集并经过人工标注的2 516条检索结果记录,该文提出的方法取得了81.3%的精确率和94.93%的召回率。
冯艳卉
洪宇
颜振祥
姚建民
朱巧明
关键词:
WEB挖掘
平行语料
基于Web的大规模平行语料库构建方法研究
大规模平行语料库是机器翻译、跨语言信息检索等自然语言处理应用的重要资源。互联网上存在着海量的多语言平行资源,以往的一些研究都致力于从一些多语网站中获取平行(即互为翻译)的单语网页对,进而获取平行语料。虽然许多机构都已经展...
冯艳卉
关键词:
WEB技术
信息挖掘
平行语料库
自动构建方法
网页获取
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张