江苏省高校自然科学研究项目(07KJD520187)
- 作品数:4 被引量:7H指数:2
- 相关作者:伏玉琛钟昕华慧周小科全佳妮更多>>
- 相关机构:苏州大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金质检公益性行业科研专项项目更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种基于数据挖掘的Deep Web模式匹配方法被引量:1
- 2009年
- 模式匹配是DeepWeb异构信息集成中的关键问题.介绍了一种整体性匹配方法,即同时发现大量模式,并一次性进行匹配。主要通过分析和比较两种已经存在的大规模模式匹配原型系统:MGS和DCM,结合它们核心算法的优点,提出一种新的基于数据挖掘技术的算法(Correlated-clustering)。该算法先利用积极相关发现组匹配,再通过概念相似度的计算聚类同义属性,最后进行匹配选择。实验结果表明,本算法全面、效率高,充分体现了整体性方法的思想。
- 钟昕伏玉琛
- 关键词:DEEPWEB数据挖掘
- 基于查询接口文本的Deep Web数据源分类被引量:3
- 2010年
- 根据Deep Web数量的爆炸性增长特点,提出一种基于查询接口文本的Deep Web数据源分类算法,对于分类的查询接口,采用2种方法:基于向量空间的TF-IDF方法和基于知网的语义相似度方法。综合2种方法获得接口之间的相似度。借鉴K-NN算法,提出WDB分类算法,从而实现Deep Web数据源的分类。实验结果表明,该算法在熵和F-measure 2种评价标准上均能获得较高质量,具有一定实用价值。
- 华慧伏玉琛周小科
- 关键词:知网语义分类
- 书籍搜索领域Deep Web数据集成系统被引量:2
- 2008年
- 随着在线数据库的迅速增长,可以访问的数据库资源大大增多,但它们的信息传统搜索引擎无法获得,它隐藏在网站背后,成为人们快速有效获取信息的障碍。为了获得Deep Web中大量有价值的隐藏信息,需要整合各在线异构数据源,以便在同一领域内比较某一事物的大量相关信息。目前,越来越多的人采取网上买书的消费方式,针对这个消费热点问题,设计了一个书籍搜索领域的Deep Web数据集成系统,提供一个集成的查询接口,使得用户可以方便地进行查找和比对。
- 钟昕伏玉琛
- 关键词:DEEPWEBWEB数据集成
- 基于关联规则挖掘的商品品类管理被引量:1
- 2009年
- 基于关联规则挖掘技术,结合销售数据特征,提出了一个基于SQL的多层关联规则挖掘算法,允许用户自定义概念层次。实验结果表明,该算法可行且有效,有良好的用户交互性,能够支持品类管理中高效陈列和促销的应用。
- 全佳妮伏玉琛严建峰
- 关键词:关联规则频繁项集品类管理