蒋俊
- 作品数:3 被引量:4H指数:1
- 供职机构:苏州大学更多>>
- 发文基金:江苏省博士后科研资助计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电气工程更多>>
- 基于非主属性值的实体匹配被引量:4
- 2016年
- 实体匹配旨在找出不同数据源中指代同一实体的实例.已有的实体匹配方法大都基于实体主属性值的相似度进行匹配,而很少有工作考虑到使用实体的非主属性值来辅助实体匹配.然而,当两条指代同一实体的主属性值差异较大的时候,这两个实体可能不会被认为是匹配的实体.另一方面,这两个实体很可能共享一些特别的非主属性值,而这些非主属性值恰好可以反映出两个实体的匹配关系.基于这种思想,文中提出了一种新颖的基于非主属性值的实体匹配算法.该算法以类似于决策树的结构为基础,通过使用这种结构,不仅可以解决噪声值和空缺值带来的问题,而且可以极大地提高发现匹配记录以及尽可能早地排除不匹配记录的效率.多个数据集上的实验结果表明我们的方法比现有的实体匹配方法具有更高的准确率和召回率.此外,使用我们提出的基于决策树的匹配算法等有关技术较Baseline匹配算法在匹配效率上高出10倍多.
- 杨强李直旭蒋俊赵朋朋刘冠峰刘安周晓方
- 关键词:数据质量
- 基于H6桥拓扑结构的5KW单相户用型组串式逆变器研制
- 随着世界人口的不断增长,能源的压力也越来越大,这迫使人们不断去寻找、开发新型可持续的清洁能源。太阳能是所有新型能源里简单方便、可持续利用的最有前景的能源,利用太阳能进行光伏发电是当今世界各国的研究热点。光伏发电系统中核心...
- 蒋俊
- 关键词:逆变器拓扑结构电路设计光伏发电
- 文献传递
- 多模式数据融合中数据质量控制方法的研究与实现
- 随着互联网信息技术的迅猛发展,越来越多的数据以多种多样的形式存放在不同数据集中,如何将这些数据进行有效关联和统一已经成为当今大数据环境下的重要问题。对不同组织形式,即不同模式下的数据进行关联融合与统一的过程称之为多模式数...
- 蒋俊
- 关键词:数据融合模式映射程序语言
- 文献传递