广东省自然科学基金(9451063101002213)
- 作品数:3 被引量:15H指数:1
- 相关作者:庞雄文李拥军姚占林吴继明齐德昱更多>>
- 相关机构:华南师范大学华南理工大学更多>>
- 发文基金:广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 大数据量的高效重复记录检测方法被引量:15
- 2010年
- 针对目前重复记录检测方法不能有效处理大数据量的问题,提出了一种高效的重复记录检测方法.根据概念依赖图计算表的关键属性,并根据关键属性值将数据划分为记录集,在划分后的记录集中进行重复记录检测,大大减少需要比较的记录数,提高算法的效率;在记录集内进行重复记录检测时,将已匹配的记录合并后和已有的记录重新比较,提高了算法的准确度和效率.实验数据显示在大数据量情况下,计算效率提高47%.
- 庞雄文姚占林李拥军
- 关键词:数据处理重复记录检测数据清洗
- 凹半监督支持向量机及其应用
- 2010年
- 在训练集不足的情况下,SVM算法有待改进,以提高其评价的准确性。采用凹半监督支持向量机,利用少量标注样本和大量未标注样本进行机器学习,提高了模型预测的精度。
- 冼广铭齐德昱方群柯庆曾碧卿庞雄文
- 一种具有去噪能力的全局最小值分割模型
- 2012年
- 几何主动轮廓模型的能量泛函是非凸性的,导致图像分割结果依赖于曲线的初始化条件,对噪声敏感。针对该问题,提出一种全局最小值分割模型,对能量泛函进行凸性非约束改进,利用基于总变分对偶公式的快速数值化算法实现图像的分割。对合成图像和医学图像的分割结果表明,利用该模型可以准确提取出对象的边界,分割速度快,对噪声具有较好的鲁棒性。
- 吴继明庞雄文
- 关键词:图像分割主动轮廓模型水平集总变分能量泛函