标记和标记里面,并据此对网页噪声进行预处理,然后与相关网页进行内容匹配,通过计算节点重要度,获取网页的主题内容.对门户网站的6 318个网页的检测表明,该算法可以有效地提取网页的主题内容,准确率达到98.2%以上.用于数据挖掘工具时,该算法优于其他同类算法,可以有效地去除网页噪声.
孙楠张华伟关键词:网页净化文档对象模型阈值- 基于Prewitt算子的苹果分类研究被引量:1
- 2011年
- 提出一种简单实用的基于Prewitt算子的苹果分类算法.该算法利用Prewitt算法检测苹果图像的边缘,利用阈值方法对苹果图像进行分割,通过计算连接区域确定苹果是否有损伤.该方法不仅可以精确定位苹果的茎部和损伤部位,而且能够消除苹果图像中的阴影.100个测试样本的实验表明,该算法能够快速地对苹果进行准确分类,准确率可以达到99%.
- 张华伟孙楠
- 关键词:PREWITT算子阈值分割