目的快速检测工业场景中的文本,可以提高生产效率、降低成本,然而数据的标注耗时耗力,鲜有标注信息可用,针对目前方法在应用到工业数据时存在伪标签质量低和域差距较大等问题,本文提出了一种结合文本自训练和对抗学习的领域自适应工业场景文本检测方法。方法首先,针对伪标签质量低的问题,采用教师学生框架进行文本自训练。教师和学生模型应用数据增强和相互学习缓解域偏移,提高伪标签的质量;其次,针对域差距,提出图像级和实例级对抗学习模块来对齐源域和目标域的特征分布,使网络学习域不变特征;最后,在两个对抗学习模块之间使用一致性正则化进一步缓解域差距,提高模型的域适应能力。结果实验证明,本文的方法在工业铭牌数据集的精确率、召回率和F1值分别达到96.2%、95.0%和95.6%,较基线模型分别提高了10%、15.3%和12.8%。同时在ICDAR15和MSRA-TD500数据集上也表现出良好性能,与当前先进的方法相比,F1值分别提高0.9%和3.1%。此外,本文的方法在应用到EAST(efficient and accurate scene text detector)文本检测模型后,铭牌数据集的各指标分别提升5%,11.8%和9.5%。结论本文提出的方法成功缓解了源域与目标域数据之间的差距,显著提高了模型的泛化能力,并且具有良好的通用性,同时模型推理阶段不会增加计算成本。
在光学相机远距离拍摄图像时,由于光线衰减和环境噪声的影响,图像容易变得模糊且难以清晰识别。为应对这一挑战,提出了一种基于权重注意力和密集残差连接的图像超分算法(image super-resolution algorithm based on weighted attention and dense residual connections, WADRNet)。首先,在网络的浅层特征提取阶段,提出一种非对称卷积模块,以替代传统的卷积模块,提高了模型的信息提取能力,尤其是对边缘和纹理等关键特征的提取;其次,采用密集残差结构,在不增加额外计算量的同时实现跨层特征传递和信息的有效利用,增强了模型的上下文特征提取能力,更好地还原图像;最后,在窗口注意力模块融入权重通道注意力模块,有效地利用全局感受野特性。实验结果表明,WADRNet在自制数据集上明显领先于其他模型,尤其在峰值信噪比和结构相似性等方面;同时,该模型在公开数据集上也表现出良好的效果。因此,该方法能够显著提升低分辨图像像素质量,在工程领域具有广泛的应用潜力和价值,尤其适用于需要远距离成像的应用场景。