张冬明 作品数:6 被引量:8 H指数:1 供职机构: 国家互联网应急中心 更多>> 发文基金: 国家自然科学基金 北京市自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
语义引导的遮挡行人再识别注意力网络 被引量:7 2021年 为了解决遮挡场景下行人再识别的特征不对齐、错误匹配的问题,提出了一种语义引导对齐的注意力网络(SGAN)对齐行人的不同部分。SGAN以行人的语义掩膜作为监督信息,通过全局语义引导和局部语义引导提取行人的全身和局部特征,并根据人体不同部分的可见性动态调整模型训练。在推理阶段,依据注意力模型获得局部区块的可见性,利用共享可见的人体部分的匹配策略自适应地对特征进行相似度的计算。实验结果表明,SGAN能够容忍一定的遮挡,它的准确率不仅在全身数据集上优于大多数先进模型,在2个较大规模的复杂遮挡数据集Occluded-Duke MTMC和P-DukeMTMC-reID上也优于现有的行人再识别方法。 任雪娜 张冬明 张冬明 包秀国面向二进制特征的图像匹配方法及其系统 本发明适用于图像检索技术领域,提供了一种面向二进制特征的图像匹配方法及其系统,所述方法包括:特征提取步骤:提取待检测的图片的多个特征点的信息以及多个所述特征点的第一二进制描述子;第一匹配步骤:将多个所述第一二进制描述子与... 王宇辉 张冬明 靳国庆 唐敬亚 张勇东 刘洋 王晶文献传递 面向二进制特征的图像匹配方法及其系统 本发明适用于图像检索技术领域,提供了一种面向二进制特征的图像匹配方法及其系统,所述方法包括:特征提取步骤:提取待检测的图片的多个特征点的信息以及多个所述特征点的第一二进制描述子;第一匹配步骤:将多个所述第一二进制描述子与... 王宇辉 张冬明 靳国庆 唐敬亚 张勇东 刘洋 王晶文献传递 基于数据合成和度量学习的台标检测与识别 2022年 台标是视频的重要语义信息,其检测与识别面临类别多、结构复杂、区域小、信息量低、背景干扰大等难题.为提高模型的泛化能力,提出将台标图像叠加到背景图像中合成台标数据,来构建训练数据集.进一步,提出两阶段可伸缩台标检测与识别(scalable logo detection and recognition,SLDR)方法,其采用batch-hard度量学习方法快速训练匹配模型,确定台标类别.SLDR的检测与识别分离机制使得其可将检测目标扩展到未知类别.实验结果表明,合成数据可以有效提升模型的泛化能力和检测精度.实验亦显示SLDR方法在不更新检测模型的情况下,即可获得与端到端模型相当的精度. 张广朋 张冬明 张菁 王川宁 王立冬 邹学强关键词:可伸缩 仿视网膜采样的二进制描述子 被引量:1 2019年 现有二进制描述子生成采用随机点对或均匀采样方式,顽健性弱、计算复杂。针对这一问题,提出了一种模仿人眼视网膜特性的采样模式(RBS),首先通过设计采样密度、多尺度光滑、视野重叠等采样方法来模仿视网膜神经节细胞层(ganglion cell layer),也称为视神经层,将光信号转换为视信息的方式,再通过对典型数据学习来选择特征点对,最后使用区块均值代替单像素点计算点对比较值,生成顽健的紧致二进制描述子。在Mikolajczyk提出的数据集上进行了实验,实验结果表明,128 bit的RBS-128相对于512 bit的FREAK和BRISK正确率分别提升16.4%和5.3%。 袁庆升 靳国庆 靳国庆 张冬明关键词:神经节细胞 视频检索中图像信息量度量 帧选择是影响视频检索性能的关键因素之一,现有方法主要基于帧间差异,而忽视了视频帧的信息量高低因素,引起误选择.综合考虑信息量度量的速度、性能要求,融合显著区域检测、区块划分、多特征融合等技术,提出了一种分块信息熵的图像信... 袁庆升 张冬明 靳国庆 刘菲 包秀国关键词:视频图像