蒋树强
- 作品数:73 被引量:180H指数:6
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学农业科学更多>>
- 一种粒子滤波跟踪方法和跟踪装置
- 本发明公开了一种粒子滤波跟踪方法和跟踪装置,该方法包括:步骤S1:在原始图像帧上采样获得初始粒子集;步骤S2:对原始图像帧的像素经过前景背景分类得到概率图;步骤S3:按照系统动态模型传播粒子并采样,得到第二粒子集;步骤S...
- 梁大为黄庆明蒋树强高文
- 文献传递
- 一种对网络流媒体音视频的多维度的访问量统计方法
- 本发明公开了一种对网络流媒体音视频的多维度的访问量统计方法,包括步骤:设置不同形式的音视频访问量统计方法,根据不同形式的访问量统计方法,获取相应的音视频的用户访问的反馈信息;根据用户访问的反馈信息,进行不同的处理,得到不...
- 蒋树强黄庆明陈熙霖高文
- 文献传递
- 基于循环一致性的第一视角视频行为预测方法及系统
- 本发明提出一种基于循环一致性的第一视角视频行为预测方法和系统,通过在高维特征空间构建过去信息蒸馏损失函数、未来信息蒸馏损失函数、后向‑前向循环一致性损失函数以及前向‑后向循环一致性损失函数,充分学习过去内容和当前观察内容...
- 蒋树强张天予闵巍庆
- 视觉媒体语义自动提取关键技术研究
- 近几年来,随着计算机和网络技术的发展,数字化视频与图像信息越来越多的涌现,基于多媒体信息服务的信息时代正在向我们走来。人们对视频和图像等视觉媒体内容的需求也越来越多,越来越广泛。这就需要行之有效的技术手段来满足用户的各种...
- 蒋树强
- 关键词:语义提取视觉媒体体育视频分析图像分类艺术图像高斯混合模型
- 文献传递
- 基于笔画特征的叠加文字检测方法被引量:8
- 2007年
- 提出一种利用笔画线条的统计特征基于支持向量机进行图像中叠加文字检测的方法。该算法首先通过一种改进的线段检测算子提取出笔画线段;然后对笔画线条通过区域合并定位出候选文字块;接着对候选文字块提取一个反映文字笔画线条空间分布特点的32维特征,并通过支持向量机建立的模型对候选文字块进行确认分类。以汉字为例的初步实验表明所提出笔画纹理特征对较多字符构成的文字区域具有很好的性能。
- 王伟强付立波高文黄庆明蒋树强
- 关键词:文字检测支持向量机
- 基于增强视觉Transformer的哈希食品图像检索
- 2024年
- 作为食品计算的一个主要任务,食品图像检索近年来受到了广泛的关注。然而,食品图像检索面临着两个主要的挑战。首先,食品图像具有细粒度的特点,这意味着不同食品类别之间的视觉差异可能很小,这些差异只能在图像的局部区域中观察到。其次,食品图像包含丰富的语义信息,如食材、烹饪方式等,这些信息的提取和利用对于提高检索性能至关重要。为解决这些问题,本实验基于预训练的视觉Transformer(Vision Transformer,ViT)模型提出了一种增强ViT的哈希网络(enhanced ViT hash network,EVHNet)。针对食品图像的细粒度特点,EVHNet中设计了一个基于卷积结构的局部特征增强模块,使网络能够学习到更具有代表性的特征。为更好地利用食品图像的语义信息,EVHNet中还设计了一个聚合语义特征模块,根据类令牌特征来聚合食品图像中的语义信息。本实验提出的EVHNet模型在贪婪哈希、中心相似量化和深度极化网络3种流行的哈希图像检索框架下进行评估,并与AlexNet,ResNet50、ViT-B_32和ViT-B_164种主流网络模型进行比较,在Food-101、Vireo Food-172、UEC Food-2563个食品数据集上的实验结果表明,EVHNet模型在检索精度上的综合性能优于其他模型。
- 曹品丹闵巍庆宋佳骏盛国瑞杨延村王丽丽蒋树强
- 基于成分引导的多模态自蒸馏食品图像分割
- 2024年
- 目的:随着计算机视觉技术的发展,精确地识别并分割食品图像中的不同成分区域,对于食品营养分析和促进饮食健康管理至关重要。然而,当前图像分割模型多依赖于单一图像输入,这一做法在处理视觉差异较小的食品图像时,往往难以捕捉到细微的区分特征,从而影响分割精度。本文旨在解决单一模态在分割任务中的不足,利用文本信息为模型提供更加丰富的上、下文信息,采用自蒸馏技术,引导模型对食品图像的有效分割。方法:提出一种基于成分信息引导的多模态自蒸馏分割模型。该模型采用对比语言文本预训练模型(CLIP)捕捉成分信息,再与图像知识有效融合,结合扩散模型在稠密预测方面的优势,实现对食品图像的精准分割。结果:在基准数据集FoodSeg103上验证,所提模型的评估指标mIoU达到47.93%,超越了当前最优的FoodSAM模型1.51个百分点。在基准数据集UEC-FoodPIX Complete上,模型的评估指标mIoU达到75.13%,比FoodSAM模型高8.99个百分点。结论 :所提出的多模态自蒸馏网络在食品图像分割任务中表现出色,验证了成分信息对分割任务的有效指导作用,提升了分割精度,为食品图像分析提供了新的解决方案。
- 侯素娟孙月娟闵巍庆王瑞平蒋树强
- 关键词:图像分割多模态
- 一种扫描文档浏览适配方法
- 本发明公开了一种扫描文档浏览适配方法,包括下列步骤:步骤A,对输入的扫描文档的原始页面图像,进行预处理,去掉噪音和不必要的背景信息;步骤B,判断并将所述原始页面图像划分为多个大横向部分,对每个大横向部分根据电子设备的屏幕...
- 蒋树强黄庆明陈熙霖高文
- 文献传递
- 一种体育视频事件分析方法
- 一种体育视频事件分析方法,包含通过提取场地中的标识线及场景分类方法识别事件发生的场地区域,对比赛事件的线路模式进行分类;通过对多对象轨迹的交互分析,针对比赛事件生成球和队员的交互轨迹,据此对比赛事件的交互模式进行层次化的...
- 朱光宇黄庆明蒋树强
- 文献传递
- 多任务智能膳食管理方法、装置、存储介质、计算机设备
- 本发明提出一种多任务智能膳食管理方法、装置、存储介质、计算机设备,该方法包含:构建专门面向食品领域的食品多模态基础模型;将该食品多模态基础模型中融合多模态数据融合模块,以食品图像与膳食问题共同作为多模态输入,输出膳食上下...
- 闵巍庆周鹏飞金颖蒋树强