张鸿
- 作品数:31 被引量:171H指数:7
- 供职机构:武汉科技大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金高等学校科技创新工程重大项目长江学者和创新团队发展计划更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 基于潜语义主题加强的跨媒体检索算法被引量:11
- 2017年
- 针对不同模态数据对相同语义主题表达存在差异性,以及传统跨媒体检索算法忽略了不同模态数据能以合作的方式探索数据的内在语义信息等问题,提出了一种新的基于潜语义主题加强的跨媒体检索(LSTR)算法。首先,利用隐狄利克雷分布(LDA)模型构造文本语义空间,然后以词袋(Bo W)模型来表达文本对应的图像;其次,使用多分类逻辑回归对图像和文本分类,用得到的基于多分类的后验概率表示文本和图像的潜语义主题;最后,利用文本潜语义主题去正则化图像的潜语义主题,使图像的潜语义主题得到加强,同时使它们之间的语义关联最大化。在Wikipedia数据集上,文本检索图像和图像检索文本的平均查准率为57.0%,比典型相关性分析(CCA)、SM(Semantic Matching)、SCM(Semantic Correlation Matching)算法的平均查准率分别提高了35.1%、34.8%、32.1%。实验结果表明LSTR算法能有效地提高跨媒体检索的平均查准率。
- 黄育张鸿
- 关键词:跨媒体检索后验概率
- 基于内因和外因的研究生学术道德建设机制研究
- 2015年
- 随着研究生招生规模的逐年扩大,有关于研究生学术道德问题的研究已进入各大高校研究者的视野。已有研究表明,研究生群体中学术道德失范现象较为严重。针对于此,本文依据研究生学术道德失范的主要行为表现,从内因和外因双重层面对研究生学风及学术道德建设中存在的问题、隐患进行深入分析,并提出加强研究生学术道德建设的相关对策。
- 张鸿王雅宁
- 关键词:学术道德
- 基于注意力机制网络的航运监控图像识别模型被引量:7
- 2021年
- 针对已有的航运监控图像识别模型C3D里中级表征学习能力有限,有效特征的提取容易受到噪声的干扰,且特征的提取忽视了整体特征与局部特征之间关系的问题,提出了一种新的基于注意力机制网络的航运监控图像识别模型。该模型基于卷积神经网络(CNN)框架,首先,通过特征提取器提取图像的浅层次特征;然后,基于CNN对不同区域激活特征的不同响应强度,生成注意力信息并实现对局部判别性特征的提取;最后,使用多分支的CNN结构融合局部判别性特征和图像全局纹理特征,从而利用局部判别性特征和图像全局纹理特征的交互关系提升CNN学习中级表征的能力。实验结果表明,所提出的模型在航运图像数据集上的识别准确率达到91.8%,相较于目前的C3D模型提高了7.2个百分点,相较于判别滤波器组卷积神经网络(DFL-CNN)模型提高了0.6个百分点。可见所提模型能够准确判断船舶的状态,可以有效应用于航运监控项目。
- 张凯悦张鸿
- 关键词:智能监控卷积神经网络图像识别
- 基于完全残差的双分支去雨网络
- 2023年
- 针对使用深度学习的单幅图像去雨算法会导致细节信息丢失的问题,提出了一个双分支去雨网络,包括雨痕提取分支和细节恢复分支,通过补全细节使去雨图像更接近真实图像。雨痕提取分支的目的是完全提取出雨纹,通过构造特征金字塔来多尺度地学习雨纹信息,并在其中引入执行了全部身份映射的完全残差块来加强特征的重用和传播。为充分利用上下文信息,采用可变形卷积在动态扩大感受野的同时避免了网格伪影的产生,最后输入雨图去除雨痕便得到了初步去雨图。细节恢复分支需要产生细节特征图反馈给初步去雨图像来找回丢失的细节,使用轻量级的完全残差块捕捉特征信息,并用跳跃连接来连接完全残差块提供长距离的信息补偿。实验结果表明,该网络在合成数据集Rain100H中比较RESCAN、SPANet和JDNet等主流去雨方法,在PSNR和SSIM指标上分别至少提高了0.09 dB和0.02,在真实数据集和自制数据集中的去雨效果和细节保留程度均优于对比方法。
- 宋浩张鸿
- 关键词:卷积神经网络
- 基于关系矩阵融合的多媒体数据聚类被引量:4
- 2011年
- 针对目前多媒体聚类研究中如何挖掘和利用不同数据集之间统计关系的问题,提出一种基于关系矩阵融合的聚类方法,首先,对图像和音频数据集中提取的特征矩阵进行相关性分析和子空间映射,进而在全局范围内对图像相似度、音频相似度以及图像和音频的相关度进行融合与优化,最后,采用基于相似度的循环迭代算法进行图像和音频聚类.对比实验从多个角度验证了文中方法的有效性,并能较好地应用于多媒体交叉检索.
- 张鸿吴飞张晓龙
- 关键词:关系矩阵
- 基于语义调节与两级匹配的图像文本检索方法
- 2024年
- 图像文本检索的核心在于实现图像与文本之间的相似度匹配,其方法主要分为全局匹配和局部匹配。为了克服跨模态检索任务中全局匹配只考虑全局语义的对齐,局部匹配只考虑细粒度语义对齐,以及全局特征和局部特征交互不足的问题,该文提出一种语义调节与两级匹配(Semantic Adjustment and Two-level Matching, SATM)方法,即结合两种匹配方法并利用全局特征调节局部特征语义来进行图像文本检索。首先,在模态内进行语义调节,采用自注意力机制,利用全局特征增强局部特征;其次,在模态间通过堆叠交叉注意力实现图像和文本的局部特征之间的交互和局部匹配,并生成跨模态全局特征;然后,在模态间进行语义调节,利用跨模态全局特征引导局部特征形成全局特征,并进行全局匹配;最后,结合两种匹配相似度进行跨模态检索。该方法综合考虑全局匹配和局部匹配,并充分实现了全局特征和局部特征之间的信息交互,因此能显著提升跨模态检索的准确性,通过在Flickr30K和MS-COCO两个基准数据集上的大量的对比实验,证明了该方法的有效性和优越性。
- 刘洪洲张鸿
- 基于循环生成对抗网络的光照补偿方法被引量:6
- 2020年
- 为以较好的效果、较高的鲁棒性解决一些图片中存在的光照相关问题,对图片进行光照补偿,设计基于循环生成对抗网络的光照补偿方法。使用循环生成对抗网络对光照条件不佳的图片进行光照补偿,以分别处在正常光照和复杂光照下的同类事物或场景的图片作为对抗训练集训练CycleGAN,使用Switchable Normalization代替原CycleGAN使用的Instance Normalization,解决光照问题。通过实验中的图片对比和亮度、对比度、峰值信噪比的比较,该方法在过暗图片和强反光图片上的光照补偿效果均高于传统算法和未经更改的CycleGAN网络,验证了算法的有效性和鲁棒性。
- 赵亮赵亮
- 关键词:光照补偿计算机视觉归一化
- 基于PCA的哈希图像检索算法被引量:3
- 2020年
- 图像哈希算法的步骤大致分为投影和量化两个阶段,为提高哈希编码的性能,分别对这两个阶段进行研究。在投影阶段,通过主成分分析算法将数据投影到新的特征子空间中,以降低原始特征之间的冗余性;在量化阶段,为减少量化所带来的损失,提出一种单双比特结合的量化方法;利用得到的哈希编码进行图像检索。在两个常用的图像数据集上的实验结果表明,提出的算法较现有的主流图像哈希算法在多个评价指标下均有所提高。
- 马绍覃张鸿
- 关键词:哈希图像检索主成分分析
- 基于多级语义的判别式跨模态哈希检索算法被引量:4
- 2021年
- 针对大多数跨模态哈希方法采用二进制矩阵表示相关程度,因此无法捕获多标签数据之间更深层的语义信息,以及它们忽略了保持语义结构和数据特征的判别性等问题,提出了一种基于多级语义的判别式跨模态哈希检索算法——ML-SDH。所提算法使用多级语义相似度矩阵发现跨模态数据中的深层关联信息,同时利用平等指导跨模态哈希表示在语义结构和判别分类中的关联关系,不仅实现了对蕴含高级语义信息的多标签数据进行编码的目的,而且构建的保留多级语义的结构能够确保最终学习的哈希码在保持语义相似度的同时又具有判别性。在NUSWIDE数据集上,哈希码长度为32 bit时,所提算法在两个检索任务中的平均准确率(mAP)比深度跨模态哈希(DCMH)、成对关联哈希(PRDH)、平等指导判别式哈希(EGDH)算法分别高出了19.48,14.50,1.95个百分点和16.32,11.82,2.08个百分点。
- 刘芳名张鸿
- 关键词:语义结构
- 基于卷积神经网络迭代优化的图像分类算法被引量:19
- 2017年
- 针对传统卷积神经网络在处理图像分类的问题过程中,需要较长的训练时间、大量的存储空间和计算资源等问题,提出一种基于卷积神经网络迭代优化的图像分类算法。对卷积神经网络进行初始化,在训练网络的过程中,对每层网络单个特征图的输入进行BN(batch normalize)处理,得到归一化的数据后再输入到特征图中,采用迭代的方法调整卷积神经网络中的参数并删除低于阀值的连接。实验结果表明,在Mnist、Cifar-10数据集上,经过迭代优化后的卷积神经网络分别提高了0.33%和3.42%的准确率,有效降低了网络中参数的数量,相比原始卷积神经网络中的参数数量分别降低87.94%、85.91%,网络收敛速度更快,减小了网络的训练时间。
- 李鸣张鸿
- 关键词:卷积神经网络网络连接阈值