李菲菲 作品数:31 被引量:126 H指数:7 供职机构: 上海理工大学光电信息与计算机工程学院 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 更多>>
基于深度卷积特征的场景全局与局部表示方法 被引量:1 2022年 场景识别是计算机视觉研究中的一项基本任务。与图像分类不同,场景识别需要综合考虑场景的背景信息、局部场景特征以及物体特征等因素,导致经典卷积神经网络在场景识别上性能欠佳。为解决此问题,文中提出了一种基于深度卷积特征的场景全局与局部表示方法。此方法对场景图片的卷积特征进行变换从而为每张图片生成一个综合的特征表示。使用CAM获取局部关键区域,利用LSTM对局部区域的卷积特征进行编码形成场景图片的局部表示;通过注意力机制融合场景特征与物体特征形成场景图片的全局表示。最后,在MIT indoor 67场景识别数据集上进行实验,结果显示采用文中所提方法取得了87.59%的识别准确度。 林潮威 李菲菲 陈虬关键词:卷积神经网络 端到端网络 基于三维卷积和哈希方法的视频检索算法 被引量:1 2022年 视频信息检索与其他多媒体检索的最大不同在于视频信息量较大,因此进行视频间相似度计算时的计算量较大。此外,对视频特征的提取中常常忽略视频帧之间的时间相关性,从而导致特征提取不充分,影响视频检索的精度。为此,文中提出基于三维卷积和哈希方法的视频检索方法。该方法构建了一个端到端的框架,使用三维卷积神经网络来提取视频中代表帧的特征,并将视频特征映射到低维的汉明空间中去,在汉明空间计算相似度。在两个视频数据集下的实验结果表明,相较于当前最新的视频检索算法,文中所提方法在精度上有较大的提升。 陈汗青 李菲菲 陈虬关键词:视频检索 哈希方法 特征降维 相似度匹配 一种基于改进条件生成式对抗网络的人脸表情生成方法 被引量:2 2020年 人脸表情生成一直都是一项具有挑战性的工作.现有的方法通常将深度生成网络和面部特征相结合来完成这项任务.然而,同一张人脸的面部表情不仅微妙,而且数不胜数.如何在保持人脸身份信息不变的前提下,利用人脸特征准确地生成目标表情仍然是一个有待解决的问题.本文利用人脸特征点来描述不同的表情形状,并以此作为生成目标表情的引导条件.我们通过对Pix2Pix模型结构的改进,实现了高质量人脸表情的生成.同时,为了引导连续人脸表情的生成,我们使用变分自动编码器对人脸形状进行控制.在两个公开的数据集CK+、Oulu-CASIA上,我们评估并验证了模型在任意人脸表情转换、人脸表情移除、人脸表情生成、连续人脸表情生成等任务上的可行性和有效性. 王先先 李菲菲 陈虬基于深度迁移学习与多尺度特征融合的场景识别方法 2023年 卷积神经网络(Convolutional Neural Networks,CNN)在场景识别领域取得了较好的研究成果,但该方法并未充分考虑到场景的特殊性。同类场景图像由于采样时的尺度、视角以及背景的不同而具有类内差异性,存在于异类场景间的共有物体又使异类场景图像间具有一定的相似性。考虑到不同尺度大小的场景图像也会影响其中物体的大小,文中提出一种基于深度迁移学习与多尺度特征融合的场景识别方法。首先,使用迁移学习将在Places数据集上预训练出的网络参数迁移到CNN模型中,然后微调并再次训练网络,降低训练成本。随后,将从类激活图中获取的多尺度图像块送入CNN进行特征提取,并融合得到特征向量,使最终得到的场景图像特征更丰富。在SUN397数据集上的实验结果表明,与其它基于CNN算法相比,文中提出的算法提高了场景识别的准确度。 王桥 胡春燕 李菲菲关键词:卷积神经网络 多尺度 支持向量机 基于迁移学习与权重支持向量机的图像多标签标注算法 被引量:4 2020年 为解决图像的多标签自动标注中标签不平衡性的问题,提出了一种基于迁移学习与权重支持向量机的图像自动标注方法。为了解决所选数据集规模较小无法训练出最优的卷积神经网络的问题,文中采用迁移学习的方法,将通过Imagenet数据集训练出的Alexnet的参数迁移到文中所用的卷积神经网络模型中,并对最后一层全连接层进行微调,利用多标签分类多合页损失函数构成多分类的支持向量机。最后,文中对低频标签进行权重排序以得到图像的多标签标注结果。在Corel-5k、Esp-Game和IAPR-TC12共3个数据集上进行了实验,权重支持向量机获得的平均召回率分别提升了10%、9%和6%,低频标签对其平均精确率均提升了12%。实验结果表明,基于迁移学习的权重支持向量机的图像多标签标注方法可在有效提高数据集的召回率的同时提升低频标签的平均精确度。 陈磊 李菲菲 陈虬基于复合特征及深度学习的人群行为识别算法 被引量:8 2019年 分析人群行为的目的是更好地分析与管理人群运动的状态与趋势。针对人群行为的两种特征信息,提出了一种基于深度学习的人群行为识别方法。先将人群作为主要对象,通过前景提取方法来提取人群静态信息,利用人群运动的变化获取人群动态信息,借助卷积神经网络(CNN)模型学习这两种不同的人群行为特征,再综合这两种特征来分析常见的人群行为。同时,人群数据提取位置与间隔是影响人群行为分析的重要因素。实验结果表明,这两种人群特征能更好地描述空间维度上的人群状态和时间维度上的人群变化,合理的数据位置与数据间隔可以有效地提高人群信息的表达能力。最后将提出的方法与其他人群行为分析方法进行比较,定量与定性的实验结果验证了所提方法的有效性,同时也表明了所提方法能得到更优的混淆矩阵和更高的准确度。 袁亚军 李菲菲 陈虬关键词:动态特征 CNN 数据提取 基于元学习和神经架构搜索的半监督医学图像分割方法 2024年 多数医学图像分割方法主要在相同或者相似医疗数据领域进行训练和评估,意味其需要大量像素级别的标注。但这些模型在领域分布外的数据集上面临挑战,被称为“域偏移”问题。通常使用固定的U形分割架构解决该问题,导致其无法更好地适应特定分割任务。文中提出了一种基于梯度的元学习与神经架构搜索方法,可以根据特定任务调整分割网络以实现良好的性能并且拥有良好的泛化能力。该方法主要使用特定任务进行架构搜索模块来进一步提升分割效果,再使用基于梯度的元学习训练算法提升泛化能力。在公共数据集M&Ms上,在5%标签数据下,其Dice和Hausdorff distance分别为79.62%、15.38%。在2%标签数据下,其Dice和Hausdorff distance分别为74.03%、17.05%。与其他主流方法相比,文中所提方法拥有更好的泛化能力。 于智洪 李菲菲关键词:医学图像分割 元学习 半监督学习 基于多特征融合的视频检索算法 被引量:1 2019年 随着视频等多媒体数据呈指数式迅猛增长,高效快速的视频检索算法引起越来越多的重视。传统的图像特征如颜色直方图以及尺度不变特征变换等对视频拷贝检测中检索速度以及检测精度等问题无法达到很好的效果,因此文中提出一种多特征融合的视频检索方法。该方法利用前后两帧的时空特征进行基于滑动窗口的时间对齐算法,以达到减少检索的范围和提高检索速度的目的。该算法对关键帧进行灰度序列特征、颜色相关图特征以及SIFT局部特征提取,然后融合全局特征和局部特征两者的优势,从而提高检测精度。实验结果表明,该方法可达到较好的视频检索精度。 侯严明 李菲菲 陈虬关键词:视频检索 多特征融合 关键帧 基于改进HOG共生概率特征的行人检测算法 被引量:10 2018年 为了提高静态行人的检测精度,提出了一种基于改进梯度方向直方图共生概率特征的行人检测方法。该方法首先将梯度方向直方图特征分别与局部二值模式和颜色自相似性特征结合生成改进HOG特征,基于该特征使用第一阶段的连续自适应算法(Real Ada Boost)生成共生概率特征;然后基于此共生概率特征利用第二阶段Real Ada Boost算法进行处理得到强分类器;最后使用上述强分类器实现检测和分类。将该算法应用到INRIA行人数据库进行实验,达到了99%的检测精度,优于传统HOG特征提取算法的检测精度,实验结果证明了此算法在提高行人检测精度方面的有效性。 李盈盈 李菲菲 陈虬关键词:行人检测 梯度方向直方图 基于改进CNN特征的场景识别 被引量:4 2018年 随着人工智能的发展,场景识别作为计算机视觉研究的重要方向之一,吸引着越来越多研究者的关注.由于传统的手工特征无法充分描述场景图像的信息导致效果不理想,而卷积神经网络(CNN)提取的特征能够包含丰富的场景语义和结构信息,因此就常见的体系结构而言,本文选取AlexNet网络模型进行场景识别的研究,分别从网络模型的深度、宽度、多尺度化提取以及多层融合考虑进行改进,改进后在两个数据集上的识别率分别可达92.0%和94.5%,通过对比结果表明了本文方法的有效性. 薄康虎 李菲菲 陈虬关键词:计算机视觉 卷积神经网络