张旭东
- 作品数:166 被引量:448H指数:11
- 供职机构:合肥工业大学计算机与信息学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术电子电信机械工程天文地球更多>>
- 一种基于序列深信度网络的行人识别方法
- 本发明公开了一种基于序列深信度网络的行人识别方法,包括以下步骤:对行人数据库中的训练图像进行预处理,获得训练样本图像,对获得的训练样本图像进行HOG特征提取,构建并训练基于序列受限玻尔兹曼机的序列深信度网络,用序列深信度...
- 孙锐张广海高隽张旭东
- 纹理和深度特征增强的双流人脸呈现攻击检测方法被引量:2
- 2023年
- 人脸呈现攻击是一种利用照片、视频等将人脸通过媒介呈现在摄像头前欺骗人脸识别系统的技术.现有的人脸呈现攻击检测方法大多采用深度特征辅助监督分类,忽略有效的细粒度信息以及深度信息与纹理信息的相互联系.因此,文中提出纹理和深度特征增强的双流人脸呈现攻击检测方法.一端网络通过中心差分卷积网络提取比原始卷积网络更鲁棒的欺骗人脸纹理模式.另一端网络通过生成对抗网络生成深度图的深度线索,提高对外观变化和图像质量差异的稳定性.在特征增强模块中,设计中心边缘损失,对两类互补特征进行融合和增强.在4个数据集上的实验表明,文中方法在数据集内以及跨数据集的测试中都取得较优性能.
- 孙锐冯惠东孙琦景单晓全张旭东
- 基于支持向量机的多类形状识别系统被引量:26
- 2004年
- 支持向量机是一种能在训练样本数很少的情况下达到很好分类推广能力的学习算法,文中研究了支持向量机的分类机理,并将其应用于形状识别中,利用一对一判别策略构建了多类形状识别系统,实验中以交通标志图像为实验对象进行分类,结果表明该方法的泛化能力优于一般的识别方法。
- 赵晶张旭东高隽
- 关键词:支持向量机学习算法结构风险最小化
- 理工科研究生英文论文写作能力和技巧培养
- 2022年
- 研究生教育体系缺少系统性的写作训练,研究生不了解英文论文从选题到写作、投稿的技巧,论文初稿呈现结构不清晰,创新性较弱等问题。从论文选题,论文写作,论文投稿三个方面提出解决方法与建议,希望对理工科研究生论文写作指导工作有一定的启迪。
- 孙锐张旭东
- 关键词:科技论文写作投稿研究生培养
- 基于RGB-D的反向融合实例分割算法被引量:2
- 2021年
- RGB-D图像在提供场景RGB信息的基础上添加了Depth信息,可以有效地描述场景的色彩及三维几何信息。结合RGB图像及Depth图像的特点,提出一种将高层次的语义特征反向融合到低层次的边缘细节特征的反向融合实例分割算法。该方法通过采用不同深度的特征金字塔网络(FPN)分别提取RGB与Depth图像特征,将高层特征经上采样后达到与最底层特征同等尺寸,再采用反向融合将高层特征融合到低层,同时在掩码分支引入掩码优化结构,从而实现RGB-D的反向融合实例分割。实验结果表明,反向融合特征模型能够在RGB-D实例分割的研究中获得更加优异的成绩,有效地融合了Depth图像与彩色图像2种不同特征图像特征,在使用ResNet-101作为骨干网络的基础上,与不加入深度信息的Mask R-CNN相比平均精度提高10.6%,比直接正向融合2种特征平均精度提高4.5%。
- 汪丹丹张旭东范之国孙锐
- 结合图像特征迁移的光场深度估计方法被引量:3
- 2023年
- 光场相机可以通过单次曝光同时采集空间中光线的位置信息和角度信息,在深度估计领域具有独特优势。目前光场真实场景数据集的深度标签难以获取且准确度不高,因此现有的多数光场深度估计方法依赖光场合成场景数据集进行训练,但合成数据集与真实数据集在图像特征分布上的差异,导致网络在将子孔径图像与深度图之间的映射关系应用于真实数据集时容易出现偏差。提出一种新的光场深度估计方法,利用基于对抗学习的图像翻译网络,使合成场景子孔径图像逼近真实场景子孔径图像的特征分布。在图像翻译网络中实施多视图角度一致性约束,保证图像翻译前后不同视角子孔径图像之间的视差关系保持不变。设计一种多通道密集连接深度估计网络,利用多通道输入模块充分提取不同方向子孔径图像堆栈特征,并通过密集连接模块进行特征融合,提升网络特征提取和特征传递的效率。在光场合成数据集4D Light Field Benchmark和光场真实数据集Stanford Lytro Light Field上的实验结果表明:与Baseline网络相比,该网络的均方误差和坏像素率平均降低23.3%和8.6%;与EPINET、EPI_ORM、EPN+OS+GC等方法相比,基于该网络的估计方法有效提升了深度估计的准确度,具有良好的鲁棒性和泛化能力。
- 罗少聪张旭东万乐谢林芳黎书玉
- 关键词:光场
- 可信度双三次插值的PMD距离信息和RGB图像数据融合被引量:2
- 2013年
- PMD(photonic mixer device)相机是一款基于TOF(time-of-flight)技术的3维成像设备,在获取2维灰度的同时能够获取高精度的距离信息。但它存在水平分辨率低,随机噪声较大的缺点。针对此问题,将PMD距离信息和高分辨率RGB图像相融合,提出一种新的基于可信度的双三次插值和投影纹理的数据融合方法。该方法充分考虑了PMD相机信号幅值和距离信息可信度的关系,加强了精确的距离信息对融合结果的影响,并且给出了直接运用距离信息进行PMD距离图像在世界坐标系的重建方法,降低了运算的复杂度。实验结果表明,本文方法可以得到具有彩色信息和距离信息的高分辨率图像,融合后图像的距离信息更为准确和丰富,有效降低了随机噪声的影响,并且在运行时间上也有较强的优势。
- 胡良梅王竹萌高隽张旭东吴国松
- 关键词:数据融合双三次插值
- 基于稀疏贝叶斯分类器的汽车车型识别被引量:10
- 2005年
- 稀疏贝叶斯方法在处理分类问题上具有良好的推广性,并且使用较少的核函数,介绍了一个实时的车型识别系统.它 以每点色彩信息的高斯混合模型来实现对视频图像的背景估计,从而实现对汽车的检测;利用稀疏贝叶斯分类器对检测到的汽 车进行车型分类.实验结果表明稀疏贝叶斯分类器不仅具有支持向量机的性能,而且比SVM使用更少的按函数.实验取得了 较好的分类效果.
- 张旭东钱玮高隽方廷健
- 关键词:高斯混合模型运动目标检测稀疏贝叶斯支持向量机
- 基于协同时空建模的视频行为识别算法
- 2021年
- 行为识别是计算机视觉领域的一个重要研究方向,已被广泛应用于视频监控、人群分析、人机交互、虚拟现实等领域。而时空建模是视频行为识别的一个重要部分,有效地进行时空建模可以极大地提高行为识别的精度。现有的先进算法采用3D CNN学习强大的时空表示,但在计算上是复杂的,这也使得相关部署昂贵;此外,改进的具有时间迁移操作的2D CNN算法也被用来进行时空建模,这种算法通过沿时间维度移动一部分特征通道用以进行高效的时序建模。然而,时间迁移操作不允许自适应地重新加权时空特征。以前的工作没有考虑将这两种方法结合利用起来,取长补短,以便更好地建模时空特征。本文提出了一个协作网络用以有效地结合3D CNN和2D卷积形式的时间迁移模块。特别是一个新的嵌入注意力机制的协同时空模块(Collaborative Spatial-temporal module,CSTM)被提出用以有效的学习时空特征。本文在与时序相关的数据集(Something-Something v1,v2,Jester)上验证了该算法的有效性,并且获得了竞争性的性能。
- 郑阳张旭东
- 基于深度学习的人脸呈现攻击检测方法研究进展
- 2025年
- 随着人脸识别技术广泛应用于公共安全、金融支付等领域,呈现攻击(Presentation Attacks,PAs)对人脸识别系统的安全性构成了威胁。呈现攻击检测技术(Presentation Attacks Detection,PAD)旨在判断输入人脸的真伪,对维护识别系统的安全性和鲁棒性具有重要的研究意义。由于大规模数据集的不断涌现,基于深度学习的呈现攻击检测方法逐渐成为该领域的主流。文章对近期基于深度学习的人脸呈现攻击检测方法进行了综述。首先,概述了呈现攻击检测的定义、实施方式和常见的攻击类型;其次,分别从单模态和多模态入手,对近五年来深度学习类方法的发展趋势、技术原理和优缺点进行详细分析和总结;然后,介绍了PAD研究中使用的典型数据集及其特点,并给出算法的评估标准、协议和性能结果;最后,总结了PAD研究中面临的主要问题并展望了未来的发展趋势。
- 孙锐王菲王菲张旭东张旭东
- 关键词:多模态