白雪冰
- 作品数:9 被引量:29H指数:2
- 供职机构:宁夏大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 立体化教材建设实践——以《数字图像处理与机器视觉》为例
- 针对教学资源库融合背景下新形态教材的建设现状,分析了新工科高校在专业领域内推进新形态教材建设时面临的资源整合难度大、技术门槛高、评价体系不完善等重难点问题,揭示了在当前快速发展的教育科技环境中,传统教材向新形态教材转型的...
- 胡春生张芳艳王迪白雪冰
- 关键词:立体化教材图像处理知识重构机器视觉
- 改进的Meanshift运动目标跟踪算法被引量:5
- 2016年
- Meanshift算法在对快速运动的目标进行跟踪时容易丢失目标,并且在目标被遮挡时,也容易造成跟踪失败,跟踪的过程中跟踪框不能随着运动目标的大小变化而变化。提出一种基于Meanshift运动目标跟踪算法的改进算法。该算法基本思想是采用改进的三帧差分法对运动目标区域进行提取,求得跟踪框轮廓,同时用Meanshift算法对运动目标进行跟踪,获得目标最大概率区域,将该区域中心作为跟踪框的中心。跟踪过程中通过巴氏系数判断是否目标被遮挡,若被遮挡则调用Kalman滤波进行预测跟踪。实验结果表明,该算法能够快速、准确地跟踪目标。
- 张英车进牟晓凯白雪冰
- 关键词:三帧差分MEANSHIFT运动目标跟踪KALMAN滤波
- 基于Transformer视觉特征融合的图像描述方法
- 2024年
- 现有图像描述方法只利用区域型视觉特征生成描述语句,忽略了网格型视觉特征的重要性,并且均为两阶段方法,从而影响了图像描述的质量。针对该问题,提出一种基于Transformer视觉特征融合的端到端图像描述方法。首先,在特征提取阶段,利用视觉特征提取器提取出区域型视觉特征和网格型视觉特征;其次,在特征融合阶段,通过视觉特征融合模块对区域型视觉特征和网格型视觉特征进行拼接;最后,将所有的视觉特征送入语言生成器中以生成图像描述。该方法各部分均基于Transformer模型实现,实现了一阶段方法。在MS-COCO数据集上的实验结果表明,所提方法能够充分利用区域型视觉特征与网格型视觉特征的优势,BLEU-1、BLEU-4、METEOR、ROUGE-L、CIDEr、SPICE指标分别达到83.1%、41.5%、30.2%、60.1%、140.3%、23.9%,优于目前主流的图像描述方法,能够生成更加准确和丰富的描述语句。
- 白雪冰车进吴金蔓陈玉敏
- 关键词:图像描述
- 基于NAO的迷宫航偏校正方法被引量:1
- 2017年
- 针对NAO机器人在迷宫里由于电机自身误差、发热等因素造成的行走偏差,提出航向修正、机体侧移相结合的校正方法。运用颜色分割的方法提取黑色导航线;根据摄像头的高度、摄像头与水平面所成角度、图像竖直方向对应的实际长度和图像底边对应的实际长度对图像进行校正;根据校正后的图像进行航向修正,进行侧偏修正。实验结果表明,该方法使NAO作为巡线机器人高效地进行航偏校正。
- 白雪冰白雪冰赵婧
- 关键词:图像校正
- 结合快速鲁棒性特征改进ORB的特征点匹配算法被引量:22
- 2016年
- 针对定向二进制简单描述符(ORB)算法不具备尺度不变性的问题,提出一种结合快速鲁棒性特征(SURF)算法和ORB的改进算法。首先,利用Hessian矩阵检测特征点的方法,使得提取出的特征点具有尺度不变性;然后,用ORB生成特征描述子;接着采用K-近邻算法进行粗匹配;最后,通过比率测试、对称测试、最小平方中值(LMed S)定理进行提纯。尺度变化时,该算法比ORB的匹配精度提高了74.3个百分点,比SURF的匹配精度提高了4.8个百分点;旋转变化时,该算法比ORB的匹配精度提高了6.6个百分点;匹配时间高于SURF低于ORB。实验结果表明,改进算法不仅保持了ORB的旋转不变性,而且具备了尺度不变性,在不失速度的前提下,匹配精度得到较大提高。
- 白雪冰车进牟晓凯张英
- 关键词:特征点匹配尺度不变性旋转不变性
- 融合视觉定位信息的视觉问答算法研究
- 2024年
- 为提高视觉问答模型对图像中相关信息的捕捉,引入了视觉定位信息,以增强模型对完整图像信息的理解。通过将图像语义特征与浅层文本特征一同输入以图像为基础的文本编码器,将文本特征映射到图像空间。随后,将得到的文本特征和图像特征输入以文本为基础的图像解码器,生成视觉定位信息。实验结果显示,模型在Accuracy、Open、Binary、Consistency这四项评价指标上均取得最佳成绩,分别提高了0.84%、0.74%、3.38%、2.95%。其中,Accuracy达到了56.94%。这表明视觉定位信息有效地增强了图像特征中与问题相关部分的信息比例。
- 吴金蔓车进白雪冰白雪冰
- 关键词:视觉定位编码器解码器
- 全局线索和多级特征驱动的息肉分割
- 2024年
- 在结肠镜检查中,自动分割息肉是开发计算机辅助结肠镜检测和诊断系统的先决条件。息肉分割是一项非常具有挑战性的任务,因为息肉与周边组织具有很大的相似性以及息肉的大小形状变化很大。针对息肉与周围组织相似以及息肉多变的问题,提出基于全局线索定位和多视图特征融合的息肉分割方法。设计全局线索定位模块将全局定位信息传播到每个级别的特征图中,以显式的方式使每个级别的特征图都获得伪装特性息肉的位置信息;设计自我多视图特征融合模块,通过不同视图下的特征捕获不同视图之间的层次特征,更好地适应不同情况下的息肉分割场景。提出方法在5个数据集上的得分比对比算法提高的百分点分别为1.2、3.3、1.8、8.5和3.7,证明提出方法在学习能力和泛化能力上都达到了预期的效果。
- 简丽琼李春生陈志莉车进白雪冰高翔
- 关键词:结肠镜伪装
- NAO机器人单目视觉研究及其在物体搜救中的应用
- 随着科技的不断进步,机器人逐渐走进人们的视线,NAO机器人作为在世界范围内研究运用最广泛的机器人之一,其单目视觉逐渐成为人们研究的热点。本文以NAO机器人为开发平台,以机器视觉为基础,搭建迷宫,模拟物体搜救的场景,实现在...
- 白雪冰
- 关键词:单目视觉路径规划
- 文献传递
- 高校教学资源库融合背景下新形态教材建设的探索
- 本研究分析了教学资源库融合背景下新形态教材的建设现状,揭示了在当前快速发展的教育科技环境中,传统教材向新形态教材转型的迫切需求。以《大数据处理》专业课为例,梳理了新形态教材在内容创新、技术融合、互动性提升等方面的最新进展...
- 张芳艳王迪白雪冰胡春生
- 关键词:教学资源库纸质教材创新创业教育学习环境