您的位置: 专家智库 > >

乔寓然

作品数:19 被引量:4H指数:1
供职机构:国防科学技术大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金更多>>
相关领域:自动化与计算机技术电子电信更多>>

文献类型

  • 14篇专利
  • 2篇期刊文章
  • 2篇学位论文
  • 1篇会议论文

领域

  • 8篇自动化与计算...
  • 1篇电子电信

主题

  • 7篇网络
  • 5篇缓存
  • 4篇上网
  • 4篇片上网络
  • 4篇主存
  • 3篇丢弃
  • 3篇硬件
  • 3篇数据依赖
  • 3篇数据依赖关系
  • 3篇死锁
  • 3篇死锁检测
  • 3篇子块
  • 3篇矩阵
  • 3篇矩阵乘
  • 3篇加速器
  • 3篇报文
  • 3篇处理器
  • 2篇硬件加速
  • 2篇映射
  • 2篇冗余

机构

  • 19篇国防科学技术...

作者

  • 19篇乔寓然
  • 13篇杨乾明
  • 13篇文梅
  • 11篇张春元
  • 8篇沈俊忠
  • 6篇苏华友
  • 6篇肖涛
  • 4篇励楠
  • 4篇荀长庆
  • 4篇周宏伟
  • 4篇冯权友
  • 4篇邓让钰
  • 4篇曾坤
  • 4篇任巨
  • 4篇黄达飞
  • 4篇王勇
  • 4篇张英
  • 3篇王俊辉
  • 3篇王蕾
  • 2篇蓝强

传媒

  • 1篇计算机工程与...
  • 1篇上海交通大学...

年份

  • 2篇2021
  • 2篇2020
  • 3篇2018
  • 2篇2017
  • 3篇2016
  • 4篇2015
  • 1篇2014
  • 1篇2013
  • 1篇2012
19 条 记 录,以下是 1-10
排序方式:
一种检测片上网络中死锁的方法
本发明公开了一种检测片上网络中死锁的方法,目的是提供一种既能在死锁一旦发生时可立刻检测出死锁,且发现的死锁准确无误的方法。技术方案是先根据路由网络的拓扑互连结构,构建具有同步功能的通道等待网络;在路由网络启动后,每间隔时...
乔寓然董辛楠文梅任巨杨乾明张春元荀长庆柴俊贾文涛黄达飞薛云刚蓝强
一种支持可变分块的矩阵乘加速方法
本发明公开了一种支持可变分块的矩阵乘加速方法,步骤包括:输入矩阵A和矩阵B,根据矩阵A和矩阵B的规模确定子块大小S<Sub>i</Sub>,将矩阵A以规模为S<Sub>i</Sub>*N的子块为单位进行按行分块,将矩阵B...
文梅沈俊忠乔寓然杨乾明苏华友肖涛陈照云张春元
基于分布式有限目录的缓存数据一致性实现方法及装置
本发明公开了一种基于分布式有限目录的缓存数据一致性实现方法及装置,本发明通过私有缓存PCache X响应对应处理单元PE X的请求,且在请求不命中或数据写回时向对应的宿主DDCU X发出数据读写一致性请求事务,宿主DDC...
冯权友周宏伟王俊辉邓让钰张英王蕾曾坤王勇杨乾明励楠乔寓然
文献传递
基于设备视图冗余的众核处理器容错方法
本发明公开了一种基于设备视图冗余的众核处理器容错方法,步骤包括:预先在众核处理器的主核和冗余核中加入可靠设备单元并提供可供编程调用的设备视图;主核执行到配置指令时配置可靠设备单元,控制核为主核分配冗余核;在主核执行到启用...
乔寓然文梅任巨荀长庆范方园苏华友张春元黄达飞
文献传递
一种检测片上网络中死锁的方法
本发明公开了一种检测片上网络中死锁的方法,目的是提供一种既能在死锁一旦发生时可立刻检测出死锁,且发现的死锁准确无误的方法。技术方案是先根据路由网络的拓扑互连结构,构建具有同步功能的通道等待网络;在路由网络启动后,每间隔时...
乔寓然董辛楠文梅任巨杨乾明张春元荀长庆柴俊贾文涛黄达飞薛云刚蓝强
文献传递
基于设备视图冗余的众核处理器容错方法
本发明公开了一种基于设备视图冗余的众核处理器容错方法,步骤包括:预先在众核处理器的主核和冗余核中加入可靠设备单元并提供可供编程调用的设备视图;主核执行到配置指令时配置可靠设备单元,控制核为主核分配冗余核;在主核执行到启用...
乔寓然文梅任巨荀长庆范方园苏华友张春元黄达飞
文献传递
面向高性能处理器的混合型FIFO数据存储方法及装置
本发明公开了一种面向高性能处理器的混合型FIFO数据存储方法及装置,装置包括RAM存储器、选择器、寄存器组和FIFO控制器,FIFO写数据端口分别与RAM存储器的输入端、选择器的一个输入端相连,RAM存储器输出端与选择器...
周宏伟张见曾坤杨乾明张剑锋冯权友张英王勇励楠邓让钰乔寓然龚锐石伟刘威王永文王蕾
文献传递
深度学习算法硬件加速关键技术研究
随着互联网时代的到来,人类所产生的数据发生了前所未有的膨胀。用于处理数据的数据中心所能提供的算力也在极速增长。这就为训练更深层次的神经元网络提供了条件。深度神经网络能够从互联网所产生的大数据里获取并归纳其承载的丰富信息,...
乔寓然
关键词:硬件加速器
文献传递
一种支持优化分块策略的矩阵乘加速器设计被引量:4
2016年
在许多应用领域中,大规模浮点矩阵乘法往往是最耗时的计算核心之一。在新兴的应用中经常存在至少有一个维度很小的大规模矩阵,我们把具备这种特性的矩阵称为非均匀矩阵。由于FPGA上用以存储中间结果的片上存储器容量十分有限,计算大规模矩阵乘法时往往需要将矩阵划分成细粒度的子块计算任务。当加速非均匀矩阵乘法时,由于只支持固定分块大小,大多数现有的线性阵列结构的硬件矩阵乘法器将遭受很大的性能下降。为了解决这个问题,提出了一种有效的优化分块策略。在此基础上,在Xilinx公司的Zynq XC7Z045FPGA芯片上实现了一个支持可变分块的矩阵乘法器。通过集成224个处理单元,该矩阵乘法器在150 MHz的时钟频率下对于实际应用中的非均匀矩乘达到了48GFLOPS的实测性能,而所需带宽仅为4.8GB/s。实验结果表明,我们提出的分块策略相比于传统的分块算法实现了高达12%的性能提升。
沈俊忠肖涛乔寓然杨乾明文梅
关键词:FPGA矩阵乘法分块策略
一种基于Winograd算法的3D CNN加速方法及系统
本发明公开了一种基于Winograd算法的3D CNN加速方法及系统,其方法实施步骤包括:从输入特征图中读取待变换的特征图子块,从权值缓存中读取卷积核子块,对特征图子块Bin以及卷积核子块执行3D Winograd算法输...
沈俊忠黄友王泽龙乔寓然陈照云曹壮文梅张春元
共2页<12>
聚类工具0