胡庆丰
- 作品数:89 被引量:127H指数:6
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点实验室开放基金更多>>
- 相关领域:自动化与计算机技术理学电子电信金属学及工艺更多>>
- 面向CPU+DSP异构系统的矩阵乘加速方法
- 本发明公开了一种面向CPU+DSP异构系统的矩阵乘加速方法,目的是面向CPU+DSP异构系统提出一种高效协同的矩阵乘加速方法,以提高矩阵乘的运算速度和最大化CPU+DSP异构系统的计算效率。技术方案是先初始化参数并对CP...
- 刘杰迟利华甘新标晏益慧徐涵胡庆丰蒋杰李胜国王庆林皇甫永硕崔显涛周陈
- 文献传递
- 能耗并行加速比:高性能计算系统综合性能的有效度量
- 随着并行系统规模的扩大,高性能计算系统运行时消耗的能耗也在急剧增长,过高的能耗也给系统的可靠性、稳定性等方面带来严峻挑战。在这种情形下,能耗问题受到了前所未有的关注。因此,设计和研究高性能计算系统,需要在考虑高计算性能的...
- 王之元胡庆丰陈娟
- 关键词:能量消耗
- 文献传递
- 一种通过死代码移除来加快GPU运行速度的方法
- 本发明公开了一种通过死代码移除来加快GPU运行速度的方法,目的是提出一种通过死代码移除来加速GPU运行速度的方法,提高大规模GPU核心程序的执行和编译效率。技术方案是先为大规模GPU核心程序中的所有函数构建状态检测表;记...
- 迟利华刘杰胡庆丰晏益慧龚春叶甘新标徐涵蒋杰杨博
- 文献传递
- 并行矩阵乘的B迁移算法被引量:4
- 1997年
- 本文回顾了分布式系统上的广播-移位矩阵乘算法(B-S算法)[2]和C迁移算法[5],给出我们提出的迁移算法。B迁移算法有效地减少了通信量,在工作站机群上的应用取得了较好的结果。对比B-S算法性能提高可达到60%,对比C迁移算法,性能提高可达到140%。
- 刘杰胡庆丰迟利华
- 关键词:分布式系统
- 基于运行时代码修改的动态性能监控关键技术研究被引量:1
- 2009年
- 代码插桩是程序性能监控的重要环节。动态插桩通过对可执行程序代码的运行时修改支持动态性能监控,有助于降低性能分析工具的构建代价,提高工具易用性。本文首先阐述了Dyninst动态插桩系统的概念抽象与执行机理,然后结合大规模并行程序动态插桩的需要,对DPCL并行程序动态插桩基础设施以及基于MRNet的可扩展通信结构进行了深入分析。
- 蒋杰徐涵刘杰杨灿群胡庆丰
- 基于信息散度的视频大数据冗余删除方法
- 本发明公开了一种基于信息散度的视频大数据冗余删除方法,目的是提出一种冗余视频数据删除方法,节省存储容量,减少视频大数据计算分析时间,提高视频大数据维护管理的效率。技术方案是先将视频大数据用视频大数据集V来表示,对V进行归...
- 甘新标刘杰杨灿群徐涵胡庆丰龚春叶李胜国邹丹晏益慧黄嘉昆熊成伟
- 任务池方法在非独占式加载并行计算中的应用
- 在非独占式加载并行计算环境中,各节点上计算负载的不确定性和不均匀性会严重影响并行计算的性能.任务池方法可以对各节点的计算负载进行动态调整,是解决这一问题的有效途径.本文介绍用MPI实现集中式任务池的方法,并以一个用积分法...
- 张文勇卓红斌刘杰胡庆丰
- 关键词:并行计算MPI
- 文献传递
- 面向通用多核DSP的矩阵乘加速方法
- 本发明公开了一种面向通用多核DSP的矩阵乘加速方法,目的是提高矩阵乘的运算速度和最大化通用多核DSP的计算效率。技术方案是先对进行DSP配置并初始化:然后对矩阵A和矩阵B进行划分,依据VPU的拓扑结构mg×ng将原矩阵乘...
- 迟利华刘杰甘新标晏益慧徐涵胡庆丰蒋杰李胜国王庆林皇甫永硕崔显涛周陈
- 文献传递
- 一种并行扫描计算局部调度算法
- 为了解决优先级调度算法的可扩展性问题,本文设计并实现了一种局部的深度优先扫描算(PDFHDS)。该算法在计算初始优先级和计算最终优先级时,对每个结点只遍历一次,在这一次遍历中只访问该结点的全部直接前驱,避免了在PDFDS...
- 刘杰陈豆豆迟利华徐涵蒋杰胡庆丰
- 关键词:并行计算可扩展性
- 文献传递
- 爆炸电子发射边界的粒子模拟实现
- 2003年
- 介绍了自行研制的全电磁柱坐标粒子模拟程序的电流分配方法和金属爆炸电子发射边界的模拟实现,该电流分配方法满足电荷电流连续性方程,避免了繁琐的泊松修正,适用于复杂边界物理问题的模拟研究。基于此电流分配方法的基础上,给出了建立在高斯定理基础上的简单且易于程序实现的阴极发射边界算法。利用该程序对平面二极管电子发射现象的模拟结果证明了算法的正确性。
- 卓红斌胡庆丰常文蔚徐涵