黄胜兵
- 作品数:4 被引量:2H指数:1
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家科技重大专项更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Open64上的特殊指令合成策略研究与实现
- 2018年
- Open64是一个拥有GNU通用公共许可证的开源高性能编译器,设计结构好,分析优化全面,是编译器高级研究的理想平台。本文针对BWDSP处理器所提供的高效特殊运算指令,在Open64基础上研究并实现了面向BWDSP中的特殊指令合成策略。该策略通过扩展并重定向编译器后端模块,能够充分地利用BWDSP中的复数指令、累加指令、乘累加指令和平方和指令等特殊指令。实验结果表明,本文提出的特殊指令合成策略能够很大程度上提高程序的性能。
- 陈金娥黄胜兵
- 关键词:超长指令字
- 面向多簇架构DSP的树匹配向量化算法
- 2015年
- BWDSP是针对高性能计算设计的一款新型的处理器,采用多簇超长指令字体系结构和SIMD架构,有丰富的指令集.为充分利用BWDSP提供的向量化资源,迫切需要提出一种向量化算法.本文在open64基础上研究并实现了面向多簇超长指令字(VLIW)DSP的SIMD编译优化算法.算法基于OPEN64的中间语言WHIRL,能够充分地利用BWDSP丰富的硬件资源和向量化指令.最终实验结果表明,对于能够合成双字和单字的循环程序,该优化算法能够平均取得6倍和4倍的加速比.
- 郭连伟郑启龙黄胜兵徐华叶
- 关键词:单指令多数据超长指令字
- 分簇VLIW DSP上支持单双字模式选择的SIMD编译优化被引量:2
- 2015年
- BWDSP100是一款采用超长指令字(VLIW)和单指令多数据流(SIMD)架构的针对高性能计算领域而设计的32位静态标量数字信号处理器,其指令级并行(ILP)主要是通过其特殊的分簇体系结构和SIMD指令来实现,然而现有的编译框架无法对这些特殊的SIMD指令提供支持。由于BWDSP100拥有丰富的SIMD向量化资源,且其所运用的雷达数字信号处理领域对程序的性能要求极高,因此针对BWDSP100结构的特点,在传统Open64编译器中SIMD编译优化框架的基础上提出并实现了一种支持单双字模式选择的SIMD编译优化算法,通过该算法可以显著提高一些在DSP上有着广泛运用计算密集型程序的性能。实验结果表明,与优化前相比,该算法方案在BWDSP编译器上的实现能够平均取得5.66的加速比。
- 黄胜兵郑启龙郭连伟
- 关键词:指令级并行超长指令字
- 面向BWDSP的SIMD编译优化技术研究与实现
- BWDSP是一款采用分簇体系结构、支持SIMD的16发射的VLIW浮点运算数字信号处理器。由于其具有强大的并行处理能力,能够较好得满足实时信号处理的要求,被广泛应用于各种高性能计算领域。本文在面向BWDSP目标体系结构、...
- 黄胜兵
- 关键词:指令级并行超长指令字