黄小平
- 作品数:72 被引量:60H指数:4
- 供职机构:西北工业大学计算机学院更多>>
- 发文基金:国家自然科学基金西北工业大学基础研究基金陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 超越函数装置以及用该装置实现超越函数的方法
- 本发明公开了一种超越函数装置以及用该装置实现超越函数的方法,装置包括预处理单元、处理单元和后处理单元,其特点是所述处理单元由计数寄存器1、计数寄存器2、X寄存器及其处理通路、Y寄存器及其处理通路、Z寄存器及其处理通路、控...
- 高德远田杭沛樊晓桠张盛兵王党辉魏廷存黄小平张萌郑然
- 文献传递
- 32位双发射双流水线结构RISC微处理器设计被引量:1
- 2011年
- "龙腾R2"是西北工业大学自主研制的32位嵌入式RISC微处理器,与IBM公司的Power-PC750处理器pin-to-pin兼容。综合考虑面积、功耗、实时响应以及性能要求等因素,文章提出了一种应用于嵌入式处理器微架构设计的双发射双流水线结构。该结构的核心思想是在指令流水线前端处理阶段动态检测相邻指令的先后依赖关系,预先完成双发射判断。文中首先介绍了"龙腾R2"的微体系架构,然后重点讨论了基于双发射双流水结构的指令调度策略、相邻指令耦合关系、双发射下的相关处理以及精确异常考虑等。采用M ibench基准程序完成了性能评测,综合分析结果显示,该结构对算术计算类程序流加速明显,并且电路结构清晰,易于设计验证,同时发现优化存储系统结构是提升该处理器性能的关键。文章最后对"龙腾R2"的可测试性设计以及硅物理设计等关键技术进行了论述。"龙腾R2"已流片成功,整个处理器采用SMIC 180nm CMOS工艺,芯片面积5.9 mm×6.7 mm,核心频率266 MHz,CBGA360封装。
- 黄小平樊晓桠张盛兵史莉雯
- 关键词:可测试性设计
- 超标量处理器中引入SMT技术的性能分析研究被引量:1
- 2009年
- 同时多线程(SMT)是一种允许多个独立的线程每周期发射多条指令的技术,这种技术充分利用了可能存在的指令级并行和线程级并行,提高了有限资源的利用率。文章以西北工业大学航空微电子中心自主研发的32位超标量处理器"龙腾R2"为基础,引入SMT技术,在基本不改变内部结构大小、不增加执行功能部件、仅做一些必要修改的前提条件下进行研究。通过仿真不同的线程数和各种线程组合,进行性能分析。尽管存在制约性能提升的一些因素,引入SMT技术后依然获得了最高约50%的性能增加。
- 史莉雯樊晓桠黄小平
- 关键词:超标量处理器同时多线程
- 一种高速浮点规格化运算器
- 本实用新型公开了一种高速浮点规格化运算器,用于解决现有的规格化运算器运算速度低的问题,其技术方案是在所述前导零检测部件增加初等或阵列,所述移位器包括第一移位器和第二移位器,初等或阵列产生第一阶段移位信号;第一移位器根据第...
- 高德远姚涛樊晓桠张盛兵王党辉魏廷存黄小平张萌郑然
- 文献传递
- 基于CISC微处理器的32位整数乘法器
- 本发明公开了一种三十二位整数乘法器,属于计算机微处理器设计领域。它包括4-2压缩器,其特点是所述的4-2压缩器是三级4-2压缩器阵列,显示该乘法器可以完成有符号或者是无符号32位乘法运算,将被乘数经过符号扩展之后,使用基...
- 高德远王党辉王得利樊晓桠张盛兵黄小平魏廷存张萌
- 文献传递
- 动态可配置片上数据存储单元设计被引量:1
- 2014年
- 作为嵌入式处理器的关键部件,片上Cache的功耗能占到整个处理器功耗的50%以上;一个设计良好的片上数据存储单元能有效降低处理器功耗,并且提高整个系统的性能;便签式存储器(Scratchpad memory,SPM)具有占用片上面积少、功耗低和访问时延确定等优点,因此成为嵌入式系统领域的研究热点;以SPM为基础,介绍了一种动态可配置片上数据存储单元的设计方法,并提出SPM操作函数,方便应用程序开发;实验结果表明,该片上数据存储单元能耗降低超过35%,测试程序运行时间平均减少了20.3%。
- 张康王党辉黄小平
- 关键词:动态可配置CACHESPM状态机
- 总线监控与调试控制装置及进行总线监控与总线调试的方法
- 本发明公开了一种总线监控与调试控制装置及进行总线监控与总线调试的方法,用于解决现有的装置对总线监控与调试实时性差的技术问题。技术方案是数据采集模块采集目标系统总线上的数据,设置需要监控的数据地址及指令地址,存储器模块用于...
- 王党辉樊晓桠张盛兵安建峰韩茹张萌黄小平陈超郑乔石
- 采用GPU的ZIP密码恢复算法被引量:1
- 2015年
- 常用的zip密码恢复软件使用通用处理器进行密码恢复,每秒尝试密码次数少,往往需要很长时间才能找到正确密码。为了提高密码破解效率,提出了GPU平台上的快速ZIP密码恢复算法,针对GPU的特点,重点优化了寄存器使用以及存储器访问,对AES和HMAC算法进行了并行优化,充分发挥了GPU大规模并行运算的优势,并利用ZIP文档格式中的密码校验位提前筛选密码,大部分错误密码都不需要进行后续运算。实验结果表明,恢复AES-128加密的ZIP文档,基于GPU的算法实现了11.09倍的加速比。
- 李永达王党辉黄小平
- 倒T型隧穿场效应晶体管
- 本发明提供了一种倒T型隧穿场效应晶体管,SOI晶圆的硅衬底上方为SOI晶圆的衬底绝缘层,SOI晶圆的衬底绝缘层上方为重掺杂源区、两个单晶硅薄膜和两个重掺杂漏区,两个单晶硅薄膜L型两侧分别有一个栅极绝缘层,栅极绝缘层的两侧...
- 韩茹张海潮王党辉安建峰黄小平张萌陈超
- 文献传递
- 一种基于虚拟机的处理器高效原型验证方法被引量:1
- 2010年
- 针对传统微处理器FPGA验证难以快速精确的定位错误的问题,提出了一种基于Simics虚拟机的高效原型验证方法,使用Simics辅助FPGA验证,快速定位错误来源.该方法已在龙腾R的FPGA验证平台中得到了应用.实践表明,该方法可以有效缩短问题查找时间,同时Simics仿真结果也能提供解决问题的思路.
- 赵君建张盛兵黄小平
- 关键词:FPGASIMICS微处理器