您的位置: 专家智库 > >

国家科技重大专项(2009ZX01034-001-006)

作品数:8 被引量:13H指数:2
相关作者:刘衡竹万江华杨惠陈书明孙永节更多>>
相关机构:国防科学技术大学更多>>
发文基金:国家科技重大专项更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 8篇期刊文章
  • 3篇会议论文

领域

  • 11篇自动化与计算...

主题

  • 5篇DSP
  • 3篇向量
  • 3篇SIMD
  • 3篇MATRIX
  • 2篇单精度
  • 1篇调度
  • 1篇调度算法
  • 1篇多线程
  • 1篇多线程机制
  • 1篇软基站
  • 1篇前端
  • 1篇前端设计
  • 1篇去块效应
  • 1篇去块效应滤波
  • 1篇网络
  • 1篇线程
  • 1篇线程机制
  • 1篇向量处理
  • 1篇向量处理器
  • 1篇向量化

机构

  • 11篇国防科学技术...

作者

  • 5篇杨惠
  • 4篇万江华
  • 4篇刘衡竹
  • 4篇陈书明
  • 3篇吴铁彬
  • 2篇侯申
  • 2篇张剑锋
  • 2篇孙永节
  • 1篇舒生亮
  • 1篇吴家铸
  • 1篇庄巍
  • 1篇淡孝强
  • 1篇田希
  • 1篇邓宇
  • 1篇彭元喜
  • 1篇陈胜刚
  • 1篇王海波
  • 1篇辛乃军
  • 1篇阳柳
  • 1篇孙海燕

传媒

  • 6篇计算机工程与...
  • 1篇小型微型计算...
  • 1篇计算机科学

年份

  • 1篇2014
  • 3篇2013
  • 4篇2012
  • 3篇2011
8 条 记 录,以下是 1-10
排序方式:
“飞腾-迈创”DSP面向布局的前端设计优化
大规模集成电路设计过程中前后端设计之间有效的数据交互、迭代是影响芯片设计周期的重要因素。本文主要结合"飞腾-迈创"芯片的设计流程,总结归纳设计过程中前端设计者面向后端设计布局阶段所做的设计优化工作,主要采用了字块调整、流...
王海波陈书明万江华唐涛
关键词:前端设计
文献传递
一种适用于向量处理器的新型归约网络
2012年
现代通信和图像处理等应用领域中向量运算的宽度灵活多变,且程序可循环执行.为了支持宽度的灵活多变,研究并提出一种新颖的分层计算模型,在基于有16个向量运算单元的向量处理器上用该模型构建了一种可配置成多组多宽度的归约树结构,向量宽度为2至16.设计了控制模块,在无需修改程序的情况下可通过隐式自增的方式指定归约目标,使单程序可以多次循环执行.对所实现的归约网络部件在TSMC65nm工艺库下用Synopsys的Design Complier工具进行综合,结果显示其工作频率可达700MHz,面积为92363.04um2,功耗为17.30 mW.在相同工艺库和工作频率下,该设计的性能开销比是一种精简归约网络的2.36倍.
庄巍杨惠刘衡竹
关键词:向量运算
基于表调度的Matrix DSP指令调度算法的实现
2013年
指令调度是gcc实现指令并行、提高性能的一种优化策略,gcc目前支持的调度算法主要有表调度算法与模调度算法。主要根据Matrix芯片的体系结构特点,对现有的表调度算法进行了改进,实现了Matrix指令调度算法。实验结果表明,改进后的表调度算法能够编译出正确的指令,充分挖掘指令间的并行性,显式标注指令间的并行关系,指令字间的延迟关系符合硬件要求。
罗杰陈跃跃孙海燕阳柳淡孝强辛乃军王霁
关键词:GCC超长指令字MATRIX
FT-SIMD:一种高性能乘法器的设计被引量:1
2012年
为了提高多媒体数据的处理能力,高性能DSP普遍引入了SIMD技术。作为DSP重要组成部分的乘法器也必须具备这一功能。本文对SIMD乘法器的实现进行深入研究,提出了一种新的SIMD乘法器体系结构,采用两个16×8乘法器,通过对其操作数和结果进行符号扩展和拼接等处理,简单而高效地实现了16位FT-SIMD乘法器。同时,本体系结构可以扩展为32位和64位的SIMD乘法器。
李国强陈书明万江华杨惠
关键词:SIMD乘法器BOOTH编码
Matrix DSP中断处理系统的设计与实现被引量:4
2012年
本文研究并实现了一种快速响应中断请求信号的中断处理系统。设计过程中,在保证功能正确的前提下,尽量减小中断的延时开销。本文硬件中断和软件中断的处理机制相同,中断嵌套机制非常灵活。与传统的只有不可屏蔽中断源能打断可屏蔽中断源的中断嵌套机制不同,本文中断处理系统只要是优先级较高的中断信号就可以打断优先级较低的中断信号。这种机制简化了控制逻辑,减少了中断延时开销,使得延时开销从传统的5拍缩短为4拍。
舒生亮孙永节万江华
一种快速SIMD浮点乘加器的设计与实现被引量:5
2012年
本文设计和实现了5级全流水SIMD浮点乘加器,支持双精度和双单精度浮点乘法、乘累加(减)操作,用Modelsim和NC Verilog测试和验证了RTL代码实现,基于65nm工艺采用Synopsys公司的Design Complier工具综合硬件实现,运行频率可达714.286MHz。结果表明,相比文献[3]中经典的低延迟乘加结构,在相同综合条件下性能提升了17.89%,面积增加了6.61%,功耗降低了25.08%。
吴铁彬刘衡竹杨惠张剑锋侯申
关键词:SIMD
Matrix DSP中多线程机制的研究与设计被引量:1
2013年
深入研究了YHFT_Matrix高性能DSP中的一种多线程机制,重点介绍了其循环指令缓冲的读写机制、单线程与多线程之间的模式切换机制。在基于65nm工艺下,经过综合,代码面积、功耗都有减少,关键路径优化0.07ns。对程序的执行评估测试的分析结果表明:多线程工作模式相比单线程工作模式,其处理器性能IPC(Instructions PerCycle)平均提高了9.64%。
邓宇孙永节万江华
关键词:多线程模式切换
面向软基站高密集度计算的创新DSP的反汇编器研究被引量:1
2013年
面向高密集度计算的创新DSP,其研究工作主要包括创新DSP(FT-Matrix)芯片设计以及与芯片配套的高效编译器、汇编器、反汇编器、链接器与集成开发环境研制。提出了一种基于创新DSP指令集和体系结构的变长指令反汇编器,并允许使用宏汇编预处理命令。
吴家铸田希赵传军刘衡竹陈书明
关键词:向量DSP
一种基于FT-Matrix DSP的去块效应滤波算法的向量化实现被引量:1
2014年
针对H.264视频压缩编码标准中去块效应滤波器部分提出了一种基于YHFT-Matrix DSP的并行设计及向量实现方法。重点对H.264协议中去块效应滤波器进行理论分析,并利用向量数据访问单元、向量处理单元、高效的混洗单元和灵活的矩阵对其进行并行算法设计。将去块滤波算法分别映射到YHFT-Matrix和TI的TMS320C6415中,通过统计两者性能,表明YHFT-Matrix的性能优于TMS320C6415。
李勇陈书明陈胜刚
关键词:去块效应滤波
一种FA的设计与验证
介绍了一种应用于浮点DSP中的FA(浮点加法器),对其算法结构进行了详细的研究,采用改进的单通路算法,设计实现了FA。在完成设计后采用NC-Verilog对各个单元模块和整体结构进行了完整的验证。
王碧文彭元喜杨惠吴铁彬
关键词:浮点加法器
文献传递
共2页<12>
聚类工具0