路璐
- 作品数:6 被引量:3H指数:1
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- Mediabench中若干程序的线程可并行化限度的分析
- 串行程序的线程可并行化限度(the Limit of Thread-level Parallelism)指串行程序在利用推测多线程技术进行并行化时所能达到的最大并行性。分析串行程序的线程可并行化限度,评估推测线程数对程序...
- 路璐安虹闫洁王耀彬
- 关键词:推测多线程串行程序
- 文献传递
- 分片式处理器上的谓词执行技术优化被引量:1
- 2012年
- 谓词执行能使分片式处理器充分利用众多的执行单元,开发指令级并行性.但因此形成的超块也使得分支误预测代价增大,所以提高分支预测器的性能至关重要.本文提出一种基于剖析信息决策的谓词执行技术,该技术利用剖析信息对谓词执行前后的执行周期进行估算,从而对分支的谓词执行进行决策.该技术使分支预测器的命中率提高了0.68%~3.50%,使系统性能提高了1.67%~8.33%.同时,利用select指令表示谓词化指令也消除了重命名阶段寄存器多定义问题.
- 邓春华安虹路璐王耀彬
- 关键词:谓词执行分支预测器
- 基于加权路径的指令调度算法
- 随着线延迟的逐渐增加,指令调度技术作为一种可以有效减少处理器片上通信的技术日益重要。本文介绍一种分片式处理器结构上基于加权路径的指令调度算法,该算法利用已经放置好的指令--锚指令信息精确计算路径长度,再用指令所在路径长度...
- 路璐安虹王莉王耀彬曾斌
- 关键词:指令调度处理器
- 文献传递
- 谓词执行技术在类数据流体系结构中的实现和优化
- 2010年
- 谓词执行技术是克服程序中控制依赖的重要软件技术.利用类数据流体系结构的特点,设计了一种在类数据流体系结构中低开销、高效率地实现谓词执行技术的方法:仅占用指令编码中的1-bit;谓词的值通过片上网络在指令间直接传递,无需谓词寄存器.这种实现方法的主要开销是由类数据流指令集引入的软件输出树,本文进一步提出一种基于边剖析技术的优化方法.实验表明,这种优化能减少17.3%的软件输出树开销,同时将程序性能提高了15.5%.
- 王莉安虹王耀彬任永青从明路璐
- 用线程级推测技术在多核体系结构上并行化科学计算应用被引量:2
- 2010年
- 线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源.
- 王耀彬安虹郭锐闫洁路璐
- 关键词:多核
- 基于加权路径的指令调度算法
- 2009年
- 随着线延迟的逐渐增加,指令调度技术作为一种可以有效减少处理器片上通信的技术日益重要。本文介绍一种分片式处理器结构上基于加权路径的指令调度算法,该算法利用已经放置好的指令——锚指令信息精确计算路径长度,再用指令所在路径长度作为权值对指令进行调度。实验结果表明,本算法实现的调度器IPC比已有的两种TRIPS调度算法的IPC分别提高了21%和3%。
- 路璐安虹王莉王耀彬曾斌
- 关键词:指令调度