您的位置: 专家智库 > >

北京市科技新星计划(2010B058)

作品数:5 被引量:16H指数:2
相关作者:范东睿范灵俊叶笑春徐远超郑亚松更多>>
相关机构:中国科学院中国科学院大学首都师范大学更多>>
发文基金:北京市科技新星计划国家自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇自动化与计算...

主题

  • 2篇动态功耗
  • 2篇多核
  • 2篇组相联
  • 2篇无效
  • 2篇缓存
  • 2篇功耗
  • 1篇多核结构
  • 1篇多核系统
  • 1篇上网
  • 1篇能耗
  • 1篇能耗优化
  • 1篇能效
  • 1篇片上网络
  • 1篇嵌入式
  • 1篇嵌入式系统
  • 1篇网络
  • 1篇模拟器
  • 1篇键值
  • 1篇共享存储
  • 1篇过滤器

机构

  • 5篇中国科学院
  • 3篇中国科学院大...
  • 2篇首都师范大学
  • 1篇西安理工大学
  • 1篇韦恩州立大学
  • 1篇中国科学院研...
  • 1篇国网信息通信...
  • 1篇英特尔公司

作者

  • 4篇范东睿
  • 2篇徐远超
  • 2篇叶笑春
  • 2篇郑亚松
  • 2篇范灵俊
  • 1篇李文明
  • 1篇刘高辉
  • 1篇张帅
  • 1篇唐士斌
  • 1篇娄杰
  • 1篇张轮凯
  • 1篇张浩
  • 1篇崔慧敏
  • 1篇宋风龙
  • 1篇刘志勇
  • 1篇王达
  • 1篇施巍松
  • 1篇王栋
  • 1篇范涛
  • 1篇宋爽

传媒

  • 2篇计算机学报
  • 1篇计算机研究与...
  • 1篇小型微型计算...
  • 1篇计算机工程与...

年份

  • 1篇2014
  • 3篇2013
  • 1篇2012
5 条 记 录,以下是 1-5
排序方式:
SPARC平台模拟器源码级调试系统的研究与实现被引量:2
2013年
软件模拟器采用软件思想模拟真实硬件工作情况,作为嵌入式系统研究的基础研发工具,被广泛应用于体系结构设计调优、软硬件协同设计领域。研究提出一种在SPARC指令集模拟器平台上实现源码级调试系统的方法,一方面该方法使用SPARC交叉调试器对运行于SPARC指令集模拟器上的应用程序进行源码级调试,有效避免了单独实现源码级调试器所带来的调试信息解析困难、可靠性难以验证的弊端;另一方面提出了在集成开发环境下源码级调试系统的高效集成机制,有效解决了进程间切换延时开销大、界面僵死等问题,为SPARC平台嵌入式系统开发人员提供了一种支持图形化界面的高可靠性源码级调试系统。通过具体实现分析,对整个调试系统进行了性能评估。
范涛刘高辉叶笑春李文明宋爽范东睿
关键词:SPARCV8模拟器嵌入式系统
多核结构片上网络性能-能耗分析及优化方法被引量:12
2013年
文中探讨了片上网络在执行真实并行程序时的能耗和性能关系,并提出了一种能耗/性能优化方法.首先,文中提出了一种精确的性能-能耗模型,在性能和能耗模型中同时划分出与频率相关和与频率无关的因素,并分析其对性能和能耗的影响;其次,在性能-能耗模型中建立并行开销、片外访存开销与片上网络规模(节点数)、频率之间的关系,同时引入了并行度、通信模型等与应用相关的因素,使该模型能够同时表达软硬件特性;第三,文中提出了一种基于该性能-能耗模型的性能-能耗优化方法,通过采集程序的通信模型、访存消息数量等数据选择适当的频率和网络节点数来获得片上网络能耗最低值或处理器性能最大值.最后,文中采用8个PARSEC并行程序验证前述模型的准确性并评价性能-能耗优化方法,结果显示文中性能-能耗模型相比传统模型更加精确吻合实验测量结果,性能-能耗优化方法也有效适用于不同种类的并行程序.
张帅宋风龙王栋刘志勇范东睿
关键词:多核片上网络能耗优化
MALK:一种高效处理大规模键值的MapReduce框架
2014年
内存申请是引发共享存储系统上MapReduce性能下降的主要瓶颈之一,特别是对于需要处理大量键值的应用尤为严重.为了解决此问题,提出了一种内存开销低、能高效处理大规模键值的MapReduce并行计算框架——MALK(high-efficient MapReduce for applications having large amount of keys).MALK对于离散的大规模键值采用连续的存储管理方法,避免了大量小块内存的申请;通过更细粒度地处理Map阶段的任务和流水化Reduce阶段的任务,来减少系统运行过程中同时活跃的数据量,从而将应用程序对内存的需求控制在一个较小的范围内;并提出一种Hash表的复用机制,通过复用Hash表的存储空间来避免流水过程中Hash表内存的重复申请;MALK还综合考虑了任务的粒度和数量对任务管理开销和整体性能的影响,把Reduce阶段的任务数量设成对系统性能最优的值.实验结果表明:相对于Phoenix++,MALK的性能最高可提升3.8倍(平均2.8倍);在Map和Reduce阶段,MALK最多可节省95.2%和87.8%的存储空间;MALK在Reduce阶段还取得了更好的负载均衡,降低了L2和LLC Cache的缺失率.
郑亚松王达叶笑春崔慧敏徐远超范东睿
关键词:MAPREDUCE
针对组相联缓存的无效缓存路访问混合过滤机制研究被引量:2
2013年
近年来,功耗成为处理器设计领域的关键问题之一.传统应对功耗的方法如DVFS(Dynamic VoltageFrequency Scaling)目前遭遇了收益递减律.随着多核/众核处理器的普及化,片上缓存占有了越来越多的CPU芯片面积和功耗.针对降低功耗的问题,文中提出了通过过滤不必要的缓存路访问来降低缓存动态功耗的方法.该方法包括采用无效访问过滤器(Invalid Filter)来消除对含无效数据块的缓存路的访问;采用指令数据访问过滤器(I/D Filter)来消除对与访问类型(指令或数据)不匹配的数据块所在的缓存路的访问;以及采用tag低位过滤器(Tag-2Filter)来消除对tag低位不匹配的数据块所在的缓存路的访问.文中提出将以上3种方法合并,称为Invalid+I/D+Tag-2Filter,以期取得更好的效果.通过分析和实验验证了3种方法的有效性和互补性.同时,实验也表明,与Invalid+I/D Filter相比,Invalid+I/D+Tag-2Filter在64KB 4路组相联缓存上可以取得19.6%~47.8%(平均34.3%)的效果提升,在128KB 8路组相联缓存上可以取得19.6%~55.2%(平均39.2%)的效果提升;与Invalid+Tag-2Filter相比,Invalid+I/D+Tag-2Filter在64KB 4路组相联缓存上可以取得16.1%~27.7%(平均16.6%)的效果提升,在128KB 8路组相联缓存上可以取得6.9%~44.4%(平均25.0%)的效果提升.
范灵俊徐远超施巍松范东睿娄杰
关键词:动态功耗
一种带有无效缓存路访问过滤机制的低功耗高速缓存
2012年
功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来降低CPU的动态功耗,具体为,通过无效缓存块的预先检查(Pre-Invalid Way Checking,PIWC)消除对无效缓存路的访问,及通过不匹配缓存路的预先检测(Pre-Mismatch Way Detecting,PMWD)消除对tag低位不匹配缓存路的访问.对实际程序的测试表明,65.2%-88.9%缓存路的无效访问可以通过以上方法被消除,约60.9%-85.6%由缓存访问带来的动态能耗从而被降低.同时,跟tag-data顺序访问方法相比,对于大多数程序,我们的方法可以获得5.1%-13.8%的节能效果提升.
范灵俊唐士斌张轮凯郑亚松张浩
关键词:动态功耗
共1页<1>
聚类工具0