漆锋滨 作品数:112 被引量:50 H指数:5 供职机构: 江南计算技术研究所 更多>> 发文基金: 国家高技术研究发展计划 国家重点基础研究发展计划 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 理学 电子电信 更多>>
一种编译器数据预取方法和装置 本发明实施例提供一种编译器数据预取方法和装置,以实现高效的访存优化。所述方法包括:提供硬件指令查询软件管理片上存储器SPM中划分的局存空间,所述硬件指令包含数据的主存地址;若在所述SPM局存空间查询到所述主存地址对应的数... 漆锋滨 肖谦 沈莉 姜军 王超文献传递 一种GOT表写保护的保护方法 本发明提供了一种GOT表写保护的保护方法,包括:并且将初始化后的GOT表的读写操作属性设置为只读;在第一次调用GOT表中包含的函数相关表格项所对应的函数时,进行地址解析,以得到入口地址;先将GOT表的读写操作属性设置为读... 谢汶兵 漆锋滨 姜军 王礼生 马晓东 杨小川 黄亮明文献传递 一种基于时空特性数据的调试调优方法 本发明公开一种基于时空特性数据的调试调优方法,包括以下步骤:S1、采样控制模块配置所需采集的指标并启动采集;S2、性能指标采集模块采集性能指标,通过时间采集模块、空间采集模块分别采集当前性能指标所处的时间和代码空间,其中... 刘勇 漆锋滨 冯赟龙 陈华蓉 彭达佳 王敬宇 宋佳伟 孙川面向国产异构众核系统的Parallel C语言设计与实现 被引量:10 2017年 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 何王全 刘勇 方燕飞 魏迪 漆锋滨关键词:编程模型 并行语言 PARALLEL 编译器 基于实例的迭代编译方法及编译装置 一种基于实例的迭代编译方法及装置。所述编译方法包括:根据编译操作参数对待编译目标程序进行更新操作或应用操作;所述更新操作通过在迭代编译目标程序后形成新实例,并以实例库中的实例对新实例预测的结果确定是否将新实例添加至实例库... 白书敬 马晓东 漆锋滨 尉红梅 李中升 姜军层次化批分解算法云框架 被引量:1 2014年 Bernstein提出的批分解算法(BERNSTEIN D J.How to find smooth parts of integers.[2013-08-05].http://cr.yp.to/factorization/smoothparts-20040510.pdf)能够快速完成给定光滑界B的一批随机整数的光滑性判断。然而该方法内存需求过于庞大,使得该算法广泛应用在理论分析阶段,实际应用却很少。为解决该问题,提出一种素数分段的方法,并据此提出一种层次化批分解算法云框架。该框架通过层次化的设计使得开发过程清晰简洁,具有较强的可移植性;借鉴自MapReduce的改进的云计算框架利用云客户端的分布存储和共享存储、消息机制等并行支撑平台提供的服务完成素数分段批分解算法的映射,解决了大规模Bernstein批分解算法空间需求过大的问题。实验结果显示,该框架能够适应素因子乘积规模由1.5 GB至192 GB的批分解运算,扩展性良好,增强了批分解算法的实用性。 袁欣辉 刘勇 漆锋滨关键词:层次化 云计算 函数调用和返回的处理方法、二进制翻译方法和系统 本发明公开了一种函数调用和返回的处理方法、二进制翻译方法和系统,所述函数调用和返回的处理方法包括:将源程序的函数调用的返回地址作为假指令保存在目标程序的函数调用指令之后;在目标程序的函数调用开始,将所述假指令的地址保存到... 唐大国 王丽一 漆锋滨 文延华 卿鹏 孙俊文献传递 针对小规模整数的MPQS算法 2015年 数域筛法是目前最有效的大整数分解算法,其中候选关系的光滑性判断需要对大量规模不大的余因子做分解,MPQS作为110-digits以下最快的分解算法得到广泛的应用。但现有的MPQS软件包针对96 bit以下的整数优化不足,未充分挖掘整数规模对MPQS性能的影响。针对小规模整数的MPQS算法提出新多项式系数选取和循环拷贝筛两种优化方法,新的系数方案配合参数选取和中间结果规模控制可以尽量避免使用多精度函数;循环拷贝筛法根据筛法定理与周期函数的周期性,利用循环拷贝替代小素因子的筛法,解决了小素因子筛法成本过高和部分因子基筛法筛选效果差的问题。在神威蓝光国产CPU平台上进行的实验测试表明,两种优化方法可使MPQS性能提高30%以上。 袁欣辉 漆锋滨关键词:筛法 多项式系数 神威 一种数值预报产品实时处理方法 一种数值预报产品实时处理方法,包括:使用数值预报系统计算预报数据,数值预报系统将每次计算的预报数据保存在文件系统中;采用预报产品生产服务进程,以服务运行方式,读取数值预报系统计算的预报数据,实时判断数值预报系统计算的预报... 陈德训 刘鑫 徐金秀 漆锋滨文献传递 可重构计算及可重构编译技术研究 可重构计算是未来高性能计算的发展趋势,它兼具了通用计算的灵活性和专用计算的高效性,充分利用系统资源的同时,又能发挥应用程序的效率。可重构编译是推广可重构计算的关键技术,可重构编译系统能够为传统的软件编程人员提供一个体系结... 漆锋滨 王珊珊 姜小成 何王全关键词:可重构计算 文献传递