蒋孟奇
- 作品数:6 被引量:28H指数:3
- 供职机构:中国科学院软件研究所更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 有限元单元计算子程序的OpenMP并行化被引量:11
- 2008年
- Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。
- 宋刚蒋孟奇张云泉李玉成
- 关键词:并行编程多线程多核有限元
- 基于共享存储和Gzip的并行压缩算法研究被引量:8
- 2009年
- Gzip无损压缩算法。尽管gzip算法能够取得很好的压缩比,但它在分析和压缩编码的过程需要进行大量的计算。为了缩短压缩时间,提出了一种基于共享存储的并行压缩策略。采用OpenMP标准和"生产者/消费者"模型实现了gzip的并行压缩版本。在Beowulf集群中的一个SMP节点(双CPU)和曙光天阔服务器(4路双核)上的测试表明,并行化的gzip程序取得了极大的性能提升,尤其是大文件的压缩。
- 宋刚蒋孟奇张云泉刘胜飞
- 关键词:共享存储并行编程数据压缩OPENMPGZIP
- GOTOBLAS一般矩阵乘法高效实现机制的研究被引量:9
- 2008年
- 对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。
- 蒋孟奇张云泉宋刚李玉成
- 关键词:分块算法
- 压缩算法的OpenMP并行化实现及并行解压缩初探
- 随着峰值速度达280.6万亿次 IBM BlueGene/L 机群的投入使用,高性能计算机正面临着飞速发展,双核处理器的出现使得用户面临无处不在的并行.如何将已有的串行算法并行化并在并行计算机上实现成为高性能计算发展面临...
- 宋刚蒋孟奇张云泉李玉成陈靖柳锴
- 关键词:并行编程GZIP
- 文献传递
- 综合递归分块技术及其在数值计算中的应用
- 矩阵计算在科学计算和其它很多的领域中有着广泛的应用.而随着计算机体系结构的不断发展,尤其是分层存储的出现,现有的经典矩阵计算算法和传统数据结构已经不太适应新硬件发展的需要了.本文主要通过分析存储层次对矩阵计算的影响,结合...
- 蒋孟奇张云泉宋刚李玉成
- 关键词:矩阵计算
- 文献传递
- 综合递归分块技术及其在LAPACK中的应用
- 矩阵计算在科学计算和其它很多的领域中有着广泛的应用。LAPACK是一款线性代数函数库,它实现了线性代数计算中的大部分操作,包括矩阵分解、线性方程求解、最小二乘问题和矩阵特征值求解等多类问题,它是矩阵计算中最重要的函数库之...
- 蒋孟奇
- 关键词:矩阵计算