科学计算常用的基础并行求解软件库介绍 王彦棡 2009年12月.ppt

上传人:progressking105 文档编号:390858 上传时间:2018-10-15 格式:PPT 页数:44 大小:1.99MB
下载 相关 举报
科学计算常用的基础并行求解软件库介绍 王彦棡 2009年12月.ppt_第1页
第1页 / 共44页
科学计算常用的基础并行求解软件库介绍 王彦棡 2009年12月.ppt_第2页
第2页 / 共44页
科学计算常用的基础并行求解软件库介绍 王彦棡 2009年12月.ppt_第3页
第3页 / 共44页
科学计算常用的基础并行求解软件库介绍 王彦棡 2009年12月.ppt_第4页
第4页 / 共44页
科学计算常用的基础并行求解软件库介绍 王彦棡 2009年12月.ppt_第5页
第5页 / 共44页
亲,该文档总共44页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、,科学计算常用的基础并行求解软件库介绍王彦棡2009年12月18日,背景介绍,深腾7000是世界上规模最大的一个结点无盘启动的机群系统,成功实现了基于1428个无盘结点的机群系统。 深腾7000是国内第一个实际性能突破每秒百万亿次的异构机群系统,成功实现了1240个2路薄结点和38个16路厚结点的协同计算,实际Linpack性能突破每秒106.5万亿次。,背景介绍,Jaguar(rank 1),petsc pspline Scalapack sprng sundials superlu superlu_dist Trilinos umfpack,arpack aztec fftpack fft

2、w gsl hypre libsci metis Parmetis mumps,背景介绍,JUGENE(rank 4)、JuRoPa(rank 13)、JUMPNAG Parallel Library、ScaLAPACK、ARPACK、PARPACK、 PETSc、MUMPS、SPRNG、ParMETIS、hypre、sundials,背景介绍,Alabama Supercomputer Authority deal.II, METIS, Octave, PDE2D, PETSc, R, SCSL, SLATEC, TrilinosEcole Polytechnique Fdrale de L

3、ausanne ARPACK,AZTEC,MUMPS, PETSC,BLACS,ScaLAPACK, SPRNG, FFTW, NAG Fortran 90 library, LAPACK/BLAS from MKL,背景介绍,Trilinos petsc sundials hypre tao slepc adic Aztec BlockSolve95 gsl,MUMPS ParMetis pARMS spai spooles fftw SuperLU_dist sprng arpack parpack,软件介绍,软件介绍,软件介绍,软件介绍,软件介绍,软件介绍,软件介绍,软件介绍,软件介绍,

4、Trilinos,Trilinos受到美国政府ASC、LDRD(Laboratory Directed Research and Development)等计划联合资助,是Sandia国家实验室实施的一个大型数值软件项目。其目的是要在一个为解决大规模、复杂物理工程和科学应用的面向对象的软件框架下开发并行解决算法和数学库。自2001年启动至今,Trilinos已演变到第10版,目前仍处于活跃开发中。它广泛采用面向对象技术,大部分代码用C+编写,底层关键部分则用FORTRAN(主要是BLAS和LAPACK程序)、C(ML)实现。Trilinos能在串行、并行系统上求解线性、非线性和特征问题,提供一

5、致的数值应用程序接口(APIs, Application Programming Interfaces)以方便数值软件协作。特别地,它已经被成功的移植到目前世界最快的计算机Roadrunner上。,AztecOO, Belos, Komplex,IFPACK, ML, CLAPS,Trilinos,Trilinos的应用,流体力学,如不可压缩湍流问题、线性可压缩流问题、三维海洋流的分叉性分析问题、与时间相关的热辐射传递问题、风洞流问题、大振幅稳态水波旋流问题等。 Gregory Larson et al., Application of single-level, pointwise alge

6、braic, and smoothed aggregation multigrid methods to direct numerical simulations of incompressible turbulent flows, Comput Visual Sci, 11(2008), 2740. H. C. Elman et al., A parallel block multi-level preconditioner for the 3D incompressible Navier-Stokes equations, Journal of Computational Physics,

7、 187 (2003), 504523. Howard Elman et al., A taxonomy and comparison of parallel block multi-level preconditioners for the incompressible Navier-Stokes equations, Journal of Computational Physics, 227 (2008), 17901808. Dave A. May and Louis Moresi, Preconditioned iterative methods for Stokes flow pro

8、blems arising in computational geodynamics, Physics of the Earth and Planetary Interiors, 171 (2008), 3347. David K. Gartling and Clark R. Dohrmann, Quadratic finite elements and incompressible viscous flows, Comput. Methods Appl. Mech. Engrg., 195 (2006), 16921708.,Trilinos的应用,电磁学 Peter Arbenz et a

9、l., On a parallel multilevel preconditioned Maxwell eigensolver, Parallel Computing, 32 (2006), 157165. T. Vejchodsky et al., Modular hp-FEM system HERMES and its application to Maxwells equations, Mathematics and Computers in Simulation, 76 (2007), 223228.半导体工艺技术,如共振隧穿二极管中的电子转移问题、具辐射损害性的双极型结型晶体管大尺度

10、瞬间灵敏度分析问题。 M. S. Lasater et al., Parallel Parameter Study of the Wigner- Poisson Equations for RTDs, Computers and Mathematics with Applications, 51 (2006), 1677- -1688. E. T. Phipps et al., Large-Scale Transient Sensitivity Analysis of a Radiation- Damaged Bipolar Junction Transistor via Automatic

11、Differentiation.,Trilinos的应用,医学,如心电学中心肌组织作用位的扩展问题。 L. Gerardo-Giorda et al., A model-based block-triangular preconditioner for the Bidomain system in electrocardiology, Journal of Computational Physics, 228 (2009), 36253639. 材料学,如表面压力下金属纳米线的共振性质问题、石英晶体的高频共振问题。 Harold S. Park and Patrick A. Klein, Su

12、rface stress effects on the resonant properties of metal nanowires: The importance of finite deformation kinematics and the impact of the residual surface stress, Journal of the Mechanics and Physics of Solids, 56 (2008), 31443166. Ji Wang et al., Parallel finite element analysis of high frequency v

13、ibrations of quartz crystal resonators on LINUX cluster, Acta Mechanica Solida Sinica, Vol. 21, No. 6, December, 2008.,Trilinos的应用,大气学,如海洋气候模型等。 Katherine J. Evans et al., A Scalable and Adaptable Solution Framework within Components of the Community Climate System Model, ICCS 2009, Part II, LNCS 55

14、45, pp. 332341, 2009. Arie de Niet et al., A tailored solver for bifurcation analysis of ocean-climate models, Journal of Computational Physics, 227 (2007), 654679.其它,如核物理学。 M. Rizea et al., Finite difference approach for the two-dimensional Schringer equation with application to scission-neutron em

15、ission, Computer Physics Communications, 179 (2008), 466478.,PETSc,可扩展可移植科学计算工具箱PETSc (Portable, Extensible Toolkit for Scientific Computation) 是美国能源部DOE2000支持开发的20多个ACTS工具箱之一,是由Argonne国家实验室开发的可移植可扩展科学计算工具箱,主要用于在分布式存储环境高效求解偏微分方程组及相关问题。PETSc所有消息传递通信均采用MPI标准实现。PETSc 包含许多并行线性和非线性方程求解器,这些求解器是使用C ,C+,For

16、tran77/90和现在的Python编写的,而且PETSc支持有助于有限差分方法的并行分布式阵列。PETSc用C语言开发,遵循面向对象设计的基本特征,用户基于PETSc对象可以灵活开发应用程序。PETSc支持Fortran 77/90、C和C+编写的串行和并行代码。 PETSc最新版本为Petsc-3.0.0。,PETSc接口,Chaco - a graph partitioning package. FFTW - Fastest Fourier Transform in the West, developed at MIT by Matteo Frigo and Steven G. Joh

17、nson. Hypre - the LLNL preconditioner library. MUMPS - MUltifrontal Massively Parallel sparse direct Solver. ParMeTiS - parallel graph partitioner pARMS - A Package for the Parallel Iterative Solution of General Large Sparse Linear System, by Zhongze Li and Yousef Saad. ScaLAPACK - Scalable LAPACK.

18、SPAI - for parallel sparse approximate inverse preconditioning. SPOOLES - SParse Object Oriented Linear Equations Solve developed by Cleve Ashcraft. SPRNG - The Scalable Parallel Random Number Generators Library. Sundial/CVODE - the LLNL SUite of Nonlinear and DIfferential/ALgebraic equation Solvers

19、. SuperLU, SuperLU_Dist - robust and efficient sequential and parallel direct sparse solves. Zoltan - Parallel Partitioning, Load Balancing and Data-Management Services.,PETSc结构,PETSc结构,TAO,TAO (The Toolkit for Advanced Optimization)是美国能源部DOE2000 支持开发的20 多个ACTS 工具箱之一,是2001年由Argonne 国家实验室开发的高级最优化工具箱。

20、TAO的核心开发人员是Argonne国家实验室数学与计算机科学部的Steve Benson ,Lois Curfman McInnes ,Jorge Mor,Jason Sarich等人。研发TAO的主要目的是在高性能机器上求解大规模最优化问题,采用面向对象的编程技术,充分利用底层工具箱所提供的支持(并行稀疏矩阵数据结构、预条件子、解法器等)。在此基础上进行开发,不必重写这些代码,可以提高开发效率,节省开发时间,目标是设计出移植性好、性能高、扩展性好、独立于体系结构的并行优化软件。,TAO,SLEPc,SLEPc(Scalable Library for Eigenvalue Problem

21、Computations) 由西班牙Politecnica de Valencia大学的高性能网络设计与计算小组的成员开发,主要负责人是Jose E. Roman and Andrs Toms。SLEPc是一个并行求解大规模稀疏矩阵特征问题的软件库。它建立在PETSc基础之上,从软件结构到语法标准都与PETSc完全一致,可以理解为PETSc的功能扩展。SLEPc提供了多个软件包的接口,其中包括ARPACK, BLZPACK, PLANSO, TRLAN等,这些软件包都是可选择安装的,并不影响SLEPc的使用。SLEPc全面支持Fortran语言、C语言以及C+,可以在绝大多数UNIX系统上运行

22、。,PETSc、TAO、SLEPc的应用,流体力学,如可压缩非粘性流问题、地下水或地表水的流体问题、粘弹流体流问题、维多利亚水螅水母引起的流体流动模拟、冰川的形变和流变等。 Mehmet Sahin and Helen J. Wilson, A semi-staggered dilation-free finite volume method for the numerical solution of viscoelastic fluid flows on all-hexahedral elements, J. Non-Newtonian Fluid Mech., 147 (2007), 79

23、91. C.M. Klaij et al., Pseudo-time stepping methods for space-time discontinuous Galerkin discretizations of the compressible Navier-Stokes equations, Journal of Computational Physics, 219 (2006), 622643. Laslo T. Diosady and David L. Darmofal, Preconditioning methods for discontinuous Galerkin solu

24、tions of the Navier-Stokes equations, Journal of Computational Physics, 228 (2009), 39173935. Feng-Nan Hwang and Xiao-Chuan Cai, A parallel nonlinear additive Schwarz preconditioned inexact Newton algorithm for incompressible Navier-Stokes equations, Journal of Computational Physics, 204 (2005), 666

25、691.,PETSc、TAO、SLEPc的应用,医学,如三维超声心电图的研究、三维心肌图像恢复模拟问题、脑模型、计算生物学。 L. Carracciuolo et al., Towards a parallel component for imaging in PETSc programming environment: A case study in 3-D echocardiography, Parallel Computing, 32 (2006), 6783. P. Colli Franzone et al., Simulating patterns of excitation, re

26、polarization and action potential duration with cardiac Bidomain and Monodomain models, Mathematical Biosciences, 197 (2005), 3566. Prashanth Dumpuri et al., An atlas-based method to compensate for brain shift: Preliminary results, Medical Image Analysis, 11 (2007), 128145. Joe Pitt-Francis et al.,

27、Chaste: A test-driven approach to software development for biological modeling, Computer Physics Communications, 40th Anniversary Issue.,PETSc、TAO、SLEPc的应用,动力学,如地球动力学模拟、烟囱中由热化学对流引起的灰尘定向凝固模拟、回转动力学粒子模拟、在微流控芯片中粒子流动和运动现象的电动学模拟、化学工程中的分子动力学模拟、Bose Hubbard 模型(气态BoseEinstein冷凝物动力学)、磁流体动力学等。 R.F. Katz et al.

28、, Numerical simulation of geodynamic processes with the Portable Extensible Toolkit for Scientific Computation, Physics of the Earth and Planetary Interiors, 163 (2007), 5268. 烟囱: Richard F. Katz and M. Grae Worster, Simulation of directional solidification, thermochemical convection, and chimney fo

29、rmation in a Hele-Shaw cell, Journal of Computational Physics, 227 (2008), 98239840. Y. Nishimura et al., A finite element Poisson solver for gyrokinetic particle simulations in a global field aligned mesh, Journal of Computational Physics, 214 (2006), 657671.,Hypre,高性能预条件子Hypre(High Performance Pre

30、conditioners)由美国加州大学(UC)和劳伦斯-利弗莫尔国家实验室(LLNL)应用科学计算中心(CASC)开发。开发Hypre软件包的动机起因于美国能源部LLNL在研究国防、环境、能源和生物科学中的物理现象时开发的一些模拟代码。该软件包主要用于大规模并行计算机上求解大型稀疏线性方程组,主要目的是为用户提供高级并行预条件子。Hypre具有功能强大性、易用性、适应性和互动性等特点。,Hypre,Hypre,Hypre,流体力学,如地下储水层复杂流模拟、正压大气模型(天气预测)、大气、海洋模型、可变粘性Stokes流问题等。 Eric Chnier et al, A collocated

31、finite volume scheme to solve free convection for general non-conforming grids, Journal of Computational Physics, 228 (2009), 22962311. C. Burstedde et al., Parallel scalable adjoint-based adaptive solution of variable-viscosity Stokes flow problems, Comput. Methods Appl. Mech. Engrg., 198 (2009), 1

32、6911700. M. Oevermann et al, A sharp interface finite volume method for elliptic equations on Cartesian grids, Journal of Computational Physics, 228 (2009), 51845206.,Hypre,动力学,如水动力学、生物流体动力学(如血流动力学、肌肉壁和心瓣的弹性结构动力学)、低磁雷诺数下的自由表面流的磁流体动力学等。 Boyce E. Griffith et al., An adaptive, formally second order acc

33、urate version of the immersed boundary method, Journal of Computational Physics, 223 (2007), 1049. 其他,如电离辐射的传输问题、中性粒子传输模型、具有限单元矩阵的核空间的计算问题等。 P. N. Brown et al., Fully implicit solution of large-scale non-equilibrium radiation diffusion with high order time integration, Journal of Computational Physi

34、cs, 204 (2005), 760783.,SUNDIALS,SUNDIALS (Suite of Nonlinear and Differential/Algebraic Equation Solvers) 由LLNL(Lawrence Livermore National Laboratory)中的CASC(Center for Applied Scientific Computing)开发。SUNDIALS提供了鲁棒的时间积分和非线性求解器,主要适用于求解非线性微分/代数方程。SUNDIALS 基于标准C 语言开发,由串行/并行常微分方程初值问题求解器CVODE/PVODE,CVOD

35、E 的扩展CVODES、非线性代数方程求解器KINSOL和微分代数方程初值问题求解器IDA等多个子包组成。SUNDIALS的这四个解法器均提供串行和并行版本。2009 年5月发布了SUNDIALS当前最新的版本2.4.0。,SUNDIALS,SUNDIALS,CVODE,CVODES,IDAS,IDA,KINSOL,SUNDIALS,工业生产,如钠制冷快速反应器的研究、泡沫流化床反应器的研究、氢气甲醛混合物的催化氧化模拟、甲烷空气混合物的催化氧化模拟、热力层作用下自燃现象的研究、灵敏度分析等。 Mihai Alexe and Adrian Sandu, Forward and adjoint

36、sensitivity analysis with continuous explicit Runge-Kutta schemes, Applied Mathematics and Computation, 208 (2009), 328346. Haihua Zhao et al., Improving SFR economics through innovations from thermal design and analysis aspects, Nuclear Engineering and Design, 239 (2009), 10421055. B.D. Dudson et a

37、l., BOUT+: A framework for parallel plasma fluid simulations, Computer Physics Communications, 180 (2009), 14671480.,SUNDIALS,生物学,如软组织力学、心脏动力学、红细胞新陈代谢作用研究、人脑中各项异性扩散模拟等。 Bjrn Hald et al., Quantitative evaluation of respiration induced metabolic oscillations in erythrocytes, Biophysical Chemistry, 141

38、 (2009), 4148. Ning Kang et al., Performance of ILU preconditioning techniques in simulating anisotropic diffusion in the human brain, Future Generation Computer Systems, 20 (2004), 687698. Joe Pitt-Francis et al., Chaste: A test-driven approach to software development for biological modeling, Computer Physics Communications, 40th Anniversary Issue.,谢 谢,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教学课件 > 综合培训

copyright@ 2008-2019 麦多课文库(www.mydoc123.com)网站版权所有
备案/许可证编号:苏ICP备17064731号-1