共查询到17条相似文献,搜索用时 625 毫秒
1.
一种DSMC方法的并行策略 总被引:1,自引:1,他引:0
为提高直接模拟蒙特卡罗(DSMC)仿真模拟的并行计算效率,基于消息传递接口(MPI)的并行环境,通过对比分析主从模式及对等模式两种程序设计模式下的并行效率,探讨了对等模式下非结构网格DSMC并行程序实现的关键技术及实施途径。提出了一种非结构网格下动态负载平衡DSMC仿真模拟的并行策略,设计了基于对等模式动态负载平衡的DSMC并行算法。最后以钝锥外形的高超声速绕流问题进行仿真模拟,验证本文并行算法的有效性,结果表明,本文设计的基于对等模式动态负载平衡的DSMC并行算法能够以高效的并行效率给出合理的结果。 相似文献
2.
基于PC-CLUSTER群机并行体系结构与消息传递库MPI并行环境,研究了二维非结构网格DSMC并行算法。提出一类非结构网格动态分区策略,保证各子区域的分子数量大致相等,实现计算进程间的动态负载平衡。利用MPI库函数构造了符合DSMC并行原理的单步通讯法。采用单控制多数据流(SPMD)以及Master/Slave并行模式,设计了二维非结构网格DSMC整体并行算法。在程序的编制过程中,充分展现了Fortran90高级语言的主要特性,引人动态数组、指针、链表及派生类型数据。最后对过渡流域高超声速绕流进行了并行计算,数值试验的结果表明本文设计的并行算法可以取得较为理想的加速比。 相似文献
3.
本文介绍了采用MPI技术,基于Linux工作站机群并行CFD平台设计与实现的方法及关键技术。通过对典型CFD并行计算程序的数值试验,给出了由四台PC机组成的工作站机群的并行性能评测。 相似文献
4.
隐格式并行求解是计算流体力学并行算法研究的难点,本文针对分布式存储并行处理系统,在异构编程PVM环境下,采用"局部隐"方法,使用发送/接收数据结构和自动剖分等技术,有效地实现了对飞行器亚跨超声速流气动力数值模拟串行程序的并行化改造,保证了并行计算结果与串行结果的一致性.该方法具有简单实用、并行效率高以及并行程序可移植性好和应用前景广泛等特点. 相似文献
5.
6.
基于串行网格划分软件METIS与并行化消息传递编程接口( MPICH2)对现有串行自适应程序进行简单的并行化改造,给出了一种三维可压缩无粘流数值模拟的并行自适应方法。首先利用单个进程调用METIS,串行划分网格;然后对所有进程并行计算以获得初始网格下的流场解;再次利用单个进程对整个流场运用自适应方法进行局部网格加密并调用METIS串行划分网格;最后全部进程在流场初始解的基础上继续并行计算,以获得自适应网格下的流场解。数值模拟算例验证了此方法的可靠性与高效性。 相似文献
7.
8.
基于集群系统(CLUSTER),在Linux和MPI并行环境下,研究了带制退器的复杂膛口流场三维数值模拟并行算法。计算网格是三维多区结构化网格,数值格式采用Jameson格式及LU隐式分解方法。针对流场的复杂拓扑结构,建立分区信息文件记录各分区的相关信息,并提出了通过合并相邻网格分区的方法均衡各个进程的负载,提高程序的并行效率。在处理需要通讯的信息时,设计了自定义数据类型和"设置中间参数"相结合的方法,并通过动态分配内存减少了程序对计算机系统资源的占用。数值实验表明,本文设计的算法可以适应拓扑结构较复杂的流场,并能取得理想的并行效率,将有助于制退器性能的研究。 相似文献
9.
10.
为实现可压缩流问题的大规模高效数值求解,开展基于图形处理单元(GPU)的并行计算研究。在NVIDIA GTX 1070上建立了基于消息传递接口+统一计算设备架构(MPI+CUDA)的多GPU并行可压缩流求解器,该求解器基于结构网格有限体积法,空间离散采用AUSM+UP格式。采用一维区域分解法对计算网格进行划分,使得各GPU之间达到负载平衡。针对超声速进气道算例,对算法单GPU并行性能和多GPU可扩展性能进行分析。数值结果显示,单GPU并行计算可以获得37~46倍的加速比,极大地提高了计算效率;4块GPU并行计算加速比从47倍增加到143倍,并行效率维持在70%以上,说明并行算法具有良好的可扩展性。 相似文献
11.
MPI环境下并行程序准确性验证及效率分析 总被引:1,自引:0,他引:1
把已有的串行数值模拟程序改编成消息传递接口(MPI)下并行环境的并行数值模拟程序,模拟了基于NASA-TP1680单级透平的4种不同组合的流场,验证了并行程序的有效性和较好的并行效率.同时,分析了影响并行效率的主要因素. 相似文献
12.
13.
14.
介绍了Windows系统钩子及其运行机制,在Delphi编程环境中利用WH_CALLWNDPROC系统钩子,给出了对特定窗体的创建和销毁消息进行截获和处理的具体实现方法,解决了在受控软件源代码未知的情况下对其实施外围监控的问题。该种方法可应用于软件运行状态监控、IE广告过滤软件助手制作等领域。 相似文献
15.
以圆管构型的声传播为分析对象,研究了基于图形处理器GPU的计算气动声学(Computational Aeroacous-tics,CAA)高阶有限差分算法的并行实现,并与CPU串行及MPI并行实现作了对比分析。首先介绍了管道简化模型的2.5维线化欧拉方程和GPU的编程模式以及调优参考准则,然后给出了相关物理量的空间离散方法的GPU实现。数值实验的结果表明,与CPU串行及MPI并行程序的结果相比,使用GPU的程序实现在达到与MPI并行同样的计算效率时,可以使用更少的计算资源。较之cluster上串行算法,工作站上GPU并行算法在使用不同网格规模的情况下可达到的3倍多的加速比。 相似文献
16.
17.
《中国航空学报》2020,33(5):1392-1404
An efficient MPI/OpenMP hybrid parallel Radial Basis Function (RBF) strategy for both continuous and discontinuous large-scale mesh deformation is proposed to reduce the computational cost and memory consumption. Unlike the conventional parallel methods in which all processors use the same surface displacement and implement the same operation, the present method employs different surface points sets and influence radius for each volume point movement, accompanied with efficient geometry searching strategy. The deformed surface points, also called Control Points (CPs), are stored in each processor. The displacement of spatial points is interpolated by using only 20–50 nearest control points, and the local influence radius is set to 5–20 times the maximum displacement of control points. To shorten the searching time for the nearest control point clouds, an Alternating Digital Tree (ADT) algorithm for 3D complex geometry is designed based on an iterative bisection technique. Besides, an MPI/OpenMP hybrid parallel approach is developed to reduce the memory cost in each High-Performance Computing (HPC) node for large-scale applications. Three 3D cases, including the ONERA-M6 wing and a commercial transport airplane standard model with up to 2.5 billion hybrid elements, are used to test the present mesh deformation method. The robustness and high parallel efficiency are demonstrated by a wing deflection case with a maximum bending angle of 45° and more than 80% parallel efficiency with 1024 MPI processors. In addition, the availability for both continuous and discontinuous surface deformation is verified by interpolating the projecting displacement with opposite directions surface points to the spatial points. 相似文献