首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 625 毫秒
1.
一种DSMC方法的并行策略   总被引:1,自引:1,他引:0  
黄飞  苗文博  程晓丽  沈清 《航空学报》2014,35(4):968-974
为提高直接模拟蒙特卡罗(DSMC)仿真模拟的并行计算效率,基于消息传递接口(MPI)的并行环境,通过对比分析主从模式及对等模式两种程序设计模式下的并行效率,探讨了对等模式下非结构网格DSMC并行程序实现的关键技术及实施途径。提出了一种非结构网格下动态负载平衡DSMC仿真模拟的并行策略,设计了基于对等模式动态负载平衡的DSMC并行算法。最后以钝锥外形的高超声速绕流问题进行仿真模拟,验证本文并行算法的有效性,结果表明,本文设计的基于对等模式动态负载平衡的DSMC并行算法能够以高效的并行效率给出合理的结果。  相似文献   

2.
基于PC-CLUSTER群机并行体系结构与消息传递库MPI并行环境,研究了二维非结构网格DSMC并行算法。提出一类非结构网格动态分区策略,保证各子区域的分子数量大致相等,实现计算进程间的动态负载平衡。利用MPI库函数构造了符合DSMC并行原理的单步通讯法。采用单控制多数据流(SPMD)以及Master/Slave并行模式,设计了二维非结构网格DSMC整体并行算法。在程序的编制过程中,充分展现了Fortran90高级语言的主要特性,引人动态数组、指针、链表及派生类型数据。最后对过渡流域高超声速绕流进行了并行计算,数值试验的结果表明本文设计的并行算法可以取得较为理想的加速比。  相似文献   

3.
本文介绍了采用MPI技术,基于Linux工作站机群并行CFD平台设计与实现的方法及关键技术。通过对典型CFD并行计算程序的数值试验,给出了由四台PC机组成的工作站机群的并行性能评测。  相似文献   

4.
隐格式并行求解是计算流体力学并行算法研究的难点,本文针对分布式存储并行处理系统,在异构编程PVM环境下,采用"局部隐"方法,使用发送/接收数据结构和自动剖分等技术,有效地实现了对飞行器亚跨超声速流气动力数值模拟串行程序的并行化改造,保证了并行计算结果与串行结果的一致性.该方法具有简单实用、并行效率高以及并行程序可移植性好和应用前景广泛等特点.  相似文献   

5.
针对SMP机群的双层并行体系结构,研制出一种双层并行技术--在计算节点间采用MPI消息传递模式并行,而在计算节点内部采用OpenMP编译器指令模式并行.通过算例测试证明,采用该技术的航空CFD程序,并结合贪婪负载平衡分配技术进行并行计算,其效率可达94%,计算结果与实验值吻合.  相似文献   

6.
基于串行网格划分软件METIS与并行化消息传递编程接口( MPICH2)对现有串行自适应程序进行简单的并行化改造,给出了一种三维可压缩无粘流数值模拟的并行自适应方法。首先利用单个进程调用METIS,串行划分网格;然后对所有进程并行计算以获得初始网格下的流场解;再次利用单个进程对整个流场运用自适应方法进行局部网格加密并调用METIS串行划分网格;最后全部进程在流场初始解的基础上继续并行计算,以获得自适应网格下的流场解。数值模拟算例验证了此方法的可靠性与高效性。  相似文献   

7.
战术导弹绕流流场并行计算   总被引:1,自引:0,他引:1  
本文采用求解NS方程的方法对战术导弹的流场进行了数值模拟.应用区域分割技术和拼接网格的并行策略,发展了一种适合于分布式存贮并行环境的隐式有限体积并行算法,在PVM并行环境下,对战术导弹绕流流场实现了单块网格多机并行计算和多块网格多机并行计算,通过负载平衡等方法得到了较高的加速比.计算结果表明并行计算结果与串行计算结果完全一致.  相似文献   

8.
基于集群系统(CLUSTER),在Linux和MPI并行环境下,研究了带制退器的复杂膛口流场三维数值模拟并行算法。计算网格是三维多区结构化网格,数值格式采用Jameson格式及LU隐式分解方法。针对流场的复杂拓扑结构,建立分区信息文件记录各分区的相关信息,并提出了通过合并相邻网格分区的方法均衡各个进程的负载,提高程序的并行效率。在处理需要通讯的信息时,设计了自定义数据类型和"设置中间参数"相结合的方法,并通过动态分配内存减少了程序对计算机系统资源的占用。数值实验表明,本文设计的算法可以适应拓扑结构较复杂的流场,并能取得理想的并行效率,将有助于制退器性能的研究。  相似文献   

9.
采用基于MPI(消息传递库)的并行算法,在贴体网格下对带V形槽稳定器模型加力燃烧室紊流化学反应流场进行数值模拟,湍流模型采用k方程亚网格尺度模型,燃烧模型采用亚网格EBU模型,采用热通量辐射模型估算辐射通量。在程序设计中,采用动态内存分配、分区算法和多点重合交错网格系统,并行计算的结果与单机运行结果的对比表明计算结果是正确的,可以明显的提高运算效率,是解决复杂燃烧流动大规模数值模拟的有效手段。   相似文献   

10.
赖剑奇  李桦  张冉  常青 《航空学报》2018,39(9):121944-121953
为实现可压缩流问题的大规模高效数值求解,开展基于图形处理单元(GPU)的并行计算研究。在NVIDIA GTX 1070上建立了基于消息传递接口+统一计算设备架构(MPI+CUDA)的多GPU并行可压缩流求解器,该求解器基于结构网格有限体积法,空间离散采用AUSM+UP格式。采用一维区域分解法对计算网格进行划分,使得各GPU之间达到负载平衡。针对超声速进气道算例,对算法单GPU并行性能和多GPU可扩展性能进行分析。数值结果显示,单GPU并行计算可以获得37~46倍的加速比,极大地提高了计算效率;4块GPU并行计算加速比从47倍增加到143倍,并行效率维持在70%以上,说明并行算法具有良好的可扩展性。  相似文献   

11.
MPI环境下并行程序准确性验证及效率分析   总被引:1,自引:0,他引:1  
江小松  刘建军 《航空动力学报》2007,22(12):2043-2049
把已有的串行数值模拟程序改编成消息传递接口(MPI)下并行环境的并行数值模拟程序,模拟了基于NASA-TP1680单级透平的4种不同组合的流场,验证了并行程序的有效性和较好的并行效率.同时,分析了影响并行效率的主要因素.   相似文献   

12.
多块网格网络并行计算中的负载分配研究   总被引:2,自引:0,他引:2  
针对CFD中多块网格计算的特点,并使用MPI网络并行系统,对某战斗机绕流进行了基于三维Euler方程的并行计算,主要研究了多块网格并行计算中负载的分配方法,发展了负载自动分配和网格自动重分区程序,计算结果表明:并行计算结果和实验结果完全吻合,8个节点机的并行效率达到了89%。  相似文献   

13.
当机载/弹载雷达工作在前视状态时,由于成像场景内不同角度处目标的多普勒差异很小,很难得到 高的角度分辨率。针对海面舰船目标的前视成像应用,利用成像区域具有明显稀疏性的特点,提出一种基于复 近似消息传递压缩感知处理的前视成像角度分辨率增强算法,建立前视成像的线性观测信号模型,给出复近似 消息传递的迭代计算过程,以及多通道雷达前视成像的处理流程。通过仿真数据和 X 波段雷达实测数据的处 理结果验证了该方法的有效性。  相似文献   

14.
介绍了Windows系统钩子及其运行机制,在Delphi编程环境中利用WH_CALLWNDPROC系统钩子,给出了对特定窗体的创建和销毁消息进行截获和处理的具体实现方法,解决了在受控软件源代码未知的情况下对其实施外围监控的问题。该种方法可应用于软件运行状态监控、IE广告过滤软件助手制作等领域。  相似文献   

15.
以圆管构型的声传播为分析对象,研究了基于图形处理器GPU的计算气动声学(Computational Aeroacous-tics,CAA)高阶有限差分算法的并行实现,并与CPU串行及MPI并行实现作了对比分析。首先介绍了管道简化模型的2.5维线化欧拉方程和GPU的编程模式以及调优参考准则,然后给出了相关物理量的空间离散方法的GPU实现。数值实验的结果表明,与CPU串行及MPI并行程序的结果相比,使用GPU的程序实现在达到与MPI并行同样的计算效率时,可以使用更少的计算资源。较之cluster上串行算法,工作站上GPU并行算法在使用不同网格规模的情况下可达到的3倍多的加速比。  相似文献   

16.
MPI+OpenMP算法在三维可压缩流场计算中的应用   总被引:1,自引:0,他引:1  
在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Slave模式。通过对M6机翼和某弹丸采用多种并行方法进行流场的数值模拟,得出MPI+OpenMP混合算法在一定条件下具有高效性的结论。  相似文献   

17.
《中国航空学报》2020,33(5):1392-1404
An efficient MPI/OpenMP hybrid parallel Radial Basis Function (RBF) strategy for both continuous and discontinuous large-scale mesh deformation is proposed to reduce the computational cost and memory consumption. Unlike the conventional parallel methods in which all processors use the same surface displacement and implement the same operation, the present method employs different surface points sets and influence radius for each volume point movement, accompanied with efficient geometry searching strategy. The deformed surface points, also called Control Points (CPs), are stored in each processor. The displacement of spatial points is interpolated by using only 20–50 nearest control points, and the local influence radius is set to 5–20 times the maximum displacement of control points. To shorten the searching time for the nearest control point clouds, an Alternating Digital Tree (ADT) algorithm for 3D complex geometry is designed based on an iterative bisection technique. Besides, an MPI/OpenMP hybrid parallel approach is developed to reduce the memory cost in each High-Performance Computing (HPC) node for large-scale applications. Three 3D cases, including the ONERA-M6 wing and a commercial transport airplane standard model with up to 2.5 billion hybrid elements, are used to test the present mesh deformation method. The robustness and high parallel efficiency are demonstrated by a wing deflection case with a maximum bending angle of 45° and more than 80% parallel efficiency with 1024 MPI processors. In addition, the availability for both continuous and discontinuous surface deformation is verified by interpolating the projecting displacement with opposite directions surface points to the spatial points.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号