共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
以圆管构型的声传播为分析对象,研究了基于图形处理器GPU的计算气动声学(Computational Aeroacous-tics,CAA)高阶有限差分算法的并行实现,并与CPU串行及MPI并行实现作了对比分析。首先介绍了管道简化模型的2.5维线化欧拉方程和GPU的编程模式以及调优参考准则,然后给出了相关物理量的空间离散方法的GPU实现。数值实验的结果表明,与CPU串行及MPI并行程序的结果相比,使用GPU的程序实现在达到与MPI并行同样的计算效率时,可以使用更少的计算资源。较之cluster上串行算法,工作站上GPU并行算法在使用不同网格规模的情况下可达到的3倍多的加速比。 相似文献
5.
传统有限元串行计算技术耗时长、效率低,已远远不能满足工程实践需要。通过分析串行计算的耗时分布、程序可并行性及数据相关性,在保持串行程序不变的基础上,采用基于多线程的OpenMP技术实现单元刚度矩阵形成总体刚度矩阵的程序并行化。针对有限元计算机翼实例进行了不同线程数目下并行加速比的研究,结果表明,OpenMP技术可有效提高有限元计算效率,且存在一个最佳的线程数,使得并行加速比达到最大,此外加速比还与问题的计算量等因素有关。 相似文献
6.
<正> 1.引言 为提高跨音速差分计算效率,人们在计算格式的设计、改进方面做了大量的工作,并取得了可喜的成就。并行计算机的出现和发展,使我们有可能进一步提高计算效率。第9期阂赛金等:旋成体零攻角纵向大扰动势流的人F一2迭代及其并行算法A弓n因为并行处理机具有处理数据能力强、计算效益高的特点,但这种机器必须结合具体问题和机器特点加以考虑才能发挥其优势。目前,利用我国设计的“YH一1”(“银河一1”)亿次并行处理机,开展跨音速差分计算的并行算法研究具有理论和运用上的重要意义 相似文献
7.
8.
本文给出了二维紊流射流掺混流场的有限差分数值计算方法。用这种方法可以计算等截面和变截面二维(平面的和轴对称的)可压缩紊流射流掺混的流场分布。本方法已经用FORTRAN算法语言编制成计算程序,在FELIX C-256电子计算机上进行运算。通过算例和实验结果表明,本文提供的方法是可行的。 相似文献
9.
隐格式并行求解是计算流体力学并行算法研究的难点,本文针对分布式存储并行处理系统,在异构编程PVM环境下,采用"局部隐"方法,使用发送/接收数据结构和自动剖分等技术,有效地实现了对飞行器亚跨超声速流气动力数值模拟串行程序的并行化改造,保证了并行计算结果与串行结果的一致性.该方法具有简单实用、并行效率高以及并行程序可移植性好和应用前景广泛等特点. 相似文献
10.
11.
12.
13.
14.
MPI环境下并行程序准确性验证及效率分析 总被引:1,自引:0,他引:1
把已有的串行数值模拟程序改编成消息传递接口(MPI)下并行环境的并行数值模拟程序,模拟了基于NASA-TP1680单级透平的4种不同组合的流场,验证了并行程序的有效性和较好的并行效率.同时,分析了影响并行效率的主要因素. 相似文献
15.
16.
GPU平台上的叶轮机械CFD加速计算 总被引:2,自引:1,他引:1
通过数据并行的方式对一个成熟的叶轮机多块网格气动计算程序(MAP)进行了并行化处理,利用计算统一设备架构(CUDA)技术实现了在图形处理单元(GPU)上的并行计算.保留了原程序中的2阶空间迎风格式和隐式时间离散格式,并采用了隐式迭代对线性系统进行求解.经过2个叶轮机械算例的测试,与在传统的中央处理器(CPU)上运行的原程序相比,在计算结果完全一致的前提下,单GPU的计算速度最高可达单CPU计算速度的8.89倍,与四核并行的CPU计算相比可以得到2.39倍的加速. 相似文献
17.
18.
《载人航天》2020,(4)
针对天宫一号目标飞行器无控飞行轨道衰降数值预报需要快速确定轨道积分高精度计算模型中的空气动力,在发展基于修正Boettcher/Legge非对称桥函数的天宫一号空气动力特性当地化算法基础上,对当地化算法的运算流程及对应程序代码进行了整体分析,根据原程序热点代码集中、数据独立性强及传输需求少等特点,发展了多核处理单元的并行优化方法。引入CUDA架构的GPU设备同时,开展了系统、算法以及语句三个层次的并行优化,设计了GPU内存对齐访问方案,使用数据传输函数,将算法求解部分内循环经过展开与合并,整理为整体移植入核函数的一个循环,利用GPU较强的并行计算能力提升运算效率,对函数、循环、指令等代码语句进行级别优化。使用设计的并行计算方案对类天宫飞行器空气动力特性当地化串行算法程序进行CPU+GPU移植优化,达到了近5倍的并行加速比,且使单次求解中GPU数据传输时间缩减为原来的23%,证实了并行方案和优化设计手段的高效实用性。在类天宫飞行器空气动力特性GPU并行算法程序验证基础上,使用GPU并行程序对天宫飞行器轨道衰降飞行340~120 km过程的气动特性进行了不同迎角、侧滑角等飞行姿态计算分析,提供了大量可供轨道飞行力学数值预报的空气动力计算数据。 相似文献
19.
给出了一种适用于混合网格的并行无矩阵GMRES+LU-SGS隐式时间格式。首先采用LU-SGS方法迭代若干步以获得一个合适的初场,然后切换到GMRES方法在每一时间步内近似求解,并将LU-SGS方法作为其预处理器。为加速收敛,将CFL数随着残差的降低逐步放大;为减少存储量和计算量,通量Jacobian采用无矩阵处理。在保证与串行执行一致的前提下,采用基于共享内存的OpenMP方法实现了并行计算,并通过对网格的分组避免了内存争夺。算例验证表明,方法极大地提高了计算收敛效率,并行结果与串行结果完全一致,计算结果与实验结果吻合较好。 相似文献
20.
分析讨论了快速傅里叶变换(FFT)的算法结构,基于FFT运算特点,给出了一种采用现场可编程门阵列(FPGA)实现FFT运算的新方案。该方案采用基2算法及单元结构的设计思路,计算单元采用流水与并行结合的结构,加快了运算速度,内部接收单元采用乒乓RAM结构,扩大了数据吞吐量。MAX plusⅡ环境下的时序分析结果与基于Matlab的理论计算相一致,说明了方案设计的正确性。FPGA与FFT的结合将大幅度提高FFT的处理速度,扩大了FFT的应用领域。 相似文献