首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 250 毫秒
1.
GPU平台上的叶轮机械CFD加速计算   总被引:1,自引:1,他引:1  
通过数据并行的方式对一个成熟的叶轮机多块网格气动计算程序(MAP)进行了并行化处理,利用计算统一设备架构(CUDA)技术实现了在图形处理单元(GPU)上的并行计算.保留了原程序中的2阶空间迎风格式和隐式时间离散格式,并采用了隐式迭代对线性系统进行求解.经过2个叶轮机械算例的测试,与在传统的中央处理器(CPU)上运行的原程序相比,在计算结果完全一致的前提下,单GPU的计算速度最高可达单CPU计算速度的8.89倍,与四核并行的CPU计算相比可以得到2.39倍的加速.  相似文献   

2.
赖剑奇  李桦  张冉  常青 《航空学报》2018,39(9):121944-121953
为实现可压缩流问题的大规模高效数值求解,开展基于图形处理单元(GPU)的并行计算研究。在NVIDIA GTX 1070上建立了基于消息传递接口+统一计算设备架构(MPI+CUDA)的多GPU并行可压缩流求解器,该求解器基于结构网格有限体积法,空间离散采用AUSM+UP格式。采用一维区域分解法对计算网格进行划分,使得各GPU之间达到负载平衡。针对超声速进气道算例,对算法单GPU并行性能和多GPU可扩展性能进行分析。数值结果显示,单GPU并行计算可以获得37~46倍的加速比,极大地提高了计算效率;4块GPU并行计算加速比从47倍增加到143倍,并行效率维持在70%以上,说明并行算法具有良好的可扩展性。  相似文献   

3.
本文采用时间相关法和隐式推进迭代方法求解了绕HERMES外形高超声速无粘流动。将抛物型方程和代数方程相结合生成计算网格,既节省了网格生成的时间,又能得到较合理的网格分布。在时间相关法计算中,采用了显式NND格式;在隐式推进迭代计算中,采用了推广的隐式NND格式。  相似文献   

4.
为克服动能BGK格式计算耗时多、收敛慢的缺点,在格式中引入当地时间步长、隐式LU-SGS方法和多重网格技术,基于RAE2822翼型粘性跨声速绕流的数值模拟,对其收敛性的改善进行了研究。结果表明:上述3种加速手段对求解定常问题时的收敛性有明显的改善,达到定常解所需的迭代步数随着CFL数的提高而减少;因而求解某类问题时,隐式格式比显式格式更具优势;多重网格既适用于显式格式,也适用于隐式格式,加速性更加突出。  相似文献   

5.
p型多重网格间断Galekin有限元方法研究   总被引:1,自引:0,他引:1  
在二维非结构网格上,使用p型多重网格间断Galerkin方法求解定常可压缩欧拉方程。p型多重网格方法主要特征是通过对不同阶次多项式的近似解进行递归迭代求解。文中高阶近似(p0)上使用显式格式,在最低阶近似(p=0)上选用隐式格式,而非显式格式,从而在保证精度和占用较小内存的情况下加速收敛到定常解。运用该方法对NACA0012跨音速无粘流动进行数值模拟,数值结果表明:p型多重网格方法同单重显式Runge-Kutta方法相比,收敛速度能够提高6倍左右,并且精度保持不变。  相似文献   

6.
为了提高间断伽辽金(discontinuous Galerkin, DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit, GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel, LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture, CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得...  相似文献   

7.
DG方法是一种非常具有潜力的高精度方法,但其在对复杂外形的数值模拟方面仍存在内存需求量大、计算量巨大等不足.为了进一步提高DG方法求解Euler方程的效率,在传统p型多重网格的基础上,结合LU-SGS和GMRES两种隐式迭代方法,研究其整体加速性能.p型多重网格方法通过对不同阶次多项式近似解进行递归迭代求解,来达到加速收敛的目的.高阶近似(p>0)使用显式龙格库塔格式,最低阶近似(p=0)使用隐式格式.对NACA0012翼型和ONERA M6机翼跨音速无粘流动进行数值模拟,结果表明:与显式TVD-RKDG时间格式相比,DG(p0)层上采用LU-SGS和GMRES的p型多重网格方法收敛速度均得到明显提高,且GMRES迭代法性能最佳,LU-SGS迭代法次之.  相似文献   

8.
许多非定常无粘流体力学问题的数值模拟都需要利用Euler方程组来进行计算,而由于在隐格式下,所选取的时间步长可以比在显格式下时大得多,所以隐格式越来越受到重视,其中隐式LU分解是最常用的方法之一。对三维Euler方程组,采用隐式LU分解进行计算时,网格点所在的各个对角阵面之间存在数据依赖关系,本文分析了采用区域分解且边界上用显格式代替隐格式进行计算的高效性,在长方体建筑物内的爆炸模拟表明,在有112个CPU的某MPP巨型机上,并行计算效率超过60%。本文还分析了计算结果与串行计算时的差异,以及利用区域重叠减小这种差异的方法,同时考虑了对处理器进行合理的逻辑组织,将计算网格映射到处理器网格,以最大限度减少通信开销的方法。文中最后以一个爆炸毁伤的例子实际说明了所述方法的可行性与高效性。  相似文献   

9.
许侃  高正红  傅林 《航空计算技术》2013,43(2):91-94,98
将三维可压缩Navier-Stokes方程求解器LMNS3D移植至GPU平台,研究了显式和隐式两种时间推进方法下利用GPU加速的策略与效果。其中显式方法采用五步Runge-Kutta法;隐式方法中由于LU-SGS算法数据依赖性强,不适于并行计算,因而采用了DP-LUR方法。测试表明,程序在双精度下可取得与原CPU代码一致的运算结果,并可获得约20x(RK)与15x(DP-LUR)的加速效果。  相似文献   

10.
本文发展了二维非定常不可压N-S方程的局部网格加密方法(LMR):需加密区域预先指定;仅对空间方向加密,分粗细二层网格,细网格覆盖在粗网格上;粗和细网格上分别用显式和隐式差分格式。结合压力修正法类的余量型差分格式,恰当地处理了粗细网格之间的信息传递,使得粗细网格交接面上质量守恒,即满足连续性条件。粗网格通过插值给细网格边界值影响细网格;细网格通过粗细网格压力Poisson方程耦合求解影响粗网格,并且由于压力Poisson方程从动量方程形成,在细网格覆盖下的粗网格上,压力Poisson方程是细网格方程的组合,从而耦合求解时粗细网格压力Poisson方程不需迭代。 本文中计算了二维方腔内的自然对流模型问题,Rayleigh数是10~6。粗网格用显式ULWC格式,细网格用隐式余量型近似因式分解格式。Poisson方程用快速直接算法PO1STG(在FISHPACK中)。粗网格距△=1/16,细网格距△=1/64,加密1/4区域,计算到定常局部网格加密方法所需CPU时间比同等均匀网格(△=1/64)节约一倍以上。  相似文献   

11.
董海涛  刘丁松 《航空学报》2015,36(7):2186-2196
提出的虚拟黏性法是一种关于Navier-Stokes方程黏性项(黏性应力项和传热项)的隐式新方法。通过引入虚拟时间和虚拟黏性项,将隐式格式的构造大大简化,从而避免了大型复杂隐式差分方程组的常规求解。在虚拟时间推进过程中所需求解的方程组的系数矩阵是一个三对角矩阵,它具有计算简单且计算量小的优点。用模型方程和Navier-Stokes方程进行了数值仿真,研究各种参数对计算的影响,并在精度和效率上与显式方法进行比较,证实了算法的正确性和优势。最后分析了本文格式的适用范围。  相似文献   

12.
周旭  何洪庆 《推进技术》1993,14(2):8-14
采用适用于多层复合结构的当量热容瞬态热传导方程,通过坐标变换解决多个移动边界问题,用ADI方法推导了二维隐式求解格式,在与烧蚀相耦合的情况下获得了复合结构喷管的温度分布。用隐式方法计算有效地减少了计算机时,对工程设计大有裨益。  相似文献   

13.
李旭  周洲  薛臣 《航空学报》2020,41(9):123712-123712
对Goldstein提出的反馈力浸入边界法进行了新的思考,改进了其对力源项的计算,拓展了该浸入边界法的使用范围。传统的反馈力浸入边界法在进行力源项的计算时,含有对速度误差的时间积分项,只能用于含时间项的Navier-Stokes (N-S)方程的求解,且在显式时间推进时有严格的时间步长限制。本文改进的方法则直接通过迭代过程中的速度误差求和来计算力源项,避免了时间相关的参数,使其不仅能适合非定常隐式时间推进,还能与不含时间项的定常N-S方程求解方法结合。为了验证改进方法的可靠性,对二维静止圆柱绕流、静止流体中的振荡圆柱、运动椭圆翼以及三维静止圆球的流场进行了计算,计算结果均与文献结果符合较好,表明本文改进的方法是有效的。得出的结论为:可以直接基于迭代次数进行反馈力源项的计算,改进的反馈力浸入边界法不仅可与非定常N-S方程结合,进行隐式求解,还可以与定常N-S方程结合用于定常流动的模拟,可将改进的方法运用到更多的流动问题当中。  相似文献   

14.
高精度差分求解气动方程的几个问题   总被引:10,自引:13,他引:10  
本文探讨了发展高精度格式的必要性,研究了高精度格式与网格以及熵增条件的关系,并发展一种半离散化的空间为三阶精度的格式。从此半离散化的格式出发,可建立多步显式格式及隐式格式。模型问题的计算表明,该三阶精度的格式具有好的精度,且激波附近基本上没有波动。  相似文献   

15.
基于线性化处理,在时间方向上对间断Galerkin方程进行了隐式离散,从整体上对迭代过程进行了合理的优化,并以此求解了计算流体力学中的二维Euler方程。其中,LU-SGS方法得到了进一步的推广,被用来高效求解隐式格式对应的大型稀疏线性系统。数值实验表明,无论对于亚声速问题还是跨声速问题,该格式都是无条件稳定的;与显式的Runge-Kutta间断Galerkin格式相比,当残值下降到相同量级时,隐式格式所需的迭代步数和CPU时间均在很大程度上得到了减少。  相似文献   

16.
基于非结构网格流场计算的网格重排序   总被引:2,自引:0,他引:2  
提出基于非结构网格流场计算时的网格重排序,优化了网格信息在内存中的存贮位置,使得计算过程中调用数据的处理速度加快,有效提高了计算效率。以M6机翼及DLR-F4翼身组合体的跨音速无粘流场为算例,分别通过显式四步龙格-库塔推进格式和隐式LU-SGS推进格式来验证网格重排序后对计算效率的提高作用。原始网格均用Delaunay方法生长,并分别使用了两种重排序方法进行比较。计算结果表明:重排序后的计算效率可以提高到未排序时的3到5倍,很具实用价值。  相似文献   

17.
本文采用有限体积Galerkin法和非结构网格数值求解了跨声速三维Euler方程,通量的求解采用VanLeer-阶逆风矢能量发裂方式,并通过外插使其上升为二阶精度,分别采用了显式及隐式两种格式求解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号