首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于GPU和隐式格式的CFD并行计算方法   总被引:1,自引:0,他引:1  
张兵  韩景龙 《航空学报》2010,31(2):249-256
从图形处理器(GPU)架构特点出发,提出了基于数据并行的隐式计算流体力学(CFD)求解方法,空间离散格式采用迎风Roe格式,计算网格适用于结构和非结构网格。采用统一计算设备架构(CUDA)技术实现了GPU上的隐式CFD并行计算。分别在Intel Core2 Quad3.0GHzCPU和NVIDIAGTX280 GPU上进行了计算,结果表明隐式格式计算速度是显式格式6倍以上,采用显式格式的计算加速比达到28倍,采用隐式格式计算加速比达到了28.7倍,同时计算加速比随计算规模的增加而增加。计算结果和实验结果较为吻合。  相似文献   

2.
为了提高间断伽辽金(discontinuous Galerkin, DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit, GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel, LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture, CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得...  相似文献   

3.
GPU平台上的叶轮机械CFD加速计算   总被引:2,自引:1,他引:1  
通过数据并行的方式对一个成熟的叶轮机多块网格气动计算程序(MAP)进行了并行化处理,利用计算统一设备架构(CUDA)技术实现了在图形处理单元(GPU)上的并行计算.保留了原程序中的2阶空间迎风格式和隐式时间离散格式,并采用了隐式迭代对线性系统进行求解.经过2个叶轮机械算例的测试,与在传统的中央处理器(CPU)上运行的原程序相比,在计算结果完全一致的前提下,单GPU的计算速度最高可达单CPU计算速度的8.89倍,与四核并行的CPU计算相比可以得到2.39倍的加速.  相似文献   

4.
勾文进  张帅  郑耀 《推进技术》2019,40(11):2554-2561
为实现双股射流撞击雾化过程的高效数值求解并探究射流速度和撞击角度对雾化特性的影响规律,实现了移动粒子半隐式方法(MPS)GPU加速的双股射流撞击雾化模拟。GPU加速程序的最大加速比为16,取得了较好的加速效果。将GPU加速MPS方法应用于典型工况下的双股射流撞击雾化模拟,成功捕捉到了多尺度的液膜形成、液膜破碎成液丝继而破碎成液滴的瞬态过程,模拟得到的液膜破碎长度及雾化角度与试验较为吻合,误差分别为11.7%和0.5%,验证了GPU加速MPS方法在双股射流撞击雾化问题中处理能力。参数化分析了射流速度和撞击角度对液膜破碎长度、雾化角度及一次雾化液滴索尔直径的影响。结果表明撞击角度增加或者射流速度增加均会导致液膜破碎长度减小、雾化角度增加、一次雾化液滴索尔直径减小。  相似文献   

5.
旋转坐标系下分区计算的LU隐式方法   总被引:1,自引:0,他引:1  
肖中云  刘刚  牟斌  江雄 《航空学报》2018,39(10):122079-122079
将隐式时间迭代方法应用于并行计算是CFD研究中的热点问题,研究发现LU-SGS格式在旋转坐标系下对分区边界比较敏感,对旋翼悬停状态进行分区并行计算时碰到了计算发散的问题。针对此问题,对基于LU分解的3种隐式时间迭代格式(LU-SGS、DP-LUR和HLU-SGS)进行了对比研究,设计了静止流场下的旋转网格算例对计算方法进行测试。结果表明,LU-SGS格式在网格边界采用简化处理方法,当边界的逆变速度增大时会引起数值误差放大,误差的不断积累导致计算发散。DP-LUR和HLU-SGS格式通过在边界单元采用雅克比迭代算法,能有效消除分区边界影响,使计算格式在大CFL数条件下保持稳定,其中HLU-SGS继承了LU-SGS迭代效率高的特点。在此基础上,采用并行化的LU隐式方法对Caradonna-Tung旋翼进行了并行计算,针对两套稀密程度不同的背景网格,在产生复杂分区边界的计算网格条件下,均获得了气动力和旋翼尾迹都充分收敛的流场。通过计算,分析了背景网格密度对预测气动力性能和捕捉尾迹流场的影响,计算结果与试验值吻合良好,验证了当前隐式计算方法适用于旋转坐标系并行计算,适合于推广至其他大规模并行分区的流场计算。  相似文献   

6.
针对复合材料失效等准静态问题,提出了显隐式联合的求解方法:在加载前期,非线性程度较低时,采用计算效率较高的隐式求解器求解;在材料出现损伤后,非线性程度较高时,改用条件收敛的显式求解器推进计算,中间通过数据传递将材料的应力应变水平及材料损伤状态由隐式求解器传递到显式求解器。该方法在保证计算精度的前提下,兼顾了隐式与显式分析的优点,有效提高了计算效率。  相似文献   

7.
DG方法是一种非常具有潜力的高精度方法,但其在对复杂外形的数值模拟方面仍存在内存需求量大、计算量巨大等不足.为了进一步提高DG方法求解Euler方程的效率,在传统p型多重网格的基础上,结合LU-SGS和GMRES两种隐式迭代方法,研究其整体加速性能.p型多重网格方法通过对不同阶次多项式近似解进行递归迭代求解,来达到加速收敛的目的.高阶近似(p>0)使用显式龙格库塔格式,最低阶近似(p=0)使用隐式格式.对NACA0012翼型和ONERA M6机翼跨音速无粘流动进行数值模拟,结果表明:与显式TVD-RKDG时间格式相比,DG(p0)层上采用LU-SGS和GMRES的p型多重网格方法收敛速度均得到明显提高,且GMRES迭代法性能最佳,LU-SGS迭代法次之.  相似文献   

8.
双方程k-ω剪切应力输运(SST)湍流模型通常以隐式耦合方式或者显式半耦合/解耦的方式来求解。本文提出了该模型的一种显式耦合应用方法,即通过点隐的方式来处理湍流源项的刚性,并与混合Runge-Kutta时间推进以及当地时间步长、隐式残差光顺等加速收敛技术相结合,从而使得湍流方程可以与流动方程同时求解。为了增强计算的鲁棒性,进一步对湍流变量进行了限制。将所发展的方法用于DLR平面叶栅算例,确认了求解结果的正确性以及刚性的来源。通过对三维NASA Rotor 67的模拟,验证了SST模型的精度;进一步将其与Badwin-Lomax(BL)模型、Spalart-Allmaras(SA)模型对比,发现三者都能正确地捕捉出口参数分布,且SST与SA模型的模拟结果比较一致;对于该算例,SST模型在总温模拟上更具优势,而BL模型在总压分布上与试验值更加接近。  相似文献   

9.
本文用守恒型显式格式及交替方向隐式迭代计算二维底部流场。守恒显式格式是从全守恒的Navier-Stokes方程组出发,在Allen—Cheng格式的基础上引进了“调整因子”。这对放大稳定性要求的步长,加速收敛均有益处。本文还用交替方向隐式迭代计算了同样的流场。结果表明只要边界条件逼近一致性较好,交替方向隐式迭代比显式格式收敛快,节约40%机时。  相似文献   

10.
为克服动能BGK格式计算耗时多、收敛慢的缺点,在格式中引入当地时间步长、隐式LU-SGS方法和多重网格技术,基于RAE2822翼型粘性跨声速绕流的数值模拟,对其收敛性的改善进行了研究。结果表明:上述3种加速手段对求解定常问题时的收敛性有明显的改善,达到定常解所需的迭代步数随着CFL数的提高而减少;因而求解某类问题时,隐式格式比显式格式更具优势;多重网格既适用于显式格式,也适用于隐式格式,加速性更加突出。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号