首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
针对大量数据串行相位解卷绕实时性较差的问题,设计了基于GPU的并行相位解卷绕算法。首先分析了典型的串行解卷绕算法在GPU平台实现的可行性,之后设计了适合于GPU加速的并行解卷绕算法。最后对基于GPU的并行相位解卷绕算法进行了仿真验证,多次测试结果表明:在保证解卷绕正确性的基础上,基于GPU的并行相位解卷绕算法相比传统CPU串行解卷绕算法约有3.5倍的加速比,基于GPU的并行相位解卷绕算法相比GPU串行解卷绕算法有63倍的加速比。  相似文献   

2.
三维磁流体力学(MHD)数值模拟是用来研究日冕和太阳风最常用的方法之一, 其中将计算得到的日冕电子数密度转化为日冕偏振亮度(Polarization Brightness, PB)是与观测对比的重要方法. 由于待转换电子数据网格密度、PB数据网格密度和计算模型的复杂度, 使得日冕偏振亮度的计算比较耗时, 利用单CPU计算无法达到近实时转换日冕偏振亮度的要求, 从而影响了数值模拟的验证效率. 本文在CPU/GPU环境下, 利用CUDA编程技术, 提出了一个日冕偏振亮度并行计算模型. 实验结果表明, 该模型比CPU上的串行模型计算速度提高了31.86倍, 达到了近实时模拟与观测数据比对的计算要求.   相似文献   

3.
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。   相似文献   

4.
现有无人机(UAV)影像三维重建方法在功耗、时效等方面无法满足移动终端对低功耗、高时效的需求。为此,在有限资源FPGA平台下,结合指令优化策略和软硬件协同优化方法,提出一种基于FPGA高吞吐量硬件优化架构的无人机航拍影像快速低功耗高精度三维重建方法。首先,构建多尺度深度图融合算法架构,增强传统FPGA相位相关算法对不可信区域的鲁棒性,如低纹理、河流等区域。其次,结合高并行指令优化策略,提出高性能软硬件协同优化方案,实现多尺度深度图融合算法架构在有限资源FPGA平台的高效运行。最后,将现有CPU方法、GPU方法与FPGA方法进行综合实验比较,实验结果表明:FPGA方法在重建时间消耗上与GPU方法接近,比CPU方法快近20倍,但功耗仅为GPU方法的2.23%。   相似文献   

5.
    
智能卫星技术对卫星时间序列数据挖掘提出了越来越多的需求。通常卫星数据计算量都非常大,若串行执行则需要较长时间。以卫星异变过程多类型特征分析过程为典型代表,针对窗口划分与向量相似度计算、特征提取、傅里叶变换、聚类等常见数据挖掘操作,探讨了在多核CPU和GPU的典型异构计算节点中对时序数据挖掘过程进行并行优化的多种策略,包括向量化方法、多进程方法、GPU计算等方法。对这几种优化策略的适用情况进行了实验分析对比。结果表明,针对不同任务情况综合使用多种优化策略具有显著提升效果。  相似文献   

6.
跨声速定常流场的隐式求解相当于使用牛顿迭代法求解一个非线性方程组。为满足牛顿迭代收敛性的要求,通常需要对所求解问题进行全局化处理。在同伦延拓的框架内,提出了一种基于拉普拉斯算子的方程延拓方法,提高了定常流场隐式求解收敛速度。针对定常流场通常初始化为均匀来流的特点,一方面利用拉普拉斯算子的椭圆性加快边界条件信息向流场内部的传播,另一方面利用拉普拉斯算子的线性和正定性改善延拓问题的正则性,综合两者增加拟牛顿算法的稳定性,提高可用CFL数,最终达到提高流场求解效率的目的。由于流场问题的复杂性和非线性,难以通过理论分析得出先验的最优非线性求解策略。因此,通过无黏NACA0012翼型、湍流RAE2822翼型和三维ONERA M6机翼等算例的数值实验,研究了拉普拉斯项参数对收敛效率的影响,给出了效率较优的参数组合,验证了本文方法在跨声速情况下相对于经典伪时间推进法可以节约20%以上的CPU计算时间。   相似文献   

7.
基于分布式平台开展一种新的时域有限差分(FDTD)并行算法研究,该算法基于VC++、CUDA5.0平台开发,调用Intel MPI 4.1.0库进行测试,在上海交通大学高性能计算中心图形处理单元(GPU)集群、上海超级计算机中心的“魔方”商用超级计算机以及国家超级计算济南中心的“神威蓝光”国产超级计算机等平台开展软件调试。通过对纯CPU、GPU以及CPU和GPU的混合测试,线程调度水平、核心函数处理速度得到明显提升,同时减少了通信执行时间比例,提高了加速比和并行效率,最后以2×2微带阵列为验证模型进行拓扑优化测试,结果证明该算法准确、有效。   相似文献   

8.
针对软件仿真高动态扩频信号实时性差的问题,通过分析扩频信号生成过程和分段插值运动模型,建立了一种高动态信号生成模型,由动态参数和当前时间计算瞬时伪码相位和瞬时载波相位,各采样点的计算彼此不相关,将仿真信号组织成多维的数据结构,利用GPU中大量的浮点运算单元并行计算,提高了信号仿真的实时性。仿真验证结果表明,基于GPU的分段插值多维并行算法仿真时长1s采样率100Msps的信号,仿真与传输耗时共计322ms,与CPU串行仿真相比加速约19.4倍,实现了高动态扩频信号实时仿真。  相似文献   

9.
以XRS-152/153影像增强器DR/CT成像系统为研究对象,在分析其输出像场畸变特性的基础上,从校正精度和校正实时性要求出发,采用空间坐标多项式变换方法进行畸变校正.同时,为了解决畸变校正算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU, Graphic Processing Unit)并行计算和高速浮点计算特性,将图像映射为GPU中的纹理,采用多线程并行计算,使得校正算法在GPU中加速执行.实验结果表明,本方法能有效实现畸变图像的校正,GPU加速方法可以在不损失图像信息的前提下,实现实时校正.  相似文献   

10.
当前,市场上普遍使用的负责推理的终端人工智能(AI)芯片使用训练好的参数对数据进行快速高效运算。但在通常训练过程中使用的数据集和真实数据的分布不一致,由此获得的参数会导致终端AI芯片识别准确度降低。为此,提出了一种基于终端AI芯片的可视化反馈系统架构方法。使用反卷积特征可视化方法,在具有高效计算性能的终端AI芯片上,对卷积核参数进行迭代优化,达到可识别该图像目的。相比于CPU/GPU和FPGA,所提架构在卷积神经网络模型里,更具有高效处理能力和灵活可塑性。实验表明,该研究有效提高了终端AI芯片的普适性、识别准确度和处理效率。   相似文献   

11.
针对二分法计算拉格朗日乘子时收敛速度较慢的问题, 提出了拉格朗日乘子计算方法, 应用于优化准则(OC)法和导重(GW)法2种密度更新方法, 并与二分法进行了对比。建立体积约束下柔度最小的拓扑优化模型;通过固体各向同性材料惩罚(SIMP)法或材料属性有理近似(RAMP)法计算单元的弹性模量;通过所提方法计算拉格朗日乘子, 并通过导重法更新单元密度;通过Heaviside投影函数减少灰度单元的数量。计算结果表明:虽然所提方法对有限元分析次数并没有显著改进, 但计算拉格朗日乘子所用CPU时间少于二分法, 且密度更新次数降低至50%以下;在2个数值算例中, 采用SIMP模型时, 导重法所得结构柔度比OC法更小, 能够得到刚度更高的结构。   相似文献   

12.
三、涡轮流量计仪表特性曲线的计算由动量矩原理可知,当转子处于平衡时,可得到力矩平衡方程 T_d=∑T_i=T_h T_b T_t T_m T_P T_f下面分别讨论各力矩的大小。  相似文献   

13.
针对航天器设备因构成复杂引起的动力学分析模型建模困难问题,提出一种基于拓扑优化技术的有限元模型简化方法,以设备实测质量特性为约束条件,通过拓扑优化方法确定设备有限元模型可行设计空间中的材料分布,实现对结构刚度性能的模拟,获得满足动力学特性分析需要的简化的设备有限元模型。应用该方法创建了某星敏感器简化有限元模型,得到的星敏感器简化模型与产品实际质量、质心位置和转动惯量特性基本一致,并且前两阶频率分析值与试验值之间最大偏差约为30%。将该简化模型应用于其支撑结构的动态响应性能评估,两者组合体固有频率及加速度响应趋势的分析数据在450Hz以下的频率范围内与试验数据吻合较好,固有频率最大偏差约为39%。星敏感器简化模型的应用验证了基于拓扑优化技术的有限元模型简化建模方法的可行性,为航天器上复杂设备动力学分析有限元模型的简化建模提供了一种新的解决途径。  相似文献   

14.
场磨式电场传感器常被用来测量特高压直流(HVDC)输电线路下地面合成电场强度.传统对其标定的方法存在标定装置体积较大、户外标定移动不方便的缺点.针对此问题研究了一种应用于特高压直流输电线路下地面合成电场测量的电场传感器便携式缩尺标定装置.基于有限元方法建立了传感器的三维电场模型,基于该模型对便携式标定装置的尺寸、结构等关键参数做出了模拟分析,在此基础上进行了便携式标定装置的结构参数的优化设计.将便携式缩尺标定装置与标准的标定装置进行了实验比较.仿真及实验结果表明该标定装置能够方便、准确地对场磨式电场传感器进行标定.   相似文献   

15.
降落伞流固耦合问题的数值模拟和流场分析   总被引:1,自引:1,他引:1  
提出了基于压力耦合的半隐式算法,即SIMPLE (Semi-Implicit Method for Pressure-Linked Equations)算法和生成阶梯网格方法的对稳定下降阶段的降落伞进行数值模拟的新方法.此方法在降落伞流固耦合计算中具有较好的稳定性和较高的效率.对降落伞稳定下降阶段的流固耦合问题进行了数值模拟.降落伞模型分别采用了圆形伞和锥形伞稳定下降时的结构数据,并对锥形伞模型进行了不同来流攻角情形下的模拟.与平行有限元方法相比,采用SIMPLE算法的新方法得到了更准确和更合理的结果.此新方法可以作为传统数值模拟方法的一个可靠替代和重要补充.      相似文献   

16.
相控阵天线的快速测量和校准一直是相控阵天线研究的热门问题。传统校准方法的测量速度较慢,不能满足大量工程需求的测量校准要求。针对实际工程应用需求,在对幅相求解算法研究的基础上,提出了一种基于幅度测量的快速校准方法--四相幅度校准法(FPC)。经理论分析,该方法的校准时间仅相当于采用6位数字移相器的旋转矢量法所花费校准时间的1/16。对四相幅度校准法、采用4位数字移相器的旋转矢量法和采用6位数字移相器的旋转矢量法的校准速度和校准精度做了对比试验,试验结果验证了四相幅度校准法的正确性和高效性。   相似文献   

17.
涡旋微槽散热器具有传输高热流密度的潜力,在解决航空航天高功率密度器件热控制方面具有广泛应用前景.在实验研究的基础上,采用有限体积法对不同体积流量和槽道结构的涡旋微槽中的流动与传热特性进行了数值模拟研究.对涡旋微槽流动的稳定性进行了分析,给出了摩擦因子和Nu数沿流动方向的变化曲线,并采用场协同原理对涡旋微槽强化传热的机理进行了探讨.计算得到的微槽平均传热系数和摩擦阻力系数与实验数据进行了对比.结果表明:涡旋微槽中二次流的出现是涡旋微槽强化传热的机理所在.  相似文献   

18.
有限元网格结点编号   总被引:10,自引:0,他引:10  
在有限元分析中,求解高阶线性代数方程组时整体刚度矩阵所需存储与由网格结点编号决定的顺序有关.在基于等带宽存储的求解法与基于变带宽存储的求解法的基础上推导出它们的关系.据此,提出了有限元网格结点编号的前沿法与矩形法,并给出了这两种编号法的内存消耗与结点数量的关系.理论分析和实例表明这两种编号法能有效地减少计算机内存消耗.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号