首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
基于分布式平台开展一种新的时域有限差分(FDTD)并行算法研究,该算法基于VC++、CUDA5.0平台开发,调用Intel MPI 4.1.0库进行测试,在上海交通大学高性能计算中心图形处理单元(GPU)集群、上海超级计算机中心的“魔方”商用超级计算机以及国家超级计算济南中心的“神威蓝光”国产超级计算机等平台开展软件调试。通过对纯CPU、GPU以及CPU和GPU的混合测试,线程调度水平、核心函数处理速度得到明显提升,同时减少了通信执行时间比例,提高了加速比和并行效率,最后以2×2微带阵列为验证模型进行拓扑优化测试,结果证明该算法准确、有效。   相似文献   

2.
针对软件仿真高动态扩频信号实时性差的问题,通过分析扩频信号生成过程和分段插值运动模型,建立了一种高动态信号生成模型,由动态参数和当前时间计算瞬时伪码相位和瞬时载波相位,各采样点的计算彼此不相关,将仿真信号组织成多维的数据结构,利用GPU中大量的浮点运算单元并行计算,提高了信号仿真的实时性。仿真验证结果表明,基于GPU的分段插值多维并行算法仿真时长1s采样率100Msps的信号,仿真与传输耗时共计322ms,与CPU串行仿真相比加速约19.4倍,实现了高动态扩频信号实时仿真。  相似文献   

3.
为了提升航空发动机非线性模型预测控制(MPC)的实时性,将交替方向乘子法(ADMM)应用于模型预测控制的滚动优化中。基于状态空间模型构造预测方程,通过引入辅助变量和对偶变量,将二次型性能指标和发动机约束改写为适合ADMM算法求解的形式。在航空发动机部件级模型上开展的仿真结果表明,基于ADMM算法的单变量模型预测能够实现对指令信号的高性能跟踪和约束的有效管理。相比于内点法(IPM),ADMM算法在滚动优化过程中,在不同控制指令下,均具有更高的实时性,且在预测时域增加的情况下,计算耗时增加更少,验证了其在模型预测控制中应用的有效性。   相似文献   

4.
  总被引:2,自引:0,他引:2  
针对变循环发动机非线性部件模型共同工作方程组求解时初值选取对收敛速度和精度的影响问题,提出一种基于量子粒子群优化(QPSO)算法与Broyden拟牛顿法混合的求解思路。首先,对变循环发动机(VCE)进行变几何特性分析以及反向传播(BP)神经网络下的外涵道稳态特性分析基础上,建立反映变几何特性以及模式切换等全状态部件模型。其次,以该模型性能计算为基准,提出了一种基于QPSO的Broyden拟牛顿混合算法来达到发动机共同工作平衡要求,通过发散系数实现混合算法的切换,以改善单一Broyden拟牛顿法对初值选取的依赖性同时提高QPSO算法的求解效率。通过高阶非线性方程组的仿真验证了算法的有效性、求解效率以及精度。最后,进行VCE部件模型稳态、动态仿真计算,结果表明:与GasTurb性能计算结果对比可以看出发动机速度特性、高度特性等变化趋势与GasTurb基本一致,且误差均小于2%;基于QPSO的Broyden拟牛顿混合算法可有效快速地完成VCE部件模型的求解;所建VCE部件模型能够有效实现该新型发动机的性能模拟分析。  相似文献   

5.
触地关机模式下的着陆器软着陆稳定性研究   总被引:1,自引:0,他引:1  
以触地关机软着陆模式下的某型着陆器为研究对象,建立其软着陆过程的动力学仿真模型。基于仿真模型,结合优化方法与多岛遗传算法(MIGA)确定了着陆器的极恶劣地形工况参数,并利用径向基函数(RBF)神经网络建立了反映极恶劣工况下着陆器速度参数与稳定性指标值之间映射关系的代理模型。将着陆器速度参数做离散化处理得到样本点,利用神经网络模型计算了各样本点对应的软着陆稳定性指标值,基于计算结果给出了各项软着陆稳定性指标的云图和三维速度稳定性边界,并得到了综合各项稳定性指标的着陆器速度稳定性边界。分析结果可直观地确定保证着陆器安全着陆的速度取值范围,为着陆器速度的合理控制提供参考。   相似文献   

6.
    
高光谱图像在带来丰富光谱信息的同时,其数据量大和维数高的特性也使得各种目标检测算法进行处理时往往产生庞大的运算量,所以采用可以实现高光谱异常目标检测算法的高速处理方案显得尤为迫切和重要。考虑到现场可编程门阵列(FPGA)强大的并行计算能力和极具灵活的设计方式,针对高光谱异常目标检测RXD算法中协方差矩阵及其逆的计算量过大的问题,以分块并行和正交三角(QR)分解为主要加速思想,利用高层次综合(HLS)工具对算法进行优化,提出了RXD算法在FPGA平台上的加速方案。实验结果表明,所提出的基于FPGA平台的加速方案可以在保持算法检测性能的同时达到相较于CPU实现7.04倍的加速,验证了加速方案的正确有效性。  相似文献   

7.
三维磁流体力学(MHD)数值模拟是用来研究日冕和太阳风最常用的方法之一, 其中将计算得到的日冕电子数密度转化为日冕偏振亮度(Polarization Brightness, PB)是与观测对比的重要方法. 由于待转换电子数据网格密度、PB数据网格密度和计算模型的复杂度, 使得日冕偏振亮度的计算比较耗时, 利用单CPU计算无法达到近实时转换日冕偏振亮度的要求, 从而影响了数值模拟的验证效率. 本文在CPU/GPU环境下, 利用CUDA编程技术, 提出了一个日冕偏振亮度并行计算模型. 实验结果表明, 该模型比CPU上的串行模型计算速度提高了31.86倍, 达到了近实时模拟与观测数据比对的计算要求.   相似文献   

8.
针对传统FastSLAM算法需要大量粒子构建地图导致计算复杂度高、难以提高估计精度等问题,研究构建了一种基于智能优化箱粒子滤波(IOBPF)的移动机器人FastSLAM算法。首先,将萤火虫算法(FA)的动态寻优机制引入箱粒子滤波(BPF),建立了箱粒子的荧光亮度更新公式、吸引度计算公式和位置更新公式,使箱粒子集智能化地向高似然区域移动,避免了箱粒子的退化现象。然后,以改进的智能优化箱粒子滤波进行机器人位姿估计,并采用扩展区间卡尔曼滤波(EIKF)完成地图的构建和更新。移动机器人的模型仿真和实体实验结果表明:所提智能化FastSLAM算法可有效提升箱粒子的性能,并降低地图构建所需粒子数,从而显著提高FastSLAM的定位精度和地图构建的鲁棒性。   相似文献   

9.
高性能信号处理应用的快速发展,对相应处理器的运算速度及吞吐效率提出了巨大挑战。移位器是数字信号处理器(DSP)上的重要部件,通过为移位器设计额外专用随机存取存储器(RAM)和查找表(LUT),并对其指令集及架构进行优化调整,从而达到提高处理器使用效率和传输速率的目的。此外,基于移位器与相应查找表指令,可在数据暂存的同时进行移位、提取、算术与逻辑运算处理,将部分数据运算的过程直接合并在对移位器RAM的数据存读取过程中,显著地提高了运算部件的使用效率。结果表明:基于移位器查找表的暂存技术可以达到与传输总线接近的吞吐率,对信号处理算法快速傅里叶变换(FFT)可以达到加速比约为1.15~1.20的性能提升效果。   相似文献   

10.
    
针对粗糙集(RS)理论在处理评估问题时,无法处理决策属性缺失的信息系统的问题,提出一种基于信息熵(IE)和粗糙集的空中目标威胁评估模型。该模型通过信息熵方法计算各属性权重,选取最大权重的属性替代决策属性,构建完备的粗糙集决策信息系统,并根据属性重要性方法进行离散化处理,基于决策辨识矩阵实现属性约简和权重计算,对空中目标的威胁程度进行量化评估。模型拓宽了粗糙集理论在评估中的适用范围,减少对先验信息的需求与人为主观因素的影响。仿真结果表明,该方法可以实现对空中目标的有效评估。  相似文献   

11.
现有无人机(UAV)影像三维重建方法在功耗、时效等方面无法满足移动终端对低功耗、高时效的需求。为此,在有限资源FPGA平台下,结合指令优化策略和软硬件协同优化方法,提出一种基于FPGA高吞吐量硬件优化架构的无人机航拍影像快速低功耗高精度三维重建方法。首先,构建多尺度深度图融合算法架构,增强传统FPGA相位相关算法对不可信区域的鲁棒性,如低纹理、河流等区域。其次,结合高并行指令优化策略,提出高性能软硬件协同优化方案,实现多尺度深度图融合算法架构在有限资源FPGA平台的高效运行。最后,将现有CPU方法、GPU方法与FPGA方法进行综合实验比较,实验结果表明:FPGA方法在重建时间消耗上与GPU方法接近,比CPU方法快近20倍,但功耗仅为GPU方法的2.23%。   相似文献   

12.
    
智能卫星技术对卫星时间序列数据挖掘提出了越来越多的需求。通常卫星数据计算量都非常大,若串行执行则需要较长时间。以卫星异变过程多类型特征分析过程为典型代表,针对窗口划分与向量相似度计算、特征提取、傅里叶变换、聚类等常见数据挖掘操作,探讨了在多核CPU和GPU的典型异构计算节点中对时序数据挖掘过程进行并行优化的多种策略,包括向量化方法、多进程方法、GPU计算等方法。对这几种优化策略的适用情况进行了实验分析对比。结果表明,针对不同任务情况综合使用多种优化策略具有显著提升效果。  相似文献   

13.
基于二级声辐射模型的地面声场高效预测方法   总被引:1,自引:0,他引:1  
建立了可用于直升机运动状态下噪声传播特性分析的高效地面声场预测方法。该方法包括计算旋翼气动、噪声的自由尾迹方法和时域FW-H方程;计入大气、地面等环境因素的声传播模型及地面声场计算模型;为提高计算效率,在声源计算与噪声传播之间引入基于“紧致球声源”的二级声辐射模型;在此基础上,还提出了通过建立“特征参数声辐射球库”以实现直升机运动状态下噪声实时预测的方法。以AH-1旋翼为算例,通过与地面声场直接计算法对比,说明了方法的有效性及高效性;此外,文中还分析了大气、地面等环境因素对噪声传播以及地面声场特性的影响。   相似文献   

14.
日冕物质抛射(Coronal Mass Ejection,CME)参数识别模型是太阳风预报过程的重要组成部分.在空间环境预报业务中,为提高太阳风预报的准确率,需要提高CME参数识别的精度.模型以计算任务串行的方式运行,运算效率低导致模型运算时间长,不能满足这种需求.CME参数识别模型的物理运算过程相互不独立,其在单节点上的运行方式不能满足并行化要求.基于MapReduce的并行计算框架,改进了CME参数识别模型的计算流程,提出CDMR(CME detection under MapReduce)方法,实现了CME参数识别模型的并行计算,并对比分析CME参数识别模型在串行计算和MapReduce并行计算下的运行时间,提高了模型的识别精度和计算效率.   相似文献   

15.
二维跨音速Euler方程分区并行算法   总被引:3,自引:0,他引:3  
对二维跨音速流动的Euler方程分区算法、并行算法以及多区计算的有效内边界耦合条件进行了探讨,应用Van Leer矢通量分裂方法和一维数组方式,研究了多种区域分解数目的分区计算效率.并行计算中采用"先进先出"的同步控制等待机制,采用纯结点并行编程方式进行了单区、二区和四区并行计算对比,分析了影响并行效率和通讯过载比的主要因素.  相似文献   

16.
降落伞流固耦合问题的数值模拟和流场分析   总被引:2,自引:1,他引:1  
提出了基于压力耦合的半隐式算法,即SIMPLE (Semi-Implicit Method for Pressure-Linked Equations)算法和生成阶梯网格方法的对稳定下降阶段的降落伞进行数值模拟的新方法.此方法在降落伞流固耦合计算中具有较好的稳定性和较高的效率.对降落伞稳定下降阶段的流固耦合问题进行了数值模拟.降落伞模型分别采用了圆形伞和锥形伞稳定下降时的结构数据,并对锥形伞模型进行了不同来流攻角情形下的模拟.与平行有限元方法相比,采用SIMPLE算法的新方法得到了更准确和更合理的结果.此新方法可以作为传统数值模拟方法的一个可靠替代和重要补充.      相似文献   

17.
提出了一种基于3GPP TS 25.212协议的单RAM的turbo并行编码技术,并详细介绍了所设计tur-bo并行编码器硬件结构框架的具体实现方法及优化方式,解决了传统编码技术中的低速和芯片面积过大的问题,使其适应当今通信系统。该编码技术计算S序列时,并不直接计算基序列,而使用中间序列的计算来代替,极大的减少了计算的周期,减少了芯片的使用面积。Matlab的仿真结果表明,该设计在码片速率为61.44 MHz时,编码速率达到了0.35 ms,满足通信系统的高速传输要求。  相似文献   

18.
针对非线性超声无损检测金属材料微裂纹取向角度的问题,开展了微裂纹取向与超声波的和频非线性效应研究,建立了超声和频非线性特征系数与微裂纹取向角度的关系模型。理论和有限元仿真实验结果表明,随着微裂纹取向角度的逐渐增大,超声和频非线性特征系数与微裂纹取向角度之间呈现明显的正相关趋势,而且相比二次非线性特征系数,和频非线性特征系数对微裂纹取向检测更为敏感。同时,从超声波平均能流密度(即声强)的角度出发,计算可知和频分量声强会随着微裂纹取向角度的增大而增大,而二次谐波声强基本不会发生变化,同时和频分量声强占比相比于二次谐波声强占比也得到了明显提高。超声波声强计算结果与仿真计算结果趋势基本一致,证明了理论模型的正确性。通过实验验证了模型的有效性,为金属材料微裂纹取向的检测提供了一种有效的手段。   相似文献   

19.
针对集群系统的多节点多GPU环境,提出一种新型虚拟化GPU计算平台。该平台实现对集群系统所有节点上GPU资源的统一抽象与管理,构建公共GPU资源池。原有GPU应用程序可以不经任何修改而迁移到虚拟化GPU计算平台,并具备访问资源池内任何GPU的能力,编程人员无需显式针对多节点多GPU应用展开MPI编程。应用程序摆脱了单个节点上GPU资源的限制,并具备无差别地访问集群系统中任何可用GPU资源的能力,能有效提高系统总体资源利用率以及吞吐量。采用流水化通信技术,实现对虚拟化GPU计算平台的运行时开销以及节点间数据传输延迟的隐藏。实验表明:与非流水化通信相比,系统总体数据传输延迟降低了50%~70%,具备与节点机本地数据传输等同的通信性能。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号