首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
反卷积是图像去模糊的基本算法,针对传统反卷积算法在图像去模糊处理中实时性较弱问题,提出基于众核GPU的Iterative Deconvolve 3d反卷积算法的并行优化实现.所提算法将原算法中的核心运算放在GPU上并行实现,利用CPU和GPU协同工作模式,CPU负责串行任务GPU负责并行任务.实验表明:与传统的算法相比,在不影响图片处理效果的前提下,计算速度比CPU上的实现速度提高了近11倍,并具有良好的可扩展性.  相似文献   

2.
简述了雷达信号脉冲压缩的几种实现方法,着重讨论了数字式脉冲压缩的特点及其信号处理方法;分析了所选择的TMS320C6XEVM信号处理板的接口实现;给出了基于TMS320C6X的信号处理系统软硬件的设计。由于采用高速数字信号处理器件进行脉冲压缩,使得软件设计具有很大的灵活性。  相似文献   

3.
以圆管构型的声传播为分析对象,研究了基于图形处理器GPU的计算气动声学(Computational Aeroacous-tics,CAA)高阶有限差分算法的并行实现,并与CPU串行及MPI并行实现作了对比分析。首先介绍了管道简化模型的2.5维线化欧拉方程和GPU的编程模式以及调优参考准则,然后给出了相关物理量的空间离散方法的GPU实现。数值实验的结果表明,与CPU串行及MPI并行程序的结果相比,使用GPU的程序实现在达到与MPI并行同样的计算效率时,可以使用更少的计算资源。较之cluster上串行算法,工作站上GPU并行算法在使用不同网格规模的情况下可达到的3倍多的加速比。  相似文献   

4.
蚁群算法是一种具有高度并行特征的群智能算法,串行实现过程中具有收敛速度慢的特点,在将其应用到相依任务序列的单机调度问题中时,以任务在不同作业序下的完成时间为基础,建立了单机调度问题的TSP模型。以任务完成时间最优化为目的,实现了一种求解相依任务单机调度的改进蚁群算法,并基于GPU对其进行了并行化设计。实验表明该算法能够完成相依任务的调度处理,通过并行化得到了较高的加速比。  相似文献   

5.
为了提高间断伽辽金(discontinuous Galerkin, DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit, GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel, LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture, CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得...  相似文献   

6.
针对可编程GPU模型,提出了基于CPU-GPU的并行边缘强度加权融合算法,利用CPU和GPU协同工作模式达到图像融合的目的,其中CPU负责串行任务,而GPU负责并行任务。实验结果表明,并行边缘强度加权融合算法得到的融合图像有着较好的视觉效果,信息熵和QAB/F这两个评价指标均高于文中对比算法的相应指标;从运行时间上分析,基于CPU-GPU的融合方法所需要的运行时间远低于基于CPU方法所需要的运行时间,并且图像尺寸越大,加速比越高。  相似文献   

7.
GPU平台上的叶轮机械CFD加速计算   总被引:2,自引:1,他引:1  
通过数据并行的方式对一个成熟的叶轮机多块网格气动计算程序(MAP)进行了并行化处理,利用计算统一设备架构(CUDA)技术实现了在图形处理单元(GPU)上的并行计算.保留了原程序中的2阶空间迎风格式和隐式时间离散格式,并采用了隐式迭代对线性系统进行求解.经过2个叶轮机械算例的测试,与在传统的中央处理器(CPU)上运行的原程序相比,在计算结果完全一致的前提下,单GPU的计算速度最高可达单CPU计算速度的8.89倍,与四核并行的CPU计算相比可以得到2.39倍的加速.  相似文献   

8.
吴培灵  张征宇  孙维 《航空工程进展》2023,14(1):157-164,174
在风洞试验中,现有的基于CPU 的光流法求解荧光油膜运动速度场耗时过长,而基于GPU 的光流法存在GPU 资源利用不充分的问题。为此,提出基于荧光油膜图像分块和临界约束的GPU 荧光油膜运动路径实时测量方法。将荧光油膜时序图像按照GPU 的资源将整帧图像切割分块并行处理,创建其对应的光流并行计算策略,即充分利用GPU 的并行流水架构优势和共享内存实现各并行块的光流计算的硬件加速;同时结合块间临界约束条件,以各块的速度矩阵迭代差为标志控制其迭代计算次数。结果表明:本文方法在保证荧光油膜运动速度场计算精度的条件下,较传统的基于CPU 的光流法解算速度平均提升了2 789.5 倍,较整帧图像的GPU 光流法速度平均提升了10.09 倍,实时解算速度可达90 帧/秒。  相似文献   

9.
以雷达软件化接收系统回波信号脉冲压缩处理为例,利用FFT算法分析了雷达软件化接收系统脉冲压缩处理软件化的可行性,并进行雷达回波脉压处理的仿真.  相似文献   

10.
赖剑奇  李桦  张冉  常青 《航空学报》2018,39(9):121944-121953
为实现可压缩流问题的大规模高效数值求解,开展基于图形处理单元(GPU)的并行计算研究。在NVIDIA GTX 1070上建立了基于消息传递接口+统一计算设备架构(MPI+CUDA)的多GPU并行可压缩流求解器,该求解器基于结构网格有限体积法,空间离散采用AUSM+UP格式。采用一维区域分解法对计算网格进行划分,使得各GPU之间达到负载平衡。针对超声速进气道算例,对算法单GPU并行性能和多GPU可扩展性能进行分析。数值结果显示,单GPU并行计算可以获得37~46倍的加速比,极大地提高了计算效率;4块GPU并行计算加速比从47倍增加到143倍,并行效率维持在70%以上,说明并行算法具有良好的可扩展性。  相似文献   

11.
A new approach using a multilayered feed forward neural network for pulse compression is presented. The 13 element Barker code was used as the signal code. In training this network, the extended Kalman filtering (EKF)-based learning algorithm which has faster convergence speed than the conventional backpropagation (BP) algorithm was used. This approach has yielded output peak signal to sidelobe ratios which are much superior to those obtained with the BP algorithm. Further, for use of this neural network for real time processing, parallel implementation of the EKF-based learning algorithm is indispensable. Therefore, parallel implementation has also been developed  相似文献   

12.
GNSS软件接收机因其可移植性及灵活性等优点,持续受到业内关注。但传统的软件接收机存在计算量大、耗时长的捕获和跟踪基带信号处理过程,使得软件接收机往往跟踪通道较少,且难以在嵌入式系统上运行。利用嵌入式图形处理器(GPU)的高浮点性能和并行运算能力,对GNSS软件接收机中耗时长且并行性明显的模块进行加速,实现采用CUDA流的数据读取,以及多采样点并行的捕获和多采样点、多卫星并行的跟踪。采用嵌入式GPU进行加速后,可将数据读取速度提高3.43倍,卫星搜捕速度提高16.83倍,卫星跟踪速度提高11.28倍。实验结果表明,在嵌入式Jetson TX2平台上可以支持超过90个62MHz采样的GNSS卫星信号处理。研制了三天线GNSS信号的定位和测姿接收机,为未来小型嵌入式PNT系统的研制提供新思路。  相似文献   

13.
The effects of target Doppler are addressed in relation to adaptive receive processing for radar pulse compression. To correct for Doppler-induced filter mismatch over a single pulse, the Doppler-compensated adaptive pulse compression (DC-APC) algorithm is presented whereby the respective Doppler shifts for large target returns are jointly estimated with the illuminated range profile and subsequently incorporated into the original APC adaptive receive filter formulation. As a result, the Doppler-mismatch-induced range sidelobes can be suppressed thereby regaining a significant portion of the sensitivity improvement that is possible when applying adaptive pulse compression (APC) without the existence of significant Doppler mismatch. In contrast, instead of compensating for Doppler mismatch, the single pulse imaging (SPI) algorithm generalizes the APC formulation for a bank of Doppler-shifted matched filters thereby producing a sidelobe-suppressed range-Doppler image from the return signal of a single radar pulse which is applicable for targets with substantial variation in Doppler. Both techniques are based on the recently proposed APC algorithm and its generalization, the multistatic adaptive pulse compression (MAPC) algorithm, which have been shown to be effective for the suppression of pulse compression range sidelobes thus dramatically increasing the sensitivity of pulse compression radar.  相似文献   

14.
传统的GPU性能评估一般都采用定性评估方法,难以在保证效率的情况下给出一个准确的评估结果。介绍了确定影响GPU性能的关键指标,并给出了对GPU性能评估的理论基础,应用模糊数学中的模糊综合评判方法建立数学模型,最终运用该模型得出了GPU性能的定量评估值。实验表明,方法为准确判断GPU性能提供了科学的依据,且具有较好的实用性和可靠性。  相似文献   

15.
A new class of symmetric radar pulse compression polyphase codes is introduced which is compatible with digital signal processing. These codes share many of the useful properties of the Frank polyphase code. In contrast with the Frank code, the new codes are not subject to mainlobe to sidelobe ratio degradation caused by bandlimiting prior to sampling and digital pulse compression. It is shown that bandlimiting the new codes prior to pulse compression acts as a waveform amplitude weighting which has the effect of increasing the mainlobe to sidelobe ratios.  相似文献   

16.
Adaptive pulse compression via MMSE estimation   总被引:2,自引:0,他引:2  
Radar pulse compression involves the extraction of an estimate of the range profile illuminated by a radar in the presence of noise. A problem inherent to pulse compression is the masking of small targets by large nearby targets due to the range sidelobes that result from standard matched filtering. This paper presents a new approach based upon a minimum mean-square error (MMSE) formulation in which the pulse compression filter for each individual range cell is adaptively estimated from the received signal in order to mitigate the masking interference resulting from matched filtering in the vicinity of large targets. The proposed method is compared with the standard matched filter and least-squares (LS) estimation and is shown to be superior over a variety of stressing scenarios.  相似文献   

17.
宽带信号广泛应用于雷达、导航和卫星通讯等领域。宽带信号的传统接收处理方法主要是采用匹配滤波或子带分割技术。本文用去斜脉冲压缩处理方法处理宽带信号,给出了具体的实现结构和改进措施,分析了如何选择系统的信号采样频率,同时还给出了脉压波形的仿真结果及性能分析。实验表明:对中心频率为9.5GHz、带宽1.3GHz、脉冲宽度30μs的宽带线性调频信号,采用该方法处理只需90MHz采样数据率,大大降低了数据采集的难度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号