首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
反卷积是图像去模糊的基本算法,针对传统反卷积算法在图像去模糊处理中实时性较弱问题,提出基于众核GPU的Iterative Deconvolve 3d反卷积算法的并行优化实现.所提算法将原算法中的核心运算放在GPU上并行实现,利用CPU和GPU协同工作模式,CPU负责串行任务GPU负责并行任务.实验表明:与传统的算法相比,在不影响图片处理效果的前提下,计算速度比CPU上的实现速度提高了近11倍,并具有良好的可扩展性.  相似文献   

2.
针对小波变换与Contourlet变换的不足,提出了一种将非下采样Contourlet 变换与主成分分析相结合的图像融合算法。对已配准好的融合源图像作NSCT分解,采用PCA加权融合规则对低频系数处理,采用边缘强度最大的规则对各高频子带系数作融合处理,分别得到融合图像的变换系数,对该系数经NSCT逆变换重构得到融合图像。实验结果表明,算法有效地融合了源图像中的重要信息,融合图像边缘、纹理、细节清晰,得到较好视觉效果和较优的评价指标。  相似文献   

3.
吴培灵  张征宇  孙维 《航空工程进展》2023,14(1):157-164,174
在风洞试验中,现有的基于CPU 的光流法求解荧光油膜运动速度场耗时过长,而基于GPU 的光流法存在GPU 资源利用不充分的问题。为此,提出基于荧光油膜图像分块和临界约束的GPU 荧光油膜运动路径实时测量方法。将荧光油膜时序图像按照GPU 的资源将整帧图像切割分块并行处理,创建其对应的光流并行计算策略,即充分利用GPU 的并行流水架构优势和共享内存实现各并行块的光流计算的硬件加速;同时结合块间临界约束条件,以各块的速度矩阵迭代差为标志控制其迭代计算次数。结果表明:本文方法在保证荧光油膜运动速度场计算精度的条件下,较传统的基于CPU 的光流法解算速度平均提升了2 789.5 倍,较整帧图像的GPU 光流法速度平均提升了10.09 倍,实时解算速度可达90 帧/秒。  相似文献   

4.
基于GPU的脉冲压缩并行化研究   总被引:1,自引:0,他引:1  
在雷达数字脉冲压缩实时信号处理中,常需要每秒完成几亿甚至几百亿次的运算,采用能够专注于执行高度线程化并行任务的GPU实现脉冲压缩具有重要意义.根据线性调频信号和匹配滤波器理论基础,提出了基于GPU的脉冲压缩并行化实现方法.测试结果表明,基于GPU的脉冲压缩并行化方法相对于CPU有百倍以上的加速比.  相似文献   

5.
红外图像所含边缘等细节偏少、可见光又容易受外部环境干扰,融合图像可以提供更全面的信息,符合人或机器的视觉特性,为图像进一步分析、识别等提供基础。提出一种比值与梯度加权的可见光与红外光图像融合算法,结合小波变换在图像分解中的特性及信号集中的特点,将小波变换应用于红外光和可见光图像融合中可以提高融合信息的理解能力。针对分解获得的低频系数主要反映图像细节信息的特点,对低频系数采用比值加权分析融合规则;针对分解获得的高频系数主要反映图像边缘信息特征的特点,对高频系数采用改进边缘检测算子梯度加权的融合规则。选取多组图像进行了不同融合规则实验对比分析,通过客观评价指标进行评价,改进的融合算法可以获得较清晰的融合图像,可以增加图像的互补信息,并能较好地提高融合图像的清晰度。  相似文献   

6.
图像融合一直以来都是图像处理与机器视觉领域中极其重要的研究方向,而稀疏表示(Sparse Representation,SR)是当前应用最为广泛的图像表示理论之一.针对传统的基于稀疏表示的图像融合策略对超完备字典信息利用不足的问题,提出了基于原子加权稀疏表示(Atom?weighted Sparse Representation,AWSR)的图像融合算法.首先,利用超完备字典对源图像进行稀疏域分解,得到稀疏系数向量;然后,基于超完备字典的信息表达特性构造权向量,并对稀疏系数向量进行加权;最后,基于原子加权融合系数,并结合稀疏系数向量及超完备字典完成源图像的融合.基于六种融合图像质量客观评价指标的对比实验证明了本文方法的融合质量优于传统的基于稀疏表示的图像融合算法,验证了该加权策略能够有效提升图像融合系统的抗噪性和鲁棒性.  相似文献   

7.
以圆管构型的声传播为分析对象,研究了基于图形处理器GPU的计算气动声学(Computational Aeroacous-tics,CAA)高阶有限差分算法的并行实现,并与CPU串行及MPI并行实现作了对比分析。首先介绍了管道简化模型的2.5维线化欧拉方程和GPU的编程模式以及调优参考准则,然后给出了相关物理量的空间离散方法的GPU实现。数值实验的结果表明,与CPU串行及MPI并行程序的结果相比,使用GPU的程序实现在达到与MPI并行同样的计算效率时,可以使用更少的计算资源。较之cluster上串行算法,工作站上GPU并行算法在使用不同网格规模的情况下可达到的3倍多的加速比。  相似文献   

8.
不同传感器获得的多幅图像对同一场景的描述具有信息的冗余性和互补性,在小波图像融合的基础上提出了一种基于边缘和方向相关性的图像融合算法。对参加融合的两幅图像进行小波多尺度分解,对高低频子带系数分别采取不同的融合方法;根据高频分量不同的小波方向特性,采用基于方向相关系数的融合规则,而对低频分量采用能量和边缘特征相结合的融合方法;通过小波重构得到融合图像。实验结果表明,融合图像的视觉效果较好,客观评价指标均有提高。  相似文献   

9.
针对天宫一号目标飞行器无控飞行轨道衰降数值预报需要快速确定轨道积分高精度计算模型中的空气动力,在发展基于修正Boettcher/Legge非对称桥函数的天宫一号空气动力特性当地化算法基础上,对当地化算法的运算流程及对应程序代码进行了整体分析,根据原程序热点代码集中、数据独立性强及传输需求少等特点,发展了多核处理单元的并行优化方法。引入CUDA架构的GPU设备同时,开展了系统、算法以及语句三个层次的并行优化,设计了GPU内存对齐访问方案,使用数据传输函数,将算法求解部分内循环经过展开与合并,整理为整体移植入核函数的一个循环,利用GPU较强的并行计算能力提升运算效率,对函数、循环、指令等代码语句进行级别优化。使用设计的并行计算方案对类天宫飞行器空气动力特性当地化串行算法程序进行CPU+GPU移植优化,达到了近5倍的并行加速比,且使单次求解中GPU数据传输时间缩减为原来的23%,证实了并行方案和优化设计手段的高效实用性。在类天宫飞行器空气动力特性GPU并行算法程序验证基础上,使用GPU并行程序对天宫飞行器轨道衰降飞行340~120 km过程的气动特性进行了不同迎角、侧滑角等飞行姿态计算分析,提供了大量可供轨道飞行力学数值预报的空气动力计算数据。  相似文献   

10.
基于区域分割的红外与可见光图像融合算法的研究(英文)   总被引:7,自引:1,他引:6  
由于红外图像和可见光图像的成像特点不同,因此在航空监视领域红外图像和可见光图像融合有重要的研究意义。由于非下采Contourlet变换具有更好的方向性、较高的逼近精度和更好的稀疏表达性能,能有效的提取图像的特征信息。因此我们在非下采Contourlet域,以空间频率为度量标准对红外图像进行阈值分割,经过分割将红外图像和可见光图像分别划分为目标区域以及背景,随后对红外图像和可见光图像进行边缘检测从而得到边缘区域,针对三个不同区域分别选择不同的融合规则进行融合。通过两组不同灰度差异的红外与可见光图像的实验,将基于像素点,窗口策略的融合算法和本文所提出基于区域算法进行了主观和客观的对比,试验结果表明基于区域分割的红外与可见光图像融合算法不仅能有效提取出红外图像中的目标信息还能有效的保持可见光图像的所反映的光谱信息,因此本文提出的算法是一种有效且可行的图像融合算法。  相似文献   

11.
为解决雷达图像仿真中海量地面材质数据的存储和加载问题,采用基于自适应最大行程长度编码和修正 偶对的压缩算法进行材质数据的压缩,从而有效地减少了数据的存储量,消除数据传输的瓶颈,提高了数据传输的 吞吐能力。压缩算法面向 GPU快速处理,得到压缩数据适用于 GPU进行快速解压。  相似文献   

12.
采用了API 转发的技术路线,通过虚拟机、虚拟机管理系统与宿主机中各模块的协作,为虚拟机提 供与物理GPU 具有相同功能的显卡,在应用程序库层面实现了国产GPU 芯片的虚拟化平台。此外通过设计基 于QoS 的GPU 资源自适应调度算法,为多虚拟机的资源竞争提供了公平调度保证。最后通过测试验证了基于 国产GPU 芯片的虚拟化构建的可用性和基于QoS 的自适应公平性调度算法的有效性。  相似文献   

13.
基于GPU和隐式格式的CFD并行计算方法   总被引:1,自引:0,他引:1  
张兵  韩景龙 《航空学报》2010,31(2):249-256
从图形处理器(GPU)架构特点出发,提出了基于数据并行的隐式计算流体力学(CFD)求解方法,空间离散格式采用迎风Roe格式,计算网格适用于结构和非结构网格。采用统一计算设备架构(CUDA)技术实现了GPU上的隐式CFD并行计算。分别在Intel Core2 Quad3.0GHzCPU和NVIDIAGTX280 GPU上进行了计算,结果表明隐式格式计算速度是显式格式6倍以上,采用显式格式的计算加速比达到28倍,采用隐式格式计算加速比达到了28.7倍,同时计算加速比随计算规模的增加而增加。计算结果和实验结果较为吻合。  相似文献   

14.
针对精确制导武器末制导机器视觉技术应用需求,研究了基于卷积神经网络的、针对复杂背景及小目标的自主目标检测识别算法,并分别进行了网络性能评估和硬件资源需求定量评估。针对最优算法,提出了基于嵌入式受限资源下的高精度神经网络压缩算法,并对算法进行了普适性评估。基于GPU嵌入式平台,实现TensorRT路线网络优化,并在速度和精度两方面均衡考虑下,对裁剪与量化算法进行了详细实验验证。实验结果表明,高精度神经网络压缩算法在硬件资源受限条件下,可以有效提升推理速度,最终经算法优化后的网络结构,可以获得3倍以上的速度提升,网络精度损失小于5%。  相似文献   

15.
Multi-sensor image matching based on salient edges has broad prospect in applications, but it is difficult to extract salient edges of real multi-sensor images with noises fast and accurately by using common algorithms. According to the analysis of the features of salient edges, a novel salient edges detection algorithm and its rapid calculation are proposed based on possibility fuzzy C-means (PFCM) kernel clustering using two-dimensional vectors composed of the values of gray and texture. PFCM clustering can overcome the shortcomings that fuzzy C-means (FCM) cluster- ing is sensitive to noises and possibility C-means (PCM) clustering tends to find identical clusters. On this basis, a method is proposed to improve real-time performance by compressing data sets based on the idea of data reduction in the field of mathematical analysis. In addition, the idea that kernel-space is linearly separable is used to enhance robustness further. Experimental results show that this method extracts salient edges for real multi-sensor images with noises more accurately than the algorithm based on force fields and the FCM algorithm; and the proposed method is on average about 56 times faster than the PFCM algorithm in real time and has better robustness.  相似文献   

16.
杨静  冀红霞  魏明坤 《航空学报》2011,32(8):1469-1477
针对一类具有未建模误差和扰动的非线性系统的状态估计问题,提出一种在线估计并补偿模型误差的非线性滤波算法,该算法利用非线性预测滤波(NPF)基于预测输出残差的方差最小的基本原则估计模型误差,冉利用扩展卡尔曼滤波(EKF)的思想对补偿后的模型进行状态估计;详细推导了状态估计误差及其方差阵的传播模型.以卫星姿态确定系统为例,...  相似文献   

17.
针对电视制导应用,提出了一种改进的SURF特征描述子目标跟踪算法。首先对SURF特征描述子的生成过程进行了改进,利用三角特征和对角特征设计了改进的SURF特征描述子,在保证区分能力的基础上提高了运算速度;基于SURF特征点匹配,设计了电视制导的匹配跟踪策略。仿真试验证明,基于改进SURF特征描述子的跟踪算法满足电视制导需求,同时运算速度达到了26f/s,比改进前提高了一倍以上,满足实时性要求。  相似文献   

18.
针对准同步CDMA(码分多址)系统中解相关检测运算复杂度高以及常规CG(共轭梯度)法收敛速度慢的问题,提出了SSOR-PCG(对称超松弛预处理共轭梯度)模型求解方法。通过SSOR预处理降低了扩频码矩阵的条件数,从而提高收敛速度,减少了迭代次数。实验结果表明,本文提出的方法相对于解相关检测,运算复杂度大大降低,而误码率与解相关检测器相当;相对于共轭梯度法,收敛速度更快,有效减少了迭代次数。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号