共查询到18条相似文献,搜索用时 187 毫秒
1.
2.
3.
在风洞试验中,现有的基于CPU 的光流法求解荧光油膜运动速度场耗时过长,而基于GPU 的光流法存在GPU 资源利用不充分的问题。为此,提出基于荧光油膜图像分块和临界约束的GPU 荧光油膜运动路径实时测量方法。将荧光油膜时序图像按照GPU 的资源将整帧图像切割分块并行处理,创建其对应的光流并行计算策略,即充分利用GPU 的并行流水架构优势和共享内存实现各并行块的光流计算的硬件加速;同时结合块间临界约束条件,以各块的速度矩阵迭代差为标志控制其迭代计算次数。结果表明:本文方法在保证荧光油膜运动速度场计算精度的条件下,较传统的基于CPU 的光流法解算速度平均提升了2 789.5 倍,较整帧图像的GPU 光流法速度平均提升了10.09 倍,实时解算速度可达90 帧/秒。 相似文献
4.
基于GPU的脉冲压缩并行化研究 总被引:1,自引:0,他引:1
在雷达数字脉冲压缩实时信号处理中,常需要每秒完成几亿甚至几百亿次的运算,采用能够专注于执行高度线程化并行任务的GPU实现脉冲压缩具有重要意义.根据线性调频信号和匹配滤波器理论基础,提出了基于GPU的脉冲压缩并行化实现方法.测试结果表明,基于GPU的脉冲压缩并行化方法相对于CPU有百倍以上的加速比. 相似文献
5.
红外图像所含边缘等细节偏少、可见光又容易受外部环境干扰,融合图像可以提供更全面的信息,符合人或机器的视觉特性,为图像进一步分析、识别等提供基础。提出一种比值与梯度加权的可见光与红外光图像融合算法,结合小波变换在图像分解中的特性及信号集中的特点,将小波变换应用于红外光和可见光图像融合中可以提高融合信息的理解能力。针对分解获得的低频系数主要反映图像细节信息的特点,对低频系数采用比值加权分析融合规则;针对分解获得的高频系数主要反映图像边缘信息特征的特点,对高频系数采用改进边缘检测算子梯度加权的融合规则。选取多组图像进行了不同融合规则实验对比分析,通过客观评价指标进行评价,改进的融合算法可以获得较清晰的融合图像,可以增加图像的互补信息,并能较好地提高融合图像的清晰度。 相似文献
6.
图像融合一直以来都是图像处理与机器视觉领域中极其重要的研究方向,而稀疏表示(Sparse Representation,SR)是当前应用最为广泛的图像表示理论之一.针对传统的基于稀疏表示的图像融合策略对超完备字典信息利用不足的问题,提出了基于原子加权稀疏表示(Atom?weighted Sparse Representation,AWSR)的图像融合算法.首先,利用超完备字典对源图像进行稀疏域分解,得到稀疏系数向量;然后,基于超完备字典的信息表达特性构造权向量,并对稀疏系数向量进行加权;最后,基于原子加权融合系数,并结合稀疏系数向量及超完备字典完成源图像的融合.基于六种融合图像质量客观评价指标的对比实验证明了本文方法的融合质量优于传统的基于稀疏表示的图像融合算法,验证了该加权策略能够有效提升图像融合系统的抗噪性和鲁棒性. 相似文献
7.
以圆管构型的声传播为分析对象,研究了基于图形处理器GPU的计算气动声学(Computational Aeroacous-tics,CAA)高阶有限差分算法的并行实现,并与CPU串行及MPI并行实现作了对比分析。首先介绍了管道简化模型的2.5维线化欧拉方程和GPU的编程模式以及调优参考准则,然后给出了相关物理量的空间离散方法的GPU实现。数值实验的结果表明,与CPU串行及MPI并行程序的结果相比,使用GPU的程序实现在达到与MPI并行同样的计算效率时,可以使用更少的计算资源。较之cluster上串行算法,工作站上GPU并行算法在使用不同网格规模的情况下可达到的3倍多的加速比。 相似文献
8.
不同传感器获得的多幅图像对同一场景的描述具有信息的冗余性和互补性,在小波图像融合的基础上提出了一种基于边缘和方向相关性的图像融合算法。对参加融合的两幅图像进行小波多尺度分解,对高低频子带系数分别采取不同的融合方法;根据高频分量不同的小波方向特性,采用基于方向相关系数的融合规则,而对低频分量采用能量和边缘特征相结合的融合方法;通过小波重构得到融合图像。实验结果表明,融合图像的视觉效果较好,客观评价指标均有提高。 相似文献
9.
《载人航天》2020,(4)
针对天宫一号目标飞行器无控飞行轨道衰降数值预报需要快速确定轨道积分高精度计算模型中的空气动力,在发展基于修正Boettcher/Legge非对称桥函数的天宫一号空气动力特性当地化算法基础上,对当地化算法的运算流程及对应程序代码进行了整体分析,根据原程序热点代码集中、数据独立性强及传输需求少等特点,发展了多核处理单元的并行优化方法。引入CUDA架构的GPU设备同时,开展了系统、算法以及语句三个层次的并行优化,设计了GPU内存对齐访问方案,使用数据传输函数,将算法求解部分内循环经过展开与合并,整理为整体移植入核函数的一个循环,利用GPU较强的并行计算能力提升运算效率,对函数、循环、指令等代码语句进行级别优化。使用设计的并行计算方案对类天宫飞行器空气动力特性当地化串行算法程序进行CPU+GPU移植优化,达到了近5倍的并行加速比,且使单次求解中GPU数据传输时间缩减为原来的23%,证实了并行方案和优化设计手段的高效实用性。在类天宫飞行器空气动力特性GPU并行算法程序验证基础上,使用GPU并行程序对天宫飞行器轨道衰降飞行340~120 km过程的气动特性进行了不同迎角、侧滑角等飞行姿态计算分析,提供了大量可供轨道飞行力学数值预报的空气动力计算数据。 相似文献
10.
基于区域分割的红外与可见光图像融合算法的研究(英文) 总被引:7,自引:1,他引:6
由于红外图像和可见光图像的成像特点不同,因此在航空监视领域红外图像和可见光图像融合有重要的研究意义。由于非下采Contourlet变换具有更好的方向性、较高的逼近精度和更好的稀疏表达性能,能有效的提取图像的特征信息。因此我们在非下采Contourlet域,以空间频率为度量标准对红外图像进行阈值分割,经过分割将红外图像和可见光图像分别划分为目标区域以及背景,随后对红外图像和可见光图像进行边缘检测从而得到边缘区域,针对三个不同区域分别选择不同的融合规则进行融合。通过两组不同灰度差异的红外与可见光图像的实验,将基于像素点,窗口策略的融合算法和本文所提出基于区域算法进行了主观和客观的对比,试验结果表明基于区域分割的红外与可见光图像融合算法不仅能有效提取出红外图像中的目标信息还能有效的保持可见光图像的所反映的光谱信息,因此本文提出的算法是一种有效且可行的图像融合算法。 相似文献
11.
为解决雷达图像仿真中海量地面材质数据的存储和加载问题,采用基于自适应最大行程长度编码和修正 偶对的压缩算法进行材质数据的压缩,从而有效地减少了数据的存储量,消除数据传输的瓶颈,提高了数据传输的 吞吐能力。压缩算法面向 GPU快速处理,得到压缩数据适用于 GPU进行快速解压。 相似文献
12.
13.
基于GPU和隐式格式的CFD并行计算方法 总被引:1,自引:0,他引:1
从图形处理器(GPU)架构特点出发,提出了基于数据并行的隐式计算流体力学(CFD)求解方法,空间离散格式采用迎风Roe格式,计算网格适用于结构和非结构网格。采用统一计算设备架构(CUDA)技术实现了GPU上的隐式CFD并行计算。分别在Intel Core2 Quad3.0GHzCPU和NVIDIAGTX280 GPU上进行了计算,结果表明隐式格式计算速度是显式格式6倍以上,采用显式格式的计算加速比达到28倍,采用隐式格式计算加速比达到了28.7倍,同时计算加速比随计算规模的增加而增加。计算结果和实验结果较为吻合。 相似文献
14.
针对精确制导武器末制导机器视觉技术应用需求,研究了基于卷积神经网络的、针对复杂背景及小目标的自主目标检测识别算法,并分别进行了网络性能评估和硬件资源需求定量评估。针对最优算法,提出了基于嵌入式受限资源下的高精度神经网络压缩算法,并对算法进行了普适性评估。基于GPU嵌入式平台,实现TensorRT路线网络优化,并在速度和精度两方面均衡考虑下,对裁剪与量化算法进行了详细实验验证。实验结果表明,高精度神经网络压缩算法在硬件资源受限条件下,可以有效提升推理速度,最终经算法优化后的网络结构,可以获得3倍以上的速度提升,网络精度损失小于5%。 相似文献
15.
Multi-sensor image matching based on salient edges has broad prospect in applications, but it is difficult to extract salient edges of real multi-sensor images with noises fast and accurately by using common algorithms. According to the analysis of the features of salient edges, a novel salient edges detection algorithm and its rapid calculation are proposed based on possibility fuzzy C-means (PFCM) kernel clustering using two-dimensional vectors composed of the values of gray and texture. PFCM clustering can overcome the shortcomings that fuzzy C-means (FCM) cluster- ing is sensitive to noises and possibility C-means (PCM) clustering tends to find identical clusters. On this basis, a method is proposed to improve real-time performance by compressing data sets based on the idea of data reduction in the field of mathematical analysis. In addition, the idea that kernel-space is linearly separable is used to enhance robustness further. Experimental results show that this method extracts salient edges for real multi-sensor images with noises more accurately than the algorithm based on force fields and the FCM algorithm; and the proposed method is on average about 56 times faster than the PFCM algorithm in real time and has better robustness. 相似文献
16.
17.