首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对软件仿真高动态扩频信号实时性差的问题,通过分析扩频信号生成过程和分段插值运动模型,建立了一种高动态信号生成模型,由动态参数和当前时间计算瞬时伪码相位和瞬时载波相位,各采样点的计算彼此不相关,将仿真信号组织成多维的数据结构,利用GPU中大量的浮点运算单元并行计算,提高了信号仿真的实时性。仿真验证结果表明,基于GPU的分段插值多维并行算法仿真时长1s采样率100Msps的信号,仿真与传输耗时共计322ms,与CPU串行仿真相比加速约19.4倍,实现了高动态扩频信号实时仿真。  相似文献   

2.
为了快速计算分析利用视频测量方法测得的高速风洞试验密度场在扰动流场作用下的实验数据,针对密度场的数值求解问题,经过光线偏折理论分析密度场得到的二阶偏微分方程,对其研究实现了CPU串行有限元法求解。在此基础上提出了基于GPU的快速有限元求解密度场的方法,该方法经过对串行有限元法求解过程效率分析后,将耗时的神经网络拟合、总刚度矩阵和总载荷向量的求解进行了基于GPU的并行加速。实验结果表明:在精度满足实际工程要求的前提下,相对于CPU串行求解方法,所提方法可大大提高求解效率,且随着网格剖分成倍加密,其加速比成倍增加。   相似文献   

3.
基于分布式平台开展一种新的时域有限差分(FDTD)并行算法研究,该算法基于VC++、CUDA5.0平台开发,调用Intel MPI 4.1.0库进行测试,在上海交通大学高性能计算中心图形处理单元(GPU)集群、上海超级计算机中心的“魔方”商用超级计算机以及国家超级计算济南中心的“神威蓝光”国产超级计算机等平台开展软件调试。通过对纯CPU、GPU以及CPU和GPU的混合测试,线程调度水平、核心函数处理速度得到明显提升,同时减少了通信执行时间比例,提高了加速比和并行效率,最后以2×2微带阵列为验证模型进行拓扑优化测试,结果证明该算法准确、有效。   相似文献   

4.
按区域惩罚划分的并行多目标遗传算法   总被引:2,自引:0,他引:2  
解决多学科设计优化问题的多目标遗传算法通常面临着大计算量的挑战,提出了一种新型的并行化算法来提高其效率.全局个体均匀的分布在各个进程,首先从所有的进程中获取全局范围的Pareto最优解极值,并发送给每个进程,再由这些极值来构造各个进程自己的惩罚函数.通过惩罚函数给个体添加约束来划分各个进程的收敛区域,同时采取优化措施保证每个进程加速收敛并且收敛区域没有重叠和遗漏,这样每个进程只需收敛到特定的一段Pareto最优解,降低了计算量;同时由于进程间交换的数据量小,保证了效率的提高.通过与串行算法(NSGA2)和其他的并行化算法比较,显示了该算法的有效性和先进性.  相似文献   

5.
LZMA(Lempel Ziv Markov-chain Algorithm)无损压缩算法在进行数据压缩时速度慢且占用大量的CPU(Central Processing Unit)资源,不能满足实时系统的要求.在改进算法的基础上,采用FPGA(Field Programmable Gate Array)设计了一个LZMA压缩算法硬件加速电路.该电路由LZ77压缩控制器、区间编码控制器和数据读出控制器组成,采用数据乒乓结构、高性能并行匹配结构和流水线处理结构等多种方法提高了LZMA压缩算法的速度,在支持标准LZMA压缩文件格式的同时,将压缩速度提升到近125 Mb/s,相比基于软件的LZMA算法加速10倍,每个时钟处理的相对数据加速近200倍.最后通过基于Virtex-6 FPGA的ML605开发平台验证了硬件加速电路的正确性和可行性.   相似文献   

6.
现有无人机(UAV)影像三维重建方法在功耗、时效等方面无法满足移动终端对低功耗、高时效的需求。为此,在有限资源FPGA平台下,结合指令优化策略和软硬件协同优化方法,提出一种基于FPGA高吞吐量硬件优化架构的无人机航拍影像快速低功耗高精度三维重建方法。首先,构建多尺度深度图融合算法架构,增强传统FPGA相位相关算法对不可信区域的鲁棒性,如低纹理、河流等区域。其次,结合高并行指令优化策略,提出高性能软硬件协同优化方案,实现多尺度深度图融合算法架构在有限资源FPGA平台的高效运行。最后,将现有CPU方法、GPU方法与FPGA方法进行综合实验比较,实验结果表明:FPGA方法在重建时间消耗上与GPU方法接近,比CPU方法快近20倍,但功耗仅为GPU方法的2.23%。   相似文献   

7.
    
提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,Graphic Processing Unit)的分层低密度奇偶校验LDPC(Low-Density Parity-Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的问题.此外,通过采取片上constant memory存储器压缩存储校验矩阵以及利用片外global memory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9~34.8倍.  相似文献   

8.
提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,Graphic Processing Unit)的分层低密度奇偶校验LDPC(Low-Density Parity-Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的问题.此外,通过采取片上constant memory存储器压缩存储校验矩阵以及利用片外global memory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9 ~34.8倍.  相似文献   

9.
X射线动态数字图像降噪方法与快速实现   总被引:2,自引:2,他引:0  
对于X射线动态数字成像系统,为了实现高帧频采集引起的数字摄影(DR,Digital Radiography)图像降质的恢复,采用Anscombe变换将NL-means降噪算法引入到DR图像的降噪中.为了解决NL-means降噪算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU,Graphic Processing Unit)并行计算和高速浮点计算特性,将DR图像映射为GPU中的纹理,采用多线程并行计算,使得NL-means算法在GPU中加速执行.实验结果表明,NL-means能够有效抑制动态DR图像噪声.GPU加速方法可以在不损失图像信息的前提下,加速比可达2个数量级以上,满足了实时降噪的要求.  相似文献   

10.
    
高光谱图像在带来丰富光谱信息的同时,其数据量大和维数高的特性也使得各种目标检测算法进行处理时往往产生庞大的运算量,所以采用可以实现高光谱异常目标检测算法的高速处理方案显得尤为迫切和重要。考虑到现场可编程门阵列(FPGA)强大的并行计算能力和极具灵活的设计方式,针对高光谱异常目标检测RXD算法中协方差矩阵及其逆的计算量过大的问题,以分块并行和正交三角(QR)分解为主要加速思想,利用高层次综合(HLS)工具对算法进行优化,提出了RXD算法在FPGA平台上的加速方案。实验结果表明,所提出的基于FPGA平台的加速方案可以在保持算法检测性能的同时达到相较于CPU实现7.04倍的加速,验证了加速方案的正确有效性。  相似文献   

11.
对于卫星导航系统,由导航天线进行波束合成的多路并行导航信号需要具有严格的相位一致性,本文给出基于专用地检设备的多通道相位一致性测量方法。该地检设备采用载波相位辅助伪码测距技术,通过载波相位和伪码相位的联合解算,实现了伪码相位对载波相位解整周期模糊,最终测距精度达到1ps。采用该测试方法对系统进行配相,实现了各通道无周期模糊的相位一致性。  相似文献   

12.
同轴数字全息中固有的共轭像问题会严重影响再现像质量,已有的相位恢复算法需要大量计算才能祛除共轭像,且无法获得连续分布的解包裹相位像。提出一种基于多波长的相位恢复算法,该算法利用4个波长下记录的数字全息图,并在迭代过程中借助光学解包裹原理扩展了测量范围,实现了再现成像面中共轭像祛除的同时获得解包裹的相位分布。同时,由于在物面及记录面添加了约束条件,该方法中所用波长数少于其他已提出的基于多波长原理的相位恢复算法,而且具有更快的迭代收敛速度和更好的共轭像祛除效果。数值仿真和实验结果皆证明了该方法的有效性。   相似文献   

13.
将太阳能离子推力器应用于卫星的推进系统,完成从地球同步转移轨道(GTO)到地球同步轨道(GEO)转移任务;建立任务模型,设计基于纬度幅角的反馈控制策略,对发动机开关时间进行优化.采用图形处理器(GPU, graphic processing unit)加速的遗传算法(GA,genetic algorithm)对卫星转移轨道任务进行优化设计.仿真结果表明:通过对该闭环控制器的定常参数进行优化,可将轨道导引至目标轨道附近;采用太阳能离子推力器可减少燃料消耗.基于GPU加速的遗传算法,可缩短算法运算时间.  相似文献   

14.
LU-SGS因有较高的鲁棒性和小的内存需求而得到广泛应用,然而用于混合网格计算前需要进行网格排序和分组来实现算法并行;此外,LU-SGS格式收敛效率不高。针对这些缺点,本文提出了一种改进的适用于复杂混合网格的雅可比迭代方法,无需网格排序和分组就可实现算法的并行化,且有较快的收敛速度。该方法编程实现简单,易于采用OpenMP实现并行。算例研究表明,相比于LU-SGS格式,在各来流条件下,本文提出的方法收敛速度更快,鲁棒性好,并行和串行结果一致,且内存需求增加很少。   相似文献   

15.
为提升涡扇发动机的加速性能,对传统的转子加速度N-dot控制结构进行了改进,提出了一种基于跟踪误差的主动切换控制策略,在跟踪误差较大时,执行N-dot控制回路,否则执行稳态控制回路。同时提出了基于等高度线的N-dot控制计划制定方法,采用差分进化算法对加速过程进行优化,最大限度地减小与最大转速之间的误差。以优化出的不同高度下最大高压转子加速度作为N-dot控制计划,并采用紧格式动态线性化无模型自适应控制(CFDL-MFAC)算法设计N-dot控制器。与常规Min-Max选择结构下的PID控制N-dot相比,主动切换MFAC的N-dot控制在某中等推力军用涡扇发动机设计点上加速时间减小了0.7 s,在非设计点上加速减少了约1.2 s。  相似文献   

16.
单声道歌声分离是指将单声道歌曲中的伴奏和歌声分离,在旋律提取、歌词识别、卡拉OK伴奏等方面有重要应用。针对当前时频谱图预测精度受限的问题,利用高分辨率网络具有并行结构及特征充分交互提高模型性能的优势,提出基于高分辨率网络的单声道歌声分离算法。设计并构建适合单声道歌声分离的高分辨率网络,输入歌曲的时频谱图到网络,得到预测的伴奏和歌声时频谱图。结合歌曲相位进行重构,得到伴奏和歌声的时域信号。实验表明,在公开数据集MIR-1K上,所提算法的SNR、SIR、SAR指标均优于当前代表性算法,提高了分离后伴奏和歌声的质量。   相似文献   

17.
介绍DGPS系统原理,分析讨论了载波相位DGPS定位中主要残差在中、低动态下的影响,提出了载波相位DGPS接收机中一种不需要解算整周模糊度而快速解算定位的一种算法。  相似文献   

18.
基于N-S方程串并行计算的机翼优化设计   总被引:2,自引:1,他引:1  
对典型的大展弦比和中等展弦比机翼在0.7~0.9马赫数区间进行了串行和并行计算的数值校验,证实了以N-S (Navier-Stokes)方程为主控方程的串行和并行流场求解器的正确性,并讨论了并行效率和加速比.结合Powell算法,讨论了在确定的机翼平面形状和翼型的条件下,以升阻比最大为目标的三维机翼截面翼型最大厚度与扭角的优化设计.算例结果表明,厚度的非线性分布和负的扭角会改善机翼流场的流动状态,使机翼的升阻比得到提高,优化设计方法是可行的.   相似文献   

19.
在科学研究领域, 存储容量、处理效率和分析精度并不能适应科学数据的指数级增长速度。通过对科学数据结构与标准的研究, 提出了一个海量科学数据计算框架BSDF。提出了一种基于模型驱动的统一数据接口, 实现对异构科学数据的无差别访问;提出了一种基于元数据的自动分区算法, 通过参数预取与超平面维度计算确定任务颗粒度。实验结果表明:与H5Spark科学数据计算框架的基于9项基准测试的性能相比, BSDF计算框架提升了39%~68%;在特定领域PKTM的算法优化上, BSDF达到了41.62倍的加速比。   相似文献   

20.
尺度不变特征变换(SIFT)算法具有优良的鲁棒性,在计算机视觉领域得到广泛应用。针对SIFT算法高计算复杂度而导致其在CPU上运行实时性低的问题,基于现场可编程门阵列(FPGA)设计了一种低复杂度的快速SIFT硬件架构,主要对算法的特征描述符提取部分进行优化。通过降低梯度信息(包括梯度幅值和梯度方向)的位宽、优化高斯权重系数的产生、简化三线性插值系数的计算和简化梯度幅值直方图索引的求解等方法,避免了指数、三角函数和乘法等复杂计算,降低了硬件设计复杂度和硬件资源消耗。实验结果显示,提出的低复杂度快速SIFT硬件架构,与软件相比,可以获得约200倍的加速;与相关研究相比,速度提高了3倍,特征描述符稳定性提高了18%以上。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号