首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。   相似文献   

2.
针对大量数据串行相位解卷绕实时性较差的问题,设计了基于GPU的并行相位解卷绕算法。首先分析了典型的串行解卷绕算法在GPU平台实现的可行性,之后设计了适合于GPU加速的并行解卷绕算法。最后对基于GPU的并行相位解卷绕算法进行了仿真验证,多次测试结果表明:在保证解卷绕正确性的基础上,基于GPU的并行相位解卷绕算法相比传统CPU串行解卷绕算法约有3.5倍的加速比,基于GPU的并行相位解卷绕算法相比GPU串行解卷绕算法有63倍的加速比。  相似文献   

3.
现有无人机(UAV)影像三维重建方法在功耗、时效等方面无法满足移动终端对低功耗、高时效的需求。为此,在有限资源FPGA平台下,结合指令优化策略和软硬件协同优化方法,提出一种基于FPGA高吞吐量硬件优化架构的无人机航拍影像快速低功耗高精度三维重建方法。首先,构建多尺度深度图融合算法架构,增强传统FPGA相位相关算法对不可信区域的鲁棒性,如低纹理、河流等区域。其次,结合高并行指令优化策略,提出高性能软硬件协同优化方案,实现多尺度深度图融合算法架构在有限资源FPGA平台的高效运行。最后,将现有CPU方法、GPU方法与FPGA方法进行综合实验比较,实验结果表明:FPGA方法在重建时间消耗上与GPU方法接近,比CPU方法快近20倍,但功耗仅为GPU方法的2.23%。   相似文献   

4.
    
高光谱图像在带来丰富光谱信息的同时,其数据量大和维数高的特性也使得各种目标检测算法进行处理时往往产生庞大的运算量,所以采用可以实现高光谱异常目标检测算法的高速处理方案显得尤为迫切和重要。考虑到现场可编程门阵列(FPGA)强大的并行计算能力和极具灵活的设计方式,针对高光谱异常目标检测RXD算法中协方差矩阵及其逆的计算量过大的问题,以分块并行和正交三角(QR)分解为主要加速思想,利用高层次综合(HLS)工具对算法进行优化,提出了RXD算法在FPGA平台上的加速方案。实验结果表明,所提出的基于FPGA平台的加速方案可以在保持算法检测性能的同时达到相较于CPU实现7.04倍的加速,验证了加速方案的正确有效性。  相似文献   

5.
    
声发射(AE)技术是一种无损检测方法,可以对飞行器中复合材料结构的动态缺陷进行监测。针对AE信号模态成分复杂以及复合材料各向异性导致源定位精度不高的问题,提出基于经验小波变换(EWT)的广义互相关(GCC)时差定位(TDOA)算法。通过EWT对传感器观测到的AE信号进行自适应的分解重构得到其主频模态,有效提高了各通道信号间的相关系数;通过多向波速测量实验对波速进行了多项式拟合;采用GCC法求取各通道信号的时差对AE源进行定位。在平台实验中以T800型碳纤维复合材料板为对象,以断铅信号为AE源对算法进行了验证,实验结果证明了算法的准确性和实用性。  相似文献   

6.
图像检索一直是信息检索领域的难题。提出了一种基于尺度不变特征变换(SIFT,Scale Invariant Feature Transform),K-Means和潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)的图像检索算法。算法主要分为两个阶段。预备工作得到分类完成的图库、概率分配参数表和基本词库;实现检索是在预备工作的基础上归类测试图片,然后在该类下搜索最相似图片。对比传统的基于文本或内容的检索方法,该算法在检索之前将图片库中所有图片按其本身特征进行自动分类,取代人工标注图像信息的过程,同时由于整个算法完全基于图像特征,故此方法不会引入人工因素的干扰。实验结果表明,该算法能够较为准确地将要检索的图片归为图片库对应的类别中,有效地提高图像检索效率。  相似文献   

7.
  总被引:2,自引:0,他引:2  
针对变循环发动机非线性部件模型共同工作方程组求解时初值选取对收敛速度和精度的影响问题,提出一种基于量子粒子群优化(QPSO)算法与Broyden拟牛顿法混合的求解思路。首先,对变循环发动机(VCE)进行变几何特性分析以及反向传播(BP)神经网络下的外涵道稳态特性分析基础上,建立反映变几何特性以及模式切换等全状态部件模型。其次,以该模型性能计算为基准,提出了一种基于QPSO的Broyden拟牛顿混合算法来达到发动机共同工作平衡要求,通过发散系数实现混合算法的切换,以改善单一Broyden拟牛顿法对初值选取的依赖性同时提高QPSO算法的求解效率。通过高阶非线性方程组的仿真验证了算法的有效性、求解效率以及精度。最后,进行VCE部件模型稳态、动态仿真计算,结果表明:与GasTurb性能计算结果对比可以看出发动机速度特性、高度特性等变化趋势与GasTurb基本一致,且误差均小于2%;基于QPSO的Broyden拟牛顿混合算法可有效快速地完成VCE部件模型的求解;所建VCE部件模型能够有效实现该新型发动机的性能模拟分析。  相似文献   

8.
星基增强系统(SBAS)是向用户提供完好性信息的广域增强系统,涉及生命安全领域。为了提高SBAS系统的抗欺骗能力,基于椭圆曲线数字签名算法(ECDSA)提出面向北斗星基增强系统(BDSBAS)的电文认证设计方案。根据国内商用密码标准椭圆曲线(SM2)算法进行相应参数设计和电文排布方案,并描述了空中密钥更新(OTAR)的电文播发策略。为了进一步对试验方案进行验证,采用蒙特卡罗OTAR仿真器,基于3种播发调度算法进行仿真试验,通过调整权重对不同情况下OTAR电文接收时间进行分析。仿真结果为具体情况下OTAR电文方案播发调度的选择提供了重要参考依据。   相似文献   

9.
基于SAGWO算法的UCAVs动态协同任务分配   总被引:1,自引:2,他引:1  
通过分析无人作战飞机(UCAV)优势概率和任务联合威胁以及定义任务时间,建立了以目标价值毁伤、编队损耗代价和时间消耗为性能指标的多无人作战飞机(UCAVs)多约束动态任务分配数学模型,采用改进的灰狼优化(GWO)算法对数学模型进行求解;针对基本GWO算法求解早熟的缺点,给出了自适应调整策略和跳出局部最优策略,引入了二次曲线控制方法;对UCAVs动态协同任务分配特点,设计了目标任务序列编码方式,提出了基于自适应GWO(SAGWO)算法的UCAVs多目标动态任务分配方法。从静态与动态2种情况分别对该方法进行仿真验证;仿真结果表明,该方法是有效的,相比较于其他算法,其优化过程快速精准。   相似文献   

10.
尺度不变特征变换(SIFT)算法具有优良的鲁棒性,在计算机视觉领域得到广泛应用。针对SIFT算法高计算复杂度而导致其在CPU上运行实时性低的问题,基于现场可编程门阵列(FPGA)设计了一种低复杂度的快速SIFT硬件架构,主要对算法的特征描述符提取部分进行优化。通过降低梯度信息(包括梯度幅值和梯度方向)的位宽、优化高斯权重系数的产生、简化三线性插值系数的计算和简化梯度幅值直方图索引的求解等方法,避免了指数、三角函数和乘法等复杂计算,降低了硬件设计复杂度和硬件资源消耗。实验结果显示,提出的低复杂度快速SIFT硬件架构,与软件相比,可以获得约200倍的加速;与相关研究相比,速度提高了3倍,特征描述符稳定性提高了18%以上。   相似文献   

11.
    
提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,Graphic Processing Unit)的分层低密度奇偶校验LDPC(Low-Density Parity-Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的问题.此外,通过采取片上constant memory存储器压缩存储校验矩阵以及利用片外global memory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9~34.8倍.  相似文献   

12.
LZMA(Lempel Ziv Markov-chain Algorithm)无损压缩算法在进行数据压缩时速度慢且占用大量的CPU(Central Processing Unit)资源,不能满足实时系统的要求.在改进算法的基础上,采用FPGA(Field Programmable Gate Array)设计了一个LZMA压缩算法硬件加速电路.该电路由LZ77压缩控制器、区间编码控制器和数据读出控制器组成,采用数据乒乓结构、高性能并行匹配结构和流水线处理结构等多种方法提高了LZMA压缩算法的速度,在支持标准LZMA压缩文件格式的同时,将压缩速度提升到近125 Mb/s,相比基于软件的LZMA算法加速10倍,每个时钟处理的相对数据加速近200倍.最后通过基于Virtex-6 FPGA的ML605开发平台验证了硬件加速电路的正确性和可行性.   相似文献   

13.
将太阳能离子推力器应用于卫星的推进系统,完成从地球同步转移轨道(GTO)到地球同步轨道(GEO)转移任务;建立任务模型,设计基于纬度幅角的反馈控制策略,对发动机开关时间进行优化.采用图形处理器(GPU, graphic processing unit)加速的遗传算法(GA,genetic algorithm)对卫星转移轨道任务进行优化设计.仿真结果表明:通过对该闭环控制器的定常参数进行优化,可将轨道导引至目标轨道附近;采用太阳能离子推力器可减少燃料消耗.基于GPU加速的遗传算法,可缩短算法运算时间.  相似文献   

14.
将两片基于ARM(Advanced RISC Machine)内核的微控制器应用于某型共轴式无人直升机飞控导航系统的CPU(Central Processing Unit)模块,连同电源及舵机信号处理模块、信号处理及接口模块形成一个高度集成的嵌入式飞控导航计算机,提供的8路异步串行通讯接口、8路数字信号口,与组合导航设备、信号调理设备、收发电台和姿态稳定系统与舵机等外围设备连接构成一套完整的无人直升机数字式飞控导航系统,另配置了16 MB FLASH(Flash Eeprom)用于任务与飞行状态数据记录,并基于ADS(ARM Developer Suite)集成开发环境编制了系统的飞控与自主导航软件.经地面检测与调试,该系统运行情况良好.  相似文献   

15.
基于DeviceNet总线的双CPU冗余实现   总被引:1,自引:0,他引:1  
介绍了一种基于DeviceNet现场总线的双CPU冗余实现,双CPU冗余设计对提高分布式计算系统(DCS,Distributed Computer System)可靠性有重要意义.两个CPU处理单元与多个数据I/O单元通过一个现场总线连接,CPU处理单元中运行的DeviceNet客户机和服务器程序实现两个处理器单元之间的数据同步及对各个数据I/O单元的冗余控制.当主CPU单元发生严重故障停止运行时,从CPU单元中运行的伪组2客户机程序帮助从CPU单元快速完成主从切换,在不到8 ms的时间内接管整个系统.该研究应用于某专用DCS系统过程控制站的设计中,提高了系统的可靠性.  相似文献   

16.
卫星导航共视时间比对一直是远距离时间比对的重要方法之一。使用我国最新发射的北斗三号全球导航卫星,基于中科院国家授时中心(NTSC)和捷克光电研究院(TP)各自的时间产生和保持系统,开展了中捷北斗三号长基线共视时间比对试验。本文对中捷两站各自的北斗卫星可视数及其卫星高度角情况进行了统计分析,利用Vondark滤波对时间比对结果进行了降噪处理,最后将北斗三号共视时间比对结果与北斗二号及GPS共视时间比对结果进行了比较。结果表明:北斗三号在当前全球组网阶段中捷共视可视卫星数比北斗二号还少的情况下,其共视时间比对精度达到1.16ns,较北斗二号提升约19%,与GPS更为接近。  相似文献   

17.
以XRS-152/153影像增强器DR/CT成像系统为研究对象,在分析其输出像场畸变特性的基础上,从校正精度和校正实时性要求出发,采用空间坐标多项式变换方法进行畸变校正.同时,为了解决畸变校正算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU, Graphic Processing Unit)并行计算和高速浮点计算特性,将图像映射为GPU中的纹理,采用多线程并行计算,使得校正算法在GPU中加速执行.实验结果表明,本方法能有效实现畸变图像的校正,GPU加速方法可以在不损失图像信息的前提下,实现实时校正.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号