首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于FPGA的红外目标识别神经网络加速器设计   总被引:1,自引:0,他引:1       下载免费PDF全文
在红外目标识别领域,基于卷积神经网络的深度学习算法的识别精度已远远超过了传统模式识别算法,但神经网络的实现需要庞大的计算和存储,难以在无人机等嵌入式平台上进行部署。针对此问题,将通道级量化策略和梯度的近似优化训练引入到了低比特神经网络模型的建立中,并提出了一种可充分利用硬件计算资源的FPGA加速器,其整体平均性能为65.6GOPS。与其他相关工作的对比表明,低比特量化方法及其FPGA加速器实现,可以为嵌入式红外目标识别系统提供一种能效高、识别精度高的解决方案。  相似文献   

2.
地外探测无人系统具有存储、算力和能量等资源受限的特点.以深度学习为基础的感知、定位和决策算法可有效提升无人系统的智能化水平,而这类算法通常需要高算力,难以直接应用于地外探测无人系统.首先针对剪枝和量化的深度神经网络模型轻量化方法,在公开数据集上对多种算法进行定量分析.其次,提出基于剪枝、量化的轻量化计算方案,实现了基于模块化配置的轻量化计算软件StarLight,对深度神经网络进行快速轻量化和性能评估,解决了模型难以直接应用到计算资源受限系统的问题.最后,基于StarLight,对应用于火星车实验系统中的多种任务模型进行轻量化,在计算功耗≤15 W、计算处理主频≤1.2 GHz和计算存储容量≤1TB的受限资源条件下,实现了深度神经网络模型部署.实验表明,该软件能够满足计算资源受限系统的深度神经网络模型轻量化需求,为进一步提升地外探测无人系统的智能化水平奠定了基础.  相似文献   

3.
近年来,表现出极其优越性能的神经网络算法对硬件算力的要求逐渐提高.在一些低功耗场景如星载系统中,拥有可编程重构、高并行等特性的FPGA是神经网络算法较为合适的硬件加速平台.为了解决传统神经网络硬件加速器设计中片内资源消耗大、各功能模块耦合性高等问题,设计实现了一套专用AI指令集并应用在了基于FPGA的神经网络加速器的设计中.文章首先介绍了该指令集的设计方案.整个指令集由指令寄存器、指令解释器、指令转发模块、内存管理单元和多个模块构成.通过该指令集可实现对不同模块的复用,降低模块之间的耦合性.并以YOLOV3 Tiny网络模型为例,对比了平铺式和指令控制式两种加速方案的逻辑资源的消耗.验证了应用专用指令集可以减少约50%的FPGA逻辑资源的使用.  相似文献   

4.
    
高光谱图像在带来丰富光谱信息的同时,其数据量大和维数高的特性也使得各种目标检测算法进行处理时往往产生庞大的运算量,所以采用可以实现高光谱异常目标检测算法的高速处理方案显得尤为迫切和重要。考虑到现场可编程门阵列(FPGA)强大的并行计算能力和极具灵活的设计方式,针对高光谱异常目标检测RXD算法中协方差矩阵及其逆的计算量过大的问题,以分块并行和正交三角(QR)分解为主要加速思想,利用高层次综合(HLS)工具对算法进行优化,提出了RXD算法在FPGA平台上的加速方案。实验结果表明,所提出的基于FPGA平台的加速方案可以在保持算法检测性能的同时达到相较于CPU实现7.04倍的加速,验证了加速方案的正确有效性。  相似文献   

5.
目标检测与跟踪技术广泛应用于交通、医疗、安保和航天等领域.目前,目标检测与跟踪技术面临目标微弱、背景复杂、目标被遮挡等挑战.同时,随着脑科学研究的不断深入,人们对人脑视觉系统的理解逐渐透彻,利用类脑计算解决复杂背景下高精度目标检测与跟踪问题成为相关领域的重要研究方向.本文结合神经工程导向的类脑模型和计算机工程导向的深度神经网络(Deep Neural Networks, DNNs),提出多种基于类脑模型与深度神经网络的目标检测与跟踪算法,包括:基于演算侧抑制的目标检测算法,基于结构 对比度(Structure Contrast, SC)视觉注意模型的弱小目标检测算法和基于记忆机制与分层卷积特征的目标跟踪算法.实验结果表明,将类脑模型和深度神经网络应用于目标检测和跟踪领域,有利于实现复杂条件下的高精度目标检测和鲁棒性目标跟踪.  相似文献   

6.
随着智能控制技术的不断成熟,无人机给军事领域带来快速发展的同时也带来了威胁.因此针对空中飞行的无人机进行实时检测的任务需求,设计了一种基于Gabor深度学习的无人机目标检测算法.首先,搭建基于Gabor滤波器的深度神经网络,输入的图片经过该网络进行网格化划分,用以特征提取;然后,针对每个格子的特征利用回归算法计算其中物体的位置信息,并利用分类算法计算物体的类别信息,对以上得到的回归和分类结果进行筛选、融合得到最终的检测结果;最后,采集空中飞行的无人机真实数据构建数据集,在此基础上进行网络模型训练和算法验证.  相似文献   

7.
近年来,卷积神经网络(CNN)已被计算机视觉任务广泛采用。由于FPGA的高性能、能效和可重新配置性,已被认为是最有前途的CNN硬件加速器,但是受FPGA计算能力、存储资源的限制,基于传统Winograd算法计算三维卷积的FPGA解决方案性能还有提升的空间。首先,研究了适用于三维运算的Winograd算法一维展开过程;然后,通过增加一次性输入特征图和卷积块的维度大小、低比特量化权重和输入数据等方法改善CNN在FPGA上的运行性能。优化思路包括使用移位代替部分除法的方法、分tile方案、二维到三维扩展及低比特量化等4个部分。相对传统的二维Winograd算法,优化算法每个卷积层的时钟周期数减少了7倍左右,相较传统滑窗卷积算法平均每个卷积层减少7倍左右。通过研究,证明了基于一维展开的3D-Winograd算法可以大大减少运算复杂度,并改善在FPGA运行CNN的性能。   相似文献   

8.
提出了一种新的多目标组合运输物流量预测建模算法.以时间、领域、影响以及组合运输为基准,运用系统工程理论思想设计出一种四维的物流量影响因素模型,并运用结构方程模型对所建模型做了优化,提取出组合运输物流量的核心影响因素.在改进的神经网络算法的基础上结合遗传算法,提出了一种结合遗传算法的改进的神经网络新算法,弥补了改进的神经网络算法上的缺陷,在多目标组合运输物流量预测的实例应用中,该算法不仅有很高的预测精度,而且具有收敛速度快、运行稳定的特点.   相似文献   

9.
目标检测作为计算机视觉领域的热点问题,目前基于深度学习的目标检测方法可以分为2类:两步检测和一步检测,前者有着较高准确性,后者有着较好速度,但是为提高检测的性能两者都引入了锚机制。为提高目标检测系统的性能,基于深度卷积神经网络的两步检测算法引入了注意力引导(AG)模块,通过对候选区域网络(RPN)的锚机制进行引导,使得对于预选锚框形状的选择更具有多样性;同时针对传统的后处理方式非极大值抑制(NMS)算法存在的误检和漏检的问题,提出了一种置信度因子的NMS(Cf-NMS)算法,对于模型的整体性能有着很大的贡献。实验结果说明,所提方法虽然在速度性能上有略微的下降,但是无论是在RPN变体还是现有的先进算法在准确性方面都有提升。   相似文献   

10.
多目标优化问题是工程应用中的常见问题,已有的方法在解决3个目标以上的高维优化问题时效果欠佳.如何进行有效的个体选择是求解高维多目标优化问题的关键.针对该问题,提出了求解高维多目标优化问题的子目标进化算法.从理论上证明了多目标优化问题Pareto非支配解的求取,可通过子目标函数值排序,先行选择进化种群中部分非支配解;然后,根据排序信息有选择性地比较进化种群中的元素,减少了比较次数,从而快速获得非支配解集.同时,提出归一化函数差值的Minkowski距离"k近邻"距离计算方法,在进化过程中应用到密度函数中,加速了收敛速度.同当前求解高维多目标优化的算法,在对标准测试函数的计算性能上进行比较,统计结果显示了所提算法在性能上的优势.   相似文献   

11.
现有无人机(UAV)影像三维重建方法在功耗、时效等方面无法满足移动终端对低功耗、高时效的需求。为此,在有限资源FPGA平台下,结合指令优化策略和软硬件协同优化方法,提出一种基于FPGA高吞吐量硬件优化架构的无人机航拍影像快速低功耗高精度三维重建方法。首先,构建多尺度深度图融合算法架构,增强传统FPGA相位相关算法对不可信区域的鲁棒性,如低纹理、河流等区域。其次,结合高并行指令优化策略,提出高性能软硬件协同优化方案,实现多尺度深度图融合算法架构在有限资源FPGA平台的高效运行。最后,将现有CPU方法、GPU方法与FPGA方法进行综合实验比较,实验结果表明:FPGA方法在重建时间消耗上与GPU方法接近,比CPU方法快近20倍,但功耗仅为GPU方法的2.23%。   相似文献   

12.
新型进化神经网络模型   总被引:1,自引:0,他引:1  
目前的进化神经网络模型大多采用遗传算法进行网络进化设计.而研究表明,这种进化神经网络存在遗传编码、遗传操作及网络结构限制等很多问题;而采用进化规划是一种很好的途径.鉴于此,为了克服传统进化规划算法的不足,结合作者提出的快速免疫进化规划提出了一种网络连接权值及其拓扑结构同时进化优化的新型进化神经网络模型.最后,通过典型的异或分类问题(XOR)比较了该模型同BP神经网络及传统进化神经网络的计算性能,发现它不但计算精度好,而且计算效率高.   相似文献   

13.
目标检测技术广泛应用于交通、医疗、安保和航天等领域.目前,目标检测技术面临目标微弱、背景复杂、目标被遮挡等挑战[1].针对星表非结构化模拟地形采集的图像中岩石和石块小目标检测识别率低、误识别率高的问题,研究了当下效果最好、模型轻量化的YOLOv5目标检测算法,在其基础上进行改进优化器与优化检测框重复检测效果的一种满足实时性要求的岩石目标检测算法.具体通过引入空标签负样本、结合随机梯度下降法SGD(stochastic gradient descent)优化模型和非极大值抑制参数调节方法,提升YOLOv5网络模型的特征描述能力和分类准确率.利用在地面试验场采集的复杂地形图像作为数据集,并采用mAP(mean average pre-cision)、画面每秒传输帧数(FPS)、准确率和召回(P-R)曲线等作为性能指标,对所提出的目标检测网络进行了试验验证.结果 表明本文提出的改进网络拥有更高的准确率和更低的虚警率,同时保持原有算法的实时性.  相似文献   

14.
针对传统深度学习模型在进行焊缝缺陷检测时对小缺陷目标检测效果不理想问题,提出基于改进深度学习Faster RCNN模型的焊缝缺陷检测算法,算法通过多层特征网络提取多尺度特征图并共同作用于模型后续环节,以充分利用模型中的低层特征,增加细节信息;改进模型的区域生成网络,加入多种滑动窗口,从而优化了模型锚点的长宽比设置,提高检测能力。实验表明,改进Faster RCNN模型取得最优的缺陷检测结果,对于小缺陷目标仍取得较好的检测精度,从而验证了算法的有效性。  相似文献   

15.
针对传统优化算法在解决多约束条件下拦截弹道设计问题时迭代计算耗时过长的缺点,提出了一种快速拦截弹道设计方法.该方法基于人工神经网络的非线性拟合技术,先通过普通优化算法进行离线样本计算,对样本中目标位置和优化得到的飞行程序参数进行输入-输出映射拟合训练,从而实现在给定目标位置的情况下对最优飞行程序参数的快速计算,达到提高拦截弹道设计效率的目的.经过数值仿真验证,将该方法应用于拦截弹道设计,在保证良好命中精度的同时,设计所需的计算时间大大减少,从而提高了弹道设计的时效性.   相似文献   

16.
基于全局灵敏度方程的多层次弹道优化设计   总被引:1,自引:0,他引:1  
为了使防空导弹优化的弹道更有效的拦截目标,依据多层次法理论,以杀伤概率最大为目标,设计导弹中制导段弹道和末制导段时间参数.整个模型分为3层,第1层是导弹中制导段弹道,第2层是导弹末制导段,第3层是战斗部毁伤目标.将一个层次视为一个子系统,多层次弹道优化问题实质上就是多学科设计优化问题.采用全局灵敏度方程方法计算参数之间的敏度,在系统层进行优化,最终可得到杀伤概率最大的弹道.最后进行了拦截空地导弹目标的计算示例,并采用了均匀实验设计方法和BP神经网络以减小计算量.结果证明全局灵敏度方程是求解多层次弹道优化设计的有效方法.  相似文献   

17.
针对卷积神经网络难以对低光照环境拍摄的图像进行人脸检测的问题。提出了一种将图像显著性检测算法和深度学习相结合的算法,并应用于低光照人脸检测。所提算法将图像的显著性信息与图像原始RGB通道融合,用于神经网络训练。在低光照人脸数据集DARK FACE上进行了充分的实验,结果表明:所提方法在DARK FACE数据集上获得了比当前主流人脸检测算法更好的检测精度,进而验证了所提算法的有效性。   相似文献   

18.
一种基于FPGA的超高速32k点FFT处理器   总被引:4,自引:0,他引:4  
采用FPGA(Field Programmable Gate Arrays)实现了一个超高速的32k点的流水线FFT(Fast Fourier Transform)处理器.FPGA的工作频率为125MHz,可以处理连续的1Gs/s(1 Giga-samples per second)的复数数据.该FFT处理器主要基于二维分解算法,采用MDF(Multi-path Delay Feedback)流水线结构,并结合MDC(Multi-path Delay Commutator)及SDF(Single-path Delay Feedback)结构的特点.处理器的内存资源消耗相对MDC结构有所减少,而运算速度相对SDF结构有所提高.建立了处理器的算法和设计模型,并根据模型对处理器的3个组成模块进行了优化以减小资源消耗.利用VHDL语言在Xilinx ISE工具上进行了设计,FPGA的布局布线结果验证了设计的可行性.  相似文献   

19.
航天器对大容量高效计算的要求越来越高,现有的星载计算体系的能力已经难以满足其需求,需要建立具有自组织能力的智能计算体系,还要实现高效的任务调度.给出了航天器分布式智能计算体系的模型和任务调度问题的多目标优化模型,并根据该模型设计了改进粒子群算法和改进蚁群算法结合的DPSO-EACO算法,先利用粒子群算法生成初始调度方案,再用该方案初始化蚁群算法,利用蚁群算法生成最终调度结果.仿真结果表明,该算法的性能与改进粒子群算法和改进蚁群算法相比具有明显的性能优势.  相似文献   

20.
陨石坑是天体表面最为显著的地形特征,传统陨石坑识别方法主要是对小型陨石坑正负样本的二分类问题研究,且效率和精度均不高。以星体宏观视角下的大型陨石坑作为研究对象,结合图像处理和神经网络等方面的知识,创建了来自不同数据源的陨石坑样本数据库,研究了数据源对网络模型泛化能力的影响,提出了一种效率更高的陨石坑多分类识别方法。在非极大值抑制(NMS)算法基础上,提出了一种精度更高的陨石坑检测算法。经过参数优化和实验验证,构建的基于深度学习的多尺度多分类陨石坑自动识别网络框架取得了较高的准确率,在同源验证集上识别率可达0.985,在异源验证集上识别率可达0.863,并且有效改善了目标检测时检测框冗余及误检测的问题。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号