首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 625 毫秒
1.
深度神经网络目标检测算法计算复杂度高、模型复杂,对硬件平台的算力有很高需求,针对以上问题,设计了一种基于现场可编程门阵列(field programmable gate array, FPGA)芯片的硬件专用加速器.通过软硬件协同方法,设计具有高并行度及深度流水的片上架构,并使用模型量化、结构优化等方法对神经网络模型进行优化.在所设计的加速器系统中进行神经网络目标检测算法的部署,实现了高数据吞吐率、低功率消耗的FPGA神经网络计算,且模型精度损失低于1.2%,为在低能耗嵌入式平台上部署深度神经网络目标检测算法提供了有效解决方案,可广泛应用于机载、星载智能计算设备.  相似文献   

2.
一种基于FPGA的超高速32k点FFT处理器   总被引:4,自引:0,他引:4  
采用FPGA(Field Programmable Gate Arrays)实现了一个超高速的32k点的流水线FFT(Fast Fourier Transform)处理器.FPGA的工作频率为125MHz,可以处理连续的1Gs/s(1 Giga-samples per second)的复数数据.该FFT处理器主要基于二维分解算法,采用MDF(Multi-path Delay Feedback)流水线结构,并结合MDC(Multi-path Delay Commutator)及SDF(Single-path Delay Feedback)结构的特点.处理器的内存资源消耗相对MDC结构有所减少,而运算速度相对SDF结构有所提高.建立了处理器的算法和设计模型,并根据模型对处理器的3个组成模块进行了优化以减小资源消耗.利用VHDL语言在Xilinx ISE工具上进行了设计,FPGA的布局布线结果验证了设计的可行性.  相似文献   

3.
为了适应空间科学技术的发展, 满足空间科学应用系统的数据传输速率、多进制数字调制方式以及实现调制体制灵活性的要求, 提出了一种适用于空间应用的高速调制系统的设计与实现方案. 该方案采用了基于FPGA和DAC的通信调制技术, 可在硬件设计不变的情况下, 实现QPSK, 8 PSK和16 QAM等多种调制方式下的高速数据传输. 分析了高速调制在硬件实现上的技术难点, 解决了高频率高精度同步时钟生成、高速数据转换、宽带调制等技术问题. 实测表明, 在载频为2 GHz时, 该调制系统在8PSK调制下速率可达750 Mbit/s, 且调制信号的矢量幅度误差(EVM)仅为3.3 %.   相似文献   

4.
SRAM型FPGA的抗SEU方法研究   总被引:3,自引:0,他引:3  
通过分析静态随机访问存储器(Static Random Access Memorg,SRAM)型现场可编程门阵列(Field Programable Gate Array,FPGA)遭受空间单粒子翻转(SEU)效应的影响,并比较几种常见的抗SEU技术:三模冗余(Triple Module Redwcdancy,TMR)、纠错码(Error Correction Code,ECC)和擦洗(Scrubbing),提出了一种硬件、时间冗余相结合的基于双模块冗余比较的抗SEU设计方法。在FPGA平台上对线性反馈移位寄存器(Linear Feedback Shift Register,LFSR)逻辑进行软件仿真的抗SEU验证实现,将各种容错设计方法实现后获得的实验数据进行分析比较。结果表明,64阶LFSR的抗SEU容错开销与基于硬件的TMR方法相比,可以节省92%的冗余逻辑资源;与基于时间的TMR相比,附加时间延迟缩短26%。  相似文献   

5.
设计并实现了嵌入式红外视频数字录像机.它基于PC/104Plus体系结构,实现了PCI数据传输,在FPGA(Field-Programmable Gate Array)的控制下、使用2个存储单元轮换存储方式硬件化地实现了红外视频采集与数据传输、红外视频播放与数据传输的并行操作.该录像机人机界面友好,文件管理完善.   相似文献   

6.
基于FPGA的直接驱动阀用音圈电机功率驱动器   总被引:1,自引:1,他引:0  
音圈电机的功率驱动器对控制器运算速度要求较高,传统方法普遍采用模拟控制,但其存在调试不便、特性漂移、不易实现复杂控制算法、无法与数字控制器直接实现接口等固有缺点.介绍了基于现场可编程门阵列(FPGA,Field Programmable Gate Array)的采用全数字式控制的直接驱动阀用音圈电机功率驱动器.利用FPGA通过模块化设计,实现了产生脉宽调制(PWM,Pulse Width Modulation)信号、电流信号采样及其数字滤波、电流闭环控制以及与其它数字控制器的通讯等功能.仿真及实验结果表明:所设计的基于FPGA的音圈电机功率驱动器具有良好的电流跟踪性能,可以满足直接驱动阀系统的控制要求.FPGA的运用,大大简化了系统硬件结构,提高了系统的控制性能,且便于扩展功能以及与其它数字控制器实现接口.  相似文献   

7.
为了解决上下文自适应二进制算术编码器(CABAC,Context-based Adaptive Binary Arithmetic Coder)硬件实现吞吐率难以提高的问题,提出了基于数据流动态特性的电路优化方法.通过建立算法的数据流模型,提取出限制硬件实现性能的数据流反馈环路.针对上下文环路,采用3条迭代周期不同的子环路更新具有不同依赖周期的上下文变量,提高了时钟频率和吞吐率;对于字节打包环路,通过提取一类可简化电路结构的数据元素,并为之构建快速旁路,增加了环路的处理速度.基于上述方法并辅以基本的电路优化手段,设计实现在现场可编程门阵列(FPGA,Field-Programmable Gate Array)平台上频率可达309MHz,并且每个时钟周期处理一个编码符号.  相似文献   

8.
近年来,表现出极其优越性能的神经网络算法对硬件算力的要求逐渐提高.在一些低功耗场景如星载系统中,拥有可编程重构、高并行等特性的FPGA是神经网络算法较为合适的硬件加速平台.为了解决传统神经网络硬件加速器设计中片内资源消耗大、各功能模块耦合性高等问题,设计实现了一套专用AI指令集并应用在了基于FPGA的神经网络加速器的设计中.文章首先介绍了该指令集的设计方案.整个指令集由指令寄存器、指令解释器、指令转发模块、内存管理单元和多个模块构成.通过该指令集可实现对不同模块的复用,降低模块之间的耦合性.并以YOLOV3 Tiny网络模型为例,对比了平铺式和指令控制式两种加速方案的逻辑资源的消耗.验证了应用专用指令集可以减少约50%的FPGA逻辑资源的使用.  相似文献   

9.
尺度不变特征变换(SIFT)算法具有优良的鲁棒性,在计算机视觉领域得到广泛应用。针对SIFT算法高计算复杂度而导致其在CPU上运行实时性低的问题,基于现场可编程门阵列(FPGA)设计了一种低复杂度的快速SIFT硬件架构,主要对算法的特征描述符提取部分进行优化。通过降低梯度信息(包括梯度幅值和梯度方向)的位宽、优化高斯权重系数的产生、简化三线性插值系数的计算和简化梯度幅值直方图索引的求解等方法,避免了指数、三角函数和乘法等复杂计算,降低了硬件设计复杂度和硬件资源消耗。实验结果显示,提出的低复杂度快速SIFT硬件架构,与软件相比,可以获得约200倍的加速;与相关研究相比,速度提高了3倍,特征描述符稳定性提高了18%以上。   相似文献   

10.
多码率RS码部分并行译码结构设计   总被引:1,自引:0,他引:1  
为了满足在一个通信系统中使用多码率RS(Reed-Solomon)码的需求,提出了一种多码率部分并行结构的RS码译码器.按照功能,该译码器可分为伴随式计算模块,关键方程求解模块以及错误位置和错误值求解模块3个主要组成部分.针对符合CCSDS标准的2种RS码的特点,将运算系数相同的伴随式计算子单元进行复用;在关键方程的求解运算中使用一种新颖的部分并行结构,使得复用部分和非复用部分的运算周期相同,以减少运算等待时间,提高译码效率;在错误位置和错误值求解中采用查表方式完成Forney算法的系数相乘,并复用求逆查表运算和系数相同的钱氏搜索计算子单元,以减少资源的消耗.通过码率选择信号,可以选择RS(255,223)和RS(255,239)2种译码模式.通过Altera公司的FPGA(Field Pro-grammable Gate Array)对该多码率译码器进行了硬件实现,结果显示此译码器仅消耗2981个逻辑单元和9472 bit的存储器资源,大大低于2种单一码率译码器消耗资源的总和.  相似文献   

11.
In recent years, deep learning (DL) methods have proven their efficiency for various computer vision (CV) tasks such as image classification, natural language processing, and object detection. However, training a DL model is expensive in terms of both complexities of the network structure and the amount of labeled data needed. In addition, the imbalance among available labeled data for different classes of interest may also adversely affect the model accuracy. This paper addresses these issues using a new convolutional neural network (CNN) based architecture. The proposed network incorporates both spatial and spectral information that combines two sub-networks: spatial-CNN and spectral-CNN. The spectral-CNN extracts spectral information, while spatial-CNN captures spatial information. Moreover, to make the features more robust, a multiscale spatial CNN architecture is introduced using different kernels. The final feature vector is formed by concatenating the outputs obtained from both spatial-CNN and spectral-CNN. To address the data imbalance problem, a generative adversarial network (GAN) was used to generate data for the underrepresented class. Finally, relatively a shallower network architecture was used to reduce the number of parameters in the network and improve the processing speed. The proposed model was trained and tested on Senitel-2 images for the classification of the debris-covered glacier. The results showed that the proposed method is well-suited for mapping and monitoring debris-covered glaciers at a large scale with high classification accuracy. In addition, we compared the proposed method with conventional machine learning approaches, support vector machine (SVM), random forest (RF) and multilayer perceptron (MLP).  相似文献   

12.
为了把高层体系结构的标准应用到实时系统中,必须确保运行时支撑环境的实时性.联邦成员间相关的任务之间有优先顺序约束关系,在联邦成员内调度运行时较难提供可预测的响应,因而难以保证所有任务尤其是非周期任务的实时性.以任务调度理论的角度在联邦成员内部综合调度周期与非周期任务运行的D-EDF(Double-Earliest Deadline First)策略,既能舍弃部分冗余数据使周期性任务在截止时间前高效完成,又能调度非周期性任务规则的运行提高实时响应速度,使得联邦成员可以高效地处理有优先顺序约束关系的任务,进而改进了运行时支撑环境的实时性.最后证明了D-EDF调度策略的可行性.   相似文献   

13.
大规模车辆监控通信服务器的设计与实现   总被引:11,自引:0,他引:11  
为了解决大规模车队同时利用短消息业务和通用分组无线业务与多个监控中心进行通信的问题,研究了基于上述两种通道的车辆监控通信模型,详细设计了其中的通信服务器的功能和结构,使其能够支持各监控中心自由选择监控车辆、信息广播、特殊信息优先等服务.为了提高服务器的运行效率,在数据结构中充分采用了以空间换时间的方法,自行设计了监控接口协议,实现时采用了多线程、消息通信和组件技术.系统完成后大量的现场实验结果表明了服务器的高效性和稳定性.   相似文献   

14.
研究了空间通信用高速Reed-Solomon(255,223)码硬判决译码器的FPGA实现方法,提出一种新的纠错算法实现结构以最大程度提高译码器性能。设计中采用RiBM算法求解关键方程,并通过应用高速比特并行乘法器以及流水线和并行处理方法提高译码通过率。综合和测试验证结果显示,该译码器译码通过速率为1.7Gbit/s,译码延迟为296个时钟周期,优于目前同类型的RS译码器性能指标。  相似文献   

15.
基于PCA和WPSVM的航天器电特性识别方法   总被引:1,自引:1,他引:0  
针对航天器电特性监测系统识别过程中存在测试数据量大、特征维数高、样本少、计算速度慢和识别率低等问题,提出基于主成分分析(PCA)的特征提取和加权近似支持向量机(WPSVM)的在线故障诊断方法.实现了对信号故障特征的主成分分析、选择和提取,并对高维特征数据实现了降维,提高了航天器电特性在线故障诊断的准确性和速度.针对PCA中的结果选取问题,提出运用数据贡献度阈值进行数据截取的方法,有效地保证了数据的有效性与一致性.结果表明:该方法充分利用了航天器电特性监测系统的有用数据特征,有效提高了识别的精度,且计算时间较短,效率较高.   相似文献   

16.
具有相乘非线性的马达速度鲁棒控制   总被引:2,自引:2,他引:0  
变转速变排量联合控制是一种新型的容积控制,具有效率高和相对快的响应,但由于具有相乘的本质非线性,给控制带来一定的难度.针对变频调速变排量联合控制的泵控马达速度试验系统,建立了系统的数学模型,对存在的本质非线性问题,提出采用精确反馈线性化方法进行线性化处理,并设计了基于积分滑模面的马达速度滑模变结构控制器.由于系统参数多,各个参数是变化的且不易确定,造成常规的滑模变结构控制输出抖振现象严重,为降低输出抖振现象,提出采用自适应模糊滑模控制器进行改进,并对稳定性进行证明.最后对该控制方法的抗干扰性和正弦信号跟踪性进行了仿真试验,仿真结果验证了所设计的控制方法正确性.   相似文献   

17.
Linux内核在新型硬件平台上的实现   总被引:3,自引:0,他引:3  
新型微处理器M3270的研制成功,使得支持该体系结构的操作系统的研究迫在眉睫.通过对Linux内核体系结构的研究,进而分析出往新型硬件平台移植Linux内核所需进行的工作,将大大提高操作系统的设计水平、缩短开发时间.在分析了Linux内核的体系结构和M3270硬件体系结构的基础上,提出在该硬件平台上实现Linux内核的方法.   相似文献   

18.
基于Web的带宽自适应组件化多媒体监控系统   总被引:4,自引:0,他引:4  
当前的分布式多媒体监控系统存在通用性、易用性和扩展性不足等缺点,且不能自适应多种网络状况.为解决其通用性、易用性问题,参考流媒体系统结构,给出了基于Browser/Server模式的监控系统结构.为增强其可扩展性,在DirectShow技术基础上,设计了基于COM的监控系统软件结构.采用带宽自适应的策略和方法,实现了系统对多种网络状况的动态自适应.   相似文献   

19.
轻量级门户单点登录服务机制   总被引:3,自引:0,他引:3  
信息门户的建设过程中需要容易实施且灵活高效的整合模式.为克服传统单点登录机制无法满足在动态松耦合环境下实现快速整合的缺陷,结合面向服务架构思想,提出一种轻量级门户单点登录服务机制(LSSO-Service,Lightweight Single Sign-on Service),可为门户整合提供结构简单、完善通用、松散耦合、快速机动的单点登录服务.LSSO-Service基于高于对象层的分布式服务集成模式进行功能划分,可实现采用不同技术的应用系统在门户中的快速动态整合.阐述了LSSO-Service的设计思想和工作原理,并通过在国内某大型水利信息门户中的应用实践,说明该研究结果对于门户建设具有较高的理论意义和参考价值.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号