首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 859 毫秒
1.
Cache是处理器重要的存储模块,对处理器性能提升有着至关重要的作用.空间环境中,保护Cache免受软错误影响已成为设计新一代高可靠微处理器日益严峻的挑战.设计一种针对Cache Tag单错及邻位双错的低开销容错方法.可以保证Cache访问、Cache行填充和Cache行回写不受单位错误和邻位双错的影响,与传统SEC FastTag容错方法相比,Tag单位及邻位双错容错能力得到提高.通过扩展FastTag结构优化设计,降低SEC DAEC编解码逻辑带来的面积、功耗以及性能方面的开销.以四路组相连写回Cache为目标系统,与传统SEC DAEC容错方法相比,本文提出的方法面积开销降低8.47%,功耗开销降低37.7%,关键路径时延减小0.13 ns.  相似文献   

2.
    
提出了一种面向海量遥感图像高速压缩应用需求的多现场可编程门阵列(FPGA,Field-Programmable Gate Array),即处理器设计方案,包括针对压缩任务中模块间松耦合和模块内强关联的问题,提出了混合式多FPGA并行处理器结构;给出了包含数据均衡分发和码流规则回收的压缩处理机制,提高了同构FPGA的并行效率,确保压缩处理过程的正确性;给出了支持处理器故障和链路故障的结构容错模型,保证压缩处理过程的可靠性;给出了基于分布式外部存储与高速串行总线的多FPGA通信策略,满足海量遥感图像高速压缩的通信要求.实验结果表明:单片同构FPGA的并行效率达93.5%;应用系统的硬件压缩结果与软件压缩结果一致,计算吞吐率达1.6 Gbit/s以上,并具有高可靠性.  相似文献   

3.
视频编解码算法不仅复杂度非常高,对数据存储需要密集的矢量化访问.针对这一问题提出了一种线性斜移结构的二维存储方案,支持任意行或任意列的单指令存取,与SIMD(Simple Instruction Multiple Data)结构的矢量处理器相结合,能够成倍的加速视频计算的执行效率.给出了该方案的地址计算逻辑和存储结构,精简的地址计算逻辑和数据重排逻辑构成了视频处理器的矢量地址产生单元,解决了数据重排的高延迟和高复杂度问题.结合H.264视频编码标准对这一结构的性能进行了分析和对比,对该编码标准中的运动估计,分像素插值和去块效应滤波这3个计算复杂度最高的模块在该结构下的执行效率进行了分析和对比.   相似文献   

4.
    
提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,Graphic Processing Unit)的分层低密度奇偶校验LDPC(Low-Density Parity-Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的问题.此外,通过采取片上constant memory存储器压缩存储校验矩阵以及利用片外global memory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9~34.8倍.  相似文献   

5.
提出了一种基于Nvidia公司Fermi架构图形处理单元(GPU,Graphic Processing Unit)的分层低密度奇偶校验LDPC(Low-Density Parity-Check)码译码算法的译码器结构优化设计.利用GPU架构的并行性特点,采用帧间与层内双重并行的处理方式,充分利用流多处理器硬件资源,有效缓解了分层译码算法并行度受限的问题.此外,通过采取片上constant memory存储器压缩存储校验矩阵以及利用片外global memory存储器对译码迭代信息进行联合访问的优化方法,有效降低了访存延迟,提高了译码吞吐率.测试结果表明,通过采用多帧并行处理和存储器访问优化可以提升基于GPU的LDPC译码器吞吐率14.9 ~34.8倍.  相似文献   

6.
实现了面向宇航应用的高可靠SoC异常处理系统软硬件设计.为提高可靠性,将处理器及异常处理系统寄存器进行冗余设计,对SoC片上SRAM及各外设存储模块引入EDAC检错/纠错(纠一检二)机制.采用中断控制器统一管理众多的外设中断请求,对数据/指令的EDAC校验一位错和二位错异常,引入不同的硬件处理机制.一位错可通过EDAC逻辑纠正,不影响处理器正常运行,通过中断控制器以异步异常方式处理;二位错不能被EDAC逻辑纠正,影响处理器指令执行,通过总线反馈信号以精确同步异常方式处理,保证了异常响应的效率和系统可靠性.仿真验证结果表明,该异常处理系统可正确处理SoC众多外设和处理器内部异常.本文中的设计方法对高可靠处理器异常处理系统设计具有一定的参考价值.  相似文献   

7.
基于对等网络的自适应安全协作框架研究   总被引:3,自引:0,他引:3  
提出一种新型的基于对等网络架构的无集中的安全协作框架.灵活有效地支持多种安全服务,如安全管理、安全数据的存储和共享、安全信息发布等;给出了一种适应大规模动态网络环境的支持管理结构自动构造和安全组件自配置的层次和对等方式混合的安全管理方法;基于P2P(Peer-to-Peer)网络的动态特性实现了安全协作框架对于节点变化和安全协作需求的自适应;无集中的结构消除了集中管理的性能和带宽瓶颈,在网络攻击状态下有较强生存能力.   相似文献   

8.
首先对当前星载计算机系统在高轨卫星领域的应用现状进行了分析,主要涉及处理器最小系统的存储器设计、数据共享及总线协议设计等。针对上述3个方面存在的不足,提出了处理器最小系统存储器优化设计方案,解决了存储器应用与选型的困境;采用“存储器+FPGA电路”的设计方法,实现了主备机数据共享;提出了一种自适应总线协议设计方法,解决了1553B总线协议通用性较差等问题。提出的设计方法,在中国下一代大容量通信卫星平台的星务计算机系统中得以应用,并取得了较好的效果,为星载计算机系统后续优化设计工作提供了新的思路。  相似文献   

9.
针对嵌入式图像匹配计算特点,采用TMS320C6X系列处理器作为并行神经处理单元,设计了 一种基于TMS320C6X系列处理器HPI(Host-Port-Interface)互连的神经网络图像匹配多处理机系统,在这种并行计算系统中,包括一个主控计算单元和三个并行神经计算单元,主控计算单元通过HPI接口与各个神经匹配处理单元直接连接,通过HPI接口,主控计算单元可以直接访问各个神经元的片上和片外存储器,实现实时图像数据的直接转发和神经元中间运算结果的读取.理论分析表明,该设计可有效优化神经计算结构,提高图像匹配的实时性.   相似文献   

10.
星载高速图像数据压缩原理样机的研制   总被引:9,自引:1,他引:8  
针对星上高速遥感数据实时压缩要求,选用多模式自适应量化压缩算法,设计了同步并行阵列与流水线相结合的压缩系统体系结构,并以可编程序门阵列物理实现.采用四路压缩系统并行的阵列结构,研制成功高速数据压缩原理样机,数据处理速度大于1000Mbit/s,恢复图像平均峰值信噪比大于40dB.   相似文献   

11.
提出了一种基于查表的开环记忆多项式模型(MPM,Memory Polynomial Model)预失真器.从MPM预失真器系数估计和执行信号预失真处理两方面加以考虑.首先,利用预失真器和高功率放大器(HPA,High Power Amplifier)传输特性的互补性,由采集到的HPA输入、输出基带数据进行单次最小二乘估计得到MPM预失真器的系数,避免了以往递归结构的收敛性和计算量大等问题.然后,利用MPM预失真器的特点,建立了基于输入信号强度索引的一维向量表,通过查表实现MPM预失真器的幂次累加项,极大地减少了实现预失真器所需的计算量及硬件开销.仿真显示,采用提出的预失真器可以有效补偿HPA对信号的记忆非线性失真,有效带宽内获得了近20 dB的功率改善,也显著改善了系统误码性能.  相似文献   

12.
车载平视显示(HUD)系统通过图像翘曲变换将原始平面图像信息显示在挡风玻璃曲面上,原始图像数据的非线性访问会造成存储器访问效率下降。为此,设计了一种高速缓冲存储器(Cache),以最大程度保证像素数据访问的连续性,减少存储器访问次数并提高带宽资源利用率。为优化Cache性能,提出存储空间分离管理技术和地址分级比较技术,提高图像像素在Cache中的存储密度,并节省逻辑资源。此外,提出一种Cache容量动态调整的方法,在保证命中率前提下减少Cache存储资源的使用、降低功耗。实验结果显示,存储空间分离管理技术使存储资源节省25%,地址分级比较技术使逻辑资源节省近10%,Cache容量可以减少75%,且动态功耗减少67.578%,静态功耗减少14.060%。   相似文献   

13.
对SNOW机群系统的分布式共享存储管理机制进行适当的简化,就可实现网络虚拟存储环境.它以本地节点的主存作为cache,以网络上其它节点机的主存作为本地节点机主存的后援存储,取代本地节点机的硬盘或其它介质的存储设备.充分利用网络上节点的物理存储空间,使一些在单机上由于内存限制而无法完成的计算成为可能.这对于时间敏感性不高但需使用大内存的计算程序尤其适合.本文在介绍了网络虚存的概念之后,详细阐述了一个网络虚拟环境NET-RAM总体结构,软cache的实现方法,并对该网络虚存环境进行了测试,分析了测试结果.最后对今后的工作进行了探讨.   相似文献   

14.
  总被引:1,自引:1,他引:0  
数据更新率是星敏感器的一项重要指标。随着大面阵图像探测器的应用,传统单路质心方法的处理速度已成为更新率的主要瓶颈。为此,提出一种多路快速星点质心提取方法。首先,采用基于目标行方向有效长度的边界目标信息融合技术,能够实现各种形状边界目标信息的正确融合。其次,采用动态双指针循环映射机制,能够对无效信息占用存储资源进行循环利用,大大提高了存储资源的利用效率。最后,对本文方法进行实验测试,并在相同现场可编程门阵列(FPGA)芯片上,与传统单路质心方法的性能进行对比分析。实验结果表明,本文方法处理速度约为传统单路质心方法的3.6倍,但使用的存储资源仅约为后者直接扩展的多路方法的40%,从而验证了本文方法的可行性与有效性。  相似文献   

15.
针对具有共享存贮的分布式可扩展机群系统的结构及实现特点,通过实验的方法,对共享存贮器访问, 进程调度, 和同步开销等性能参数进行了特征化.对并行应用程序中影响性能的几个主要因素进行了分析,并给出了运用性能数据及系统性能参数对程序和系统的性能进行分析的方法. 将此方法运用于系统行为与性能的可视化,实现了一个基于分布式共乡存贮环境的并行应用程序的性能可视化工具,实时显示和后处理分析并行程序的行为和性能.  相似文献   

16.
实时连续多媒体任务模型及调度算法   总被引:1,自引:0,他引:1  
传统周期任务模型过于简单,不能适应实时多媒体流任务的多种形式,以用户为中心的连续媒体的调度算法由于未能从全局上考虑任务的服务质量QoS(Quality of Service)需求,因而调度效率较低.提出一种改进的以多媒体对象为中心周期任务模型,该任务模型概括了目前多媒体任务的基本表现形式.基于该任务模型,提出了一种以连续多媒体流的整个质量表现过程为中心的任务表现路径模型TPP(Task Presentation Path).在全面考虑表现路径中媒体流对象的全局死线、局部死线和任务连续失效率的基础上,给出了连续多媒体流的比例资源分配调度算法PSTPP(Proportional Share based on Task Presentation Path).实验结果表明了所提出的周期任务模型的合理性,调度算法能提供比传统分时策略以及EDF算法更好的QoS保证.  相似文献   

17.
基于内部总线的控制系统体系结构   总被引:1,自引:0,他引:1  
控制系统是卫星平台的关键分系统.由于各卫星总体任务的不同,各卫星对控制系统的要求也不断变化,使得控制系统的配置随着任务的不同而发生较大变化,对控制系统的体系结构产生较大的影响.对目前控制系统体系结构的特点进行分析,提出基于内部总线的控制系统体系结构以适应不断变化的配置需求,并进行可行性分析.分析结果表明这种体系结构有利于系统的配置变化和带宽的提高,能满足不同平台任务的需要.  相似文献   

18.
基于Web的带宽自适应组件化多媒体监控系统   总被引:4,自引:0,他引:4  
当前的分布式多媒体监控系统存在通用性、易用性和扩展性不足等缺点,且不能自适应多种网络状况.为解决其通用性、易用性问题,参考流媒体系统结构,给出了基于Browser/Server模式的监控系统结构.为增强其可扩展性,在DirectShow技术基础上,设计了基于COM的监控系统软件结构.采用带宽自适应的策略和方法,实现了系统对多种网络状况的动态自适应.   相似文献   

19.
Flash闪存是一种非易失性的存储器件,随着工艺尺寸的不断减小,存储容量需求的不断增加,存储可靠性与寿命成为Flash生产与应用过程中最严重的两个挑战.基于多级 (MLC,Multilevel Cell) "与非(NAND)型" Flash的层级结构特征与读写操作特性,构造了一种基于正交映射的纠错编码方法,给出其编解码原理与结构,并分析其纠错能力.在此基础上,分析了该编码方法在Flash存储系统中的两种典型应用场景,即分布式多用户共享存储以及历史数据的无差错恢复.此外,Flash存储单元的可靠性受擦除次数的限制,其寿命相当有限,该编码方法可以有效地利用坏块来提高Flash的整体生命周期.分析结果表明:不改变整体结构,只需对编码模块进行简单调整,即可实现多种实际应用需求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号