共查询到19条相似文献,搜索用时 62 毫秒
1.
为提高正交算法的运算速度,提出了一种将N点的一维正交变换分解成N0×N1点的二维正交变换(N=N0N1)和运算量较少的附加运算的并行扩维正交变换算法.在定义正交变换算法扩维并行性的基础上,讨论了离散傅里叶变换(DFT)、Hadamard变换和Hartley变换等算法的实现及性能.在TMS320C80多处理机平台上不同算法实现的试验结果表明:算法可有效减少数据的相关性、降低编程的复杂性,消除了处理单元片内内存容量的限制,适于以数字信号处理器(DSP)为处理单元的多处理机平台的并行实现. 相似文献
2.
离散W alsh变换(简称DWT)在实时信号处理中具有广泛应用,但它在单DSP上实现时,其高效求解问题规模受DSP片内内存容量的限制。在问题规模小于片内内存容量时,运算时间与问题规模近似呈线性关系;而当问题规模大于片内内存容量时,随着问题规模增加,运算时间近似呈现指数关系增加。文中在证明离散W alsh变换具有扩维并行性基础上,将N点的一维离散W alsh变换分解成N0×N1点的二维DWT(其中N=N0×N1)算法。算法通过减少数据的相关性的方法解决在单DSP平台上高效求解快速离散W alsh变换的问题规模受片内内存容量限制的问题,降低编程的复杂性。并在TMS320C80的单处理单元上进行该算法实现方法研究。结果表明,理论分析和试验结果吻合,算法适合在单DSP上实现。 相似文献
3.
4.
5.
6.
7.
针对离散Fourier变换(DFT)在实时信号处理中具有广泛应用、而其运算速度又受到DSP器件性能限制的情况,进行了DFT的并行性研究及并行性能分析;并在基于并行多处理机平台-TMS320C80的编程结构基础上,实现了两种并行DFT算法。基于TMS320C80进行的试验表明:所开发的并行DFT算法的运行结果与理论分析吻合,该并行算法的速度和精度都得到了保证。 相似文献
8.
9.
在基于小波变换的图像压缩编码算法中,Pearlman的利用子带内小波系数的聚类特性的Set Partition Embedded block(SPECK)算法与SPIHT算法相比,具有更低复杂度、更快的编解码速度和相近的性能。文中提出了一种基于DSP平台的SPECK编码器在实时环境下的应用方案。通过使用提升结构的整数小波变换并基于DSP平台上对变换流程进行优化,以提高小波变换的速度。引进误差比特数(Number of Error Bits)概念,并定义绝对零系数(Absolute Zero-Coefficient)对原有的SPECK算法进行改进,在不影响压缩性能的情况下,显著地减少了原算法对内存的需求,并提高了执行速度。实验结果证明,改进后的算法适应了大多数的实时系统的要求,是一个具有实用价值的DSP解决方案。 相似文献
10.
11.
针对多机系统结构,本文提出了在大粒度级并行划分串行程序的算示。该算法通过识别并行循环任务以及通过确定调用上下文关系识别过程任务,来划分串行程序中的并行成份。该算法是对串行程序实施并行分解的基础。本文还给出了该算法的正确性证明。 相似文献
12.
揭示了快速小波变换(FWT)算法内在固有的并行性,并基于多处理机平台TMS320C80进行了两种不同问题规模的FWT算法并行实现的研究,结果表明:理论的分析和实验结果是一致的,并且算法的速度和精度都得到了保证。 相似文献
13.
14.
15.
航空、航天领域中有许多问题非常适合并且需要使用并行处理,尤其可以利用SIMD计算机,以提高处理速度,如流场计算,FFT,矩阵运算等。但并行程序设计与串行程序设计相比较在实现上要更复杂。有许多影响并行程序效率的复杂因素需要通过实验进行研究,以不断优化算法。本文实现了一个在串行机上运行的适用于SIMD并行程序设计及性能评价的模拟环境—SIMDP2(SIMDProgrammingandPerformanceevaluatingenvironment)。该系统为研究者提供了一个廉价而灵活的SIMD计算机的并行算法研究及性能评价的实验环境。在该环境下,用户可分析、优化并行算法及评价所定义的SIMD系统结构 相似文献
16.
由于数字计算机的时序工作方式,在数字计算机上进行连续系统仿真,要做到实时,常常在频带上受到限制。以Transputer为基础的数字仿真器,采用了并行处理技术和超大规模集成电路相结合,使仿真速度大大提高。 相似文献
17.
18.
并行计算机系统中网络对整个系统性能影响起到了关键作用,而SPMD并行计算机系统在科学计算,特别是航空航天中比较普及,因此开发了通用SPMD并行系统结构性能评价模拟系统。该文描述的面向对象网络模拟系统是该模拟环境的一部分,采用伪汇编代码的算法程序作为输入,通过配置结构参数、与系统提供的描述不同结构的伪虻编指令函数库编译链接,达到对不同层次细节、不同侧重部件模拟研究的目的。与同类研究相比,本文的研究具有更通用的特点,能够方便地构造不同的动态和静态网络,特别是能够对可重构的多级互连网络进行性能评价研究。 相似文献
19.
结合 TMS32 0 C80的编程结构 ,利用神经网络的权并行性和神经元并行性 ,提出了BP算法的并行实现方法 ,并解决了存储器访问冲突、数据双缓冲传输、PP细粒度并行和死锁等问题。结果表明 ,该并行 BP算法十分有效。 相似文献