共查询到20条相似文献,搜索用时 887 毫秒
1.
基于Pentium Pro的高性能BLAS的设计与实现 总被引:1,自引:1,他引:1
李忠泽 《北京航空航天大学学报》1998,24(4):454-457
支持科学和工程计算的BLAS(基本线性代数子程序)在高性能计算中有着重要作用.本文针对Pentium Pro的体系结构特点,提出了一些优化方法使得BLAS在Pentium Pro上计算性能达到最佳.测试表明,在200MHz的Pentium Pro上BLAS3的速度可达112Mflops. 相似文献
2.
基于投影寻踪的高光谱图像异常检测并行算法 总被引:1,自引:0,他引:1
投影寻踪方法能有效提取数据中的非高斯结构凸显异常信息,但在求解最优投影方向时存在计算量大、运行时间长的问题,为提高处理效率,提出一种机群环境下的并行算法.选用偏度和峰度组合作为投影指标,将所有像素光谱作为特定投影方向集依次搜索,求解最优投影方向.在并行计算各候选方向投影指标时,分割图像数据分布存储于各机群结点,数据子块朝候选方向并行投影后,将指标计算式变形分解,使各结点在指标计算过程中所需数据均为本地数据,解决数据局部性问题,并采用一种"轮流作主"的机制提高算法负载均衡程度.利用实用型模块化高光谱仪数据在机群系统上进行测试,达到了较好的加速效果,表明该并行算法具有良好的并行性能. 相似文献
3.
本文提出了航天器热分析技术的流程图(热分析器),着重论述了热分析的结点网络法的基本理论、特点及其运用实例.本文介绍依照结点网络法而编制的稳态温度的250阶结点网络方程通用计算机程序.经过实例验证,得到计算精度在2~8℃范围内的良好计算结果.讨论了影响计算精度的主要因素并与国外热分析器的性能作了比较. 相似文献
4.
网络计算环境下任务调度问题研究 总被引:5,自引:0,他引:5
利用网上空闲处理机组成机群并行计算环境是快速增长的研究领域,任务调度是其中最关键性的问题之一.在基于消息传递机制的网络并行计算环境下,针对一类大粒度计算任务并行时协同同步工作问题,发展了一种新的静态调度模型,提出了调度算法,它映射一类特殊的并行程序任务到由网络上若干空闲处理机组成的机群中.研究表明该算法能减少此类并行程序的完成时间. 相似文献
5.
以XRS-152/153影像增强器DR/CT成像系统为研究对象,在分析其输出像场畸变特性的基础上,从校正精度和校正实时性要求出发,采用空间坐标多项式变换方法进行畸变校正.同时,为了解决畸变校正算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU, Graphic Processing Unit)并行计算和高速浮点计算特性,将图像映射为GPU中的纹理,采用多线程并行计算,使得校正算法在GPU中加速执行.实验结果表明,本方法能有效实现畸变图像的校正,GPU加速方法可以在不损失图像信息的前提下,实现实时校正. 相似文献
6.
数据交换是电子政务应用的核心问题.构建一种应用层数据交换覆盖网络成为解决这类问题的关键.分析了电子政务数据交换的特点,提出了电子政务数据交换覆盖网络eGON(e-Government data exchange Overlay Network)的概念模型,在树型结构组织网络的基础上,引入结点间组织距离和结点适应度概念,提出了一种eGON拓扑结构模型——双尺度异质组织网络模型DSHON(Dual Scale Heterogeneous Organization Network),该模型按照与组织距离和能力适应度2种尺度相关的概率添加快捷边,实现网络性能改善.设计了eGON的总体结构、构建与维护机制、路由维护协议和基于组织距离优先的消息路由算法,并进行了路由算法实验验证. 相似文献
7.
二维跨音速Euler方程分区并行算法 总被引:3,自引:0,他引:3
对二维跨音速流动的Euler方程分区算法、并行算法以及多区计算的有效内边界耦合条件进行了探讨,应用Van Leer矢通量分裂方法和一维数组方式,研究了多种区域分解数目的分区计算效率.并行计算中采用"先进先出"的同步控制等待机制,采用纯结点并行编程方式进行了单区、二区和四区并行计算对比,分析了影响并行效率和通讯过载比的主要因素. 相似文献
8.
网络分布式并行计算的负载平衡 总被引:2,自引:0,他引:2
胡凯 《北京航空航天大学学报》2004,30(11):1121-1124
利用分布式系统动态负载平衡的原理,设计了一种适应网络分布式并行计算环境的负载平衡实现机制,采用集中式负载信息收集策略,集中和分布式相结合的传输控制策略.定义了一种新的复合型负载指标来衡量各处理机的负载程度.讨论了相应的理论和实现中的关键问题,给出了主要的实现策略和算法.仿真比较研究表明这种体系结构和相应策略能对网络环境下分布式并行计算提供有力支持. 相似文献
9.
日冕物质抛射(Coronal Mass Ejection,CME)参数识别模型是太阳风预报过程的重要组成部分.在空间环境预报业务中,为提高太阳风预报的准确率,需要提高CME参数识别的精度.模型以计算任务串行的方式运行,运算效率低导致模型运算时间长,不能满足这种需求.CME参数识别模型的物理运算过程相互不独立,其在单节点上的运行方式不能满足并行化要求.基于MapReduce的并行计算框架,改进了CME参数识别模型的计算流程,提出CDMR(CME detection under MapReduce)方法,实现了CME参数识别模型的并行计算,并对比分析CME参数识别模型在串行计算和MapReduce并行计算下的运行时间,提高了模型的识别精度和计算效率. 相似文献
10.
X射线动态数字图像降噪方法与快速实现 总被引:2,自引:2,他引:0
对于X射线动态数字成像系统,为了实现高帧频采集引起的数字摄影(DR,Digital Radiography)图像降质的恢复,采用Anscombe变换将NL-means降噪算法引入到DR图像的降噪中.为了解决NL-means降噪算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU,Graphic Processing Unit)并行计算和高速浮点计算特性,将DR图像映射为GPU中的纹理,采用多线程并行计算,使得NL-means算法在GPU中加速执行.实验结果表明,NL-means能够有效抑制动态DR图像噪声.GPU加速方法可以在不损失图像信息的前提下,加速比可达2个数量级以上,满足了实时降噪的要求. 相似文献
11.
基于动态负载平衡的sort-first绘制集群 总被引:1,自引:0,他引:1
对图形绘制集群中节点间负载不均衡问题提出了基于延期着色绘制的sort-first图形绘制集群.分析了延期着色中可见性检测、全局光照着色、局部光照着色3类算法的计算原理,用于预测不同阶段的绘制负载;将负载预测算法转换为场景绘制中的片段着色算法;借助图形处理器的并行处理能力,通过集中式的预着色计算,获得了屏幕空间内逐像素的绘制负载分布;基于预测的绘制负载分布,分配图形绘制集群中各个节点的绘制任务.根据实验结果,该系统可以实时预测并剖分绘制负载,精确的负载预测使系统获得高速、稳定的图形绘制性能. 相似文献
12.
根据星载合成孔径雷达(Synthetic Aperture Radar,SAR)实时和准实时成像的需求,论文设计和实现了一种混合编程模式的非线性CS(Nonlinear Chirp Scaling, NCS)成像算法。此方法基于SMP(Symmetric Multiprocessing)集群系统,利用MPI(Message Passing Interface)和Pthread混合编程,实现了多进程和多线程的两级流水线并行成像处理。通过在HP刀片系统上的实验验证和结果分析,这种混合编程的流水线NCS并行成像算法既能较好适应前端系统传输一景原始回波数据时间不小于8s的情况,又能较好适应大规模原始回波数据堆积并且等待处理的情况。 相似文献
为了提高中继协作系统的整体性能,设计了基于QC-LDPC(Quasi-Cycle Low-Density Parity-Check)码联合分层译码的混合转发协作系统,给出了用于源节点和中继节点编码的QC-LDPC系统码的构造方法,并提出了适用于该协作系统的联合分层译码新算法.根据传统译码转发和编码协作的特点,采用了中继混合转发协作策略,无论中继是否译码成功,中继节点都发送一定形式的冗余信息给目的节点,从而提高协作系统的编码增益和分集增益.仿真结果表明:所提出的混合转发协作系统可以充分发挥中继的分集和编码优势;与非协作系统相比,可以显著提高中继协作系统译码性能. 相似文献
14.
降低功耗、延长寿命是无线传感器网络的一个重要问题,同时,对监测区域保持一定的覆盖质量才能及时捕捉到目标的状态变化.一种广泛采用的策略是选出能够满足监测区域质量要求的最小节点集作为工作节点,关闭其他冗余节点.因此,传感器网络中控制节点休眠与保持覆盖质量是两个重要方面.提出了一个数学模型,求解满足任意给定覆盖服务质量下所需的最小节点数.实验表明,当监测区域与节点感知区域比值较大时,提出的方法更为准确地计算出所需最小工作节点数,且此方法复杂度低、传感器节点的感知区域可以为任意形状.网络覆盖质量与节点休眠率同时达到最大化是一个NP难问题,采用遗传算法进行仿真实验尝试性解决这一问题,为传感器网络实际应用带来重要意义. 相似文献
15.
在系统总功率一定的情况下,通过在协同节点间进行优化的功率分配以改善系统的接收性能.针对单中继协同传输,推导了节点间最优功率分配因子的闭式表达式,给出了中继节点的激活条件,仅当信道的衰落特性满足该条件时,中继节点才发送信号到目的节点,否则进入空闲状态.多节点协同传输场景下,直接根据系统的输出信噪比难以得到节点间最优功率分配因子的闭式表达式.因此,推导了系统输出信噪比的上界,在此基础上,提出了一种新的功率分配方法.将整个功率分配过程分成两步,采用迭代的方法实现节点间的最优功率分配.仿真结果表明,对于单中继节点的情况,所提出的功率分配方案能够获得约1~2 dB的性能增益,随着参与协同传输的节点数的增大,迭代的功率分配可使系统获得显著的性能提升. 相似文献