首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 887 毫秒
1.
基于Pentium Pro的高性能BLAS的设计与实现   总被引:1,自引:1,他引:1  
支持科学和工程计算的BLAS(基本线性代数子程序)在高性能计算中有着重要作用.本文针对Pentium Pro的体系结构特点,提出了一些优化方法使得BLAS在Pentium Pro上计算性能达到最佳.测试表明,在200MHz的Pentium Pro上BLAS3的速度可达112Mflops.  相似文献   

2.
基于投影寻踪的高光谱图像异常检测并行算法   总被引:1,自引:0,他引:1  
投影寻踪方法能有效提取数据中的非高斯结构凸显异常信息,但在求解最优投影方向时存在计算量大、运行时间长的问题,为提高处理效率,提出一种机群环境下的并行算法.选用偏度和峰度组合作为投影指标,将所有像素光谱作为特定投影方向集依次搜索,求解最优投影方向.在并行计算各候选方向投影指标时,分割图像数据分布存储于各机群结点,数据子块朝候选方向并行投影后,将指标计算式变形分解,使各结点在指标计算过程中所需数据均为本地数据,解决数据局部性问题,并采用一种"轮流作主"的机制提高算法负载均衡程度.利用实用型模块化高光谱仪数据在机群系统上进行测试,达到了较好的加速效果,表明该并行算法具有良好的并行性能.  相似文献   

3.
本文提出了航天器热分析技术的流程图(热分析器),着重论述了热分析的结点网络法的基本理论、特点及其运用实例.本文介绍依照结点网络法而编制的稳态温度的250阶结点网络方程通用计算机程序.经过实例验证,得到计算精度在2~8℃范围内的良好计算结果.讨论了影响计算精度的主要因素并与国外热分析器的性能作了比较.  相似文献   

4.
网络计算环境下任务调度问题研究   总被引:5,自引:0,他引:5  
利用网上空闲处理机组成机群并行计算环境是快速增长的研究领域,任务调度是其中最关键性的问题之一.在基于消息传递机制的网络并行计算环境下,针对一类大粒度计算任务并行时协同同步工作问题,发展了一种新的静态调度模型,提出了调度算法,它映射一类特殊的并行程序任务到由网络上若干空闲处理机组成的机群中.研究表明该算法能减少此类并行程序的完成时间.   相似文献   

5.
以XRS-152/153影像增强器DR/CT成像系统为研究对象,在分析其输出像场畸变特性的基础上,从校正精度和校正实时性要求出发,采用空间坐标多项式变换方法进行畸变校正.同时,为了解决畸变校正算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU, Graphic Processing Unit)并行计算和高速浮点计算特性,将图像映射为GPU中的纹理,采用多线程并行计算,使得校正算法在GPU中加速执行.实验结果表明,本方法能有效实现畸变图像的校正,GPU加速方法可以在不损失图像信息的前提下,实现实时校正.  相似文献   

6.
数据交换是电子政务应用的核心问题.构建一种应用层数据交换覆盖网络成为解决这类问题的关键.分析了电子政务数据交换的特点,提出了电子政务数据交换覆盖网络eGON(e-Government data exchange Overlay Network)的概念模型,在树型结构组织网络的基础上,引入结点间组织距离和结点适应度概念,提出了一种eGON拓扑结构模型——双尺度异质组织网络模型DSHON(Dual Scale Heterogeneous Organization Network),该模型按照与组织距离和能力适应度2种尺度相关的概率添加快捷边,实现网络性能改善.设计了eGON的总体结构、构建与维护机制、路由维护协议和基于组织距离优先的消息路由算法,并进行了路由算法实验验证.   相似文献   

7.
二维跨音速Euler方程分区并行算法   总被引:3,自引:0,他引:3  
对二维跨音速流动的Euler方程分区算法、并行算法以及多区计算的有效内边界耦合条件进行了探讨,应用Van Leer矢通量分裂方法和一维数组方式,研究了多种区域分解数目的分区计算效率.并行计算中采用"先进先出"的同步控制等待机制,采用纯结点并行编程方式进行了单区、二区和四区并行计算对比,分析了影响并行效率和通讯过载比的主要因素.  相似文献   

8.
网络分布式并行计算的负载平衡   总被引:2,自引:0,他引:2  
利用分布式系统动态负载平衡的原理,设计了一种适应网络分布式并行计算环境的负载平衡实现机制,采用集中式负载信息收集策略,集中和分布式相结合的传输控制策略.定义了一种新的复合型负载指标来衡量各处理机的负载程度.讨论了相应的理论和实现中的关键问题,给出了主要的实现策略和算法.仿真比较研究表明这种体系结构和相应策略能对网络环境下分布式并行计算提供有力支持.   相似文献   

9.
日冕物质抛射(Coronal Mass Ejection,CME)参数识别模型是太阳风预报过程的重要组成部分.在空间环境预报业务中,为提高太阳风预报的准确率,需要提高CME参数识别的精度.模型以计算任务串行的方式运行,运算效率低导致模型运算时间长,不能满足这种需求.CME参数识别模型的物理运算过程相互不独立,其在单节点上的运行方式不能满足并行化要求.基于MapReduce的并行计算框架,改进了CME参数识别模型的计算流程,提出CDMR(CME detection under MapReduce)方法,实现了CME参数识别模型的并行计算,并对比分析CME参数识别模型在串行计算和MapReduce并行计算下的运行时间,提高了模型的识别精度和计算效率.   相似文献   

10.
X射线动态数字图像降噪方法与快速实现   总被引:2,自引:2,他引:0  
对于X射线动态数字成像系统,为了实现高帧频采集引起的数字摄影(DR,Digital Radiography)图像降质的恢复,采用Anscombe变换将NL-means降噪算法引入到DR图像的降噪中.为了解决NL-means降噪算法计算量大、运算速度慢的问题,利用可编程图形处理单元(GPU,Graphic Processing Unit)并行计算和高速浮点计算特性,将DR图像映射为GPU中的纹理,采用多线程并行计算,使得NL-means算法在GPU中加速执行.实验结果表明,NL-means能够有效抑制动态DR图像噪声.GPU加速方法可以在不损失图像信息的前提下,加速比可达2个数量级以上,满足了实时降噪的要求.  相似文献   

11.
基于动态负载平衡的sort-first绘制集群   总被引:1,自引:0,他引:1  
对图形绘制集群中节点间负载不均衡问题提出了基于延期着色绘制的sort-first图形绘制集群.分析了延期着色中可见性检测、全局光照着色、局部光照着色3类算法的计算原理,用于预测不同阶段的绘制负载;将负载预测算法转换为场景绘制中的片段着色算法;借助图形处理器的并行处理能力,通过集中式的预着色计算,获得了屏幕空间内逐像素的绘制负载分布;基于预测的绘制负载分布,分配图形绘制集群中各个节点的绘制任务.根据实验结果,该系统可以实时预测并剖分绘制负载,精确的负载预测使系统获得高速、稳定的图形绘制性能.  相似文献   

12.
根据星载合成孔径雷达(Synthetic Aperture Radar,SAR)实时和准实时成像的需求,论文设计和实现了一种混合编程模式的非线性CS(Nonlinear Chirp Scaling, NCS)成像算法。此方法基于SMP(Symmetric Multiprocessing)集群系统,利用MPI(Message Passing Interface)和Pthread混合编程,实现了多进程和多线程的两级流水线并行成像处理。通过在HP刀片系统上的实验验证和结果分析,这种混合编程的流水线NCS并行成像算法既能较好适应前端系统传输一景原始回波数据时间不小于8s的情况,又能较好适应大规模原始回波数据堆积并且等待处理的情况。  相似文献   

13.
  总被引:4,自引:4,他引:0  
为了提高中继协作系统的整体性能,设计了基于QC-LDPC(Quasi-Cycle Low-Density Parity-Check)码联合分层译码的混合转发协作系统,给出了用于源节点和中继节点编码的QC-LDPC系统码的构造方法,并提出了适用于该协作系统的联合分层译码新算法.根据传统译码转发和编码协作的特点,采用了中继混合转发协作策略,无论中继是否译码成功,中继节点都发送一定形式的冗余信息给目的节点,从而提高协作系统的编码增益和分集增益.仿真结果表明:所提出的混合转发协作系统可以充分发挥中继的分集和编码优势;与非协作系统相比,可以显著提高中继协作系统译码性能.  相似文献   

14.
降低功耗、延长寿命是无线传感器网络的一个重要问题,同时,对监测区域保持一定的覆盖质量才能及时捕捉到目标的状态变化.一种广泛采用的策略是选出能够满足监测区域质量要求的最小节点集作为工作节点,关闭其他冗余节点.因此,传感器网络中控制节点休眠与保持覆盖质量是两个重要方面.提出了一个数学模型,求解满足任意给定覆盖服务质量下所需的最小节点数.实验表明,当监测区域与节点感知区域比值较大时,提出的方法更为准确地计算出所需最小工作节点数,且此方法复杂度低、传感器节点的感知区域可以为任意形状.网络覆盖质量与节点休眠率同时达到最大化是一个NP难问题,采用遗传算法进行仿真实验尝试性解决这一问题,为传感器网络实际应用带来重要意义.  相似文献   

15.
在系统总功率一定的情况下,通过在协同节点间进行优化的功率分配以改善系统的接收性能.针对单中继协同传输,推导了节点间最优功率分配因子的闭式表达式,给出了中继节点的激活条件,仅当信道的衰落特性满足该条件时,中继节点才发送信号到目的节点,否则进入空闲状态.多节点协同传输场景下,直接根据系统的输出信噪比难以得到节点间最优功率分配因子的闭式表达式.因此,推导了系统输出信噪比的上界,在此基础上,提出了一种新的功率分配方法.将整个功率分配过程分成两步,采用迭代的方法实现节点间的最优功率分配.仿真结果表明,对于单中继节点的情况,所提出的功率分配方案能够获得约1~2 dB的性能增益,随着参与协同传输的节点数的增大,迭代的功率分配可使系统获得显著的性能提升.  相似文献   

16.
    
规约是并行应用最常用的集合通信操作之一,现存规约算法存在2方面主要问题。第一,不适应复杂环境,当计算环境出现干扰时,规约效率显著降低。第二,不支持容错,当节点发生故障时,规约被迫中断。针对上述问题,提出一种基于任务并行的高性能分布式规约框架。首先,该框架将规约拆分为一系列独立的计算任务,使用任务调度器以保证就绪任务被优先调度到具有较高性能的节点上执行,从而有效避免了慢节点对整体性能的影响。其次,该框架基于规约数据的可靠性存储和故障侦听机制,以任务为粒度,可在应用不退出的前提下实现故障恢复。在复杂环境中的实验结果表明,分布式规约框架具有高可靠性,与现有规约算法相比,规约性能最高提升了2.2倍,并发规约性能最高提升了4倍。  相似文献   

17.
广义非线性强度与广义滑动面   总被引:1,自引:1,他引:0  
广义Mises准则满足八面体面上的剪应力和正应力之比为常数,SMP(Spatially Mobilized Plane)准则满足空间滑动面上的剪应力和正应力之比为常数,那么对于包含或逼近现有非线性强度准则的广义非线性强度,在物理空间中应存在一平面,且满足该平面上的剪应力和正应力之比为常数.为此,提出了介于八面体面和空间滑动面之间的广义滑动面,与广义非线性强度相对应,广义滑动面上的剪应力与正应力之比为常数,并给出了广义滑动面上应力比的表达式,及主应力空间中的强度面形状.通过深入分析和对比,表明了广义非线性强度和广义滑动面在材料强度描述上的一致性.   相似文献   

18.
Back propagation artificial natural network (BPANN) is a well known and widely used machine learning methodology in the field of remote sensing. In this paper an attempt is made to retrieve the spinach crop parameters like biomass, leaf area index, average plant height and soil moisture content by using the X-band scattering coefficients with BPANN at different growth stages of this crop. The maturity age of this crop was found to be 45 days from the date of sowing. After 45 days from the date of sowing, this crop was cut at a certain height for production. Then, it is a point of interest to investigate the microwave response of variation in production. Significant variations in all the crop parameters were observed after cutting the crop and consequently made the problem more critical. Our work confirms the utility of BPANN in handling such a non-linear data set. The BPANN is essentially a network of simple processing nodes arranged into different layers as input, hidden and the output. The input layer propagates components of a particular input vector after weighting these with synaptic weights to each node in the hidden layer. At each node, these weighted input vector components are added. Each hidden layer computes output corresponding to these weighted sum through a non-linear/linear function (e.g. LOGSIG, TANSIG and PURLIN). These functions are known as transfer functions. Thus, each of the hidden layer nodes compute output values, which become inputs to the nodes of the output layer. At nodes of output layer also a weighted sum of outputs of previous layer (hidden layer) are obtained and processed through a transfer function. Thus, the output layer nodes compute the network output for the particular input vector. In this paper, output nodes use linear transfer function. Different transfer functions e.g. TANSIG, LOGSIG and PURELIN were used and the performance of the ANN was optimized by changing the number of neurons in the hidden layers. The present analysis suggests the need of critical analysis of the BPANN in terms of selection of the best transfer function and other network parameters for the better results.  相似文献   

19.
随着图形处理器(GPU)的快速发展,基于计算设备统一构架(CUDA)可以方便地将并行计算技术应用于超声声场数值仿真计算,极大地提升计算效率。阐述了弹性动力学有限积分算法(EFIT)的原理,在采用CPU实现带吸收边界的钢材料二维点源激励声场仿真的基础上,基于GPU实现了仿真模型的并行计算,介绍了GPU程序的设计流程和参数优化方法,包括纹理内存使用、吸收边界优化和数据传输优化。对比了相同条件下CPU和GPU仿真计算的耗时和平均计算效率,定量分析了GPU对于EFIT模型效率的提升。比对结果表明,EFIT具有良好的并行计算条件,采用并行计算方法能够有效提升模型计算速度,对于复杂声场仿真应用具有广阔的应用前景。   相似文献   

20.
装备平行仿真是系统建模与仿真领域的新兴仿真技术,已经成为研究热点。在装备维修保障领域中,分析了装备剩余寿命(RUL)预测存在的突出问题,即模型参数固定、不具备自适应演化能力,成为阻碍实现装备剩余寿命自适应预测的首要因素。结合装备平行仿真理论,在建模分析的基础上提出了面向装备剩余寿命预测的平行仿真框架,该框架以Wiener状态空间模型为基础仿真模型,在动态注入的装备退化观测数据驱动下,利用期望最大化(EM)算法在线更新模型参数,并利用卡尔曼滤波(KF)算法实现仿真输出数据与观测数据的同化(DA),从而实现仿真模型动态演化,使得仿真输出不断逼近装备真实退化状态,为准确预测剩余寿命提供高逼真度仿真模型和数据输出。以某轴承性能退化数据为数据驱动源,对该框架进行了验证,仿真结果表明平行仿真方法能准确仿真装备性能退化过程,在提高预测精度的基础上实现了装备剩余寿命的自适应预测,有力证明了平行仿真方法的可行性和有效性。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号